LLM áá»á¬ážá¡áá»áá¯ážáá»áá¯ážááᯠááŸá¬ááœá±ááŒááºážááŸáá·áº ááŸáá¯ááºážááŸááºááŒááºáž
á€áááºáááºážá á¬á áá®áá®ááá¯ááᯠááŒáá·áºááẠá¡áá±á«áºááœááºááŸááá±á¬ áá¯á¶ááᯠááŸáááºáá«
ááááºáááºáááºážá á¬ááœáẠGenerative AI ááẠáááºážááá¬áá±á¬áááᯠáááºááá¯á·ááŒá±á¬ááºážáá²áá±áááºá Large Language Models (LLMs) áá»á¬áž áááºááá¯á· áááºáááºááŒáááºá á áá¬ážáááºáá áºáá¯áá²á·ááá¯á· á á®ážááœá¬ážáá±ážáá¯ááºáááºážáá áºáá¯ááẠáááºážááá¯á·ááᯠáááºááá¯á· á¡áá¯á¶ážáá»á ááá¯ážáááºááŸá¯áááŸáááá¯ááºáááºááᯠááŒáá·áºááŸá¯áá²á·áá«áááºá á€á¡áááºážááœááºáá±á¬á· LLM áá»á¬ážá¡áá»áá¯ážáá»áá¯ážááᯠááŸáá¯ááºážááŸááºááŒá®áž áááºážááá¯á·áá¡á¬ážáá¬áá»ááºáá»á¬ážááŸáá·áº á¡á¬ážáááºážáá»ááºáá»á¬ážááᯠáá¬ážáááºááẠááŒáá¯ážá á¬ážáá«áááºá
á áá¬ážáááºá ááá®ážá ááºááœáẠáá±á¬ááºáá áºááá·áºááŸá¬ áááºááŸá LLM áá»á¬ážá áááºáááºážáá»ááºááᯠááŸá¬ááœá±ááŒá®áž ááááááá¯á· á¡áá¯á¶ážááŒá¯ááŸá¯á¡ááœáẠááá·áºáá±á¬áºáá±á¬ áá±á¬áºáááºáá»á¬ážááᯠáá¬ážáááºááŒááºážááŒá áºáááºá
á€áááºáááºážá á¬ááœáẠáá«áááºááá·áºá¡ááŒá±á¬ááºážá¡áá¬áá»á¬ážááŸá¬ -
- áááºááŸá LLM áá»á¬ážá á¡áá»áá¯ážá¡á á¬ážáá»á¬ážá
- Azure ááœáẠááááá¡áá¯á¶ážááŒá¯ááŸá¯á¡ááœáẠáá±á¬áºáááºáá»á¬ážááᯠá ááºážáááºááŒááºážá ááŒááºáááºááá¯ážáááºá¡á±á¬ááºáá¯ááºááŒááºážááŸáá·áº ááŸáá¯ááºážááŸááºááŒááºážá
- LLM áá áºáá¯ááᯠáááºááá¯á· áááºáááºáááºáááºážá
á€áááºáááºážá á¬ááŒá®ážáá¯á¶ážááŒá®ážáá±á¬áẠáááºááẠ-
- ááááá¡áá¯á¶ážááŒá¯ááŸá¯á¡ááœáẠááá·áºáá±á¬áºáá±á¬ áá±á¬áºáááºááᯠááœá±ážáá»ááºááá¯ááºáááºá
- áá±á¬áºáááºá á áœááºážáá±á¬ááºáááºááᯠá ááºážáááºá ááŒááºáááºááá¯ážáááºá¡á±á¬ááºáá¯ááºáááºážááᯠáá¬ážáááºááá¯ááºáááºá
- á á®ážááœá¬ážáá±ážáá¯ááºáááºážáá»á¬áž áá±á¬áºáááºáá»á¬ážááᯠáááºááá¯á· áááºáááºááŒáááºááᯠááááŸáááá¯ááºáááºá
LLM áá»á¬ážá á¡áá»áá¯ážá¡á á¬ážáá»á¬ážááᯠáá¬ážáááºááŒááºáž
LLM áá»á¬ážááᯠáááºážááá¯á·á ááœá²á·á ááºážáá¯á¶á áá±á·áá»áá·áºááá·áº áá±áá¬ááŸáá·áº á¡áá¯á¶ážááŒá¯ááŸá¯á¡áá±á«áº áá°áááºá á¡áá»áá¯ážá¡á á¬ážáá»á¬ážá áœá¬ ááœá²ááŒá¬ážááá¯ááºáááºá á€ááœá¬ááŒá¬ážáá»ááºáá»á¬ážááᯠáá¬ážáááºááŒááºážááŒáá·áº á áá¬ážáááºááẠááááááá¯á·á¡ááŒá±á¡áá±ááá¯á· ááá·áºáá±á¬áºáá±á¬ áá±á¬áºáááºááᯠááœá±ážáá»ááºááá¯ááºááŒá®áž á ááºážáááºá ááŒááºáááºááá¯ážáááºá¡á±á¬ááºáá¯ááºáááºážááá¯áááºáž áá¬ážáááºááá¯ááºáááºááŒá áºáááºá
LLM áá±á¬áºáááºá¡áá»áá¯ážá¡á á¬ážáá»á¬ážá áœá¬ ááŸáááŒá®áž ááááá¡áá¯á¶ážááŒá¯ááá¯ááá·áº áááºááœááºáá»ááºá áá±áá¬á ááœá±áá±ážáá»á±ááŸá¯á ááááºááŸáá·áº á¡ááŒá¬ážá¡áá»ááºáá»á¬ážáá±á«áº áá°áááºá áá±á¬áºáááºááœá±ážáá»ááºááŸá¯ááœá²ááŒá¬ážááá¯ááºáááºá
áá±á¬áºáááºáá»á¬ážááᯠá á¬áá¬ážá á¡áá¶á áá®áá®ááá¯á áá¯á¶ááááºáááºáá®ážááŒááºáž á ááá·áº á¡áá»áá¯ážá¡á á¬ážá¡ááá¯áẠá¡áá¯á¶ážááŒá¯ááá¯áá«á ááá°áá®áá±á¬ áá±á¬áºáááºá¡áá»áá¯ážá¡á á¬ážááᯠááœá±ážáá»ááºááá¯ááºáá«áááºá
-
á¡áá¶ááŸáá·áº á áá¬ážááááŒááºááŒááºážá á€áááºááœááºáá»ááºá¡ááœáẠWhisper áá±á¬áºáááºáá»á¬ážááẠá áá¬ážááááŒááºááŒááºážá¡ááœáẠá¡áá°ážááá·áºáá±á¬áºááŒá®áž á¡áá»áá¯ážáá»áá¯ážáá±á¬ á¡áá¶áá»á¬ážáá±á«áºááœáẠáá±á·áá»áá·áºáá¬ážáááºá áá¬áá¬á áá¬ážá á¯á¶á áá¬ážááááŒááºááá¯ááºáááºá Whisper áá±á¬áºáááºá¡ááŒá±á¬ááºáž ááá¯ááá¯áá±á·áá¬áááºá
-
áá¯á¶ááááºáááºáá®ážááŒááºážá áá¯á¶ááááºáááºáá®ážááẠDALL-E ááŸáá·áº Midjourney ááá¯á·ááẠáá¬áááºááŒá®ážáá±á¬ ááœá±ážáá»ááºá áá¬áá»á¬ážááŒá áºáááºá DALL-E ááᯠAzure OpenAI á០áá¶á·ááá¯ážáá±ážáááºá DALL-E á¡ááŒá±á¬ááºáž ááá¯ááá¯áááºááŸá¯ááẠááŸáá·áº á€áááºáááºážá á¬á á¡áááºáž á ááœááºáááºáž áá«áááºáááºá
-
á á¬áá¬ážáááºáá®ážááŒááºážá áá±á¬áºáááºá¡áá»á¬ážá á¯ááẠá á¬áá¬ážáááºáá®ážááŒááºážá¡ááœáẠáá±á·áá»áá·áºáá¬ážááŒá®áž GPT-3.5 á០GPT-4 á¡áá áá±á¬áºáááºáá»á¬ážá áœá¬ ááœá±ážáá»ááºááá¯ááºáááºá GPT-4 ááẠá¡ááŒá®ážáá¯á¶ážá á»á±ážááŸá¯ááºážááŸááááºá Azure OpenAI playground ááœáẠá áœááºážáá±á¬ááºáááºááŸáá·áº á á»á±ážááŸá¯ááºážá¡á ááá·áºááá¯á¡ááºáá»ááºááŸáá·áº ááá¯ááºáá®ááá·áº áá±á¬áºáááºááᯠá ááºážáááºááŒáá·áºááẠááá·áºáá±á¬áºáááºá
-
á¡áá»áá¯ážáá»áá¯ážáá±á¬ áá±áá¬áá¯á¶á á¶áá»á¬ážááᯠááá¯ááºááœááºááá¯ááºááŒááºážá á¡áá»áá¯ážáá»áá¯ážáá±á¬ áá±áá¬áá»á¬ážááᯠááá·áºááœááºážáá¯ááºáá°ááá¯áá«á gpt-4 turbo with vision ááá¯á·ááá¯áẠgpt-4o áá²á·ááá¯á·áá±á¬ OpenAI á áá±á¬ááºáá¯á¶ážááœáẠáá±á¬áºáááºáá»á¬ážááᯠá ááºážá á¬ážááá¯ááºáááºá á€áá±á¬áºáááºáá»á¬ážááẠááá¬ááá¬áá¬á áá¬ážááᯠáá®ááœááºáá¬ážáááºááŸá¯ááŸáá·áº áá±á«ááºážá ááºááá¯ááºááŒá®áž áá»áá¯ážá á¯á¶áá¯á¶á á¶ á¡ááºáá¬áá±á·á áºáá»á¬ážááŸáááá·áº áááºááœááºááá¯ááºáááºá
áá±á¬áºáááºááœá±ážáá»ááºááŒááºážááẠá¡ááŒá±áá¶á áœááºážáááºáá»á¬ážááᯠáááŸáá á±áá±á¬áºáááºáž ááá¯á¶áá±á¬ááºááá¯ááºáá«á áááŒá¬áá áá¯áá¹ááá®á¡áá°áž áá±áá¬áá»á¬ážááᯠLLM áá¶ááá¯á· ááá·áºááœááºážááŒá±á¬ááŒááẠááá¯á¡ááºáááºá áááºážááᯠáááºááá¯á· ááŸááºážáááºážáááºááá¯áááºááŸá¬ áá±á¬ááºááá¯ááºážá¡ááá¯ááºážáá»á¬ážááœáẠáááºáááºááŸááºážááŒáá«áááºá
Foundation Model ááá¯áááºááŸá¬ Stanford áá¯áá±ááááá¬ááŸááºáá»á¬ážá áááºáá®ážáá²á·áá±á¬ á áá¬ážáá¯á¶áž ááŒá áºááŒá®áž á¡á±á¬ááºáá«á¡áá»ááºáá»á¬ážá¡á áááºááŸááºáá¬ážááẠ-
- Unsupervised learning ááá¯á·ááá¯áẠself-supervised learning ááŒáá·áº áá±á·áá»áá·áºáá¬ážáááºá á¡ááŸááºá¡áá¬ážááá¬ážáá±á¬ áá»áá¯ážá á¯á¶áá±áá¬áá±á«áºááœáẠáá±á·áá»áá·áºáá¬ážááŒá®áž áá°á·áááºááŸááºáááá¯á¡ááºáá«á
- á¡ááœááºááŒá®ážáá¬ážáá±á¬ áá±á¬áºáááºáá»á¬ážááŒá áºáááºá áá®áá»á¶ááá¬áááŸááá±á¬ parameter áá»á¬ážáá«áááºááá·áº áááºááŸáá¯ááºážáá±á¬ ááá°ážáááºáááºáááºááºáá»á¬ážááŒá áºáááºá
- á¡ááŒá¬ážáá±á¬áºáááºáá»á¬ážá¡ááœáẠá¡ááŒá±áá¶á¡ááŒá Ạá¡áá¯á¶ážááŒá¯ááẠáááºááœááºáááºá á¡ááŒá¬ážáá±á¬áºáááºáá»á¬ážááᯠfine-tuning ááŒáá·áº áááºáá±á¬ááºáá¬ááœáẠá¡á á¡ááŒá Ạá¡áá¯á¶ážááŒá¯ááá¯ááºáááºá
áá¯á¶áááºážááŒá Ạ- Essential Guide to Foundation Models and Large Language Models | by Babar M Bhatti | Medium
á€ááœá¬ááŒá¬ážáá»ááºááᯠááá¯ááá¯ááŸááºážáááºážá á±ááẠChatGPT ááᯠá¥ááá¬áá°ááŒáá«á áá¯á·á ChatGPT á ááááá¯á¶ážáá¬ážááŸááºážááᯠáááºáá±á¬ááºáá¬ááœáẠGPT-3.5 ááᯠfoundation model á¡ááŒá Ạá¡áá¯á¶ážááŒá¯áá²á·áááºá OpenAI ááẠá áá¬ážááŒá±á¬áááºááœááºááŸá¯á¡ááœáẠá¡áá°ážááŒá¯áá¬ážáá±á¬ chat-specific áá±áá¬áá»á¬ážááŒáá·áº GPT-3.5 ááᯠfine-tune ááŒá¯áá¯ááºáá²á·áááºá
áá¯á¶áááºážááŒá Ạ- 2108.07258.pdf (arxiv.org)
LLM áá»á¬ážááᯠopen source ááŒá áºááŒááºáž ááá¯á·ááá¯áẠproprietary ááŒá áºááŒááºážá¡ááááºáž ááœá²ááŒá¬ážááá¯ááºáááºá
Open source áá±á¬áºáááºáá»á¬ážááẠááŒááºáá°áá°áá¯á¡ááœáẠááœáá·áºááŸá áºáá¬ážááŒá®áž áááºáá°áááᯠá¡áá¯á¶ážááŒá¯ááá¯ááºáááºá áá±á¬áºáááºáááºáá®ážáá° áá¯áá¹ááá® ááá¯á·ááá¯áẠáá¯áá±ááá¡ááá¯ááºážá¡ááá¯ááºážá០áá¯ááºáá±ážáááºá áááºážááá¯á·ááᯠá á áºáá±ážá ááŒááºáááºá á áááºááŒáá¯ááºááŒá¯áá¯ááºááá¯ááºáááºá ááá¯á·áá±á¬áº áá¯ááºáá¯ááºááŸá¯á¡ááœáẠá¡áá±á¬ááºážáá¯á¶áž áááŒá áºááá¯ááºáá±á¬áºáááºážá áááºáá¯á¶ááœá±ááá·áºáááºááŸá¯ááŸáááŒá®áž áá±ááŸááºááááºážááááºážááŸá¯ áááŸáááá¯ááºáá±á¬áºáááºáž ááŒá áºááá¯ááºáááºá áá¬áááºááŒá®áž open source áá±á¬áºáááºáá»á¬ážááŸá¬ Alpaca, Bloom ááŸáá·áº LLaMA ááá¯á· ááŒá áºáááºá
Proprietary áá±á¬áºáááºáá»á¬ážááẠáá¯áá¹ááá®ááá¯ááºááá¯ááºááŒá®áž ááŒááºáá°á¡ááœáẠáááœáá·áºááŸá áºáá¬ážáá±á¬ áá±á¬áºáááºáá»á¬ážááŒá áºáááºá áá¯ááºáá¯ááºááŸá¯á¡ááœáẠá¡áá±á¬ááºážáá¯á¶áž optimize ááŒá¯áá¯ááºáá¬ážááŒá®áž á áááºááŒáá¯ááºááŒááºáááºááŒááºáž áááŒá¯áá¯ááºááá¯ááºáá«á á¡ááá²á· ááááá¯ááºáá±á¬áºáááºáž á á¬áááºážááœááºážááŒááºáž ááá¯á·ááá¯áẠááœá±áá±ážáá»á±ááŸá¯ ááá¯á¡ááºááá¯ááºáááºá áá±á¬áºáááºáá±á·áá»áá·áºáá¬ááœáẠá¡áá¯á¶ážááŒá¯áá±á¬ áá±áá¬ááᯠá¡áá¯á¶ážááŒá¯áá°áá»á¬áž ááááºážáá»á¯ááºá áááááŒáá·áº áá±áá¬áá¯á¶ááŒá¯á¶ááŸá¯ááŸáá·áº AI áá¬áááºáá°ááŸá¯ááᯠáá±á¬áºáááºááá¯ááºááŸááºá¡á¬áž áá¯á¶ááŒááºááááºá áá¬áááºááŒá®áž proprietary áá±á¬áºáááºáá»á¬ážááŸá¬ OpenAI áá±á¬áºáááºáá»á¬áž, Google Bard ááŸáá·áº Claude 2 ááá¯á· ááŒá áºáááºá
LLM áá»á¬ážááᯠáá¯ááºáá±ážáá±á¬ output á¡áá»áá¯ážá¡á á¬ážá¡ááááºáž ááœá²ááŒá¬ážááá¯ááºáááºá
Embedding áá±á¬áºáááºáá»á¬ážááẠá á¬áá¬ážááᯠáá¶áá«ááºáá¯á¶á á¶ (embedding) ááá¯á· ááŒá±á¬ááºážáá²áá±ážáááºá á€áá¶áá«ááºáá¯á¶á á¶ááẠá áá¬ážáá¯á¶ážáá»á¬áž ááá¯á·ááá¯áẠá á¬ááŒá±á¬ááºážáá»á¬ážá¡ááŒá¬áž áááºááœááºááŸá¯ááᯠá ááºáá»á¬ážáá¬ážáááºááẠááœááºáá°á á±ááŒá®áž classification áá±á¬áºáááºáá»á¬áž ááá¯á·ááá¯áẠclustering áá±á¬áºáááºáá»á¬ážáá²á·ááá¯á· áá¶áá«ááºáá¯á¶á á¶á¡áá±á«áº á¡ááŒá±áá¶áá±á¬ áá±á¬áºáááºáá»á¬ážááœáẠá¡áá¯á¶ážááŒá¯ááá¯ááºáááºá Embedding áá±á¬áºáááºáá»á¬ážááᯠtransfer learning á¡ááœáẠá¡áá¯á¶ážááŒá¯ááŒááŒá®áž abundant data ááŸááá±á¬ surrogate task á¡ááœáẠáá±á¬áºáááºáá áºáᯠáááºáá±á¬ááºááŒá®áž ááá¯áá±á¬áºáááºá weights (embedding) áá»á¬ážááᯠdownstream task áá»á¬ážááœáẠááŒááºáááºá¡áá¯á¶ážááŒá¯áááºá á¥ááá¬ááŸá¬ OpenAI embeddings ááŒá áºáááºá
áá¯á¶ááááºáááºáá®ážáá±á¬áºáááºáá»á¬ážááẠáá¯á¶ááááºáá»á¬ážááᯠáááºáá®ážáá±ážáááºá á€áá±á¬áºáááºáá»á¬ážááᯠáá¯á¶ááááºáááºážááŒááºááŒááºážá áá¯á¶ááááºáá±á«ááºážá ááºááŒááºážááŸáá·áº áá¯á¶ááááºáá¬áá¬ááŒááºááŒááºážááá¯á·ááœáẠá¡áá¯á¶ážááŒá¯ááŒáááºá áá¯á¶ááááºáááºáá®ážáá±á¬áºáááºáá»á¬ážááᯠLAION-5B áá²á·ááá¯á·áá±á¬ áá¯á¶ááááºáá±áá¬á¡á á¯á¡áá±ážááŒá®ážáá»á¬ážáá±á«áºááœáẠáá±á·áá»áá·áºáá¬ážááŒá®áž áá¯á¶á¡áá áºáá»á¬áž áááºáá®ážááŒááºáž ááá¯á·ááá¯áẠááŸáááŒá®ážáá¬ážáá¯á¶áá»á¬ážááᯠinpainting, super-resolution, colorization áááºážááá¬áá»á¬ážááŒáá·áº áááºážááŒááºááá¯ááºáááºá á¥ááá¬áá»á¬ážááŸá¬ DALL-E-3 ááŸáá·áº Stable Diffusion áá±á¬áºáááºáá»á¬áž ááŒá áºáááºá
á á¬áá¬ážááŸáá·áº áá¯ááºáááºáá®ážáá±á¬áºáááºáá»á¬ážááẠá á¬áá¬áž ááá¯á·ááá¯áẠáá¯ááºáá»á¬ážááᯠáááºáá®ážáá±ážáááºá á€áá±á¬áºáááºáá»á¬ážááᯠá á¬áá¬ážá¡áá»ááºážáá»á¯ááºááŒááºážá áá¬áá¬ááŒááºááŒááºážááŸáá·áº áá±ážááœááºážááŒá±ááá¯ááŒááºážááá¯á·ááœáẠá¡áá¯á¶ážááŒá¯ááŒáááºá á á¬áá¬ážáááºáá®ážáá±á¬áºáááºáá»á¬ážááᯠBookCorpus áá²á·ááá¯á·áá±á¬ á á¬áá¬ážáá±áá¬á¡á á¯á¡áá±ážááŒá®ážáá»á¬ážáá±á«áºááœáẠáá±á·áá»áá·áºáá¬ážááŒá®áž á á¬áá¬ážá¡áá áºáá»á¬áž áááºáá®ážááŒááºáž ááá¯á·ááá¯áẠáá±ážááœááºážáá»á¬ážááᯠááŒá±ááá¯ááá¯ááºáááºá áá¯ááºáááºáá®ážáá±á¬áºáááºáá»á¬ážá á¥ááᬠCodeParrot ááẠGitHub áá²á·ááá¯á·áá±á¬ áá¯ááºáá±áá¬á¡á á¯á¡áá±ážááŒá®ážáá»á¬ážáá±á«áºááœáẠáá±á·áá»áá·áºáá¬ážááŒá®áž áá¯ááºá¡áá áºáá»á¬áž áááºáá®ážááŒááºáž ááá¯á·ááá¯áẠááŸáááŒá®ážáá¬ážáá¯ááºáá»á¬ážá០á¡ááŸá¬ážáá»á¬ážááᯠááŒááºáááºááá¯ááºáááºá
LLM áá»á¬ážá ááœá²á·á ááºážáá¯á¶á¡áá»áá¯ážá¡á á¬ážáá»á¬ážááᯠááŸááºážááŒááẠá¡áá¬ážáááºážáá áºáᯠá¡áá¯á¶ážááŒá¯ááŒáá«á áá¯á·á
áááºá áááºáá±áá»á¬á áá»á±á¬ááºážáá¬ážáá»á¬ážá¡ááœáẠáá±ážááœááºážá á¬áá±ážááœá²áá±ážááẠáá¬áááºáá±ážááá¯ááºáááºá áááºááœáẠá¡áá¯ááºáá±á¬áºááŸá áºáŠážááŸáááŒá®áž áá áºáŠážááẠá¡ááŒá±á¬ááºážá¡áá¬áá±ážáá¬ážááŒááºážááᯠááŒá®ážááŒááºááŒá®áž áá áºáŠážááẠááŒááºáááºáá¯á¶ážáááºááŒááºážááᯠááŒá®ážááŒááºáááºá
á¡ááŒá±á¬ááºážá¡áá¬áá±ážáá¬ážáá°ááẠDecoder-only áá±á¬áºáááºáá²á·ááá¯á·ááŒá áºááŒá®ážá áá±á«ááºážá ááºááᯠááŒáá·áºááŒá®áž áááºáá±ážáá¬ážáá¬ážááá·áºá¡áá¬áá»á¬ážááᯠá¡ááŒá±áá¶á áááºáááºážá á¬áá±ážááá¯ááºáááºá áááºážááá¯á·ááẠá áááºáááºá á¬ážááœááºááŸáá·áº á¡ááááá¬áá±ážáá±á¬ á¡ááŒá±á¬ááºážá¡áá¬áá±ážáá¬ážáá¬ááœáẠáá±á¬ááºážááœááºáá±á¬áºáááºáž áá±á«ááºážá ááºááŸáá·áº áááºáá°áááá·áº áááºááŸááºáž áá»áœááºá¯ááºááá¯á· ááááºááá¯ááºáá»á¬ážááœáẠáá±á¬áºááŒáá²á·áá±á¬ áá±á¬áºáááºá¡áá»á¬ážá ᯠ(OpenAI áá±á¬áºáááºáá»á¬ážá Llama2 áá²á·ááá¯á·áá±á¬ open source áá±á¬áºáááºáá»á¬ážááŸáá·áº Hugging Face transformers) ááᯠAzure AI Studio ááœááºááŸááá±á¬ Model Catalog ááŸá¬ áááŸáááá¯ááºáá«áááºá
Azure AI Studio ááẠdeveloper áá»á¬ážá¡ááœáẠgenerative AI application áá»á¬áž áááºáá®ážáááºááŸáá·áº á ááºážáááºááŸá¯á០á áááºá á¡áá²ááŒááºááŒááºážá¡áá ááœá¶á·ááŒáá¯ážááá¯ážáááºááŸá¯ áá¯ááºáááºážá ááºá¡á¬ážáá¯á¶ážááᯠá á®áá¶ááá·áºááœá²ááá¯ááºááẠAzure AI áááºáá±á¬ááºááŸá¯áá»á¬ážá¡á¬ážáá¯á¶ážááᯠáá áºáá±áá¬áááºážááœáẠGUI ááœááºáá°á áœá¬ á¡áá¯á¶ážááŒá¯ááá¯ááºáá±á¬ Cloud Platform áá áºáá¯ááŒá áºáááºá Azure AI Studio á Model Catalog ááẠá¡áá¯á¶ážááŒá¯áá°á¡á¬áž á¡á±á¬ááºáá«á¡áá¬áá»á¬ážááᯠáá¯ááºáá±á¬ááºááá¯ááºá á±áá«áááº-
- á áááºáááºá á¬ážáᬠFoundation Model ááᯠcatalog áá²á០ááŸá¬ááœá±áá« - ááá¯ááºááá¯ááºááŸá¯ááŸááá±á¬ áá±á¬áºáááºááŒá áºá á± open source áá±á¬áºáááºááŒá áºá á±á task, license ááá¯á·ááá¯áẠname á¡ááá¯áẠá á áºáá¯ááºááá¯ááºáááºá ááŸá¬ááœá±áá±ážááᯠááá¯ááá¯áá±á¬ááºážááœááºá á±ááẠáá±á¬áºáááºáá»á¬ážááᯠAzure OpenAI collection, Hugging Face collection á ááá·áº collection áá»á¬ážá¡ááŒá Ạá á¯á ááºážáá¬ážáááºá
- áá±á¬áºáááºáááºááᯠááŒááºáááºáá¯á¶ážáááºáá«á á¡áá¯á¶ážááŒá¯ááẠáááºááœááºáá»ááºááŸáá·áº áááºááŒá¬ážááŸá¯áá±áᬠá¡áá±ážá áááºáá±á¬áºááŒáá»ááºá áá¯ááºááá°áá¬áá»á¬ážááŸáá·áº á¡ááœááºážááá¯ááºáž á¡áá²ááŒááºááŸá¯á á¬ááŒáá·áºááá¯ááºááœáẠáááŸááá±á¬ á¡áá²ááŒááºááŸá¯ááááºáá»á¬áž áá«áááºáááºá
- á ááºááŸá¯áá¯ááºáááºážááœáẠáááŸáááá¯ááºáá±á¬ áá±á¬áºáááºáá»á¬ážááŸáá·áº áá±áá¬á á¯á¶áá»á¬ážá¡áá±á«áº Benchmark áá»á¬ážááᯠááŸáá¯ááºážááŸááºá á á®ážááœá¬ážáá±ážá¡ááŒá±á¡áá±ááᯠááŒáá·áºáááºážááá¯ááºááá·áº áá±á¬áºáááºááᯠáááºááŸááºááá¯ááºááẠModel Benchmarks áááºážááŸáá»á¬ážá០ááŒáá·áºááŸá¯ááá¯ááºáááºá
- Azure AI Studio á á ááºážáááºááŸá¯ááŸáá·áº ááá¯ááºáá¶ááŒááºáž á áœááºážáá±á¬ááºáááºáá»á¬ážááᯠá¡áá¯á¶ážááŒá¯á ááááááá¯á¡ááºááá·áº á¡áá¯ááºááá¬áá¡ááœáẠáá±á¬áºáááºá áœááºážáá±á¬ááºááẠááá¯ážáááºá á±ááẠááááá áááºááŒá¬ážááŸá¯áá±áá¬ááŒáá·áº áá±á¬áºáááºááᯠfine-tune ááŒá¯áá¯ááºááá¯ááºáááºá
- áá°á pre-trained áá±á¬áºááẠááá¯á·ááá¯áẠfine-tuned áá±á¬áºáááºááᯠremote real time inference - managed compute - ááá¯á·ááá¯áẠserverless api endpoint - pay-as-you-go ááŒáá·áº áááºáááºááá¯ááºááŒá®áž application áá»á¬ážá០á¡áá¯á¶ážááŒá¯ááá¯ááºá á±áááºá
Note
Catalog áá²ááŸá áá±á¬áºáááºá¡á¬ážáá¯á¶ážááᯠáááºááŸáááœáẠfine-tuning ááŸáá·áº/ááá¯á·ááá¯áẠpay-as-you-go deployment á¡ááœáẠá¡áá¯á¶ážááŒá¯ááá¯ááºááŒááºáž áááŸááá«á áá±á¬áºáááºá á áœááºážáá±á¬ááºáááºááŸáá·áº ááá·áºáááºáá»ááºáá»á¬ážá¡ááœáẠáá±á¬áºáááºáááºááᯠá á áºáá±ážáá«á
áá»áœááºá¯ááºááá¯á· startup á¡ááœá²á·ááŸáá·áºá¡áá° LLM áá»áá¯ážá á¯á¶ááŸáá·áº Cloud Platform (Azure Machine Learning) ááᯠá ááºážáááºáá±á·áá¬áá²á·ááŒá®áž áá±á¬áºáááºáá»á¬ážááᯠááŸáá¯ááºážááŸááºááŒááºážá á ááºážáááºáá±áá¬áá±á«áºááœáẠá¡áá²ááŒááºááŒááºážá á áœááºážáá±á¬ááºááẠááá¯ážáááºá á±áááºááŸáá·áº inference endpoint áá»á¬ážááœáẠáááºáááºááá¯ááºááŒááºážááá¯á·ááᯠáá¯ááºáá±á¬ááºááá¯ááºáá²á·áááºá
ááá¯á·áá±á¬áº áááºááá·áºá¡áá»áááºááœáẠpre-trained áá±á¬áºáááºááᯠá¡áá¯á¶ážááŒá¯ááŒááºážááẠfine-tuning ááŒá¯áá¯ááºááá·áºááááºáž? á¡áá¯ááºááá¬áá¡ááá¯áẠáá±á¬áºáááºá áœááºážáá±á¬ááºááẠááá¯ážáááºá á±ááẠá¡ááŒá¬ážáááºážáááºážáá»á¬áž ááŸááá«ááá¬áž?
LLM á០ááááºááá¯á¡ááºáá»ááºáá»á¬ážááᯠáááŸáá á±ááẠá á®ážááœá¬ážáá±ážáá¯ááºáááºážáá»á¬áž á¡áá¯á¶ážááŒá¯ááá¯ááºááá·áº áááºážáááºážá¡áá»áá¯ážáá»áá¯áž ááŸááááºá LLM ááᯠproduction ááœáẠáááºáááºáá¬ááœáẠáááºááẠáááºááŒá¬ážááŸá¯á¡ááá·áºá¡áááºážá ááŸá¯ááºááœá±ážááŸá¯á áá¯ááºáá»á ááááºááŸáá·áº á¡áááºá¡ááœá±áž ááá°áá®ááá·áº áá±á¬áºáááºá¡áá»áá¯ážá¡á á¬ážáá»á¬ážááᯠááœá±ážáá»ááºááá¯ááºáááºá á¡á±á¬ááºáá«áááºážáááºážáá»á¬ážááŸá¬ á¡áá»áá¯ážáá»áá¯ážááŒá áºáá«áááº-
-
Context áá«áá±á¬ Prompt engineeringá ááá¯á¡ááºáá±á¬ á¡ááŒá±áá»á¬ážáááŸáá á±ááẠprompt áá±ážááá·áºá¡áá« áá¯á¶áá±á¬ááºáá±á¬ context ááᯠáá±ážááŒááºážááŒá áºáááºá
-
Retrieval Augmented Generation, RAGá ááá·áºáá±áá¬ááẠdatabase ááá¯á·ááá¯áẠweb endpoint áá áºáá¯ááœáẠááŸáááá¯ááºááŒá®ážá prompt áá±ážááá·áºá¡áá»áááºááœáẠááá¯áá±áᬠááá¯á·ááá¯áẠáá±áá¬á¡ááá¯ááºážá¡á ááᯠááá·áºááœááºážááẠááá·áºáá±á¬áºáá±á¬ áá±áá¬ááᯠááá°ááŒá®áž á¡áá¯á¶ážááŒá¯áá°á prompt á á¡á áááºá¡ááá¯ááºážá¡ááŒá Ạááá·áºááœááºážááá¯ááºáááºá
-
Fine-tuned áá±á¬áºáááºá ááááá áá±áá¬ááŒáá·áº áá±á¬áºáááºááᯠáá±á¬ááºááẠáááºááŒá¬ážááŸá¯ ááŒá¯áá¯ááºááŒááºážááŒáá·áº áá±á¬áºáááºááẠááá¯ááá¯áááá»ááŒá®áž ááá¯á¡ááºáá»ááºáá»á¬ážááᯠááá¯ááá¯áá¯á¶á·ááŒááºááá¯ááºáá±á¬áºáááºáž áá¯ááºáá»á ááááºáá»á¬ážááŸáááá¯ááºáááºá
áá¯á¶áááºáž: Four Ways that Enterprises Deploy LLMs | Fiddler AI Blog
Pre-trained LLM áá»á¬ážááẠá á¬áá¯á¶ážááá¯áá áºááŒá±á¬ááºážááŒáá·áºááŒááºáž ááá¯á·ááá¯áẠáá±ážááœááºážáá áºáá¯áá²á·ááá¯á·áá±á¬ á¡ááá¯áá»á¯áẠprompt ááŒáá·áºáááºáž âzero-shotâ áááºáá°ááŸá¯ááŒáá·áº ááá¬ááá¬áá¬á áá¬áž á¡áá¯ááºáá»á¬ážááœáẠáá±á¬ááºážá áœá¬ áá¯ááºáá±á¬ááºááá¯ááºáááºá
ááá¯á·áá±á¬áº á¡áá¯á¶ážááŒá¯áá°ááẠáá±ážááœááºážááᯠá¡áá±ážá ááẠáá±á¬áºááŒáá»ááºááŸáá·áº ááá°áá¬áá»á¬áž (Context) ááŒáá·áº ááá¯ááá¯áá±á¬ááºážá áœá¬ ááœá²á·á ááºážááá¯ááºááá·áºá¡áá« á¡ááŒá±ááẠááá¯ááá¯áááá»ááŒá®áž á¡áá¯á¶ážááŒá¯áá° áá»áŸá±á¬áºááá·áºáá»ááºááŸáá·áº áá®ážá ááºáá¬áááºááŒá áºáááºá á€á¡ááŒá±á¡áá±ááœáẠprompt ááœáẠááá°áá¬áá áºáá¯áᬠáá«áááºáá«á âone-shotâ áááºáá°ááŸá¯á ááá°áá¬áá»á¬ážá áœá¬ áá«áááºáá«á âfew-shotâ áááºáá°ááŸá¯ áᯠáá±á«áºáááºá Context áá«áá±á¬ prompt engineering ááẠá áááºááẠá¡áá±á¬ááºážáá¯á¶ážááŸáá·áº á ááááºáááºáá¬áá¯á¶áž áááºážáááºážááŒá áºáááºá
LLM áá»á¬ážááœáẠáááºááŒá¬ážááŸá¯á¡áá»áááºááœáẠá¡áá¯á¶ážááŒá¯áá²á·áá±á¬ áá±áá¬áá»á¬ážááá¯áᬠá¡áá¯á¶ážááŒá¯á á¡ááŒá±áá¯ááºááá¯ááºááŒááºážááá·áºáááºáá»ááºááŸááááºá áááºážááá¯á·ááẠáááºááŒá¬ážááŸá¯ááŒá®ážáá±á¬áẠááŒá áºááœá¬ážáá±á¬ á¡áá»ááºá¡áááºáá»á¬ážááᯠáááááŒáá«á ááá¯áá¹áááá á¡áá»ááºá¡áááºáá»á¬áž (áá¯áá¹ááá®áá±áá¬áá²á·ááá¯á·) ááá¯áááºáž ááááŸáááá¯ááºáá«á á€ááá·áºáááºáá»ááºááᯠRAG áááºážááá¬ááŒáá·áº ááŒá±ááŸááºážááá¯ááºááŒá®ážá prompt ááᯠá á¬ááœááºá á¬áááºáž á¡ááá¯ááºážá¡á áá»á¬ážá¡ááŒá ẠááŒááºááá±áá¬ááŒáá·áº ááá¯ážááŒáŸáá·áºáá±ážáááºá á€áááºážááá¬ááᯠVector database tools (á¥ááᬠAzure Vector Search) á០á¡áá±á¬ááºá¡áá°ááŒá¯áᬠááá°áá®áá±á¬ áá±áá¬áááºážááŒá áºáá»á¬ážá០á¡áá¯á¶ážáááºáá±á¬ á¡ááá¯ááºážá¡á áá»á¬ážááᯠááŸá¬ááœá±ááŒá®áž prompt á Context áá²ááá¯á· ááá·áºááœááºážáá±ážáááºá
á€áááºážáááºážááẠá á®ážááœá¬ážáá±ážáá¯ááºáááºážáá»á¬ážááœáẠáá±áá¬á á¡áá»ááẠááá¯á·ááá¯áẠá¡áááºážá¡ááŒá Ạááá¯á¶áá±á¬ááºááá·áºá¡áá« LLM ááᯠfine-tune ááá¯ááºáá² á¡áá¯ááºááá¬áá¡ááá¯áẠá áœááºážáá±á¬ááºááẠááá¯ážáááºá á±áááºááŸáá·áº á¡ááŸá¬ážá¡ááœááºážá á¡áá¹ááá¬ááºááŸááá±á¬ á¡ááŒá±á¬ááºážá¡áá¬áá»á¬áž ááŒá áºáá±á«áºááŸá¯ááᯠáá»á±á¬á·áááºážá á±ááẠá¡áá±á¬ááºá¡áá°ááŒá¯áááºá
Fine-tuning ááẠtransfer learning ááᯠá¡áá¯á¶ážááŒá¯á áá±á¬áºáááºááᯠdownstream task ááá¯á·ááá¯áẠá¡áá°ážááŒá¿áá¬áá áºáá¯ááᯠááŒá±ááŸááºážááẠâááá·áºáá±á¬áºá¡á±á¬ááºâ ááŒá¯áá¯ááºááŒááºážááŒá áºáááºá few-shot learning ááŸáá·áº RAG ááŸáá·áº ááœá²ááŒá¬ážááŒá®áž áá±á¬áºáááºá¡áá áºáá áºáá¯ááᯠáááºáá®ážáá±ážááŒá®áž á¡áá±ážáá»áááºáá»á¬ážááŸáá·áº bias áá»á¬ážááᯠááŒááºáááºáá±ážáááºá áááºááŒá¬ážááŸá¯ááá°áá¬áá»á¬ážááœáẠinput áá áºáᯠ(prompt) ááŸáá·áº output (completion) áá áºáá¯á á® áá«áááºááááºááŒá áºáááºá á¡á±á¬ááºáá«á¡ááŒá±á¡áá±áá»á¬ážááœáẠá€áááºážáááºážááᯠáŠážá á¬ážáá±ážááá·áºáááº-
-
Fine-tuned áá±á¬áºáááºáá»á¬ážááᯠá¡áá¯á¶ážááŒá¯ááŒááºážá á áœááºážáá±á¬ááºáááºáááºážáá±á¬ áá±á¬áºáááºáá»á¬áž (embedding áá±á¬áºáááºáá»á¬ážáá²á·ááá¯á·) ááᯠá¡áá¯á¶ážááŒá¯ááá¯áá±á¬ á á®ážááœá¬ážáá±ážáá¯ááºáááºážáá»á¬ážá¡ááœáẠá ááááºáááºáá¬ááŒá®áž ááŒááºáááºáá±á¬ ááŒá±ááŸááºážáá»áẠááŒá áºá á±áááºá
-
Latency ááᯠá ááºážá á¬ážááŒááºážá á¡áá»áááºááŸá±á¬áá·áºááŸá±ážááŸá¯ááẠá¡áá±ážááŒá®ážáá±á¬ á¡áá¯á¶ážááŒá¯ááŸá¯áá áºáá¯ááŒá áºááŒá®áž á¡ááœááºááŸááºáá»á¬ážáá±á¬ prompt áá»á¬áž ááá¯á·ááá¯áẠáá±á¬áºáááºá០áááºáá°áááá·áº ááá°áá¬á¡áá±á¡ááœááºááẠprompt á¡ááŸááºááá·áºáááºáá»ááºááŸáá·áº ááá¯ááºáá®ááŸá¯áááŸááá«áá
-
á¡áá»ááºá¡áááºá¡áá áºáá»á¬ážááŸáá·áº áá±á¬ááºáá¯á¶ážááá¬ážááŸáááŒááºážá á¡áááºá¡ááœá±ážááŒáá·áº áá±áá¬áá»á¬ážááŸáá·áº ground truth label áá»á¬ážá áœá¬ááŸáááŒá®áž á¡áá»áááºá¡ááá¯áẠáá±áá¬áá»á¬ážááᯠááááºážááááºážáá¬ážááá¯ááºáá±á¬ á¡áááºážá¡ááŒá áºáá»á¬áž ááŸááá±á¬ á á®ážááœá¬ážáá±ážáá¯ááºáááºážáá»á¬ážá
LLM ááᯠá¡á á០á áááºáááºááŒá¬ážááŒááºážááẠá¡áááºá¡áá²á¡áá»á¬ážáá¯á¶ážááŸáá·áº ááŸá¯ááºááœá±ážáá¯á¶ážáááºážáááºážááŒá áºááŒá®áž áá±áá¬á¡áá±á¡ááœáẠáá»á¬ážááŒá¬ážááŸá¯á áá»áœááºážáá»ááºáá±á¬ á¡áááºážá¡ááŒá áºáá»á¬ážááŸáá·áº ááá·áºáá±á¬áºáá±á¬ ááœááºáá»á°áá¬á áœááºážá¡á¬ážáá»á¬áž ááá¯á¡ááºáááºá á€ááœá±ážáá»ááºááŸá¯ááᯠá á®ážááœá¬ážáá±ážáá¯ááºáááºážááœáẠdomain-specific á¡áá¯á¶ážááŒá¯ááŸá¯ááŸáááŒá®áž domain-centric áá±áá¬á¡áá±á¡ááœáẠááŒá®ážáá¬ážáá±á¬á¡áá«ááœááºáᬠá ááºážá á¬ážááá·áºáááºá
LLM completion ááááºáá»á¬áž ááá¯ážáááºá á±ááẠá¡áá±á¬ááºážáá¯á¶ážáááºážáááºážá áá¬ááŒá áºááá¯ááºáá«ááá²?
- Context áá«áá±á¬ prompt engineering
- RAG
- Fine-tuned áá±á¬áºáááº
ááŒá±ááŒá¬ážáá»ááº- á ááŒá áºáá«áááºá á¡áá»áááºá á¡áááºážá¡ááŒá áºááŸáá·áº á¡áááºá¡ááœá±ážááŒáá·áº áá±áá¬áá»á¬áž ááŸááá«á fine-tuning ááẠáá±á¬ááºáá¯á¶ážááá¬ážááŸáááẠá¡áá±á¬ááºážáá¯á¶ážáááºážáááºážááŒá áºáááºá ááá¯á·áá±á¬áº á¡áá»áááºááá¯á¶áá±á¬ááºáá«á RAG ááᯠááááŠážá áœá¬ á ááºážá á¬ážááá·áºáááºá
ááá·áºá á®ážááœá¬ážáá±ážá¡ááœáẠRAG ááᯠáááºááá¯á· á¡áá¯á¶ážááŒá¯ááá¯ááºáááºááᯠááá¯ááá¯áá±á·áá¬áá«á
áá±á¬ááºážááœááºáá±á¬ á¡áá¯ááºá áááºáá°ááŸá¯ááᯠáááºáááºáá¯ááºáá±á¬ááºáá«
á€áááºáááºážá á¬ááŒá®ážáá¯á¶ážáá«á áá»áœááºá¯ááºááá¯á·á Generative AI Learning collection ááᯠááŒáá·áºááŸá¯á Generative AI á¡ááŒá±á¬ááºáž ááá¯ááá¯ááá¯ážáááºá á±áá«á
Lesson 3 ááá¯á· ááœá¬ážáá«á Generative AI ááᯠáá¬áááºááŸáá áœá¬ áááºáá±á¬ááºáááºáž ááᯠáá±á·áá¬ááá¯ááºáá«áááºá
á¡ááŒá±á¬ááºážááŒá¬ážáá»ááº
á€á
á¬áááºážááᯠAI áá¬áá¬ááŒááºáááºáá±á¬ááºááŸá¯ Co-op Translator ááŒáá·áº áá¬áá¬ááŒááºáá¬ážáá«áááºá áá»áœááºá¯ááºááá¯á·ááẠáááá»ááŸááºáááºááŸá¯á¡ááœáẠááŒáá¯ážá
á¬ážáá±á¬áºáááºáž á¡ááá¯á¡áá»á±á¬áẠáá¬áá¬ááŒááºááŒááºážááœáẠá¡ááŸá¬ážáá»á¬áž ááá¯á·ááá¯áẠááŸá¬ážááœááºážáá»ááºáá»á¬áž áá«áááºááá¯ááºááŒá±á¬ááºáž áááááŒá¯áá«ááẠáá±áá¹áá¬áááºáá¶á¡ááºáá«áááºá áá°áááºážá
á¬áááºážááᯠáááááá¬áá¬á
áá¬ážááŒáá·áºáᬠááá¬ážáááºá¡áá»ááºá¡áááºá¡ááŒá
Ạáá°áááá·áºáá«áááºá á¡áá±ážááŒá®ážáá±á¬ á¡áá»ááºá¡áááºáá»á¬ážá¡ááœáẠáá°á·ááá¬ááŸááºáá»á¬ážá ááá±á¬áºáááºááŸááºááẠáá¬áá¬ááŒááºááŒááºážááᯠá¡ááŒá¶ááŒá¯áá«áááºá á€áá¬áá¬ááŒááºáá»ááºááᯠá¡áá¯á¶ážááŒá¯áá¬á០ááŒá
áºáá±á«áºáá¬ááá¯ááºááá·áº áá¬ážáááºááŸá¯ááŸá¬ážááœááºážááŸá¯áá»á¬ážá¡ááœáẠáá»áœááºá¯ááºááá¯á·ááẠáá¬áááºááá¶áá«á











