๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํด ์์ฑ AI ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ตฌ์ถํ ๋๋ ์๋ก์ด ๋์ ๊ณผ์ ๊ฐ ์๊น๋๋ค. ํต์ฌ ๋ฌธ์ ๋ ์ฃผ์ด์ง ์ฌ์ฉ์ ์์ฒญ์ ๋ํด ๋ชจ๋ธ์ด ์์ฑํ๋ ์ฝํ ์ธ ์ ์๋ต ํ์ง(์ ํ์ฑ๊ณผ ์ ํฉ์ฑ)์ ๋ณด์ฅํ๋ ๊ฒ์ ๋๋ค. ์ด์ ๊ฐ์์์๋ ๊ธฐ์กด ๋ชจ๋ธ์ ๋ํ ํ๋กฌํํธ ์ ๋ ฅ์ ์์ ํ๋ ๋ฐฉ์์ผ๋ก ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ค๋ ํ๋กฌํํธ ์์ง๋์ด๋ง๊ณผ ๊ฒ์ ๋ณด๊ฐ ์์ฑ ๊ฐ์ ๊ธฐ๋ฒ์ ๋ค๋ค์ต๋๋ค.
์ค๋ ๊ฐ์์์๋ ์ธ ๋ฒ์งธ ๊ธฐ๋ฒ์ธ ๋ฏธ์ธ ์กฐ์ (fine-tuning) ์ ๋ํด ์ด์ผ๊ธฐํฉ๋๋ค. ์ด๋ ์ถ๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด ๋ชจ๋ธ ์์ฒด๋ฅผ ์ฌํ์ต ์์ผ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ค๋ ๋ฐฉ๋ฒ์ ๋๋ค. ์์ธํ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
์ด๋ฒ ๊ฐ์์์๋ ์ฌ์ ํ์ต๋ ์ธ์ด ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ๊ฐ๋ ์ ์๊ฐํ๊ณ , ์ด ์ ๊ทผ๋ฒ์ ์ฅ์ ๊ณผ ํ๊ณ๋ฅผ ํ๊ตฌํ๋ฉฐ, ์์ฑ AI ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํด ์ธ์ ์ด๋ป๊ฒ ๋ฏธ์ธ ์กฐ์ ์ ํ์ฉํ ์ง ์๋ดํฉ๋๋ค.
๊ฐ์๋ฅผ ๋ง์น๋ฉด ๋ค์ ์ง๋ฌธ์ ๋ตํ ์ ์์ด์ผ ํฉ๋๋ค:
- ์ธ์ด ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ์ด๋ ๋ฌด์์ธ๊ฐ?
- ์ธ์ , ์ ๋ฏธ์ธ ์กฐ์ ์ด ์ ์ฉํ๊ฐ?
- ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ์ด๋ป๊ฒ ๋ฏธ์ธ ์กฐ์ ํ ์ ์๋?
- ๋ฏธ์ธ ์กฐ์ ์ ํ๊ณ๋ ๋ฌด์์ธ๊ฐ?
์ค๋น๋์๋์? ์์ํด๋ด ์๋ค.
๋ณธ๊ฒฉ์ ์ผ๋ก ์์ํ๊ธฐ ์ ์ ์ด๋ฒ ๊ฐ์์์ ๋ค๋ฃฐ ๋ด์ฉ์ ํ๋์ ๋ณด๊ณ ์ถ๋์? ๋ฏธ์ธ ์กฐ์ ์ ํต์ฌ ๊ฐ๋ ๊ณผ ๋๊ธฐ๋ถํฐ ๋ฏธ์ธ ์กฐ์ ์์ ์ ๊ณผ์ ๊ณผ ๋ชจ๋ฒ ์ฌ๋ก๊น์ง ํ์ต ์ฌ์ ์ ์ค๋ช ํ๋ ๊ทธ๋ฆผ ๊ฐ์ด๋๋ฅผ ํ์ธํด๋ณด์ธ์. ํฅ๋ฏธ๋ก์ด ์ฃผ์ ์ด๋, ์๊ธฐ ์ฃผ๋ ํ์ต์ ์ง์ํ๋ ์ถ๊ฐ ๋งํฌ๊ฐ ์๋ Resources ํ์ด์ง๋ ๊ผญ ์ฐธ๊ณ ํ์ธ์!
๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ธํฐ๋ท์ ํฌํจํ ๋ค์ํ ์ถ์ฒ์์ ์์งํ ๋ฐฉ๋ํ ํ ์คํธ๋ก ์ฌ์ ํ์ต ๋์ด ์์ต๋๋ค. ์ด์ ๊ฐ์์์ ๋ฐฐ์ ๋ฏ์ด, ์ฌ์ฉ์์ ์ง๋ฌธ("ํ๋กฌํํธ")์ ๋ํ ๋ชจ๋ธ ์๋ต ํ์ง์ ๋์ด๊ธฐ ์ํด _ํ๋กฌํํธ ์์ง๋์ด๋ง_๊ณผ ๊ฒ์ ๋ณด๊ฐ ์์ฑ ๊ฐ์ ๊ธฐ๋ฒ์ด ํ์ํฉ๋๋ค.
ํ๋กฌํํธ ์์ง๋์ด๋ง์ ์ธ๊ธฐ ๊ธฐ๋ฒ ์ค ํ๋๋ ๋ชจ๋ธ์๊ฒ ์๋ต์ ๊ธฐ๋ํ๋ ๋ฐ๋ฅผ ๋ ๋ช ํํ ์๋ดํ๋ ๊ฒ์ ๋๋ค. ์ด๋ _๋ช ์์ ์ง์นจ_์ ์ ๊ณตํ๊ฑฐ๋ _๋ช ๊ฐ์ง ์์_๋ฅผ ๋ณด์ฌ์ฃผ๋(์๋ฌต์ ์ง์นจ) ๋ฐฉ์์ผ๋ก, ์ด๋ฅผ _few-shot learning_์ด๋ผ ๋ถ๋ฆ ๋๋ค. ํ์ง๋ง ๋ ๊ฐ์ง ํ๊ณ๊ฐ ์์ต๋๋ค:
- ๋ชจ๋ธ์ ํ ํฐ ์ ํ ๋๋ฌธ์ ์ ๊ณตํ ์ ์๋ ์์ ์๊ฐ ์ ํ๋๊ณ , ํจ๊ณผ๊ฐ ๋จ์ด์ง ์ ์์ต๋๋ค.
- ๋งค ํ๋กฌํํธ๋ง๋ค ์์๋ฅผ ์ถ๊ฐํ๋ฉด ํ ํฐ ๋น์ฉ์ด ๋์์ ธ ๋น์ฉ ๋ถ๋ด๊ณผ ์ ์ฐ์ฑ ์ ํ์ด ์๊น๋๋ค.
๋ฏธ์ธ ์กฐ์ ์ ๋จธ์ ๋ฌ๋ ์์คํ ์์ ํํ ์ฐ์ด๋ ๋ฐฉ๋ฒ์ผ๋ก, ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ํน์ ์์ ์ ๋ง๊ฒ ์๋ก์ด ๋ฐ์ดํฐ๋ก ์ฌํ์ต์์ผ ์ฑ๋ฅ์ ๊ฐ์ ํ๋ ๊ฒ์ ๋๋ค. ์ธ์ด ๋ชจ๋ธ์ ๊ฒฝ์ฐ, ํน์ ์์ ์ด๋ ์์ฉ ๋ถ์ผ์ ๋ง์ถ _์ ๋ณ๋ ์์ ์งํฉ_์ผ๋ก ์ฌ์ ํ์ต ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํด, ํด๋น ์์ ์ด๋ ๋ถ์ผ์ ๋ ์ ํํ๊ณ ์ ํฉํ ๋ง์ถคํ ๋ชจ๋ธ์ ๋ง๋ค ์ ์์ต๋๋ค. ๋ถ๊ฐ์ ์ผ๋ก, ๋ฏธ์ธ ์กฐ์ ์ few-shot learning์ ํ์ํ ์์ ์๋ฅผ ์ค์ฌ ํ ํฐ ์ฌ์ฉ๋๊ณผ ๋น์ฉ์ ์ ๊ฐํ๋ ํจ๊ณผ๋ ์์ต๋๋ค.
์ฌ๊ธฐ์ ๋งํ๋ ๋ฏธ์ธ ์กฐ์ ์ ์๋ ํ์ต ๋ฐ์ดํฐ์ ํฌํจ๋์ง ์์ ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐํด ์ฌํ์ตํ๋ ๊ฐ๋ ํ์ต(supervised) ๋ฏธ์ธ ์กฐ์ ์ ์๋ฏธํฉ๋๋ค. ์ด๋ ์๋ณธ ๋ฐ์ดํฐ๋ก ํ์ดํผํ๋ผ๋ฏธํฐ๋ง ๋ฐ๊ฟ ์ฌํ์ตํ๋ ๋น๊ฐ๋ ํ์ต(unsupervised) ๋ฏธ์ธ ์กฐ์ ๊ณผ๋ ๋ค๋ฆ ๋๋ค.
์ค์ํ ์ ์ ๋ฏธ์ธ ์กฐ์ ์ด ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ์ํด ์ผ์ ์์ค์ ์ ๋ฌธ ์ง์์ด ํ์ํ ๊ณ ๊ธ ๊ธฐ๋ฒ์ด๋ผ๋ ๊ฒ์ ๋๋ค. ์๋ชป ์ํํ๋ฉด ๊ธฐ๋ํ ๊ฐ์ ํจ๊ณผ๊ฐ ์๊ฑฐ๋, ์คํ๋ ค ๋์ ๋๋ฉ์ธ์์ ๋ชจ๋ธ ์ฑ๋ฅ์ด ์ ํ๋ ์ ์์ต๋๋ค.
๋ฐ๋ผ์ "์ด๋ป๊ฒ" ๋ฏธ์ธ ์กฐ์ ํ ์ง ๋ฐฐ์ฐ๊ธฐ ์ ์, ์ ์ด ๋ฐฉ๋ฒ์ ์ ํํด์ผ ํ๋์ง, ์ธ์ ๋ฏธ์ธ ์กฐ์ ์ ์์ํด์ผ ํ๋์ง ๋จผ์ ์์์ผ ํฉ๋๋ค. ๋ค์ ์ง๋ฌธ์ ์ค์ค๋ก์๊ฒ ๋์ ธ๋ณด์ธ์:
- ์ฌ์ฉ ์ฌ๋ก: ๋ฏธ์ธ ์กฐ์ ์ ํ๋ ค๋ _์ฌ์ฉ ์ฌ๋ก_๋ ๋ฌด์์ธ๊ฐ? ํ์ฌ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ์ด๋ค ๋ถ๋ถ์ ๊ฐ์ ํ๊ณ ์ถ์๊ฐ?
- ๋์: ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ์ํด _๋ค๋ฅธ ๊ธฐ๋ฒ_์ ์๋ํด๋ดค๋๊ฐ? ์ด๋ฅผ ๊ธฐ์ค์ ์ผ๋ก ์ผ์ ๋น๊ตํด๋ณด์.
- ํ๋กฌํํธ ์์ง๋์ด๋ง: ๊ด๋ จ ์์๋ฅผ ํฌํจํ few-shot ํ๋กฌํํธ ๊ธฐ๋ฒ์ ์๋ํด๋ณด๊ณ ์๋ต ํ์ง์ ํ๊ฐํด๋ณด์.
- ๊ฒ์ ๋ณด๊ฐ ์์ฑ: ๋ฐ์ดํฐ ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ํ๋กฌํํธ์ ์ถ๊ฐํด๋ณด๊ณ ์๋ต ํ์ง์ ํ๊ฐํด๋ณด์.
- ๋น์ฉ: ๋ฏธ์ธ ์กฐ์ ์ ๋๋ ๋น์ฉ์ ํ์
ํ๋๊ฐ?
- ์กฐ์ ๊ฐ๋ฅ์ฑ - ์ฌ์ ํ์ต ๋ชจ๋ธ์ด ๋ฏธ์ธ ์กฐ์ ๊ฐ๋ฅํ๊ฐ?
- ๋ ธ๋ ฅ - ํ์ต ๋ฐ์ดํฐ ์ค๋น, ๋ชจ๋ธ ํ๊ฐ ๋ฐ ๊ฐ์ ์ ํ์ํ ๋ ธ๋ ฅ
- ์ปดํจํ - ๋ฏธ์ธ ์กฐ์ ์์ ์คํ๊ณผ ๋ฏธ์ธ ์กฐ์ ๋ชจ๋ธ ๋ฐฐํฌ์ ํ์ํ ์์
- ๋ฐ์ดํฐ - ๋ฏธ์ธ ์กฐ์ ํจ๊ณผ๋ฅผ ๋ผ ์ ์๋ ์ถฉ๋ถํ ํ์ง์ ์์ ํ๋ณด ์ฌ๋ถ
- ์ด์ : ๋ฏธ์ธ ์กฐ์ ์ ์ด์ ์ ํ์ธํ๋๊ฐ?
- ํ์ง - ๋ฏธ์ธ ์กฐ์ ๋ชจ๋ธ์ด ๊ธฐ์ค์ ๋ชจ๋ธ๋ณด๋ค ์ฑ๋ฅ์ด ๋ฐ์ด๋๊ฐ?
- ๋น์ฉ - ํ๋กฌํํธ๋ฅผ ๋จ์ํํด ํ ํฐ ์ฌ์ฉ๋์ ์ค์ผ ์ ์๋๊ฐ?
- ํ์ฅ์ฑ - ๊ธฐ๋ณธ ๋ชจ๋ธ์ ์๋ก์ด ๋๋ฉ์ธ์ ์ฌํ์ฉํ ์ ์๋๊ฐ?
์ด ์ง๋ฌธ๋ค์ ๋ตํ๋ฉด ๋ฏธ์ธ ์กฐ์ ์ด ์ ํฉํ์ง ํ๋จํ ์ ์์ต๋๋ค. ์ด์์ ์ผ๋ก๋ ์ด์ ์ด ๋น์ฉ์ ์ํํ ๋๋ง ๋ฏธ์ธ ์กฐ์ ์ด ํ๋นํฉ๋๋ค. ์งํํ๊ธฐ๋ก ๊ฒฐ์ ํ๋ค๋ฉด, ์ด์ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ์ด๋ป๊ฒ ๋ฏธ์ธ ์กฐ์ ํ ์ง ๊ณ ๋ฏผํ ์ฐจ๋ก์ ๋๋ค.
๊ฒฐ์ ๊ณผ์ ์ ๋ํ ๋ ๋ง์ ์ธ์ฌ์ดํธ๊ฐ ํ์ํ๋ค๋ฉด To fine-tune or not to fine-tune ์์์ ์ฐธ๊ณ ํ์ธ์.
์ฌ์ ํ์ต ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ๋ ค๋ฉด ๋ค์์ด ํ์ํฉ๋๋ค:
- ๋ฏธ์ธ ์กฐ์ ํ ์ฌ์ ํ์ต ๋ชจ๋ธ
- ๋ฏธ์ธ ์กฐ์ ์ ์ฌ์ฉํ ๋ฐ์ดํฐ์
- ๋ฏธ์ธ ์กฐ์ ์์ ์ ์คํํ ํ์ต ํ๊ฒฝ
- ๋ฏธ์ธ ์กฐ์ ๋ ๋ชจ๋ธ์ ๋ฐฐํฌํ ํธ์คํ ํ๊ฒฝ
์๋ ๋ฆฌ์์ค๋ค์ ์ ๋ณ๋ ๋ฐ์ดํฐ์ ๊ณผ ํน์ ๋ชจ๋ธ์ ์ฌ์ฉํด ์ค์ ์์ ๋ฅผ ๋จ๊ณ๋ณ๋ก ์๋ดํ๋ ํํ ๋ฆฌ์ผ์ ๋๋ค. ์ด ํํ ๋ฆฌ์ผ์ ๋ฐ๋ผ ํ๋ ค๋ฉด ํด๋น ์ ๊ณต์์ ๊ณ์ ๊ณผ ๊ด๋ จ ๋ชจ๋ธ ๋ฐ ๋ฐ์ดํฐ์ ์ ๋ํ ์ ๊ทผ ๊ถํ์ด ํ์ํฉ๋๋ค.
| ์ ๊ณต์ | ํํ ๋ฆฌ์ผ | ์ค๋ช |
|---|---|---|
| OpenAI | How to fine-tune chat models | gpt-35-turbo ๋ชจ๋ธ์ ํน์ ๋๋ฉ์ธ("๋ ์ํผ ์ด์์คํดํธ")์ ๋ง๊ฒ ๋ฏธ์ธ ์กฐ์ ํ๋ ๋ฐฉ๋ฒ์ ๋ฐฐ์๋๋ค. ํ์ต ๋ฐ์ดํฐ ์ค๋น, ๋ฏธ์ธ ์กฐ์ ์์
์คํ, ๋ฏธ์ธ ์กฐ์ ๋ชจ๋ธ์ ์ฌ์ฉํ ์ถ๋ก ๊ณผ์ ์ ๋ค๋ฃน๋๋ค. |
| Azure OpenAI | GPT 3.5 Turbo fine-tuning tutorial | Azure ํ๊ฒฝ์์ gpt-35-turbo-0613 ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ๋ ๋ฐฉ๋ฒ์ ๋ฐฐ์๋๋ค. ํ์ต ๋ฐ์ดํฐ ์์ฑ ๋ฐ ์
๋ก๋, ๋ฏธ์ธ ์กฐ์ ์์
์คํ, ์ ๋ชจ๋ธ ๋ฐฐํฌ ๋ฐ ์ฌ์ฉ ๋จ๊ณ๋ฅผ ํฌํจํฉ๋๋ค. |
| Hugging Face | Fine-tuning LLMs with Hugging Face | ์คํ LLM(์: CodeLlama 7B)์ transformers ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ Transformer Reinforcement Learning (TRL)์ผ๋ก ๋ฏธ์ธ ์กฐ์ ํ๋ ๊ณผ์ ์ ๋ค๋ฃน๋๋ค. Hugging Face์ ๊ณต๊ฐ ๋ฐ์ดํฐ์
๋ ํ์ฉํฉ๋๋ค. |
| ๐ค AutoTrain | Fine-tuning LLMs with AutoTrain | AutoTrain(๋๋ AutoTrain Advanced)์ Hugging Face์์ ๊ฐ๋ฐํ ํ์ด์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ๋ค์ํ ์์ ์ ๋ํด LLM ๋ฏธ์ธ ์กฐ์ ์ ์ง์ํฉ๋๋ค. ์ฝ๋ ์์ฑ ์์ด๋ ๋ฏธ์ธ ์กฐ์ ์ด ๊ฐ๋ฅํ๋ฉฐ, ํด๋ผ์ฐ๋, Hugging Face Spaces, ๋ก์ปฌ ํ๊ฒฝ์์ ์คํํ ์ ์์ต๋๋ค. ์น ๊ธฐ๋ฐ GUI, CLI, yaml ๊ตฌ์ฑ ํ์ผ์ ํตํ ํ์ต๋ ์ง์ํฉ๋๋ค. |
์ ํํ ๋ฆฌ์ผ ์ค ํ๋๋ฅผ ์ ํํด ๋ฐ๋ผ ํด๋ณด์ธ์. ์ด ์ ์ฅ์ ๋ด Jupyter Notebook ๋ฒ์ ์ผ๋ก ์ฐธ๊ณ ์ฉ ๋ณต์ ๋ณธ์ ์ ๊ณตํ ์ ์์ผ๋, ์ต์ ๋ฒ์ ์ ๋ฐ๋์ ์๋ณธ ์์ค๋ฅผ ์ง์ ์ด์ฉํ์๊ธฐ ๋ฐ๋๋๋ค.
์ด๋ฒ ๊ฐ์๋ฅผ ๋ง์น ํ์๋ Generative AI Learning collection์์ ์์ฑ AI ์ง์์ ๊ณ์ ํ์ฅํด๋ณด์ธ์!
์ถํํฉ๋๋ค!! ์ด ๊ณผ์ ์ v2 ์๋ฆฌ์ฆ ๋ง์ง๋ง ๊ฐ์๋ฅผ ์๋ฃํ์ จ์ต๋๋ค! ํ์ต๊ณผ ๊ฐ๋ฐ์ ๋ฉ์ถ์ง ๋ง์ธ์. **์ด๋ฒ ์ฃผ์ ์ ๊ดํ ์ถ๊ฐ ์ ์ ๋ชฉ๋ก์ RESOURCES ํ์ด์ง์์ ํ์ธํ ์ ์์ต๋๋ค.
๋ํ v1 ์๋ฆฌ์ฆ ๊ฐ์๋ ๊ณผ์ ์ ๊ฐ๋ ์ด ์ ๋ฐ์ดํธ๋์์ต๋๋ค. ์ ์ ์๊ฐ์ ๋ด์ด ์ง์์ ์๋กญ๊ฒ ๋ค์ ธ๋ณด์๊ณ , ์ง๋ฌธ๊ณผ ํผ๋๋ฐฑ์ ๊ณต์ ํด ์ฃผ์๋ฉด ์ปค๋ฎค๋ํฐ๋ฅผ ์ํ ๊ฐ์ ๊ฐ์ ์ ํฐ ๋์์ด ๋ฉ๋๋ค.
๋ฉด์ฑ
์กฐํญ:
์ด ๋ฌธ์๋ AI ๋ฒ์ญ ์๋น์ค Co-op Translator๋ฅผ ์ฌ์ฉํ์ฌ ๋ฒ์ญ๋์์ต๋๋ค. ์ ํ์ฑ์ ์ํด ์ต์ ์ ๋คํ๊ณ ์์ผ๋, ์๋ ๋ฒ์ญ์๋ ์ค๋ฅ๋ ๋ถ์ ํํ ๋ถ๋ถ์ด ์์ ์ ์์์ ์ ์ํด ์ฃผ์๊ธฐ ๋ฐ๋๋๋ค. ์๋ฌธ์ ํด๋น ์ธ์ด์ ์๋ณธ ๋ฌธ์๊ฐ ๊ถ์ ์๋ ์ถ์ฒ๋ก ๊ฐ์ฃผ๋์ด์ผ ํฉ๋๋ค. ์ค์ํ ์ ๋ณด์ ๊ฒฝ์ฐ ์ ๋ฌธ์ ์ธ ์ธ๊ฐ ๋ฒ์ญ์ ๊ถ์ฅํฉ๋๋ค. ๋ณธ ๋ฒ์ญ ์ฌ์ฉ์ผ๋ก ์ธํด ๋ฐ์ํ๋ ์คํด๋ ์๋ชป๋ ํด์์ ๋ํด ๋น์ฌ๋ ์ฑ
์์ ์ง์ง ์์ต๋๋ค.

