Skip to content

Latest commit

ย 

History

History
109 lines (73 loc) ยท 14 KB

File metadata and controls

109 lines (73 loc) ยท 14 KB

Open Source Models

LLM ๋ฏธ์„ธ ์กฐ์ •ํ•˜๊ธฐ

๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด ์ƒ์„ฑ AI ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๊ตฌ์ถ•ํ•  ๋•Œ๋Š” ์ƒˆ๋กœ์šด ๋„์ „ ๊ณผ์ œ๊ฐ€ ์ƒ๊น๋‹ˆ๋‹ค. ํ•ต์‹ฌ ๋ฌธ์ œ๋Š” ์ฃผ์–ด์ง„ ์‚ฌ์šฉ์ž ์š”์ฒญ์— ๋Œ€ํ•ด ๋ชจ๋ธ์ด ์ƒ์„ฑํ•˜๋Š” ์ฝ˜ํ…์ธ ์˜ ์‘๋‹ต ํ’ˆ์งˆ(์ •ํ™•์„ฑ๊ณผ ์ ํ•ฉ์„ฑ)์„ ๋ณด์žฅํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด์ „ ๊ฐ•์˜์—์„œ๋Š” ๊ธฐ์กด ๋ชจ๋ธ์— ๋Œ€ํ•œ ํ”„๋กฌํ”„ํŠธ ์ž…๋ ฅ์„ ์ˆ˜์ •ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋ ค๋Š” ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง๊ณผ ๊ฒ€์ƒ‰ ๋ณด๊ฐ• ์ƒ์„ฑ ๊ฐ™์€ ๊ธฐ๋ฒ•์„ ๋‹ค๋ค˜์Šต๋‹ˆ๋‹ค.

์˜ค๋Š˜ ๊ฐ•์˜์—์„œ๋Š” ์„ธ ๋ฒˆ์งธ ๊ธฐ๋ฒ•์ธ ๋ฏธ์„ธ ์กฐ์ •(fine-tuning) ์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ถ”๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•ด ๋ชจ๋ธ ์ž์ฒด๋ฅผ ์žฌํ•™์Šต ์‹œ์ผœ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋ ค๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ์ž์„ธํžˆ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

ํ•™์Šต ๋ชฉํ‘œ

์ด๋ฒˆ ๊ฐ•์˜์—์„œ๋Š” ์‚ฌ์ „ ํ•™์Šต๋œ ์–ธ์–ด ๋ชจ๋ธ์˜ ๋ฏธ์„ธ ์กฐ์ • ๊ฐœ๋…์„ ์†Œ๊ฐœํ•˜๊ณ , ์ด ์ ‘๊ทผ๋ฒ•์˜ ์žฅ์ ๊ณผ ํ•œ๊ณ„๋ฅผ ํƒ๊ตฌํ•˜๋ฉฐ, ์ƒ์„ฑ AI ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ์–ธ์ œ ์–ด๋–ป๊ฒŒ ๋ฏธ์„ธ ์กฐ์ •์„ ํ™œ์šฉํ• ์ง€ ์•ˆ๋‚ดํ•ฉ๋‹ˆ๋‹ค.

๊ฐ•์˜๋ฅผ ๋งˆ์น˜๋ฉด ๋‹ค์Œ ์งˆ๋ฌธ์— ๋‹ตํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค:

  • ์–ธ์–ด ๋ชจ๋ธ์˜ ๋ฏธ์„ธ ์กฐ์ •์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€?
  • ์–ธ์ œ, ์™œ ๋ฏธ์„ธ ์กฐ์ •์ด ์œ ์šฉํ•œ๊ฐ€?
  • ์‚ฌ์ „ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ์–ด๋–ป๊ฒŒ ๋ฏธ์„ธ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ๋‚˜?
  • ๋ฏธ์„ธ ์กฐ์ •์˜ ํ•œ๊ณ„๋Š” ๋ฌด์—‡์ธ๊ฐ€?

์ค€๋น„๋˜์—ˆ๋‚˜์š”? ์‹œ์ž‘ํ•ด๋ด…์‹œ๋‹ค.

๊ทธ๋ฆผ์œผ๋กœ ๋ณด๋Š” ๊ฐ€์ด๋“œ

๋ณธ๊ฒฉ์ ์œผ๋กœ ์‹œ์ž‘ํ•˜๊ธฐ ์ „์— ์ด๋ฒˆ ๊ฐ•์˜์—์„œ ๋‹ค๋ฃฐ ๋‚ด์šฉ์„ ํ•œ๋ˆˆ์— ๋ณด๊ณ  ์‹ถ๋‚˜์š”? ๋ฏธ์„ธ ์กฐ์ •์˜ ํ•ต์‹ฌ ๊ฐœ๋…๊ณผ ๋™๊ธฐ๋ถ€ํ„ฐ ๋ฏธ์„ธ ์กฐ์ • ์ž‘์—…์˜ ๊ณผ์ •๊ณผ ๋ชจ๋ฒ” ์‚ฌ๋ก€๊นŒ์ง€ ํ•™์Šต ์—ฌ์ •์„ ์„ค๋ช…ํ•˜๋Š” ๊ทธ๋ฆผ ๊ฐ€์ด๋“œ๋ฅผ ํ™•์ธํ•ด๋ณด์„ธ์š”. ํฅ๋ฏธ๋กœ์šด ์ฃผ์ œ์ด๋‹ˆ, ์ž๊ธฐ ์ฃผ๋„ ํ•™์Šต์„ ์ง€์›ํ•˜๋Š” ์ถ”๊ฐ€ ๋งํฌ๊ฐ€ ์žˆ๋Š” Resources ํŽ˜์ด์ง€๋„ ๊ผญ ์ฐธ๊ณ ํ•˜์„ธ์š”!

Illustrated Guide to Fine Tuning Language Models

์–ธ์–ด ๋ชจ๋ธ์˜ ๋ฏธ์„ธ ์กฐ์ •์ด๋ž€?

๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์€ ์ธํ„ฐ๋„ท์„ ํฌํ•จํ•œ ๋‹ค์–‘ํ•œ ์ถœ์ฒ˜์—์„œ ์ˆ˜์ง‘ํ•œ ๋ฐฉ๋Œ€ํ•œ ํ…์ŠคํŠธ๋กœ ์‚ฌ์ „ ํ•™์Šต ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์ „ ๊ฐ•์˜์—์„œ ๋ฐฐ์› ๋“ฏ์ด, ์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ("ํ”„๋กฌํ”„ํŠธ")์— ๋Œ€ํ•œ ๋ชจ๋ธ ์‘๋‹ต ํ’ˆ์งˆ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด _ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง_๊ณผ ๊ฒ€์ƒ‰ ๋ณด๊ฐ• ์ƒ์„ฑ ๊ฐ™์€ ๊ธฐ๋ฒ•์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์˜ ์ธ๊ธฐ ๊ธฐ๋ฒ• ์ค‘ ํ•˜๋‚˜๋Š” ๋ชจ๋ธ์—๊ฒŒ ์‘๋‹ต์— ๊ธฐ๋Œ€ํ•˜๋Š” ๋ฐ”๋ฅผ ๋” ๋ช…ํ™•ํžˆ ์•ˆ๋‚ดํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Š” _๋ช…์‹œ์  ์ง€์นจ_์„ ์ œ๊ณตํ•˜๊ฑฐ๋‚˜ _๋ช‡ ๊ฐ€์ง€ ์˜ˆ์‹œ_๋ฅผ ๋ณด์—ฌ์ฃผ๋Š”(์•”๋ฌต์  ์ง€์นจ) ๋ฐฉ์‹์œผ๋กœ, ์ด๋ฅผ _few-shot learning_์ด๋ผ ๋ถ€๋ฆ…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๋‘ ๊ฐ€์ง€ ํ•œ๊ณ„๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค:

  • ๋ชจ๋ธ์˜ ํ† ํฐ ์ œํ•œ ๋•Œ๋ฌธ์— ์ œ๊ณตํ•  ์ˆ˜ ์žˆ๋Š” ์˜ˆ์‹œ ์ˆ˜๊ฐ€ ์ œํ•œ๋˜๊ณ , ํšจ๊ณผ๊ฐ€ ๋–จ์–ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋งค ํ”„๋กฌํ”„ํŠธ๋งˆ๋‹ค ์˜ˆ์‹œ๋ฅผ ์ถ”๊ฐ€ํ•˜๋ฉด ํ† ํฐ ๋น„์šฉ์ด ๋†’์•„์ ธ ๋น„์šฉ ๋ถ€๋‹ด๊ณผ ์œ ์—ฐ์„ฑ ์ œํ•œ์ด ์ƒ๊น๋‹ˆ๋‹ค.

๋ฏธ์„ธ ์กฐ์ •์€ ๋จธ์‹ ๋Ÿฌ๋‹ ์‹œ์Šคํ…œ์—์„œ ํ”ํžˆ ์“ฐ์ด๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ, ์‚ฌ์ „ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ํŠน์ • ์ž‘์—…์— ๋งž๊ฒŒ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋กœ ์žฌํ•™์Šต์‹œ์ผœ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์–ธ์–ด ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, ํŠน์ • ์ž‘์—…์ด๋‚˜ ์‘์šฉ ๋ถ„์•ผ์— ๋งž์ถ˜ _์„ ๋ณ„๋œ ์˜ˆ์‹œ ์ง‘ํ•ฉ_์œผ๋กœ ์‚ฌ์ „ ํ•™์Šต ๋ชจ๋ธ์„ ๋ฏธ์„ธ ์กฐ์ •ํ•ด, ํ•ด๋‹น ์ž‘์—…์ด๋‚˜ ๋ถ„์•ผ์— ๋” ์ •ํ™•ํ•˜๊ณ  ์ ํ•ฉํ•œ ๋งž์ถคํ˜• ๋ชจ๋ธ์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ถ€๊ฐ€์ ์œผ๋กœ, ๋ฏธ์„ธ ์กฐ์ •์€ few-shot learning์— ํ•„์š”ํ•œ ์˜ˆ์‹œ ์ˆ˜๋ฅผ ์ค„์—ฌ ํ† ํฐ ์‚ฌ์šฉ๋Ÿ‰๊ณผ ๋น„์šฉ์„ ์ ˆ๊ฐํ•˜๋Š” ํšจ๊ณผ๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

์–ธ์ œ, ์™œ ๋ชจ๋ธ์„ ๋ฏธ์„ธ ์กฐ์ •ํ•ด์•ผ ํ• ๊นŒ?

์—ฌ๊ธฐ์„œ ๋งํ•˜๋Š” ๋ฏธ์„ธ ์กฐ์ •์€ ์›๋ž˜ ํ•™์Šต ๋ฐ์ดํ„ฐ์— ํฌํ•จ๋˜์ง€ ์•Š์€ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”๊ฐ€ํ•ด ์žฌํ•™์Šตํ•˜๋Š” ๊ฐ๋… ํ•™์Šต(supervised) ๋ฏธ์„ธ ์กฐ์ •์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์›๋ณธ ๋ฐ์ดํ„ฐ๋กœ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ ๋ฐ”๊ฟ” ์žฌํ•™์Šตํ•˜๋Š” ๋น„๊ฐ๋… ํ•™์Šต(unsupervised) ๋ฏธ์„ธ ์กฐ์ •๊ณผ๋Š” ๋‹ค๋ฆ…๋‹ˆ๋‹ค.

์ค‘์š”ํ•œ ์ ์€ ๋ฏธ์„ธ ์กฐ์ •์ด ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ์–ป๊ธฐ ์œ„ํ•ด ์ผ์ • ์ˆ˜์ค€์˜ ์ „๋ฌธ ์ง€์‹์ด ํ•„์š”ํ•œ ๊ณ ๊ธ‰ ๊ธฐ๋ฒ•์ด๋ผ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ž˜๋ชป ์ˆ˜ํ–‰ํ•˜๋ฉด ๊ธฐ๋Œ€ํ•œ ๊ฐœ์„  ํšจ๊ณผ๊ฐ€ ์—†๊ฑฐ๋‚˜, ์˜คํžˆ๋ ค ๋Œ€์ƒ ๋„๋ฉ”์ธ์—์„œ ๋ชจ๋ธ ์„ฑ๋Šฅ์ด ์ €ํ•˜๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ "์–ด๋–ป๊ฒŒ" ๋ฏธ์„ธ ์กฐ์ •ํ• ์ง€ ๋ฐฐ์šฐ๊ธฐ ์ „์—, ์™œ ์ด ๋ฐฉ๋ฒ•์„ ์„ ํƒํ•ด์•ผ ํ•˜๋Š”์ง€, ์–ธ์ œ ๋ฏธ์„ธ ์กฐ์ •์„ ์‹œ์ž‘ํ•ด์•ผ ํ•˜๋Š”์ง€ ๋จผ์ € ์•Œ์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์Œ ์งˆ๋ฌธ์„ ์Šค์Šค๋กœ์—๊ฒŒ ๋˜์ ธ๋ณด์„ธ์š”:

  • ์‚ฌ์šฉ ์‚ฌ๋ก€: ๋ฏธ์„ธ ์กฐ์ •์„ ํ•˜๋ ค๋Š” _์‚ฌ์šฉ ์‚ฌ๋ก€_๋Š” ๋ฌด์—‡์ธ๊ฐ€? ํ˜„์žฌ ์‚ฌ์ „ ํ•™์Šต ๋ชจ๋ธ์˜ ์–ด๋–ค ๋ถ€๋ถ„์„ ๊ฐœ์„ ํ•˜๊ณ  ์‹ถ์€๊ฐ€?
  • ๋Œ€์•ˆ: ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ์–ป๊ธฐ ์œ„ํ•ด _๋‹ค๋ฅธ ๊ธฐ๋ฒ•_์„ ์‹œ๋„ํ•ด๋ดค๋Š”๊ฐ€? ์ด๋ฅผ ๊ธฐ์ค€์„ ์œผ๋กœ ์‚ผ์•„ ๋น„๊ตํ•ด๋ณด์ž.
    • ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง: ๊ด€๋ จ ์˜ˆ์‹œ๋ฅผ ํฌํ•จํ•œ few-shot ํ”„๋กฌํ”„ํŠธ ๊ธฐ๋ฒ•์„ ์‹œ๋„ํ•ด๋ณด๊ณ  ์‘๋‹ต ํ’ˆ์งˆ์„ ํ‰๊ฐ€ํ•ด๋ณด์ž.
    • ๊ฒ€์ƒ‰ ๋ณด๊ฐ• ์ƒ์„ฑ: ๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๋ฅผ ํ”„๋กฌํ”„ํŠธ์— ์ถ”๊ฐ€ํ•ด๋ณด๊ณ  ์‘๋‹ต ํ’ˆ์งˆ์„ ํ‰๊ฐ€ํ•ด๋ณด์ž.
  • ๋น„์šฉ: ๋ฏธ์„ธ ์กฐ์ •์— ๋“œ๋Š” ๋น„์šฉ์„ ํŒŒ์•…ํ–ˆ๋Š”๊ฐ€?
    • ์กฐ์ • ๊ฐ€๋Šฅ์„ฑ - ์‚ฌ์ „ ํ•™์Šต ๋ชจ๋ธ์ด ๋ฏธ์„ธ ์กฐ์ • ๊ฐ€๋Šฅํ•œ๊ฐ€?
    • ๋…ธ๋ ฅ - ํ•™์Šต ๋ฐ์ดํ„ฐ ์ค€๋น„, ๋ชจ๋ธ ํ‰๊ฐ€ ๋ฐ ๊ฐœ์„ ์— ํ•„์š”ํ•œ ๋…ธ๋ ฅ
    • ์ปดํ“จํŒ… - ๋ฏธ์„ธ ์กฐ์ • ์ž‘์—… ์‹คํ–‰๊ณผ ๋ฏธ์„ธ ์กฐ์ • ๋ชจ๋ธ ๋ฐฐํฌ์— ํ•„์š”ํ•œ ์ž์›
    • ๋ฐ์ดํ„ฐ - ๋ฏธ์„ธ ์กฐ์ • ํšจ๊ณผ๋ฅผ ๋‚ผ ์ˆ˜ ์žˆ๋Š” ์ถฉ๋ถ„ํ•œ ํ’ˆ์งˆ์˜ ์˜ˆ์‹œ ํ™•๋ณด ์—ฌ๋ถ€
  • ์ด์ : ๋ฏธ์„ธ ์กฐ์ •์˜ ์ด์ ์„ ํ™•์ธํ–ˆ๋Š”๊ฐ€?
    • ํ’ˆ์งˆ - ๋ฏธ์„ธ ์กฐ์ • ๋ชจ๋ธ์ด ๊ธฐ์ค€์„  ๋ชจ๋ธ๋ณด๋‹ค ์„ฑ๋Šฅ์ด ๋›ฐ์–ด๋‚œ๊ฐ€?
    • ๋น„์šฉ - ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋‹จ์ˆœํ™”ํ•ด ํ† ํฐ ์‚ฌ์šฉ๋Ÿ‰์„ ์ค„์ผ ์ˆ˜ ์žˆ๋Š”๊ฐ€?
    • ํ™•์žฅ์„ฑ - ๊ธฐ๋ณธ ๋ชจ๋ธ์„ ์ƒˆ๋กœ์šด ๋„๋ฉ”์ธ์— ์žฌํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€?

์ด ์งˆ๋ฌธ๋“ค์— ๋‹ตํ•˜๋ฉด ๋ฏธ์„ธ ์กฐ์ •์ด ์ ํ•ฉํ•œ์ง€ ํŒ๋‹จํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์ƒ์ ์œผ๋กœ๋Š” ์ด์ ์ด ๋น„์šฉ์„ ์ƒํšŒํ•  ๋•Œ๋งŒ ๋ฏธ์„ธ ์กฐ์ •์ด ํƒ€๋‹นํ•ฉ๋‹ˆ๋‹ค. ์ง„ํ–‰ํ•˜๊ธฐ๋กœ ๊ฒฐ์ •ํ–ˆ๋‹ค๋ฉด, ์ด์ œ ์‚ฌ์ „ ํ•™์Šต ๋ชจ๋ธ์„ ์–ด๋–ป๊ฒŒ ๋ฏธ์„ธ ์กฐ์ •ํ• ์ง€ ๊ณ ๋ฏผํ•  ์ฐจ๋ก€์ž…๋‹ˆ๋‹ค.

๊ฒฐ์ • ๊ณผ์ •์— ๋Œ€ํ•œ ๋” ๋งŽ์€ ์ธ์‚ฌ์ดํŠธ๊ฐ€ ํ•„์š”ํ•˜๋‹ค๋ฉด To fine-tune or not to fine-tune ์˜์ƒ์„ ์ฐธ๊ณ ํ•˜์„ธ์š”.

์‚ฌ์ „ ํ•™์Šต ๋ชจ๋ธ์„ ์–ด๋–ป๊ฒŒ ๋ฏธ์„ธ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ๋‚˜?

์‚ฌ์ „ ํ•™์Šต ๋ชจ๋ธ์„ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋ ค๋ฉด ๋‹ค์Œ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค:

  • ๋ฏธ์„ธ ์กฐ์ •ํ•  ์‚ฌ์ „ ํ•™์Šต ๋ชจ๋ธ
  • ๋ฏธ์„ธ ์กฐ์ •์— ์‚ฌ์šฉํ•  ๋ฐ์ดํ„ฐ์…‹
  • ๋ฏธ์„ธ ์กฐ์ • ์ž‘์—…์„ ์‹คํ–‰ํ•  ํ•™์Šต ํ™˜๊ฒฝ
  • ๋ฏธ์„ธ ์กฐ์ •๋œ ๋ชจ๋ธ์„ ๋ฐฐํฌํ•  ํ˜ธ์ŠคํŒ… ํ™˜๊ฒฝ

๋ฏธ์„ธ ์กฐ์ • ์‹ค์Šต

์•„๋ž˜ ๋ฆฌ์†Œ์Šค๋“ค์€ ์„ ๋ณ„๋œ ๋ฐ์ดํ„ฐ์…‹๊ณผ ํŠน์ • ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด ์‹ค์ œ ์˜ˆ์ œ๋ฅผ ๋‹จ๊ณ„๋ณ„๋กœ ์•ˆ๋‚ดํ•˜๋Š” ํŠœํ† ๋ฆฌ์–ผ์ž…๋‹ˆ๋‹ค. ์ด ํŠœํ† ๋ฆฌ์–ผ์„ ๋”ฐ๋ผ ํ•˜๋ ค๋ฉด ํ•ด๋‹น ์ œ๊ณต์ž์˜ ๊ณ„์ •๊ณผ ๊ด€๋ จ ๋ชจ๋ธ ๋ฐ ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•œ ์ ‘๊ทผ ๊ถŒํ•œ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

์ œ๊ณต์ž ํŠœํ† ๋ฆฌ์–ผ ์„ค๋ช…
OpenAI How to fine-tune chat models gpt-35-turbo ๋ชจ๋ธ์„ ํŠน์ • ๋„๋ฉ”์ธ("๋ ˆ์‹œํ”ผ ์–ด์‹œ์Šคํ„ดํŠธ")์— ๋งž๊ฒŒ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ฐฐ์›๋‹ˆ๋‹ค. ํ•™์Šต ๋ฐ์ดํ„ฐ ์ค€๋น„, ๋ฏธ์„ธ ์กฐ์ • ์ž‘์—… ์‹คํ–‰, ๋ฏธ์„ธ ์กฐ์ • ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•œ ์ถ”๋ก  ๊ณผ์ •์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
Azure OpenAI GPT 3.5 Turbo fine-tuning tutorial Azure ํ™˜๊ฒฝ์—์„œ gpt-35-turbo-0613 ๋ชจ๋ธ์„ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ฐฐ์›๋‹ˆ๋‹ค. ํ•™์Šต ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ๋ฐ ์—…๋กœ๋“œ, ๋ฏธ์„ธ ์กฐ์ • ์ž‘์—… ์‹คํ–‰, ์ƒˆ ๋ชจ๋ธ ๋ฐฐํฌ ๋ฐ ์‚ฌ์šฉ ๋‹จ๊ณ„๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.
Hugging Face Fine-tuning LLMs with Hugging Face ์˜คํ”ˆ LLM(์˜ˆ: CodeLlama 7B)์„ transformers ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์™€ Transformer Reinforcement Learning (TRL)์œผ๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ๊ณผ์ •์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค. Hugging Face์˜ ๊ณต๊ฐœ ๋ฐ์ดํ„ฐ์…‹๋„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค.
๐Ÿค— AutoTrain Fine-tuning LLMs with AutoTrain AutoTrain(๋˜๋Š” AutoTrain Advanced)์€ Hugging Face์—์„œ ๊ฐœ๋ฐœํ•œ ํŒŒ์ด์ฌ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋กœ, ๋‹ค์–‘ํ•œ ์ž‘์—…์— ๋Œ€ํ•ด LLM ๋ฏธ์„ธ ์กฐ์ •์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋“œ ์ž‘์„ฑ ์—†์ด๋„ ๋ฏธ์„ธ ์กฐ์ •์ด ๊ฐ€๋Šฅํ•˜๋ฉฐ, ํด๋ผ์šฐ๋“œ, Hugging Face Spaces, ๋กœ์ปฌ ํ™˜๊ฒฝ์—์„œ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์›น ๊ธฐ๋ฐ˜ GUI, CLI, yaml ๊ตฌ์„ฑ ํŒŒ์ผ์„ ํ†ตํ•œ ํ•™์Šต๋„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

๊ณผ์ œ

์œ„ ํŠœํ† ๋ฆฌ์–ผ ์ค‘ ํ•˜๋‚˜๋ฅผ ์„ ํƒํ•ด ๋”ฐ๋ผ ํ•ด๋ณด์„ธ์š”. ์ด ์ €์žฅ์†Œ ๋‚ด Jupyter Notebook ๋ฒ„์ „์œผ๋กœ ์ฐธ๊ณ ์šฉ ๋ณต์ œ๋ณธ์„ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์œผ๋‚˜, ์ตœ์‹  ๋ฒ„์ „์€ ๋ฐ˜๋“œ์‹œ ์›๋ณธ ์†Œ์Šค๋ฅผ ์ง์ ‘ ์ด์šฉํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.

์ˆ˜๊ณ ํ•˜์…จ์Šต๋‹ˆ๋‹ค! ํ•™์Šต์„ ๊ณ„์†ํ•˜์„ธ์š”.

์ด๋ฒˆ ๊ฐ•์˜๋ฅผ ๋งˆ์นœ ํ›„์—๋Š” Generative AI Learning collection์—์„œ ์ƒ์„ฑ AI ์ง€์‹์„ ๊ณ„์† ํ™•์žฅํ•ด๋ณด์„ธ์š”!

์ถ•ํ•˜ํ•ฉ๋‹ˆ๋‹ค!! ์ด ๊ณผ์ •์˜ v2 ์‹œ๋ฆฌ์ฆˆ ๋งˆ์ง€๋ง‰ ๊ฐ•์˜๋ฅผ ์™„๋ฃŒํ•˜์…จ์Šต๋‹ˆ๋‹ค! ํ•™์Šต๊ณผ ๊ฐœ๋ฐœ์„ ๋ฉˆ์ถ”์ง€ ๋งˆ์„ธ์š”. **์ด๋ฒˆ ์ฃผ์ œ์— ๊ด€ํ•œ ์ถ”๊ฐ€ ์ œ์•ˆ ๋ชฉ๋ก์€ RESOURCES ํŽ˜์ด์ง€์—์„œ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋˜ํ•œ v1 ์‹œ๋ฆฌ์ฆˆ ๊ฐ•์˜๋„ ๊ณผ์ œ์™€ ๊ฐœ๋…์ด ์—…๋ฐ์ดํŠธ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ž ์‹œ ์‹œ๊ฐ„์„ ๋‚ด์–ด ์ง€์‹์„ ์ƒˆ๋กญ๊ฒŒ ๋‹ค์ ธ๋ณด์‹œ๊ณ , ์งˆ๋ฌธ๊ณผ ํ”ผ๋“œ๋ฐฑ์„ ๊ณต์œ ํ•ด ์ฃผ์‹œ๋ฉด ์ปค๋ฎค๋‹ˆํ‹ฐ๋ฅผ ์œ„ํ•œ ๊ฐ•์˜ ๊ฐœ์„ ์— ํฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.

๋ฉด์ฑ… ์กฐํ•ญ:
์ด ๋ฌธ์„œ๋Š” AI ๋ฒˆ์—ญ ์„œ๋น„์Šค Co-op Translator๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ฒˆ์—ญ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ •ํ™•์„ฑ์„ ์œ„ํ•ด ์ตœ์„ ์„ ๋‹คํ•˜๊ณ  ์žˆ์œผ๋‚˜, ์ž๋™ ๋ฒˆ์—ญ์—๋Š” ์˜ค๋ฅ˜๋‚˜ ๋ถ€์ •ํ™•ํ•œ ๋ถ€๋ถ„์ด ์žˆ์„ ์ˆ˜ ์žˆ์Œ์„ ์œ ์˜ํ•ด ์ฃผ์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค. ์›๋ฌธ์€ ํ•ด๋‹น ์–ธ์–ด์˜ ์›๋ณธ ๋ฌธ์„œ๊ฐ€ ๊ถŒ์œ„ ์žˆ๋Š” ์ถœ์ฒ˜๋กœ ๊ฐ„์ฃผ๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ค‘์š”ํ•œ ์ •๋ณด์˜ ๊ฒฝ์šฐ ์ „๋ฌธ์ ์ธ ์ธ๊ฐ„ ๋ฒˆ์—ญ์„ ๊ถŒ์žฅํ•ฉ๋‹ˆ๋‹ค. ๋ณธ ๋ฒˆ์—ญ ์‚ฌ์šฉ์œผ๋กœ ์ธํ•ด ๋ฐœ์ƒํ•˜๋Š” ์˜คํ•ด๋‚˜ ์ž˜๋ชป๋œ ํ•ด์„์— ๋Œ€ํ•ด ๋‹น์‚ฌ๋Š” ์ฑ…์ž„์„ ์ง€์ง€ ์•Š์Šต๋‹ˆ๋‹ค.