আপনার LLM-কে ফাইন-টিউন করা

জেনারেটিভ এআই অ্যাপ্লিকেশন তৈরি করতে বড় ভাষার মডেল ব্যবহার করা নতুন চ্যালেঞ্জ নিয়ে আসে। একটি গুরুত্বপূর্ণ বিষয় হলো, ব্যবহারকারীর নির্দিষ্ট অনুরোধের জন্য মডেল দ্বারা তৈরি করা কন্টেন্টের প্রতিক্রিয়ার গুণমান (নির্ভুলতা এবং প্রাসঙ্গিকতা) নিশ্চিত করা। পূর্ববর্তী পাঠে, আমরা প্রম্পট ইঞ্জিনিয়ারিং এবং রিট্রিভাল-অগমেন্টেড জেনারেশন এর মতো কৌশলগুলি আলোচনা করেছি যা বিদ্যমান মডেলের প্রম্পট ইনপুট পরিবর্তন করে সমস্যার সমাধান করার চেষ্টা করে।

আজকের পাঠে, আমরা একটি তৃতীয় কৌশল, ফাইন-টিউনিং, আলোচনা করব যা চ্যালেঞ্জটি সমাধান করার চেষ্টা করে অতিরিক্ত ডেটা দিয়ে মডেলটি পুনরায় প্রশিক্ষণ করে। আসুন বিস্তারিতভাবে বিষয়টি দেখি।

শেখার উদ্দেশ্য

এই পাঠে প্রাক-প্রশিক্ষিত ভাষার মডেলের জন্য ফাইন-টিউনিং এর ধারণা পরিচিত করা হয়েছে, এই পদ্ধতির সুবিধা এবং চ্যালেঞ্জগুলি অনুসন্ধান করা হয়েছে, এবং আপনার জেনারেটিভ এআই মডেলের কর্মক্ষমতা উন্নত করতে ফাইন টিউনিং কখন এবং কিভাবে ব্যবহার করতে হবে তার নির্দেশনা প্রদান করা হয়েছে।

পাঠের শেষে, আপনি নিম্নলিখিত প্রশ্নগুলির উত্তর দিতে সক্ষম হওয়া উচিত:

ভাষার মডেলগুলির জন্য ফাইন টিউনিং কী?
কখন এবং কেন ফাইন টিউনিং উপকারী?
আমি কিভাবে একটি প্রাক-প্রশিক্ষিত মডেল ফাইন-টিউন করতে পারি?
ফাইন-টিউনিং এর সীমাবদ্ধতাগুলি কী?

প্রস্তুত? চলুন শুরু করা যাক।

চিত্রিত গাইড

আমরা বিস্তারিত আলোচনায় যাওয়ার আগে আপনি কি জানতে চান যে আমরা কি বিষয়গুলি কভার করব? এই চিত্রিত গাইডটি দেখুন যা এই পাঠের জন্য শেখার যাত্রা বর্ণনা করে - ফাইন-টিউনিং এর মূল ধারণা এবং প্রেরণা শেখা থেকে শুরু করে, প্রক্রিয়া এবং সেরা অনুশীলনগুলি বুঝতে ফাইন-টিউনিং কাজটি সম্পাদনের জন্য। এটি অনুসন্ধানের জন্য একটি আকর্ষণীয় বিষয়, তাই আপনার স্ব-নির্দেশিত শিক্ষার যাত্রাকে সমর্থন করার জন্য অতিরিক্ত লিঙ্কগুলি পেতে Resources পৃষ্ঠাটি দেখতে ভুলবেন না!

ভাষার মডেলগুলির জন্য ফাইন-টিউনিং কী?

সংজ্ঞা অনুযায়ী, বড় ভাষার মডেলগুলি ইন্টারনেট সহ বিভিন্ন উৎস থেকে সংগৃহীত বিশাল পরিমাণ টেক্সটে প্রাক-প্রশিক্ষিত। পূর্ববর্তী পাঠে আমরা শিখেছি যে ব্যবহারকারীর প্রশ্নের ("প্রম্পট") প্রতিক্রিয়ার গুণমান উন্নত করতে আমাদের প্রম্পট ইঞ্জিনিয়ারিং এবং রিট্রিভাল-অগমেন্টেড জেনারেশন এর মতো কৌশল প্রয়োজন।

একটি জনপ্রিয় প্রম্পট-ইঞ্জিনিয়ারিং কৌশল মডেলটিকে প্রতিক্রিয়ায় কি আশা করা হচ্ছে সে সম্পর্কে আরও নির্দেশনা দেওয়ার বিষয় জড়িত, হয় নির্দেশাবলী (স্পষ্ট নির্দেশনা) প্রদান করে বা কয়েকটি উদাহরণ দিয়ে (অস্পষ্ট নির্দেশনা)। এটি ফিউ-শট লার্নিং নামে পরিচিত, কিন্তু এর দুটি সীমাবদ্ধতা রয়েছে:

মডেল টোকেন সীমাবদ্ধতা আপনাকে দেওয়া উদাহরণগুলির সংখ্যা সীমিত করতে পারে এবং কার্যকারিতা সীমিত করতে পারে।
মডেল টোকেন খরচ প্রতি প্রম্পটে উদাহরণ যোগ করাকে ব্যয়বহুল করতে পারে এবং নমনীয়তা সীমিত করতে পারে।

ফাইন-টিউনিং একটি সাধারণ অনুশীলন মেশিন লার্নিং সিস্টেমে যেখানে আমরা একটি প্রাক-প্রশিক্ষিত মডেল গ্রহণ করি এবং নির্দিষ্ট কাজের উপর তার কর্মক্ষমতা উন্নত করতে নতুন ডেটা দিয়ে পুনরায় প্রশিক্ষণ করি। ভাষার মডেলগুলির ক্ষেত্রে, আমরা প্রাক-প্রশিক্ষিত মডেলটিকে একটি নির্দিষ্ট কাজ বা অ্যাপ্লিকেশন ডোমেনের জন্য একটি কিউরেটেড উদাহরণ সেট দিয়ে ফাইন-টিউন করতে পারি একটি কাস্টম মডেল তৈরি করতে যা সেই নির্দিষ্ট কাজ বা ডোমেনের জন্য আরও সঠিক এবং প্রাসঙ্গিক হতে পারে। ফাইন-টিউনিং এর একটি পার্শ্ব-লাভ হলো এটি ফিউ-শট লার্নিংয়ের জন্য প্রয়োজনীয় উদাহরণগুলির সংখ্যা কমাতে পারে - টোকেন ব্যবহারের খরচ এবং সংশ্লিষ্ট খরচ কমানো।

কখন এবং কেন আমাদের মডেলগুলি ফাইন-টিউন করা উচিত?

এই প্রসঙ্গে, যখন আমরা ফাইন-টিউনিং এর কথা বলি, আমরা পর্যবেক্ষণাধীন ফাইন-টিউনিং এর কথা বলছি যেখানে পুনরায় প্রশিক্ষণ নতুন ডেটা যোগ করে করা হয় যা মূল প্রশিক্ষণ ডেটাসেটের অংশ ছিল না। এটি একটি অপ্রত্যক্ষ ফাইন-টিউনিং পদ্ধতির থেকে আলাদা যেখানে মডেলটি মূল ডেটাতে পুনরায় প্রশিক্ষিত হয়, কিন্তু ভিন্ন হাইপারপ্যারামিটার দিয়ে।

মনে রাখার মূল বিষয় হলো, ফাইন-টিউনিং একটি উন্নত কৌশল যা কাঙ্ক্ষিত ফলাফল পেতে নির্দিষ্ট স্তরের দক্ষতা প্রয়োজন। যদি ভুলভাবে করা হয়, এটি প্রত্যাশিত উন্নতি প্রদান নাও করতে পারে এবং এমনকি আপনার লক্ষ্যযুক্ত ডোমেনের জন্য মডেলের কর্মক্ষমতা হ্রাস করতে পারে।

তাই, ভাষার মডেলগুলি "কিভাবে" ফাইন-টিউন করতে হবে তা শেখার আগে, আপনাকে জানতে হবে "কেন" আপনি এই পথটি নিতে চান এবং "কখন" ফাইন-টিউনিং প্রক্রিয়া শুরু করতে হবে। এই প্রশ্নগুলি জিজ্ঞাসা করে শুরু করুন:

ব্যবহার ক্ষেত্রে: আপনার ফাইন-টিউনিং এর জন্য ব্যবহার ক্ষেত্রে কী? আপনি বর্তমান প্রাক-প্রশিক্ষিত মডেলের কোন দিক উন্নত করতে চান?
বিকল্প: আপনি কি কাঙ্ক্ষিত ফলাফল অর্জন করতে অন্যান্য কৌশলগুলি চেষ্টা করেছেন? তুলনার জন্য একটি বেসলাইন তৈরি করতে তাদের ব্যবহার করুন।
- প্রম্পট ইঞ্জিনিয়ারিং: প্রাসঙ্গিক প্রম্পট প্রতিক্রিয়ার উদাহরণ সহ ফিউ-শট প্রম্পটিং এর মতো কৌশল চেষ্টা করুন। প্রতিক্রিয়ার গুণমান মূল্যায়ন করুন।
- রিট্রিভাল অগমেন্টেড জেনারেশন: আপনার ডেটা অনুসন্ধান করে প্রাপ্ত কোয়েরি ফলাফল দিয়ে প্রম্পটগুলি বৃদ্ধি করার চেষ্টা করুন। প্রতিক্রিয়ার গুণমান মূল্যায়ন করুন।
খরচ: আপনি কি ফাইন-টিউনিং এর খরচগুলি চিহ্নিত করেছেন?
- টিউনযোগ্যতা - প্রাক-প্রশিক্ষিত মডেলটি কি ফাইন-টিউনিং এর জন্য উপলব্ধ?
- প্রচেষ্টা - প্রশিক্ষণ ডেটা প্রস্তুত করতে, মডেল মূল্যায়ন এবং পরিমার্জন করতে।
- কম্পিউট - ফাইন-টিউনিং কাজগুলি চালানোর জন্য, এবং ফাইন-টিউনড মডেলটি স্থাপন করার জন্য
- ডেটা - ফাইন-টিউনিং প্রভাবের জন্য যথেষ্ট গুণমানের উদাহরণে প্রবেশাধিকার
উপকারিতা: আপনি কি ফাইন-টিউনিং এর জন্য সুবিধাগুলি নিশ্চিত করেছেন?
- গুণমান - ফাইন-টিউনড মডেলটি কি বেসলাইনকে অতিক্রম করেছে?
- খরচ - এটি কি প্রম্পটগুলি সরল করে টোকেন ব্যবহারের খরচ কমায়?
- সম্প্রসারণযোগ্যতা - আপনি কি নতুন ডোমেনের জন্য বেস মডেলটি পুনঃউপযোগী করতে পারেন?

এই প্রশ্নগুলির উত্তর দিয়ে, আপনি সিদ্ধান্ত নিতে সক্ষম হওয়া উচিত যে ফাইন-টিউনিং আপনার ব্যবহার ক্ষেত্রে সঠিক পদ্ধতি কিনা। আদর্শভাবে, পদ্ধতিটি তখনই বৈধ যখন সুবিধাগুলি খরচের চেয়ে বেশি। একবার আপনি এগিয়ে যাওয়ার সিদ্ধান্ত নিলে, এটি সময় ফাইন-টিউন করার জন্য প্রাক-প্রশিক্ষিত মডেলটি কিভাবে ফাইন টিউন করতে পারেন তা চিন্তা করার।

সিদ্ধান্ত গ্রহণের প্রক্রিয়া সম্পর্কে আরও অন্তর্দৃষ্টি চান? দেখুন To fine-tune or not to fine-tune

আমরা কিভাবে একটি প্রাক-প্রশিক্ষিত মডেল ফাইন-টিউন করতে পারি?

একটি প্রাক-প্রশিক্ষিত মডেল ফাইন-টিউন করতে আপনার প্রয়োজন:

একটি প্রাক-প্রশিক্ষিত মডেল ফাইন-টিউন করতে
একটি ডেটাসেট ফাইন-টিউনিং এর জন্য ব্যবহার করতে
একটি প্রশিক্ষণ পরিবেশ ফাইন-টিউনিং কাজটি চালানোর জন্য
একটি হোস্টিং পরিবেশ ফাইন-টিউনড মডেলটি স্থাপন করার জন্য

বাস্তবে ফাইন-টিউনিং

নিম্নলিখিত সম্পদগুলি একটি নির্বাচিত মডেল এবং একটি কিউরেটেড ডেটাসেট ব্যবহার করে একটি বাস্তব উদাহরণ দিয়ে আপনাকে হাঁটানোর জন্য ধাপে ধাপে টিউটোরিয়াল প্রদান করে। এই টিউটোরিয়ালগুলি কাজ করার জন্য, আপনাকে নির্দিষ্ট প্রদানকারীর উপর একটি অ্যাকাউন্ট থাকতে হবে, সেইসাথে প্রাসঙ্গিক মডেল এবং ডেটাসেটে প্রবেশাধিকার থাকতে হবে।

প্রদানকারী	টিউটোরিয়াল	বর্ণনা
OpenAI	কিভাবে চ্যাট মডেলগুলি ফাইন-টিউন করবেন	প্রশিক্ষণ ডেটা প্রস্তুত করে, ফাইন-টিউনিং কাজটি চালিয়ে, এবং প্রমাণে ফাইন-টিউনড মডেল ব্যবহার করে একটি নির্দিষ্ট ডোমেন ("রেসিপি সহকারী") এর জন্য `gpt-35-turbo` ফাইন-টিউন করতে শিখুন।
Azure OpenAI	GPT 3.5 Turbo ফাইন-টিউনিং টিউটোরিয়াল	প্রশিক্ষণ ডেটা তৈরি এবং আপলোড করতে পদক্ষেপ গ্রহণ করে, ফাইন-টিউনিং কাজটি চালানোর মাধ্যমে Azure এ `gpt-35-turbo-0613` মডেল ফাইন-টিউন করতে শিখুন। নতুন মডেল স্থাপন করুন এবং ব্যবহার করুন।
Hugging Face	Hugging Face দিয়ে LLMs ফাইন-টিউনিং	এই ব্লগ পোস্টটি আপনাকে open LLM (উদাহরণস্বরূপ `CodeLlama 7B`) ফাইন-টিউন করতে হাঁটায় transformers লাইব্রেরি এবং Transformer Reinforcement Learning (TRL) সহ খোলা datasets ব্যবহার করে Hugging Face এ।

🤗 AutoTrain	AutoTrain দিয়ে LLMs ফাইন-টিউনিং	AutoTrain (বা AutoTrain Advanced) একটি পাইটন লাইব্রেরি যা Hugging Face দ্বারা বিকশিত হয়েছে যা LLM ফাইন-টিউনিং সহ অনেক বিভিন্ন কাজের জন্য ফাইন-টিউনিং এর অনুমতি দেয়। AutoTrain একটি নো-কোড সমাধান এবং ফাইন-টিউনিং আপনার নিজের ক্লাউডে, Hugging Face Spaces এ বা স্থানীয়ভাবে করা যেতে পারে। এটি একটি ওয়েব-ভিত্তিক GUI, CLI এবং yaml কনফিগ ফাইলের মাধ্যমে প্রশিক্ষণ উভয়কেই সমর্থন করে।

অ্যাসাইনমেন্ট

উপরের টিউটোরিয়ালগুলির একটি নির্বাচন করুন এবং তাদের মাধ্যমে হাঁটুন। আমরা শুধুমাত্র রেফারেন্সের জন্য এই রিপোতে Jupyter Notebooks এ এই টিউটোরিয়ালগুলির একটি সংস্করণ পুনরাবৃত্তি করতে পারি। সর্বশেষ সংস্করণগুলি পেতে মূল উৎসগুলি সরাসরি ব্যবহার করুন।

অসাধারণ কাজ! আপনার শেখা চালিয়ে যান।

এই পাঠটি সম্পন্ন করার পরে, আমাদের Generative AI Learning collection দেখুন আপনার Generative AI জ্ঞানকে আরও উন্নত করতে!

অভিনন্দন!! আপনি এই কোর্সের v2 সিরিজের চূড়ান্ত পাঠটি সম্পন্ন করেছেন! শেখা এবং তৈরি করা বন্ধ করবেন না। **RESOURCES পৃষ্ঠাটি দেখুন এই বিষয়ের জন্য অতিরিক্ত সুপারিশগুলির তালিকা পেতে।

আমাদের v1 সিরিজের পাঠগুলি আরও অ্যাসাইনমেন্ট এবং ধারণাগুলি সহ আপডেট করা হয়েছে। তাই আপনার জ্ঞানটি সতেজ করতে এক মিনিট সময় নিন - এবং এই পাঠগুলি সম্প্রদায়ের জন্য উন্নত করতে আমাদের প্রশ্ন এবং মতামত শেয়ার করুন।

অস্বীকৃতি:
এই নথিটি AI অনুবাদ সেবা Co-op Translator ব্যবহার করে অনুবাদ করা হয়েছে। আমরা যথাসাধ্য নির্ভুলতার চেষ্টা করি, তবে অনুগ্রহ করে সচেতন থাকুন যে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। মূল ভাষায় মূল নথিটি প্রামাণিক উৎস হিসাবে বিবেচিত হওয়া উচিত। গুরুত্বপূর্ণ তথ্যের জন্য, পেশাদার মানব অনুবাদ সুপারিশ করা হয়। এই অনুবাদ ব্যবহারের ফলে উদ্ভূত কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যার জন্য আমরা দায়ী নই।

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

আপনার LLM-কে ফাইন-টিউন করা

শেখার উদ্দেশ্য

চিত্রিত গাইড

ভাষার মডেলগুলির জন্য ফাইন-টিউনিং কী?

কখন এবং কেন আমাদের মডেলগুলি ফাইন-টিউন করা উচিত?

আমরা কিভাবে একটি প্রাক-প্রশিক্ষিত মডেল ফাইন-টিউন করতে পারি?

বাস্তবে ফাইন-টিউনিং

অ্যাসাইনমেন্ট

অসাধারণ কাজ! আপনার শেখা চালিয়ে যান।

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

আপনার LLM-কে ফাইন-টিউন করা

শেখার উদ্দেশ্য

চিত্রিত গাইড

ভাষার মডেলগুলির জন্য ফাইন-টিউনিং কী?

কখন এবং কেন আমাদের মডেলগুলি ফাইন-টিউন করা উচিত?

আমরা কিভাবে একটি প্রাক-প্রশিক্ষিত মডেল ফাইন-টিউন করতে পারি?

বাস্তবে ফাইন-টিউনিং

অ্যাসাইনমেন্ট

অসাধারণ কাজ! আপনার শেখা চালিয়ে যান।