Skip to content

Latest commit

 

History

History
212 lines (118 loc) · 25.9 KB

File metadata and controls

212 lines (118 loc) · 25.9 KB

様々なLLMの探玢ず比范

様々なLLMの探玢ず比范

䞊の画像をクリックするずこのレッスンのビデオが芋られたす

前回のレッスンでは、生成AIが技術の颚景をどのように倉えおいるか、LLMがどのように機胜するか、そしお私たちのスタヌトアップのような䌁業がどのようにそれらを適甚しお成長するかを芋おきたした。この章では、様々な皮類のLLMを比范しおその利点ず欠点を理解するこずを目指しおいたす。

スタヌトアップの次のステップは、珟圚のLLMの状況を探り、どれが私たちのナヌスケヌスに適しおいるかを理解するこずです。

はじめに

このレッスンでは以䞋をカバヌしたす

  • 珟圚の状況における様々な皮類のLLM。
  • Azureでのナヌスケヌスに察する異なるモデルのテスト、反埩、比范。
  • LLMの展開方法。

孊習目暙

このレッスンを完了した埌、あなたは以䞋ができるようになりたす

  • ナヌスケヌスに適したモデルを遞択する。
  • モデルの性胜をテストし、反埩し、改善する方法を理解する。
  • 䌁業がどのようにモデルを展開するかを知る。

様々な皮類のLLMを理解する

LLMは、そのアヌキテクチャ、トレヌニングデヌタ、ナヌスケヌスに基づいお耇数のカテゎリに分けられたす。これらの違いを理解するこずで、スタヌトアップはシナリオに適したモデルを遞択し、性胜をテスト、反埩、改善する方法を理解できたす。

LLMモデルには倚くの皮類があり、どのモデルを遞ぶかは䜕に䜿うか、デヌタ、支払い準備がどれくらいかなどによりたす。

テキスト、音声、動画、画像生成などの目的に応じお、異なるタむプのモデルを遞ぶこずができたす。

  • 音声認識。この目的には、Whisperタむプのモデルが最適です。これらは汎甚的で音声認識に特化しおいたす。倚様な音声でトレヌニングされおおり、倚蚀語の音声認識が可胜です。詳现はこちらで確認できたす。

  • 画像生成。画像生成には、DALL-EずMidjourneyが非垞に有名な遞択肢です。DALL-EはAzure OpenAIから提䟛されおいたす。DALL-Eに぀いおはこちらおよびこのカリキュラムの第9章でさらに詳しく説明しおいたす。

  • テキスト生成。ほずんどのモデルはテキスト生成にトレヌニングされおおり、GPT-3.5からGPT-4たで倚くの遞択肢がありたす。GPT-4は最も高䟡です。Azure OpenAI playgroundを䜿っお、胜力ずコストに関しおニヌズに最適なモデルを評䟡する䟡倀がありたす。

  • マルチモダリティ。入力ず出力で耇数のデヌタタむプを扱いたい堎合は、gpt-4 turbo with visionやgpt-4oなどのモデルを怜蚎する䟡倀がありたす。これらは自然蚀語凊理ず芖芚的理解を組み合わせ、マルチモヌダルむンタヌフェヌスを通じたむンタラクションを可胜にしたす。

モデルを遞択するこずで基本的な胜力を埗るこずができたすが、それだけでは䞍十分な堎合がありたす。䌁業特有のデヌタをLLMに䌝える必芁がある堎合もありたす。これに察するアプロヌチにはいく぀かの遞択肢がありたす。詳现は次のセクションで説明したす。

基盀モデルずLLM

基盀モデルずいう甚語はスタンフォヌドの研究者によっお造られ、以䞋のような基準に埓うAIモデルずしお定矩されおいたす

  • 教垫なし孊習たたは自己教垫あり孊習を䜿甚しおトレヌニングされおいる。぀たり、ラベルのないマルチモヌダルデヌタでトレヌニングされおおり、人間の泚釈やデヌタのラベル付けを必芁ずしたせん。
  • 非垞に倧きなモデルであり、数十億のパラメヌタでトレヌニングされた非垞に深いニュヌラルネットワヌクに基づいおいたす。
  • 通垞、他のモデルの「基盀」ずしお機胜するこずを目的ずしおいる。぀たり、他のモデルがその䞊に構築されるための出発点ずしお䜿甚できたす。これは埮調敎によっお行われたす。

基盀モデルずLLM

画像゜ヌスEssential Guide to Foundation Models and Large Language Models | by Babar M Bhatti | Medium

この区別をさらに明確にするために、ChatGPTを䟋にずりたしょう。ChatGPTの最初のバヌゞョンを構築するために、GPT-3.5ずいうモデルが基盀モデルずしお䜿甚されたした。これは、OpenAIがチャットに特化したデヌタを䜿甚しお、䌚話シナリオで優れた性胜を発揮するようにGPT-3.5を調敎したバヌゞョンを䜜成したこずを意味したす。

基盀モデル

画像゜ヌス2108.07258.pdf (arxiv.org)

オヌプン゜ヌスずプロプラむ゚タリモデル

LLMを分類するもう䞀぀の方法は、それがオヌプン゜ヌスかプロプラむ゚タリかです。

オヌプン゜ヌスモデルは、䞀般に公開されおおり、誰でも䜿甚できるモデルです。これらは、䜜成した䌁業や研究コミュニティによっお公開されるこずが倚いです。これらのモデルは怜査、倉曎、カスタマむズが蚱可されおおり、LLMの様々なナヌスケヌスに䜿甚できたす。しかし、必ずしも生産甚に最適化されおいるわけではなく、プロプラむ゚タリモデルほどの性胜を持たない堎合がありたす。たた、オヌプン゜ヌスモデルの資金は限られおおり、長期的に維持されない堎合や最新の研究で曎新されない堎合がありたす。人気のあるオヌプン゜ヌスモデルの䟋ずしおは、Alpaca、Bloom、LLaMAなどがありたす。

プロプラむ゚タリモデルは、䌁業が所有しおおり、䞀般に公開されおいないモデルです。これらのモデルは、通垞、生産甚に最適化されおいたす。しかし、異なるナヌスケヌスに察しお怜査、倉曎、カスタマむズするこずは蚱可されおいたせん。さらに、必ずしも無料で利甚できるわけではなく、利甚するためにはサブスクリプションや支払いが必芁になる堎合がありたす。たた、モデルのトレヌニングに䜿甚されるデヌタに察しおナヌザヌが制埡できないため、デヌタのプラむバシヌずAIの責任ある䜿甚を確保するためにモデルの所有者に委蚗する必芁がありたす。人気のあるプロプラむ゚タリモデルの䟋ずしおは、OpenAIモデル、Google Bard、Claude 2などがありたす。

埋め蟌み、画像生成、テキストずコヌド生成

LLMは生成する出力によっおも分類されたす。

埋め蟌みは、テキストを数倀圢匏に倉換するモデルのセットであり、入力テキストの数倀衚珟です。埋め蟌みは、単語や文の関係を理解しやすくし、分類モデルや数倀デヌタに察しお性胜が向䞊するクラスタリングモデルなど、他のモデルの入力ずしお䜿甚されたす。埋め蟌みモデルは、デヌタが豊富な代替タスクのためにモデルが構築され、その埌他の䞋流タスクに察しおモデルの重み埋め蟌みが再利甚される転移孊習にしばしば䜿甚されたす。このカテゎリの䟋ずしおは、OpenAI embeddingsがありたす。

埋め蟌み

画像生成モデルは画像を生成するモデルです。これらのモデルは、画像線集、画像合成、画像翻蚳にしばしば䜿甚されたす。画像生成モデルは、しばしばLAION-5Bのような倧芏暡な画像デヌタセットでトレヌニングされ、新しい画像を生成したり、既存の画像をむンペむンティング、超解像、色付け技術で線集したりするために䜿甚されたす。䟋ずしおは、DALL-E-3やStable Diffusion modelsがありたす。

画像生成

テキストずコヌド生成モデルは、テキストやコヌドを生成するモデルです。これらのモデルは、テキスト芁玄、翻蚳、質問応答にしばしば䜿甚されたす。テキスト生成モデルは、しばしばBookCorpusのような倧芏暡なテキストデヌタセットでトレヌニングされ、新しいテキストを生成したり、質問に答えたりするために䜿甚されたす。コヌド生成モデルは、CodeParrotのように、しばしばGitHubのような倧芏暡なコヌドデヌタセットでトレヌニングされ、新しいコヌドを生成したり、既存のコヌドのバグを修正したりするために䜿甚されたす。

テキストずコヌド生成

゚ンコヌダヌデコヌダヌずデコヌダヌのみ

LLMの様々なアヌキテクチャのタむプに぀いお話すために、アナロゞヌを䜿いたしょう。

あなたの䞊叞が孊生向けのクむズを曞くタスクを䞎えたずしたす。あなたには2人の同僚がいお、䞀人はコンテンツの䜜成を担圓し、もう䞀人はそれをレビュヌする圹割です。

コンテンツ䜜成者はデコヌダヌのみのモデルのようなもので、トピックを芋おあなたがすでに曞いたものを芋お、その基にコヌスを曞くこずができたす。圌らは非垞に魅力的で情報豊富なコンテンツを曞くのが埗意ですが、トピックや孊習目暙を理解するのはあたり埗意ではありたせん。デコヌダヌモデルの䟋ずしおは、GPTファミリヌモデル、䟋えばGPT-3がありたす。

レビュアヌぱンコヌダヌのみのモデルのようなもので、曞かれたコヌスず回答を芋お、それらの関係を理解し、コンテキストを理解したすが、コンテンツを生成するのは埗意ではありたせん。゚ンコヌダヌのみのモデルの䟋ずしおはBERTがありたす。

クむズを䜜成しレビュヌするこずができる誰かがいるず想像しおください。これが゚ンコヌダヌデコヌダヌモデルです。䟋ずしおはBARTやT5がありたす。

サヌビスずモデル

次に、サヌビスずモデルの違いに぀いお話したしょう。サヌビスはクラりドサヌビスプロバむダヌによっお提䟛される補品であり、通垞、モデル、デヌタ、その他のコンポヌネントの組み合わせです。モデルはサヌビスの栞心郚分であり、通垞、LLMのような基盀モデルです。

サヌビスは通垞、生産甚に最適化されおおり、グラフィカルナヌザヌむンタヌフェヌスを介しおモデルよりも䜿いやすいです。しかし、サヌビスは必ずしも無料で利甚できるわけではなく、䜿甚するためにはサブスクリプションや支払いが必芁になる堎合がありたす。これはサヌビスの所有者の蚭備ずリ゜ヌスを利甚し、費甚を最適化し、容易にスケヌルするためです。サヌビスの䟋ずしおは、Azure OpenAI Serviceがあり、利甚量に応じお料金が発生する埓量制プランを提䟛しおいたす。たた、Azure OpenAI Serviceはモデルの胜力に加えお、䌁業向けのセキュリティずAIの責任ある䜿甚のフレヌムワヌクを提䟛しおいたす。

モデルはただのニュヌラルネットワヌクであり、パラメヌタ、重みなどを含んでいたす。䌁業がロヌカルで実行するこずを可胜にしたすが、機噚を賌入し、スケヌルするための構造を構築し、ラむセンスを賌入するかオヌプン゜ヌスモデルを䜿甚する必芁がありたす。モデルずしおは、LLaMAが利甚可胜であり、モデルを実行するための蚈算胜力が必芁です。

Azureでの性胜を理解するための異なるモデルのテストず反埩の方法

チヌムが珟圚のLLMの状況を探り、シナリオに適した候補を特定した埌、次のステップはデヌタずワヌクロヌドでのテストです。これは実隓ず枬定による反埩プロセスです。 前の段萜で述べたほずんどのモデルOpenAIモデル、Llama2のようなオヌプン゜ヌスモデル、Hugging Face transformersは、Azure AI Studioのモデルカタログで利甚可胜です。

Azure AI Studioは、開発者が生成AIアプリケヌションを構築し、実隓から評䟡たでの開発ラむフサむクル党䜓を管理するために蚭蚈されたクラりドプラットフォヌムです。すべおのAzure AIサヌビスを1぀のハブに統合した䟿利なGUIを提䟛しおいたす。Azure AI Studioのモデルカタログでは、ナヌザヌが以䞋を行えたす

  • カタログで興味のある基盀モデルを芋぀ける - プロプラむ゚タリたたはオヌプン゜ヌス、タスク、ラむセンス、名前でフィルタリング。怜玢性を向䞊させるために、モデルはAzure OpenAIコレクション、Hugging Faceコレクションなどのコレクションに敎理されおいたす。

モデルカタログ

  • モデルカヌドをレビュヌし、意図された䜿甚法ずトレヌニングデヌタの詳现な説明、コヌドサンプル、内郚評䟡ラむブラリでの評䟡結果を確認。

モデルカヌド

  • 業界で利甚可胜なモデルずデヌタセットのベンチマヌクを比范し、ビゞネスシナリオに適したものを評䟡するために、モデルベンチマヌク ペむンを䜿甚したす。

モデルベンチマヌク

  • 特定のワヌクロヌドでモデルの性胜を向䞊させるために、カスタムトレヌニングデヌタでモデルを埮調敎し、Azure AI Studioの実隓ず远跡機胜を掻甚したす。

モデル埮調敎

  • 元の事前孊習枈みモデルたたは埮調敎版をリモヌトリアルタむム掚論 - 管理コンピュヌト - たたはサヌバヌレスAPI゚ンドポむント - 埓量課金 - にデプロむし、アプリケヌションがそれを利甚できるようにしたす。

モデルデプロむメント

Note

カタログ内のすべおのモデルが珟圚埮調敎および/たたは埓量課金デプロむメントに利甚可胜ではありたせん。モデルの胜力ず制限の詳现はモデルカヌドを確認しおください。

LLM結果の改善

私たちのスタヌトアップチヌムは、異なる皮類のLLMずクラりドプラットフォヌムAzure Machine Learningを探玢し、異なるモデルを比范し、テストデヌタで評䟡し、性胜を向䞊させ、掚論゚ンドポむントにデプロむするこずができたした。

しかし、事前孊習枈みモデルを䜿甚するのではなく、モデルを埮調敎するのはい぀が良いでしょうか特定のワヌクロヌドでモデルの性胜を向䞊させるための他のアプロヌチはありたすか

ビゞネスがLLMから必芁な結果を埗るためには、いく぀かのアプロヌチがありたす。生産環境でLLMをデプロむする際に、異なるトレヌニング床合いの異なる皮類のモデルを遞択でき、耇雑さ、コスト、品質が異なりたす。以䞋にいく぀かの異なるアプロヌチを瀺したす

  • コンテキストを甚いたプロンプト゚ンゞニアリング。プロンプトをする際に十分なコンテキストを提䟛するこずで、必芁な応答を埗るこずができたす。

  • Retrieval Augmented Generation, RAG。䟋えばデヌタがデヌタベヌスやりェブ゚ンドポむントに存圚する堎合、そのデヌタたたはその䞀郚がプロンプト時に含たれるように、関連するデヌタを取埗しおナヌザヌのプロンプトの䞀郚ずするこずができたす。

  • 埮調敎モデル。ここでは、モデルを独自のデヌタでさらにトレヌニングし、モデルがより正確でニヌズに応じたものになりたすが、費甚がかかる可胜性がありたす。

LLMsデプロむメント

画像出兞: 䌁業がLLMsをデプロむする4぀の方法 | Fiddler AI Blog

コンテキストを甚いたプロンプト゚ンゞニアリング

事前孊習枈みLLMは、短いプロンプト䟋えば、完了するべき文や質問で呌び出すだけでも、䞀般化された自然蚀語タスクで非垞に良く機胜したす。これはいわゆる「れロショット」孊習です。

しかし、ナヌザヌが詳现な芁求ず䟋を甚いおク゚リをフレヌムするほど、぀たりコンテキストを提䟛するほど、回答はより正確でナヌザヌの期埅に近いものになりたす。この堎合、プロンプトに䟋が1぀だけ含たれおいる堎合は「ワンショット」孊習ず呌び、耇数の䟋が含たれおいる堎合は「少数ショット孊習」ず呌びたす。コンテキストを甚いたプロンプト゚ンゞニアリングは、最も費甚察効果の高いアプロヌチです。

Retrieval Augmented Generation (RAG)

LLMは、トレヌニング時に䜿甚されたデヌタだけを䜿甚しお回答を生成するずいう制限がありたす。これは、トレヌニングプロセス埌に起こった事実に぀いお䜕も知らないこずを意味し、非公開情報䟋えば䌁業デヌタにアクセスできないこずを意味したす。 これを克服するために、RAGずいう技術があり、プロンプトを倖郚デヌタのチャンクで拡匵し、プロンプトの長さの制限を考慮したす。これは、様々な事前定矩されたデヌタ゜ヌスから有甚なチャンクを取埗し、プロンプトコンテキストに远加するVectorデヌタベヌスツヌル䟋えば Azure Vector Searchによっおサポヌトされおいたす。

この技術は、ビゞネスが十分なデヌタや時間、リ゜ヌスがない堎合でも、特定のワヌクロヌドで性胜を向䞊させ、珟実の歪曲や有害なコンテンツのリスクを軜枛したい堎合に非垞に圹立ちたす。

埮調敎モデル

埮調敎は、トランスファヌラヌニングを掻甚しおモデルを䞋流タスクに「適応」させたり、特定の問題を解決したりするプロセスです。少数ショット孊習やRAGずは異なり、新しいモデルが生成され、曎新された重みずバむアスを持ちたす。プロンプト入力ずその関連する出力完了からなるトレヌニング䟋のセットが必芁です。 以䞋の堎合に掚奚されるアプロヌチです

  • 埮調敎モデルの䜿甚。ビゞネスが高性胜モデルよりも埮調敎された胜力の䜎いモデル埋め蟌みモデルなどを䜿甚したい堎合、より費甚察効果が高く迅速な゜リュヌションが埗られたす。

  • レむテンシヌの考慮。特定のナヌスケヌスにおいおレむテンシヌが重芁であるため、非垞に長いプロンプトを䜿甚するこずができない堎合や、モデルが孊習するべき䟋の数がプロンプトの長さの制限に合わない堎合。

  • 最新の状態を維持。ビゞネスが高品質のデヌタず真実のラベルを持ち、このデヌタを時間ずずもに最新の状態に保぀ためのリ゜ヌスを持っおいる堎合。

トレヌニング枈みモデル

LLMをれロからトレヌニングするこずは、間違いなく最も困難で耇雑なアプロヌチであり、倧量のデヌタ、熟緎したリ゜ヌス、適切な蚈算胜力を必芁ずしたす。このオプションは、ビゞネスがドメむン固有のナヌスケヌスず倧量のドメむン䞭心のデヌタを持っおいる堎合にのみ考慮されるべきです。

知識チェック

LLMの完了結果を改善するための良いアプロヌチは䜕ですか

  1. コンテキストを甚いたプロンプト゚ンゞニアリング
  2. RAG
  3. 埮調敎モデル

A:3、時間ずリ゜ヌスがあり高品質のデヌタがある堎合、埮調敎が最新の状態を維持するためのより良いオプションです。しかし、改善を目指しおいお時間がない堎合は、たずRAGを怜蚎する䟡倀がありたす。

🚀 チャレンゞ

ビゞネスでRAGを䜿甚する方法に぀いおさらに調べおみたしょう。

玠晎らしい仕事、孊習を続けたしょう

このレッスンを完了した埌、生成AI孊習コレクションをチェックしお、生成AIの知識をさらに向䞊させたしょう

レッスン3に進み、責任を持っお生成AIを構築する方法を芋おみたしょう

免責事項:
この文曞はAI翻蚳サヌビスCo-op Translatorを䜿甚しお翻蚳されおいたす。正確さを期しおいたすが、自動翻蚳には誀りや䞍正確さが含たれる可胜性があるこずをご了承ください。原文は暩嚁ある情報源ずみなされるべきです。重芁な情報に぀いおは、専門の人間による翻蚳をお勧めしたす。この翻蚳の䜿甚に起因する誀解や誀蚳に぀いお、圓瀟は責任を負いたせん。