Skip to content

Latest commit

 

History

History
208 lines (111 loc) · 25.1 KB

File metadata and controls

208 lines (111 loc) · 25.1 KB

異なるLLMの探玢ず比范

異なるLLMの探玢ず比范

䞊の画像をクリックしお、このレッスンの動画をご芧ください

前回のレッスンでは、生成AIが技術の颚景をどのように倉えおいるか、倧芏暡蚀語モデルLLMがどのように機胜するか、そしお私たちのスタヌトアップのような䌁業がそれらをどのように掻甚しお成長できるかを孊びたした。この章では、異なる皮類の倧芏暡蚀語モデルLLMを比范し、それぞれの利点ず欠点を理解するこずを目指したす。

私たちのスタヌトアップの次のステップは、珟圚のLLMの状況を探玢し、どれが私たちのナヌスケヌスに適しおいるかを理解するこずです。

はじめに

このレッスンでは以䞋を孊びたす

  • 珟圚のLLMの皮類
  • Azureでのナヌスケヌスに合わせたモデルのテスト、反埩、比范
  • LLMのデプロむ方法

孊習目暙

このレッスンを完了するず、以䞋ができるようになりたす

  • ナヌスケヌスに適したモデルを遞択する
  • モデルのテスト、反埩、性胜向䞊の方法を理解する
  • 䌁業がモデルをデプロむする方法を知る

異なる皮類のLLMを理解する

LLMはそのアヌキテクチャ、トレヌニングデヌタ、ナヌスケヌスに基づいお耇数の分類が可胜です。これらの違いを理解するこずで、私たちのスタヌトアップはシナリオに適したモデルを遞択し、テスト、反埩、性胜向䞊の方法を理解するこずができたす。

LLMには倚くの皮類があり、遞択するモデルは䜿甚目的、デヌタ、予算などによっお異なりたす。

モデルをテキスト、音声、動画、画像生成などに䜿甚するかどうかによっお、遞択するモデルが異なる堎合がありたす。

  • 音声およびスピヌチ認識。この目的には、Whisperタむプのモデルが最適です。これらは汎甚的でスピヌチ認識を目的ずしおいたす。倚様な音声でトレヌニングされおおり、倚蚀語のスピヌチ認識が可胜です。Whisperタむプのモデルに぀いおはこちらをご芧ください。

  • 画像生成。画像生成には、DALL-EやMidjourneyが非垞に有名な遞択肢です。DALL-EはAzure OpenAIで提䟛されおいたす。DALL-Eに぀いおはこちらをご芧くださいおよびこのカリキュラムの第9章。

  • テキスト生成。ほずんどのモデルはテキスト生成に特化しおおり、GPT-3.5からGPT-4たで幅広い遞択肢がありたす。GPT-4は最も高䟡ですが、胜力ずコストの芳点でどのモデルが最適かを評䟡するためにAzure OpenAIプレむグラりンドを利甚する䟡倀がありたす。

  • マルチモダリティ。入力ず出力で耇数の皮類のデヌタを扱いたい堎合は、gpt-4 turbo with visionやgpt-4oのような最新のOpenAIモデルを怜蚎するこずができたす。これらは自然蚀語凊理ず芖芚理解を組み合わせ、マルチモヌダルむンタヌフェヌスを通じたむンタラクションを可胜にしたす。

モデルを遞択するず基本的な機胜が埗られたすが、それだけでは十分でない堎合がありたす。䌁業固有のデヌタをLLMに䌝える必芁がある堎合もありたす。その方法に぀いおは次のセクションで詳しく説明したす。

基盀モデルずLLMの違い

基盀モデルずいう甚語はスタンフォヌドの研究者によっお提唱され、以䞋の基準を満たすAIモデルずしお定矩されおいたす

  • 教垫なし孊習たたは自己教垫あり孊習でトレヌニングされる。぀たり、ラベルのないマルチモヌダルデヌタでトレヌニングされ、人間によるデヌタの泚釈やラベル付けを必芁ずしたせん。
  • 非垞に倧芏暡なモデル。非垞に深いニュヌラルネットワヌクで構成され、数十億のパラメヌタでトレヌニングされおいたす。
  • 他のモデルの「基盀」ずしお機胜するこずを意図しおいる。぀たり、他のモデルがその䞊に構築される出発点ずしお䜿甚されるこずができたす。これには埮調敎が含たれたす。

基盀モデルずLLMの違い

画像出兞: Essential Guide to Foundation Models and Large Language Models | by Babar M Bhatti | Medium

この違いをさらに明確にするために、ChatGPTを䟋にずりたしょう。ChatGPTの最初のバヌゞョンを構築するために、GPT-3.5ずいうモデルが基盀モデルずしお䜿甚されたした。これは、OpenAIがチャット特有のデヌタを䜿甚しお、䌚話シナリオチャットボットなどで優れた性胜を発揮するように特化したGPT-3.5のバヌゞョンを䜜成したこずを意味したす。

基盀モデル

画像出兞: 2108.07258.pdf (arxiv.org)

オヌプン゜ヌスモデルずプロプラむ゚タリモデル

LLMを分類するもう䞀぀の方法は、それがオヌプン゜ヌスかプロプラむ゚タリかです。

オヌプン゜ヌスモデルは、䞀般公開されおおり、誰でも䜿甚できるモデルです。これらは、䜜成した䌁業や研究コミュニティによっお公開されるこずが倚いです。これらのモデルは、LLMのさたざたなナヌスケヌスに合わせお怜査、倉曎、カスタマむズするこずができたす。ただし、必ずしも生産甚途に最適化されおいるわけではなく、プロプラむ゚タリモデルほど性胜が高くない堎合がありたす。たた、オヌプン゜ヌスモデルの資金提䟛は限られおいるこずがあり、長期的に維持されない堎合や最新の研究で曎新されない堎合がありたす。人気のあるオヌプン゜ヌスモデルの䟋には、Alpaca、Bloom、LLaMAなどがありたす。

プロプラむ゚タリモデルは、䌁業が所有しおおり、䞀般公開されおいないモデルです。これらのモデルは、通垞、生産甚途に最適化されおいたす。ただし、これらは怜査、倉曎、たたは異なるナヌスケヌスに合わせおカスタマむズするこずができたせん。たた、必ずしも無料で利甚できるわけではなく、䜿甚するにはサブスクリプションや支払いが必芁な堎合がありたす。さらに、モデルのトレヌニングに䜿甚されるデヌタをナヌザヌが制埡できないため、デヌタプラむバシヌやAIの責任ある䜿甚に関するコミットメントをモデル所有者に委ねる必芁がありたす。人気のあるプロプラむ゚タリモデルの䟋には、OpenAIモデル、Google Bard、Claude 2などがありたす。

埋め蟌み、画像生成、テキストおよびコヌド生成

LLMは生成する出力によっおも分類できたす。

埋め蟌みは、テキストを数倀圢匏埋め蟌みに倉換できるモデルのセットです。埋め蟌みは、入力テキストの数倀衚珟であり、機械が単語や文の関係を理解しやすくしたす。たた、分類モデルやクラスタリングモデルなど、数倀デヌタで性胜が向䞊する他のモデルの入力ずしお䜿甚できたす。埋め蟌みモデルは、転移孊習に頻繁に䜿甚されたす。転移孊習では、デヌタが豊富な代替タスク甚にモデルが構築され、その埌モデルの重み埋め蟌みが他の䞋流タスクに再利甚されたす。このカテゎリの䟋ずしおは、OpenAI埋め蟌みがありたす。

埋め蟌み

画像生成モデルは画像を生成するモデルです。これらのモデルは、画像線集、画像合成、画像翻蚳に頻繁に䜿甚されたす。画像生成モデルは、LAION-5Bのような倧芏暡な画像デヌタセットでトレヌニングされ、新しい画像を生成したり、既存の画像をむンペむンティング、超解像、色付け技術で線集したりするために䜿甚できたす。䟋ずしおは、DALL-E-3やStable Diffusionモデルがありたす。

画像生成

テキストおよびコヌド生成モデルは、テキストやコヌドを生成するモデルです。これらのモデルは、テキスト芁玄、翻蚳、質問応答に頻繁に䜿甚されたす。テキスト生成モデルは、BookCorpusのような倧芏暡なテキストデヌタセットでトレヌニングされ、新しいテキストを生成したり、質問に答えたりするために䜿甚できたす。コヌド生成モデルは、CodeParrotのように、GitHubなどの倧芏暡なコヌドデヌタセットでトレヌニングされ、新しいコヌドを生成したり、既存のコヌドのバグを修正したりするために䜿甚できたす。

テキストおよびコヌド生成

゚ンコヌダ-デコヌダずデコヌダのみ

LLMの異なるアヌキテクチャに぀いお話すために、䟋えを䜿っお説明したす。

あなたの䞊叞が孊生向けのクむズを䜜成するタスクを䞎えたずしたす。あなたには2人の同僚がいお、1人はコンテンツの䜜成を担圓し、もう1人はレビュヌを担圓しおいたす。

コンテンツ䜜成者はデコヌダのみのモデルのようなもので、トピックを芋おあなたがすでに曞いた内容を確認し、それに基づいおコヌスを䜜成するこずができたす。圌らは魅力的で情報豊富なコンテンツを䜜成するのが埗意ですが、トピックや孊習目暙を理解するのは埗意ではありたせん。デコヌダモデルの䟋ずしおは、GPTファミリヌのモデルGPT-3などがありたす。

レビュヌ担圓者ぱンコヌダのみのモデルのようなもので、曞かれたコヌスや回答を芋お、それらの関係を理解し、文脈を把握したすが、コンテンツを生成するのは埗意ではありたせん。゚ンコヌダのみのモデルの䟋ずしおは、BERTがありたす。

たた、クむズを䜜成しレビュヌするこずができる人もいるず想像しおください。これが゚ンコヌダ-デコヌダモデルです。䟋ずしおは、BARTやT5がありたす。

サヌビスずモデルの違い

次に、サヌビスずモデルの違いに぀いお説明したす。サヌビスずは、クラりドサヌビスプロバむダヌによっお提䟛される補品であり、通垞、モデル、デヌタ、その他のコンポヌネントの組み合わせです。モデルはサヌビスの䞭栞ずなるコンポヌネントであり、通垞はLLMのような基盀モデルです。

サヌビスは通垞、生産甚途に最適化されおおり、グラフィカルナヌザヌむンタヌフェヌスを介しおモデルを䜿甚するよりも簡単です。ただし、サヌビスは必ずしも無料で利甚できるわけではなく、䜿甚するにはサブスクリプションや支払いが必芁な堎合がありたす。これにより、サヌビス所有者の蚭備やリ゜ヌスを掻甚し、費甚を最適化し、簡単にスケヌルするこずができたす。サヌビスの䟋ずしおは、Azure OpenAI Serviceがありたす。このサヌビスは埓量課金制の料金プランを提䟛しおおり、ナヌザヌはサヌビスの䜿甚量に比䟋しお課金されたす。たた、Azure OpenAI Serviceは、モデルの機胜に加えお、゚ンタヌプラむズグレヌドのセキュリティず責任あるAIフレヌムワヌクを提䟛したす。

モデルはニュヌラルネットワヌクそのものであり、パラメヌタ、重みなどを含みたす。䌁業がロヌカルで実行するこずが可胜ですが、蚭備を賌入し、スケヌルするための構造を構築し、ラむセンスを賌入するか、オヌプン゜ヌスモデルを䜿甚する必芁がありたす。LLaMAのようなモデルは䜿甚可胜であり、モデルを実行するための蚈算胜力が必芁です。

Azureでの性胜を理解するための異なるモデルのテストず反埩方法

私たちのチヌムが珟圚のLLMの状況を探玢し、シナリオに適した候補を特定したら、次のステップはデヌタずワヌクロヌドでそれらをテストするこずです。これは実隓ず枬定による反埩的なプロセスです。 前の段萜で述べたほずんどのモデルOpenAIモデル、Llama2のようなオヌプン゜ヌスモデル、Hugging Face transformersなどは、Azure AI Studioのモデルカタログで利甚可胜です。

Azure AI Studioは、開発者が生成AIアプリケヌションを構築し、実隓から評䟡たでの開発ラむフサむクル党䜓を管理するためのクラりドプラットフォヌムです。Azure AIサヌビスを1぀のハブに統合し、䜿いやすいGUIを提䟛したす。Azure AI Studioのモデルカタログでは、以䞋のこずが可胜です

  • カタログ内で興味のある基盀モデルを芋぀けるこずができたす。プロプラむ゚タリモデルやオヌプン゜ヌスモデルを、タスク、ラむセンス、名前でフィルタリングしお怜玢できたす。怜玢性を向䞊させるために、モデルはAzure OpenAIコレクションやHugging Faceコレクションなどのコレクションに敎理されおいたす。

モデルカタログ

  • モデルカヌドを確認し、䜿甚目的やトレヌニングデヌタの詳现な説明、コヌドサンプル、内郚評䟡ラむブラリでの評䟡結果を確認できたす。

モデルカヌド

  • 業界で利甚可胜なモデルやデヌタセット間のベンチマヌクを比范し、ビゞネスシナリオに最適なものを評䟡するためにモデルベンチマヌクパネルを䜿甚できたす。

モデルベンチマヌク

  • カスタムトレヌニングデヌタでモデルを埮調敎し、特定のワヌクロヌドでのモデル性胜を向䞊させるこずができたす。Azure AI Studioの実隓ずトラッキング機胜を掻甚したす。

モデル埮調敎

  • 元の事前トレヌニング枈みモデルたたは埮調敎枈みバヌゞョンを、リモヌトリアルタむム掚論管理されたコンピュヌトたたはサヌバヌレスAPI゚ンドポむント埓量課金制にデプロむし、アプリケヌションがそれを利甚できるようにしたす。

モデルデプロむ

Note

カタログ内のすべおのモデルが埮調敎や埓量課金制デプロむに察応しおいるわけではありたせん。モデルカヌドでモデルの機胜や制限に぀いお詳现を確認しおください。

LLMの結果を改善する方法

私たちのスタヌトアップチヌムでは、さたざたな皮類のLLMず、異なるモデルを比范し、テストデヌタで評䟡し、性胜を向䞊させ、掚論゚ンドポむントにデプロむできるクラりドプラットフォヌムAzure Machine Learningを探求したした。

しかし、事前トレヌニング枈みモデルを䜿甚するのではなく、モデルを埮調敎するべきタむミングはい぀でしょうか特定のワヌクロヌドでモデル性胜を向䞊させるための他のアプロヌチはあるのでしょうか

ビゞネスがLLMから必芁な結果を埗るために䜿甚できるいく぀かのアプロヌチがありたす。LLMを本番環境にデプロむする際には、異なるトレヌニング床合いのモデルを遞択するこずができ、耇雑さ、コスト、品質のレベルが異なりたす。以䞋は異なるアプロヌチの䟋です

  • コンテキストを䌎うプロンプト゚ンゞニアリング。必芁な応答を埗るために、プロンプトに十分なコンテキストを提䟛するこずが重芁です。

  • RAGRetrieval Augmented Generation。デヌタがデヌタベヌスやりェブ゚ンドポむントに存圚する堎合、プロンプト時に関連するデヌタを取埗し、それをナヌザヌのプロンプトに組み蟌むこずができたす。

  • 埮調敎モデル。モデルをさらに自分のデヌタでトレヌニングするこずで、より正確でニヌズに応じた応答を埗るこずができたすが、コストがかかる可胜性がありたす。

LLMのデプロむ

画像出兞: Four Ways that Enterprises Deploy LLMs | Fiddler AI Blog

コンテキストを䌎うプロンプト゚ンゞニアリング

事前トレヌニング枈みのLLMは、短いプロンプト䟋えば、文章の補完や質問を䜿甚するだけでも、䞀般的な自然蚀語タスクで非垞に良い結果を出したす。これを「れロショット孊習」ず呌びたす。

しかし、ナヌザヌが詳现なリク゚ストや䟋を含むプロンプトを提䟛するこずで、より正確で期埅に近い応答を埗るこずができたす。この堎合、プロンプトに1぀の䟋だけを含む堎合は「ワンショット孊習」、耇数の䟋を含む堎合は「少数ショット孊習」ず呌ばれたす。コンテキストを䌎うプロンプト゚ンゞニアリングは、最もコスト効率の良いアプロヌチです。

Retrieval Augmented Generation (RAG)

LLMは、トレヌニング䞭に䜿甚されたデヌタのみを䜿甚しお応答を生成するずいう制限がありたす。぀たり、トレヌニング埌に発生した事実に぀いおは䜕も知らず、非公開情報䟋えば䌁業デヌタにはアクセスできたせん。

これを克服するために、RAGずいう技術を䜿甚したす。この技術では、プロンプトの長さの制限を考慮しながら、倖郚デヌタを文曞の断片ずしおプロンプトに远加したす。これは、Azure Vector Searchのようなベクトルデヌタベヌスツヌルによっおサポヌトされ、事前定矩されたデヌタ゜ヌスから有甚な断片を取埗し、それをプロンプトのコンテキストに远加したす。

この技術は、ビゞネスが十分なデヌタや時間、リ゜ヌスを持っおいない堎合でも、特定のワヌクロヌドで性胜を向䞊させ、珟実の歪曲や有害なコンテンツのリスクを軜枛するのに非垞に圹立ちたす。

埮調敎モデル

埮調敎は、転移孊習を掻甚しおモデルを䞋流タスクに「適応」させたり、特定の問題を解決したりするプロセスです。少数ショット孊習やRAGずは異なり、埮調敎では新しいモデルが生成され、重みやバむアスが曎新されたす。これには、単䞀の入力プロンプトずそれに関連する出力補完からなるトレヌニング䟋のセットが必芁です。 以䞋の堎合、このアプロヌチが掚奚されたす

  • 埮調敎モデルの䜿甚。ビゞネスが高性胜モデルではなく、埋め蟌みモデルのような埮調敎された胜力の䜎いモデルを䜿甚したい堎合、よりコスト効率が良く迅速な゜リュヌションずなりたす。

  • レむテンシヌの考慮。特定のナヌスケヌスでレむテンシヌが重芁であり、非垞に長いプロンプトを䜿甚するこずができない堎合や、モデルが孊習すべき䟋の数がプロンプトの長さ制限に収たらない堎合。

  • 最新情報の維持。ビゞネスが高品質なデヌタず正解ラベルを倧量に持っおおり、このデヌタを時間ずずもに最新の状態に保぀ためのリ゜ヌスを持っおいる堎合。

トレヌニング枈みモデル

LLMをれロからトレヌニングするこずは、間違いなく最も困難で耇雑なアプロヌチであり、倧量のデヌタ、熟緎したリ゜ヌス、適切な蚈算胜力が必芁です。このオプションは、ビゞネスがドメむン固有のナヌスケヌスを持ち、倧量のドメむン䞭心のデヌタを持っおいる堎合にのみ怜蚎されるべきです。

知識チェック

LLMの補完結果を改善するための良いアプロヌチは䜕でしょうか

  1. コンテキストを䌎うプロンプト゚ンゞニアリング
  2. RAG
  3. 埮調敎モデル

A:3、時間ずリ゜ヌスがあり、高品質なデヌタがある堎合、埮調敎が最新の状態を維持するための最良の遞択肢です。しかし、改善を目指しおいお時間がない堎合は、たずRAGを怜蚎する䟡倀がありたす。

🚀 チャレンゞ

RAGを䜿甚する方法に぀いおさらに孊び、ビゞネスに掻甚する方法を調べおみたしょう。

玠晎らしい仕事です、孊びを続けたしょう

このレッスンを完了した埌は、生成AI孊習コレクションをチェックしお、生成AIの知識をさらに深めおください

次のレッスン3では、生成AIを責任を持っお掻甚する方法に぀いお孊びたす


免責事項:
この文曞はAI翻蚳サヌビスCo-op Translatorを䜿甚しお翻蚳されおいたす。正確性を远求しおおりたすが、自動翻蚳には誀りや䞍正確な郚分が含たれる可胜性がありたす。元の蚀語で蚘茉された文曞を正匏な情報源ずしおご参照ください。重芁な情報に぀いおは、専門の人間による翻蚳を掚奚したす。この翻蚳の䜿甚に起因する誀解や誀認に぀いお、圓瀟は䞀切の責任を負いたせん。