Skip to content

Latest commit

 

History

History
224 lines (125 loc) · 24.1 KB

File metadata and controls

224 lines (125 loc) · 24.1 KB

さたざたなLLMの探玢ず比范

さたざたなLLMの探玢ず比范

䞊の画像をクリックするず、このレッスンの動画がご芧いただけたす

前回のレッスンでは、Generative AIが技術の颚景をどのように倉えおいるか、Large Language ModelsLLMがどのように機胜するか、そしおスタヌトアップのようなビゞネスがそれらをどのように掻甚しお成長できるかを芋おきたした。本章では、さたざたなタむプの倧芏暡蚀語モデルLLMを比范し、それぞれの長所ず短所を理解しおいきたす。

スタヌトアップの次のステップは、珟圚のLLMの状況を調査し、自分たちのナヌスケヌスに適したモデルを芋極めるこずです。

はじめに

このレッスンで扱う内容は以䞋の通りです

  • 珟圚のLLMのさたざたなタむプ
  • Azure䞊でのモデルのテスト、反埩、比范
  • LLMのデプロむ方法

孊習目暙

このレッスンを終えた埌、あなたは以䞋のこずができるようになりたす

  • ナヌスケヌスに最適なモデルを遞択する
  • モデルのテスト、反埩、性胜向䞊の方法を理解する
  • ビゞネスがモデルをどのようにデプロむしおいるかを知る

さたざたなタむプのLLMを理解する

LLMは、そのアヌキテクチャ、孊習デヌタ、ナヌスケヌスに基づいお耇数の分類が可胜です。これらの違いを理解するこずで、スタヌトアップはシナリオに合ったモデルを遞び、テストや反埩、性胜向䞊の方法を把握できたす。

倚くの皮類のLLMモデルがあり、どのモデルを遞ぶかは、䜿甚目的、デヌタ、予算などによっお異なりたす。

テキスト、音声、動画、画像生成など、䜕に䜿いたいかによっお遞ぶモデルも倉わっおきたす。

  • 音声認識
    この甚途には、Whisperタむプのモデルが優れおいたす。汎甚的で音声認識に特化しおおり、倚様な音声デヌタで孊習されおいお倚蚀語の音声認識が可胜です。Whisperタむプのモデルに぀いおはこちらをご芧ください。

  • 画像生成
    画像生成には、DALL-EやMidjourneyがよく知られおいたす。DALL-EはAzure OpenAIで提䟛されおいたす。DALL-Eに぀いおはこちらや、本カリキュラムの第9章も参照しおください。

  • テキスト生成
    ほずんどのモデルはテキスト生成に特化しおおり、GPT-3.5からGPT-4たで幅広い遞択肢がありたす。コストもさたざたで、GPT-4が最も高䟡です。Azure OpenAI playgroundで、性胜やコスト面から最適なモデルを評䟡するのがおすすめです。

  • マルチモヌダル
    入力や出力で耇数のデヌタタむプを扱いたい堎合は、gpt-4 turbo with visionやgpt-4oのような最新のOpenAIモデルを怜蚎するず良いでしょう。これらは自然蚀語凊理ず芖芚理解を組み合わせ、マルチモヌダルなむンタヌフェヌスでの察話を可胜にしたす。

モデルを遞ぶずいうこずは、基本的な胜力を埗るこずですが、それだけでは䞍十分な堎合もありたす。倚くの堎合、䌁業固有のデヌタをLLMに䌝える必芁がありたす。その方法に぀いおは、埌のセクションで詳しく説明したす。

Foundation ModelsずLLMの違い

Foundation Modelずいう甚語はスタンフォヌドの研究者によっお提唱され、以䞋のような特城を持぀AIモデルを指したす

  • 教垫なし孊習たたは自己教垫あり孊習で蚓緎されおいる
    ラベル付けされおいないマルチモヌダルデヌタで孊習し、デヌタの人手による泚釈やラベル付けを必芁ずしたせん。

  • 非垞に倧芏暡なモデルである
    数十億のパラメヌタを持぀深いニュヌラルネットワヌクに基づいおいたす。

  • 他のモデルの「基盀」ずしお䜿われるこずを意図しおいる
    ファむンチュヌニングによっお他のモデルの土台ずしお利甚されたす。

Foundation Models versus LLMs

画像出兞Essential Guide to Foundation Models and Large Language Models | by Babar M Bhatti | Medium

この違いをさらに明確にするために、ChatGPTを䟋に挙げたしょう。ChatGPTの最初のバヌゞョンは、GPT-3.5ずいうモデルを基盀モデルずしお構築されたした。぀たり、OpenAIはチャットに特化したデヌタを䜿っおGPT-3.5を調敎し、チャットボットのような䌚話シナリオで高い性胜を発揮するモデルを䜜り䞊げたのです。

Foundation Model

画像出兞2108.07258.pdf (arxiv.org)

オヌプン゜ヌスモデルずプロプラむ゚タリモデル

LLMを分類するもう䞀぀の方法は、オヌプン゜ヌスかプロプラむ゚タリかです。

オヌプン゜ヌスモデルは、䞀般に公開されおいお誰でも利甚可胜です。倚くは開発元の䌁業や研究コミュニティによっお提䟛されおおり、モデルの䞭身を怜査、改倉、カスタマむズできたす。ただし、必ずしも本番環境向けに最適化されおいるわけではなく、性胜面でプロプラむ゚タリモデルに劣るこずもありたす。たた、資金面での制玄があり、長期的なメンテナンスや最新研究の反映が十分でない堎合もありたす。代衚的なオヌプン゜ヌスモデルにはAlpaca、Bloom、LLaMAなどがありたす。

プロプラむ゚タリモデルは䌁業が所有し、䞀般には公開されおいたせん。倚くは本番環境向けに最適化されおおり、利甚にはサブスクリプションや料金が必芁な堎合がありたす。䞭身の怜査や改倉は蚱可されおおらず、利甚者はモデルのトレヌニングに䜿われるデヌタの管理やAIの責任ある利甚に぀いお、モデル所有者に信頌を眮く必芁がありたす。代衚的なプロプラむ゚タリモデルにはOpenAIモデル、Google Bard、Claude 2などがありたす。

埋め蟌みモデル、画像生成モデル、テキスト・コヌド生成モデル

LLMは生成する出力の皮類によっおも分類できたす。

埋め蟌みEmbeddingモデルは、テキストを数倀化した埋め蟌みベクトルに倉換したす。これにより、単語や文の関係性を機械が理解しやすくなり、分類モデルやクラスタリングモデルなど、数倀デヌタを扱う他のモデルの入力ずしお利甚されたす。埋め蟌みモデルは転移孊習でよく䜿われ、豊富なデヌタがある代理タスクで孊習したモデルの重み埋め蟌みを他の䞋流タスクに再利甚したす。このカテゎリの䟋ずしおOpenAI embeddingsがありたす。

Embedding

画像生成モデルは画像を生成したす。画像線集、合成、倉換に䜿われ、倧芏暡な画像デヌタセット䟋LAION-5Bで孊習されおいたす。新しい画像の生成や、むンペむンティング、超解像、色付けなどの線集が可胜です。代衚䟋はDALL-E-3やStable Diffusionモデルです。

Image generation

テキスト・コヌド生成モデルはテキストやコヌドを生成したす。テキスト芁玄、翻蚳、質問応答などに䜿われたす。倧芏暡なテキストデヌタセット䟋BookCorpusで孊習され、新しいテキストの生成や質問ぞの回答が可胜です。コヌド生成モデル䟋CodeParrotはGitHubなどの倧芏暡コヌドデヌタセットで孊習され、新しいコヌドの生成や既存コヌドのバグ修正に䜿われたす。

Text and code generation

゚ンコヌダ・デコヌダモデルずデコヌダのみモデル

LLMのアヌキテクチャの違いを説明するために、䟋え話を䜿いたしょう。

あなたの䞊叞が孊生向けのクむズ䜜成を䟝頌したした。あなたには2人の同僚がいたす。1人は問題䜜成を担圓し、もう1人は問題のレビュヌを担圓したす。

問題䜜成者はデコヌダのみモデルのようなもので、トピックを芋お既に曞かれた内容を参考にしながら問題を䜜成したす。魅力的で情報豊富なコンテンツを曞くのは埗意ですが、トピックや孊習目暙の理解はあたり埗意ではありたせん。デコヌダモデルの䟋ずしおはGPTシリヌズGPT-3などがありたす。

レビュヌ担圓者ぱンコヌダのみモデルのようなもので、曞かれた問題ず回答を芋お䞡者の関係性や文脈を理解したすが、コンテンツの生成は苊手です。゚ンコヌダモデルの䟋はBERTです。

問題䜜成ずレビュヌの䞡方をこなせる人がいるず想像しおください。これが゚ンコヌダ・デコヌダモデルに盞圓したす。䟋ずしおBARTやT5がありたす。

サヌビスずモデルの違い

最埌に、サヌビスずモデルの違いに぀いお説明したす。サヌビスはクラりドサヌビスプロバむダヌが提䟛する補品で、耇数のモデルやデヌタ、その他のコンポヌネントを組み合わせたものです。モデルはサヌビスの䞭栞郚分で、倚くはFoundation ModelやLLMです。

サヌビスは本番環境向けに最適化されおおり、GUIを通じおモデルよりも䜿いやすいこずが倚いです。ただし、無料で䜿えるずは限らず、利甚量に応じた課金やサブスクリプションが必芁な堎合がありたす。サヌビスを利甚するこずで、所有者の蚭備やリ゜ヌスを掻甚でき、コスト最適化やスケヌルが容易になりたす。䟋ずしおAzure OpenAI Serviceがあり、埓量課金制で利甚量に応じお料金が発生したす。たた、゚ンタヌプラむズレベルのセキュリティや責任あるAIフレヌムワヌクも提䟛しおいたす。

モデルはパラメヌタや重みを持぀ニュヌラルネットワヌクそのもので、䌁業がロヌカルで実行するこずも可胜ですが、その堎合は機噚の賌入やスケヌルのための構築、ラむセンス賌入やオヌプン゜ヌスモデルの利甚が必芁です。LLaMAのようなモデルは利甚可胜ですが、実行には蚈算リ゜ヌスが必芁です。

Azureで異なるモデルをテストし、性胜を理解するための反埩方法

チヌムが珟圚のLLMの状況を調査し、シナリオに適した候補を芋぀けたら、次のステップは自分たちのデヌタやワヌクロヌドでテストするこずです。これは実隓ず枬定を繰り返す反埩的なプロセスです。 前の段萜で玹介したほずんどのモデルOpenAIモデル、Llama2のようなオヌプン゜ヌスモデル、Hugging Faceのトランスフォヌマヌモデルは、Azure AI StudioのModel Catalogで利甚可胜です。

Azure AI Studioは、開発者が生成AIアプリケヌションを構築し、実隓から評䟡たでの開発ラむフサむクル党䜓を管理できるクラりドプラットフォヌムです。すべおのAzure AIサヌビスを䜿いやすいGUIの単䞀ハブに統合しおいたす。Azure AI StudioのModel Catalogでは、以䞋のこずが可胜です

  • カタログ内で興味のあるFoundation Modelを芋぀けるこずができたす。独自モデルやオヌプン゜ヌスモデルを、タスク、ラむセンス、名前でフィルタリング可胜です。怜玢性を高めるため、モデルはAzure OpenAIコレクションやHugging Faceコレクションなどのコレクションに分類されおいたす。

Model catalog

  • モデルカヌドを確認できたす。意図された甚途やトレヌニングデヌタの詳现説明、コヌドサンプル、内郚評䟡ラむブラリでの評䟡結果が含たれおいたす。

Model card

  • Model Benchmarksパネルを通じお、業界で利甚可胜なモデルやデヌタセットのベンチマヌクを比范し、ビゞネスシナリオに最適なものを評䟡できたす。

Model benchmarks

  • カスタムトレヌニングデヌタでモデルをファむンチュヌニングし、特定のワヌクロヌドでのモデル性胜を向䞊させるこずができたす。Azure AI Studioの実隓ずトラッキング機胜を掻甚したす。

Model fine-tuning

  • 元の事前孊習枈みモデルたたはファむンチュヌニング枈みモデルを、リモヌトのリアルタむム掚論マネヌゞドコンピュヌトやサヌバヌレスAPI゚ンドポむント埓量課金制にデプロむし、アプリケヌションで利甚可胜にしたす。

Model deployment

Note

カタログ内のすべおのモデルが珟圚ファむンチュヌニングや埓量課金制デプロむに察応しおいるわけではありたせん。モデルの機胜や制限に぀いおはモデルカヌドを確認しおください。

LLMの結果を改善するには

私たちのスタヌトアップチヌムでは、さたざたな皮類のLLMず、異なるモデルを比范・評䟡し、性胜を向䞊させ、掚論゚ンドポむントにデプロむできるクラりドプラットフォヌムAzure Machine Learningを詊しおきたした。

では、い぀事前孊習枈みモデルを䜿うのではなく、ファむンチュヌニングを怜蚎すべきでしょうか特定のワヌクロヌドでモデル性胜を向䞊させる他の方法はあるのでしょうか

ビゞネスがLLMから望む結果を埗るためには、いく぀かのアプロヌチがありたす。LLMを本番環境にデプロむする際には、トレヌニングの床合いや耇雑さ、コスト、品質が異なるさたざたなタむプのモデルを遞択できたす。以䞋は代衚的なアプロヌチです

  • コンテキストを甚いたプロンプト゚ンゞニアリング。必芁な回答を埗るために、プロンプトに十分なコンテキストを提䟛する方法です。

  • Retrieval Augmented GenerationRAG。デヌタがデヌタベヌスやりェブ゚ンドポむントに存圚する堎合、関連デヌタやその䞀郚を取埗しおナヌザヌのプロンプトに含めるこずで、回答の粟床を高めたす。

  • ファむンチュヌニング枈みモデル。自瀟デヌタでモデルをさらにトレヌニングし、より正確でニヌズに応じた応答が可胜になりたすが、コストがかかる堎合がありたす。

LLMs deployment

画像出兞Four Ways that Enterprises Deploy LLMs | Fiddler AI Blog

コンテキストを甚いたプロンプト゚ンゞニアリング

事前孊習枈みのLLMは、短いプロンプト文章の続きを生成する、質問に答えるなどでも䞀般的な自然蚀語タスクに非垞に良く察応したす。これを「れロショット孊習」ず呌びたす。

しかし、ナヌザヌが詳现なリク゚ストや䟋コンテキストを含めおク゚リを構築できればできるほど、回答はより正確で期埅に近いものになりたす。この堎合、プロンプトに䟋が1぀だけ含たれる堎合は「ワンショット孊習」、耇数含たれる堎合は「数ショット孊習」ず呌ばれたす。コンテキストを甚いたプロンプト゚ンゞニアリングは、最もコスト効率の良いスタヌト方法です。

Retrieval Augmented GenerationRAG

LLMは、トレヌニング時に䜿甚されたデヌタのみを䜿っお回答を生成するため、トレヌニング埌に起きた事実や非公開情報䌁業デヌタなどに぀いおは知りたせん。

この制玄を克服するのがRAGずいう手法で、プロンプトに倖郚デヌタ文曞のチャンクを远加しお補匷したす。ただし、プロンプトの長さ制限を考慮する必芁がありたす。これは、Azure Vector Searchのようなベクタヌデヌタベヌスツヌルが、事前に定矩された倚様なデヌタ゜ヌスから有甚なチャンクを怜玢し、プロンプトのコンテキストに远加するこずで実珟されたす。

この手法は、ビゞネスが十分なデヌタや時間、リ゜ヌスを持たずにLLMをファむンチュヌニングできない堎合でも、特定のワヌクロヌドで性胜を向䞊させ、虚停情報や有害コンテンツのリスクを枛らしたい堎合に非垞に有効です。

ファむンチュヌニング枈みモデル

ファむンチュヌニングは、転移孊習を掻甚しおモデルを特定のタスクや問題に「適応」させるプロセスです。数ショット孊習やRAGずは異なり、重みやバむアスが曎新された新しいモデルが生成されたす。トレヌニング䟋は、単䞀の入力プロンプトずそれに察応する出力補完から構成されたす。

以䞋の堎合に掚奚されたす

  • ファむンチュヌニング枈みモデルを䜿う堎合。高性胜モデルではなく、埋め蟌みモデルのような胜力が䜎めのモデルをファむンチュヌニングしお䜿いたい堎合、コスト効率が良く高速な゜リュヌションになりたす。

  • レむテンシを考慮する堎合。特定のナヌスケヌスでレむテンシが重芁で、非垞に長いプロンプトや倚くの䟋を䜿うこずができない堎合。

  • 最新情報を維持したい堎合。倧量の高品質デヌタず正確なラベルがあり、それらを継続的に曎新するリ゜ヌスがある堎合。

トレヌニング枈みモデル

LLMをれロからトレヌニングするのは、間違いなく最も難しく耇雑な方法であり、倧量のデヌタ、熟緎した人材、適切な蚈算リ゜ヌスが必芁です。この遞択肢は、ドメむン特化のナヌスケヌスず倧量のドメむン䞭心デヌタがある堎合に限り怜蚎すべきです。

知識チェック

LLMの補完結果を改善する良いアプロヌチはどれでしょうか

  1. コンテキストを甚いたプロンプト゚ンゞニアリング
  2. RAG
  3. ファむンチュヌニング枈みモデル

答え3。時間ずリ゜ヌス、高品質なデヌタがある堎合は、最新の状態を保぀ためにファむンチュヌニングが最適です。ただし、改善を目指しおいお時間が足りない堎合は、たずRAGを怜蚎する䟡倀がありたす。

🚀 チャレンゞ

ビゞネスでRAGを掻甚する方法に぀いおさらに調べおみたしょう。

玠晎らしい孊習を続けたしょう

このレッスンを終えたら、Generative AI Learning collectionで生成AIの知識をさらに深めおください

次のレッスン3では、生成AIを責任を持っお掻甚する方法を孊びたす

免責事項
本曞類はAI翻蚳サヌビス「Co-op Translator」を䜿甚しお翻蚳されたした。正確性には努めおおりたすが、自動翻蚳には誀りや䞍正確な郚分が含たれる可胜性がありたす。原文の蚀語による文曞が正匏な情報源ずみなされるべきです。重芁な情報に぀いおは、専門の人間による翻蚳を掚奚したす。本翻蚳の利甚により生じたいかなる誀解や誀蚳に぀いおも、圓方は䞀切の責任を負いかねたす。