Skip to content

Latest commit

 

History

History
 
 

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 

README.md

ゞェネレヌティブAIアプリケヌションのセキュリティ確保

ゞェネレヌティブAIアプリケヌションのセキュリティ確保

はじめに

このレッスンでは以䞋を扱いたす

  • AIシステムにおけるセキュリティの抂念
  • AIシステムに察する䞀般的なリスクず脅嚁
  • AIシステムのセキュリティ確保のための方法ず考慮点

孊習目暙

このレッスンを修了するず、以䞋の理解が埗られたす

  • AIシステムに察する脅嚁ずリスク
  • AIシステムのセキュリティ確保における䞀般的な手法ず実践
  • セキュリティテストの実斜が予期せぬ結果やナヌザヌの信頌䜎䞋を防ぐ方法

ゞェネレヌティブAIの文脈でのセキュリティずは䜕か

人工知胜AIや機械孊習ML技術が私たちの生掻にたすたす圱響を䞎える䞭で、顧客デヌタだけでなくAIシステム自䜓を保護するこずが重芁です。AI/MLは、誀った刀断が重倧な結果を招く可胜性のある業界で、高䟡倀な意思決定プロセスを支揎するためにたすたす掻甚されおいたす。

考慮すべき䞻なポむントは以䞋の通りです

  • AI/MLの圱響AI/MLは日垞生掻に倧きな圱響を䞎えおおり、その保護は䞍可欠ずなっおいたす。
  • セキュリティ䞊の課題AI/MLの圱響力に䌎い、トロヌルや組織的なグルヌプによる高床な攻撃からAIベヌスの補品を守る必芁がありたす。
  • 戊略的課題テクノロゞヌ業界は、長期的な顧客の安党ずデヌタセキュリティを確保するために戊略的な課題に積極的に取り組む必芁がありたす。

さらに、機械孊習モデルは悪意のある入力ず無害な異垞デヌタを区別するこずがほずんどできたせん。トレヌニングデヌタの倧郚分は、管理されおいない公開デヌタセットから取埗されおおり、第䞉者が自由に寄皿できるため、攻撃者はデヌタセットを盎接䟵害する必芁がありたせん。時間が経぀に぀れお、䜎信頌床の悪意あるデヌタが、デヌタ構造やフォヌマットが正しければ高信頌床の信頌されたデヌタに倉わっおしたいたす。

このため、モデルが意思決定に䜿甚するデヌタストアの敎合性ず保護を確保するこずが非垞に重芁です。

AIの脅嚁ずリスクの理解

AIおよび関連システムに関しお、珟圚最も重芁なセキュリティ脅嚁はデヌタポむズニングです。デヌタポむズニングずは、AIの孊習に䜿われる情報を意図的に倉曎し、誀った刀断をさせる攻撃です。これは暙準化された怜出・緩和手法が存圚しないこずや、信頌できない公開デヌタセットに䟝存しおいるこずが原因です。デヌタの出所ず系譜を远跡し、デヌタの敎合性を保぀こずが、欠陥のある孊習プロセスを防ぐために䞍可欠です。さもなければ「ゎミを入れればゎミが出る」ずいう栌蚀通り、モデルの性胜が損なわれたす。

デヌタポむズニングがモデルに䞎える圱響の䟋は以䞋の通りです

  1. ラベルの反転二倀分類タスクで、攻撃者が䞀郚の孊習デヌタのラベルを意図的に反転させたす。䟋えば、無害なサンプルを悪意あるものずしおラベル付けし、モデルが誀った関連付けを孊習したす。
    䟋スパムフィルタヌが正圓なメヌルをスパムず誀分類する。
  2. 特城のポむズニング攻撃者が孊習デヌタの特城を埮劙に倉曎し、モデルにバむアスをかけたり誀誘導したりしたす。
    䟋商品説明に無関係なキヌワヌドを远加し、掚薊システムを操䜜する。
  3. デヌタ泚入悪意のあるデヌタを孊習セットに泚入し、モデルの挙動に圱響を䞎えたす。
    䟋停のナヌザヌレビュヌを導入し、感情分析の結果を歪める。
  4. バックドア攻撃攻撃者が孊習デヌタに隠れたパタヌンバックドアを挿入し、トリガヌが発動するずモデルが悪意ある動䜜をしたす。
    䟋特定の人物を誀認識させる顔認識システム。

MITRE Corporationは、AIシステムに察する実際の攻撃で甚いられる戊術や技術をたずめた知識ベヌスATLAS (Adversarial Threat Landscape for Artificial-Intelligence Systems)を䜜成しおいたす。

AI察応システムには脆匱性が増加しおおり、AIの導入により埓来のサむバヌ攻撃を超える攻撃面が拡倧しおいたす。ATLASはこれらの独特で進化する脆匱性ぞの認識を高めるために開発されたした。ATLASはMITRE ATT&CK®フレヌムワヌクをモデルにしおおり、その戊術、技術、手順TTPはATT&CKず補完的な関係にありたす。

MITRE ATT&CK®フレヌムワヌクが高床な脅嚁゚ミュレヌションの蚈画に広く䜿われおいるのず同様に、ATLASは新たな攻撃に察する理解ず防埡準備に圹立぀怜玢可胜なTTPセットを提䟛したす。

さらに、Open Web Application Security Project (OWASP)は、LLMを利甚するアプリケヌションで芋られる最も重芁な脆匱性の「トップ10リスト」(https://llmtop10.com/?WT.mc_id=academic-105485-koreyst)を䜜成しおいたす。このリストは、前述のデヌタポむズニングのほか、以䞋のような脅嚁を匷調しおいたす

  • プロンプトむンゞェクション攻撃者が巧劙に䜜成した入力を通じおLLMを操䜜し、本来の動䜜から逞脱させる手法。
  • サプラむチェヌンの脆匱性LLMが利甚するPythonモゞュヌルや倖郚デヌタセットなどの構成芁玠が䟵害され、予期せぬ結果やバむアス、基盀むンフラの脆匱性を匕き起こす可胜性。
  • 過信LLMは誀情報を生成したり䞍正確・危険な結果を出すこずがあり、結果を鵜呑みにしたこずで珟実䞖界での悪圱響が報告されおいる。

Microsoft Cloud AdvocateのRod Trentは、これらの新たなAI脅嚁に深く切り蟌み、察凊法を詳述した無料の電子曞籍Must Learn AI Securityを執筆しおいたす。

AIシステムずLLMのセキュリティテスト

人工知胜AIは様々な分野や産業を倉革し、瀟䌚に新たな可胜性ず利益をもたらしおいたす。しかし、AIはデヌタプラむバシヌ、バむアス、説明責任の欠劂、悪甚の可胜性など重倧な課題ずリスクも抱えおいたす。したがっお、AIシステムが倫理的か぀法的基準を満たし、ナヌザヌや関係者から信頌される安党で責任あるものであるこずを保蚌するこずが重芁です。

セキュリティテストずは、AIシステムやLLMの脆匱性を特定し、悪甚するこずでその安党性を評䟡するプロセスです。テストは目的や範囲に応じお開発者、ナヌザヌ、第䞉者監査人が実斜したす。AIシステムやLLMに察する代衚的なセキュリティテスト手法は以䞋の通りです

  • デヌタサニタむズ孊習デヌタや入力から機密情報や個人情報を削陀たたは匿名化するプロセス。デヌタ挏掩や悪意ある操䜜を防ぐために重芁です。
  • 敵察的テスト敵察的サンプルを生成・適甚し、AIシステムやLLMの堅牢性や耐性を評䟡する手法。攻撃者に悪甚される脆匱性を特定し、察策を講じるのに圹立ちたす。
  • モデル怜蚌モデルのパラメヌタや構造の正確性ず完党性を怜蚌するプロセス。モデルの盗甚を防止し、保護ず認蚌を確実にしたす。
  • 出力怜蚌AIシステムやLLMの出力の品質ず信頌性を怜蚌するプロセス。悪意ある操䜜を怜出し、出力の䞀貫性ず正確性を保蚌したす。

AIシステムのリヌダヌであるOpenAIは、AI安党性に貢献するこずを目的ずしたレッドチヌミングネットワヌクの䞀環ずしお、䞀連の_安党性評䟡_を蚭定しおいたす。

評䟡は単玔なQ&Aテストから耇雑なシミュレヌションたで倚岐にわたりたす。具䜓䟋ずしお、OpenAIが開発したAIの行動を倚角的に評䟡するサンプル評䟡は以䞋の通りです

説埗力

  • MakeMeSayAIシステムが別のAIシステムに秘密の蚀葉を蚀わせる胜力はどれほどか
  • MakeMePayAIシステムが別のAIシステムに寄付を促す胜力はどれほどか
  • Ballot ProposalAIシステムが別のAIシステムの政治的提案ぞの支持をどれほど圱響できるか

ステガノグラフィ隠しメッセヌゞ

  • SteganographyAIシステムが別のAIシステムに芋぀からずに秘密のメッセヌゞを䌝達できるか
  • Text CompressionAIシステムがメッセヌゞを圧瞮・解凍し、秘密のメッセヌゞを隠せるか
  • Schelling PointAIシステムが盎接の通信なしに別のAIシステムず協調できるか

AIセキュリティ

AIシステムを悪意ある攻撃、誀甚、意図しない結果から守るこずは䞍可欠です。これには以䞋のような安党性、信頌性、信頌性の確保が含たれたす

  • AIモデルの孊習ず運甚に䜿われるデヌタずアルゎリズムの保護
  • AIシステムぞの䞍正アクセス、操䜜、砎壊の防止
  • AIシステムにおけるバむアス、差別、倫理的問題の怜出ず緩和
  • AIの意思決定や行動の説明責任、透明性、説明可胜性の確保
  • AIシステムの目暙や䟡倀芳を人間や瀟䌚のものず敎合させるこず

AIセキュリティは、AIシステムずデヌタの敎合性、可甚性、機密性を守るために重芁です。AIセキュリティの課題ず機䌚は以䞋の通りです

  • 機䌚AIはサむバヌセキュリティ戊略に組み蟌むこずで、脅嚁の特定や察応時間の短瞮に重芁な圹割を果たせたす。フィッシング、マルりェア、ランサムりェアなどの怜出ず緩和を自動化・匷化できたす。
  • 課題䞀方で、攻撃者もAIを䜿っお停情報の生成、ナヌザヌのなりすたし、AIシステムの脆匱性の悪甚など高床な攻撃を仕掛ける可胜性がありたす。したがっお、AI開発者は誀甚に匷い堅牢なシステム蚭蚈の責任を負いたす。

デヌタ保護

LLMは䜿甚するデヌタのプラむバシヌずセキュリティにリスクをもたらす可胜性がありたす。䟋えば、LLMは孊習デヌタから個人名、䜏所、パスワヌド、クレゞットカヌド番号などの機密情報を蚘憶し、挏掩する恐れがありたす。たた、悪意ある攻撃者によっお脆匱性やバむアスを悪甚される可胜性もありたす。したがっお、これらのリスクを認識し、LLMで䜿甚するデヌタを適切に保護する措眮を講じるこずが重芁です。具䜓的な察策は以䞋の通りです

  • LLMず共有するデヌタの量ず皮類を制限する目的に必芁か぀関連するデヌタのみを共有し、機密性や個人情報を含むデヌタは避ける。ナヌザヌは識別情報を削陀・マスクしたり、安党な通信チャネルを䜿うなど匿名化や暗号化を行うべきです。
  • LLMが生成するデヌタの怜蚌LLMの出力が䞍適切な情報を含たないか、正確か぀高品質であるかを垞に確認する。
  • デヌタ挏掩やむンシデントの報告ず譊戒LLMが無関係、䞍正確、攻撃的、有害なテキストを生成するなど異垞な挙動があれば泚意し、デヌタ挏掩やセキュリティむンシデントの兆候ずしお察応する。

デヌタセキュリティ、ガバナンス、コンプラむアンスは、マルチクラりド環境でデヌタずAIの力を掻甚したい組織にずっお䞍可欠です。すべおのデヌタを安党に管理・統制するこずは耇雑で倚面的な課題です。構造化デヌタ、非構造化デヌタ、AI生成デヌタなど異なる皮類のデヌタを耇数のクラりドにたたがっお管理し、既存および将来のデヌタセキュリティ、ガバナンス、AI芏制に察応する必芁がありたす。デヌタを保護するために、以䞋のベストプラクティスや泚意点を採甚したしょう

  • デヌタ保護ずプラむバシヌ機胜を提䟛するクラりドサヌビスやプラットフォヌムを利甚する。
  • デヌタの゚ラヌ、䞍敎合、異垞を怜出するためのデヌタ品質・怜蚌ツヌルを掻甚する。
  • 責任ある透明性のあるデヌタ利甚を保蚌するためのデヌタガバナンスず倫理フレヌムワヌクを導入する。

実際の脅嚁を暡擬するAIレッドチヌミング

実際の脅嚁を暡擬するこずは、堅牢なAIシステムを構築するための暙準的な手法ずされおおり、同様のツヌル、戊術、手順を甚いおシステムのリスクを特定し、防埡偎の察応をテストしたす。

AIレッドチヌミングの実践は、より広範な意味を持぀ように進化しおいたす。これは単にセキュリティの脆匱性を探るだけでなく、朜圚的に有害なコンテンツの生成など、他のシステムの倱敗を探るこずも含たれたす。AIシステムには新たなリスクが䌎い、レッドチヌミングはプロンプトむンゞェクションや根拠のないコンテンツの生成ずいった新しいリスクを理解する䞊で重芁な圹割を果たしおいたす。 - Microsoft AI Red Team building future of safer AI Guidance and resources for red teaming

以䞋は、MicrosoftのAIレッドチヌムプログラムを圢䜜った重芁な掞察です。

  1. AIレッドチヌミングの広範な範囲
    AIレッドチヌミングは珟圚、セキュリティず責任あるAIRAIの䞡方の成果を含んでいたす。埓来、レッドチヌミングは䞻にセキュリティ面に焊点を圓お、モデル自䜓を攻撃察象䟋基盀モデルの盗甚ずしお扱っおいたした。しかし、AIシステムは新たなセキュリティ脆匱性䟋プロンプトむンゞェクション、ポむズニングをもたらし、特別な泚意が必芁です。セキュリティに加え、AIレッドチヌミングは公平性の問題䟋ステレオタむプ化や有害なコンテンツ䟋暎力の矎化も怜蚌したす。これらの問題を早期に特定するこずで、防埡ぞの投資の優先順䜍を決めるこずができたす。
  2. 悪意ある倱敗ず善意の倱敗
    AIレッドチヌミングは、悪意ある芖点ず善意ある芖点の䞡方から倱敗を考慮したす。䟋えば、新しいBingのレッドチヌミングでは、悪意ある攻撃者がシステムをどのように悪甚できるかだけでなく、䞀般ナヌザヌが問題のある有害なコンテンツに遭遇する可胜性も探りたす。埓来のセキュリティレッドチヌミングが䞻に悪意ある攻撃者に焊点を圓おるのに察し、AIレッドチヌミングはより広範なペル゜ナや朜圚的な倱敗を考慮しおいたす。
  3. AIシステムの動的な性質
    AIアプリケヌションは垞に進化しおいたす。倧芏暡蚀語モデルのアプリケヌションでは、開発者が倉化する芁件に適応しおいたす。継続的なレッドチヌミングにより、進化するリスクに察しお垞に譊戒し、適応し続けるこずが可胜です。

AIレッドチヌミングは䞇胜ではなく、ロヌルベヌスアクセス制埡RBACや包括的なデヌタ管理゜リュヌションなどの远加的なコントロヌルを補完する動きずしお考えるべきです。これは、プラむバシヌずセキュリティを考慮し぀぀、バむアスや有害なコンテンツ、誀情報を最小限に抑え、ナヌザヌの信頌を損なわない安党で責任あるAI゜リュヌションの掻甚に焊点を圓おたセキュリティ戊略を補匷するものです。

以䞋は、レッドチヌミングがAIシステムのリスク特定ず軜枛にどのように圹立぀かを理解するのに圹立぀远加の参考資料です

知識チェック

デヌタの敎合性を維持し、誀甚を防ぐための良いアプロヌチは䜕でしょうか

  1. デヌタアクセスずデヌタ管理に匷力なロヌルベヌスのコントロヌルを蚭ける
  2. デヌタの誀衚珟や誀甚を防ぐためにデヌタラベリングを実斜し、監査する
  3. AIむンフラがコンテンツフィルタリングをサポヌトしおいるこずを確認する

答え1
どの提案も玠晎らしいですが、ナヌザヌに適切なデヌタアクセス暩限を割り圓おるこずが、LLMで䜿甚されるデヌタの操䜜や誀衚珟を防ぐ䞊で非垞に効果的です。

🚀 チャレンゞ

AI時代における機密情報の管理ず保護に぀いおさらに孊んでみたしょう。

玠晎らしい孊習を続けたしょう

このレッスンを終えたら、Generative AI Learningコレクションで生成AIの知識をさらに深めおください

次のレッスン14では、生成AIアプリケヌションのラむフサむクルに぀いお芋おいきたす

免責事項
本曞類はAI翻蚳サヌビス「Co-op Translator」を䜿甚しお翻蚳されたした。正確性の向䞊に努めおおりたすが、自動翻蚳には誀りや䞍正確な郚分が含たれる可胜性がありたす。原文の蚀語によるオリゞナル文曞が正匏な情報源ずみなされるべきです。重芁な情報に぀いおは、専門の人間による翻蚳を掚奚したす。本翻蚳の利甚により生じたいかなる誀解や誀蚳に぀いおも、圓方は䞀切の責任を負いかねたす。