お客様のAI利用状況(AIエージェントの種類、連携先、業務フロー、権限設定等)をヒアリングし、テスト対象とスコープを確定します。
AIエージェントペネトレーションテスト
業務自動化・生産性向上を目的としたAIエージェント活用が業種を問わず加速する一方、AIを起点とした情報漏洩や不正操作、権限逸脱といったセキュリティリスクへの懸念が高まっています。
従来のLLM単体評価では業務フロー・権限設定・外部連携を含む実践的なリスクを捉えきれず、攻撃者視点での検証が必要となっています。
AIエージェントのセキュリティリスクを可視化
GMOサイバーセキュリティ byイエラエがご提供するAIエージェントペネトレーションテストは、企業が業務に導入するAIエージェント・チャットボット・RAGなどを対象に、ホワイトハッカーが実際の攻撃者と同等の手法でペネトレーションテストを実施します。
AIが扱うデータや権限、外部システムとの連携を含む業務フロー全体を検証し、情報漏洩・不正操作・権限逸脱といったリスクを具体的に可視化。AISIのレッドチーミング手法ガイドにも対応し、実践的な対策を提案します。
※ 出典:ITR「ITR Market View:サイバー・セキュリティ・コンサルティング・サービス市場2025」 Webアプリケーション脆弱性診断サービス市場、スマートフォンアプリケーション脆弱性診断サービス市場、ペネトレーションテストサービス市場:ベンダー別売上金額シェア(2025年度予測)
AIエージェントペネトレーションテストは
こんな方におすすめ
- Microsoft 365 Copilot やKintone AI、RAG等を業務導入しており、セキュリティリスクを把握したい
- AIエージェントが扱うデータ・権限の範囲が適切か検証したい情報セキュリティ担当者様
- AIを活用した業務自動化を推進中で、導入前後のリスクアセスメントを行いたいDX推進担当者様
サービスの特長
01お客様の業務環境に合わせたオリジナルシナリオ
ホワイトハッカーがAI利用状況をヒアリングし、業務フロー・権限設定・外部連携を踏まえた実践的なテストシナリオを設計します。
02攻撃者視点での実践的ペネトレーションテスト
プロンプトインジェクションに加え、AIが持つシステム権限や連携先を含めた横断的な攻撃シミュレーションにより、情報漏洩・不正操作・権限逸脱のリスクを検証します。
03主要AIプラットフォームに幅広く対応
OpenAI(ChatGPT)、Anthropic(Claude)、Google(Gemini)、Microsoft 365 Copilot、Azure OpenAI Service等のエンタープライズAIサービスや、RAGシステム・チャットボット・Microsoft 365 CopilotやKintone AI等の業務ツール連携を含むAI機能を広くカバーします。
04AISIレッドチーミング手法ガイド準拠の検証が可能
AIセーフティ・インスティテュート(AISI)発行の「AIセーフティに関するレッドチーミング手法ガイド」に基づいた検証にも対応。業界標準に沿ったリスク評価が可能です。
AIエージェントペネトレーションテストの
診断フロー
-
01
ヒアリング・事前調査
-
02
テストシナリオ設計
ヒアリング内容をもとに、攻撃者視点でのオリジナルテストシナリオを設計。お客様環境で想定される攻撃ベクトルを洗い出します。
-
03
ペネトレーションテスト実施
お客様からお借りした業務用端末を使用し、実際の攻撃者と同等の手法でAIエージェントに対するテストを実施します。
-
04
報告書作成・送付
診断結果をまとめた詳細な報告書を作成し、お客様へ送付いたします。
-
05
報告書納品・対策提案
検出されたリスクと再現手順を報告書にまとめ、具体的な対策案とともに納品します。報告会にて詳細をご説明することも可能です。
よくある質問
- QどのようなAIサービスが診断対象になりますか?
- AOpenAI API、Azure OpenAI Service、Anthropic Claude、Google Gemini等を利用したAIエージェントや、RAGシステム、チャットボット、そしてMicrosoft 365 CopilotやKintone AI等の業務ツール連携を含むAI機能が対象です。
- Qテストにはどのくらいの期間がかかりますか?
- Aヒアリングからテスト実施、報告書納品まで、対象規模により異なりますが、一般的には数週間〜1ヶ月程度を目安としています。
- QAISIのレッドチーミング手法ガイドに準拠した検証とは何ですか?
- AAIセーフティ・インスティテュート(AISI)が発行する「AIセーフティに関するレッドチーミング手法ガイド」の観点を取り入れ、お客様の業務実態に合わせたペネトレーションテストを実施するものです。