AI News

ブロックチェーンセキュリティの新時代:OpenAIとParadigmがEVMbenchを発表

人工知能(AI)と分散型金融(DeFi:Decentralized Finance)の交差点を強化するための決定的な動きとして、OpenAIは暗号資産投資会社Paradigmとの戦略的パートナーシップを発表しました。この提携により、AIエージェントがスマートコントラクトの脆弱性を検出、修正、および悪用する能力を評価するために設計された包括的なベンチマークであるEVMbenchが導入されます。

2026年2月現在、暗号資産のエコシステムは1,000億ドル以上のオープンソース資産を保護しており、悪意のある攻撃者にとって魅力的な標的となっています。EVMbenchのリリースは、理論的なAIの応用から、経済的に意味のある環境での実用的かつ厳格なテストへの重要な転換を象徴しています。OpenAIとParadigmは、標準化されたフレームワークを提供することで、コードがメインネット(Mainnet)に到達する前に監査および強化できる防御的AIシステムの開発を加速させることを目指しています。

この取り組みは、AIエージェント(AI agents)がコードの読み書きに習熟するにつれて、イーサリアム仮想マシン(EVM:Ethereum Virtual Machine)特有の、極めてリスクの高い制約に対して厳格にテストされる必要があるという認識の高まりを強調しています。

EVMbenchの解剖:セキュリティタスクの三位一体(The Trinity of Security Tasks)

EVMbenchは単なるデータセットではなく、動的な評価環境です。これは、AIエージェントをライブバイトコードと対話させるサンドボックス化されたブロックチェーン環境に没入させることで、静的コード解析を超えたものとなっています。このベンチマークは、スマートコントラクトセキュリティ(smart contract security)のライフサイクルにおける重要なフェーズをそれぞれ模倣した、相互に関連する3つの異なる能力モードにわたってエージェントを評価します。

1. 検出(Detect):デジタル監査人

検出モードでは、エージェントはスマートコントラクトのリポジトリを監査するタスクを課されます。目的は、人間の監査人によって確認された正解となる脆弱性(Ground-truth vulnerabilities)を特定し、正確にフラグを立てることです。エージェントは「再現率(Recall)」、つまり特定に成功した既知の脆弱性の割合に基づいてスコアリングされます。このモードは、複雑なロジックフローを理解し、リエントランシー攻撃(Reentrancy attacks)や整数オーバーフロー(Integer overflows)などのセキュリティ上の欠陥を示すパターンを認識するAIの能力に挑戦します。

2. パッチ(Patch):外科的な修正

3つの中で最も複雑と思われるパッチモードでは、エージェントは脆弱性を見つけるだけでなく、それを修正することも要求されます。ここでの制約は重大です。エージェントは、元の意図された機能を維持しつつ、エクスプロイト(悪用)を排除するために脆弱なコントラクトを修正しなければなりません。これは一連の自動テストを通じて検証されます。エージェントがバグを「修正」しても、不注意にコントラクトのコアロジックを破壊したり、コンパイルエラーを導入したりした場合、その試みは失敗とみなされます。これは、プロトコルの運用を中断することなくホットフィックスを適用するという、開発者が現実世界で直面するプレッシャーを模倣しています。

3. エクスプロイト(Exploit):レッドチーマー

このモードでは、エージェントは攻撃者として振る舞います。サンドボックス環境にデプロイされたコントラクトが与えられ、資金を流出させるためのエンドツーエンドの攻撃を実行しなければなりません。採点は、トランザクション・リプレイとオンチェーン検証を介してプログラム的に行われます。このモードは「レッドチーミング(Red Teaming)」にとって極めて重要です。AIを使用して攻撃をシミュレートすることで、最も独創的な敵対的戦略に対して防御を実戦テストすることができます。

データセット:現実に根ざした構成

ベンチマークが現実世界の核となるリスクを反映することを確実にするため、OpenAIとParadigmは、40の異なる監査から120の深刻度の高い脆弱性を厳選しました。これらの大部分は、微妙で影響の大きいバグが発見されることで知られるCode4renaなどのオープンコード監査コンペティションから提供されました。

データセットへの注目すべき追加要素として、**Tempoブロックチェーン(Tempo blockchain)**のセキュリティ監査プロセスから抽出された脆弱性シナリオが含まれています。Tempoは、高スループットで低コストなステーブルコイン決済のために構築されたレイヤー1(Layer 1)ブロックチェーンです。Tempoのシナリオを含めることで、EVMbenchはそのリーチを決済指向のスマートコントラクトコードへと広げています。これは、エージェントによるステーブルコイン決済が一般的になるにつれて、大幅な成長が見込まれる領域です。

EVMbenchを支える技術インフラも同様に堅牢です。コントラクトをデプロイし、エージェントのトランザクションを決定論的にリプレイするRustベースのハーネス(Rust-based harness)を利用しています。偶発的な危害を防ぐため、エクスプロイトタスクはライブネットワークではなく、隔離されたローカルのAnvil環境で実行され、テスト場が安全で再現可能、かつ封じ込められていることを保証します。

フロンティアのベンチマーク:GPT-5.3がリード

EVMbenchの開始により、最新世代のAIモデルが暗号資産セキュリティ領域でどのように機能するかについての最初の公式な洞察が得られました。OpenAIはこのベンチマークを利用して自社のフロンティアエージェントをテストし、過去6ヶ月間で能力が大幅に飛躍したことを明らかにしました。

パフォーマンス指標は、特にエクスプロイトモードにおける「攻撃的」能力の劇的な向上を浮き彫りにしています。データによると、OpenAIのコーディングモデルの最新版である**GPT-5.3-Codex**は、前モデルを大幅に上回っています。

表1:エクスプロイトモードにおける比較パフォーマンス

モデルバージョン 実行環境 エクスプロイト成功率
GPT-5.3-Codex Codex CLI 72.2%
GPT-5 標準 31.9%
GPT-4o(参照) 標準 < 15.0%

GPT-5での成功率31.9%からGPT-5.3-Codexでの**72.2%**への跳ね上がりは、AIエージェントが明確で具体的な目的(例:「資金を引き出す」)を与えられた際、エクスプロイトパスの特定と実行において非常に熟達してきていることを示しています。

攻防のギャップ(The Offensive-Defensive Gap)

しかし、このベンチマークは、攻撃能力と防御能力の間に根強いギャップがあることも明らかにしました。エージェントはエクスプロイトタスクでは優れていましたが、検出およびパッチタスクでのパフォーマンスは依然として低いままでした。

  • 検出の課題: エージェントは単一の問題を見つけた後に監査を停止することが多く、コードベースを安全であると証明するために必要な徹底的なレビューの実行に失敗しました。
  • パッチ適用の複雑さ: 微妙なバグを取り除きながら完全な機能を維持するという要件は、困難であることが証明されました。エージェントはセキュリティ上の欠陥を修正するものの、コントラクトの意図された有用性を損なうパッチを頻繁に生成しました。これは「治療が病気よりも悪い」という、本番環境では受け入れられないシナリオです。

暗号資産業界への戦略的影響

OpenAIとParadigmのコラボレーションは、「AI x 暗号資産(Crypto)」のナラティブが成熟していることを示唆しています。暗号資産投資への深い技術的専門知識とリサーチ優先のアプローチで知られるParadigmは、ベンチマークのタスクが単に構文的に正しいだけでなく、ブロックチェーン開発者にとって意味的に重要であることを保証するために必要なドメイン知識を提供しました。

EVMbenchのタスク、ツール、および評価フレームワークをオープンソースとしてリリースすることで、両パートナーは事実上、開発者コミュニティに対して「軍備拡張への呼びかけ」を行っています。目標は、高度なセキュリティツールへのアクセスを民主化し、個々の開発者や小規模なチームが、トップクラスのセキュリティ企業と同じ厳格さでスマートコントラクトを監査できるようにすることです。

防御ツールキットの拡張:Project Aardvark

ベンチマークのリリースに合わせて、OpenAIは専用のセキュリティ研究エージェントである**Aardvark**のプライベートベータ版の拡張を発表しました。Aardvarkは、EVMbenchから得られた洞察の実践的な応用であり、防御的なセキュリティタスクのために特別に微調整されたAIエージェントです。

さらに、OpenAIはサイバー防御の研究を加速させるために1,000万ドルのAPIクレジットを投じています。この助成プログラムは、同社の最も能力の高いモデルをオープンソースソフトウェアや重要なインフラシステムの保護に適用することに焦点を当てており、AIセキュリティの利点がエコシステム全体に広く分配されることを確実にします。

今後の展望

EVMbenchの導入は、測定ツールであると同時に警告でもあります。AIのコントラクト悪用能力の急速な向上(GPT-5.3-Codexの72.2%の成功率によって証明されています)は、「隠蔽によるセキュリティ(Security by obscurity)」の窓が急速に閉まりつつあることを示唆しています。AIエージェントがより有能な攻撃者になるにつれて、防御ツールも同等かそれ以上の速度で進化しなければなりません。

ブロックチェーン業界にとって、これはAI支援による監査が、贅沢品から必需品へと間もなく移行することを意味します。将来のEVMbenchのイテレーションは、マルチチェーン環境、クロスブリッジの脆弱性、より複雑なソーシャルエンジニアリング攻撃を含むように拡張され、進化し続けるWeb3の脅威状況を反映する可能性があります。

2026年が進むにつれ、OpenAIの推論エンジンとParadigmの暗号資産ネイティブな洞察の相乗効果は、デジタル・トラストへのアプローチ方法に新たな基準を打ち立てます。もはや問題は、スマートコントラクトを保護するためにAIが使用されるかどうかではなく、次世代の自動化された脅威に先んじるために、業界がいかに迅速にこれらのベンチマークを採用できるかです。

フィーチャー
ThumbnailCreator.com
AI搭載のツールで、美しくプロフェッショナルなYouTubeサムネイルを素早く簡単に作成できます。
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AdsCreator.com
任意のウェブサイト URL から、Meta、Google、Stories 向けのブランドに沿った洗練された広告クリエイティブを即座に生成します。
Refly.ai
Refly.AI は、非技術系のクリエイターが自然言語と視覚的キャンバスを使ってワークフローを自動化できるようにするプラットフォームです。
Elser AI
テキストと画像をアニメ風アート、キャラクター、音声、短編映画に変換するオールインワンのウェブスタジオ。
BGRemover
SharkFoto BGRemoverでオンラインで簡単に画像の背景を削除できます。
VoxDeck
視覚革命をリードするAIプレゼンテーションメーカー
FineVoice
文字を感情に変える — 数秒で表現力豊かなAIボイスをクローン、デザイン、作成しよう。
Qoder
Qoderは、ソフトウェアプロジェクトの計画、コーディング、テストを自動化するAI駆動のコーディングアシスタントです。
FixArt AI
FixArt AI はサインアップ不要で、無料かつ制限なしの画像・動画生成用AIツールを提供します。
Flowith
Flowithは、無料の🍌Nano Banana Proやその他の効果的なモデルを提供するキャンバスベースのエージェント型ワークスペースです...
Skywork.ai
Skywork AIは、生産性を向上させるための革新的なAIツールです。
SharkFoto
SharkFoto は、動画、画像、音楽を効率的に作成・編集するためのオールインワンの AI 搭載プラットフォームです。
Pippit
Pippitの強力なAIツールでコンテンツ作成を向上させましょう!
Funy AI
想像をアニメに!画像やテキストからAIでビキニやキスの動画を生成。AI着せ替え機能も搭載。登録不要、完全無料!
KiloClaw
ホステッドの OpenClaw エージェント:ワンクリックでデプロイ、500以上のモデル、セキュアなインフラ、自動化されたエージェント管理をチームと開発者に提供します。
Yollo AI
AIパートナーとチャット&創作。画像から動画作成、AI画像生成機能も搭載。
SuperMaker AI Video Generator
SuperMakerを使って、驚くべき動画、音楽、画像を簡単に作成できます。
AI Clothes Changer by SharkFoto
SharkFoto の AI Clothes Changer は、フィット感、質感、ライティングまでリアルに再現した服を瞬時にバーチャル試着できます。
AnimeShorts
最先端のAI技術を使用して、魅力的なアニメ短編を簡単に作成できます。
wan 2.7-image
正確な顔、配色、テキスト、ビジュアルの一貫性を制御できるAI画像生成ツールです。
AI Video API: Seedance 2.0 Here
1つのキーで最先端の生成モデルをより低コストで提供する統合AI動画APIです。
WhatsApp AI Sales
WABot は、リアルタイムのスクリプト、翻訳、インテント検出を提供する WhatsApp 向けの AI セールス コパイロットです。
insmelo AI Music Generator
プロンプト、歌詞、またはアップロードを約1分で洗練されたロイヤリティフリーの曲に変換するAI駆動の音楽ジェネレーターです。
BeatMV
楽曲を映画のようなミュージックビデオに変換し、AIで音楽を作成するウェブベースのAIプラットフォームです。
Kirkify
Kirkify AI はミーム作成者向けに、特徴的なネオングリッチ美学を備えた顔入れ替えのバイラルミームを瞬時に生成します。
UNI-1 AI
UNI-1は視覚的推論と高忠実度の画像合成を組み合わせた統合画像生成モデルです。
Wan 2.7
プロ仕様のAIビデオモデル。精密な動作制御とマルチビューの一貫性を実現します。
Text to Music
テキストや歌詞を、AI生成のボーカル、楽器、マルチトラック書き出しを含むフルのスタジオ品質の楽曲に変換します。
Iara Chat
Iara Chat: AIによる生産性とコミュニケーションのアシスタント。
kinovi - Seedance 2.0 - Real Man AI Video
リアルな人物を出力する無料のAI動画ジェネレーター。透かしなし、商用利用権付き。
Video Sora 2
Sora 2 AIはテキストや画像を数分で短く物理的に正確なソーシャル/eコマース向けビデオに変換します。
Lyria3 AI
テキストのプロンプト、歌詞、スタイルから高音質で完全に制作された曲を瞬時に作成するAI音楽ジェネレーター。
Tome AI PPT
AI搭載のプレゼン作成ツール。数分でプロフェッショナルなスライドデッキを生成、整形、エクスポートします。
Atoms
マルチエージェント自動化によりコード不要で数分でフルスタックのアプリやウェブサイトを構築するAI駆動プラットフォーム。
AI Pet Video Generator
AI駆動のテンプレートと即時HD書き出しを使って、写真からバイラルで共有しやすいペット動画を作成します。SNS向けに最適化されています。
Paper Banana
学術テキストを即座に投稿準備が整った方法図や正確な統計図に変換する、AI搭載ツールです。
Ampere.SH
無料の管理された OpenClaw ホスティング。$500 の Claude クレジットで 60 秒で AI エージェントをデプロイできます。
Hitem3D
Hitem3Dは単一の画像をAIで高解像度かつプロダクション対応の3Dモデルに変換します。
HookTide
あなたの声を学習してコンテンツ作成・エンゲージメント・パフォーマンス分析を行うAI搭載のLinkedIn成長プラットフォームです。
Palix AI
クリエイター向けのオールインワンAIプラットフォーム。統一されたクレジットで画像、動画、音楽を生成できます。
GenPPT.AI
AI駆動のPPT作成ツール。数分でスピーカーノートとグラフ付きのプロフェッショナルなPowerPointプレゼンテーションを作成、整形、エクスポートします。
Create WhatsApp Link
分析機能、ブランドリンク、ルーティング、マルチエージェントチャット機能を備えた無料のWhatsAppリンク&QRジェネレーター。
Seedance 20 Video
Seedance 2 は、一貫したキャラクター、マルチショットの物語表現、2K のネイティブ音声を提供するマルチモーダルな AI 動画ジェネレーターです。
Gobii
Gobii はチームが 24 時間 365 日稼働する自律型デジタルワーカーを作成し、ウェブ調査やルーティンタスクを自動化できるようにします。
Veemo - AI Video Generator
Veemo AIは、テキストや画像から高品質な動画と画像を素早く生成するオールインワンプラットフォームです。
Free AI Video Maker & Generator
無料 AI 動画メーカー&ジェネレーター – 無制限、登録不要
AI FIRST
自然言語を通じてリサーチ、ブラウザ作業、ウェブスクレイピング、ファイル管理を自動化する会話型AIアシスタント。
ainanobanana2
Nano Banana 2 は、正確なテキストレンダリングと被写体の一貫性を保ちながら、4~6秒でプロ品質の4K画像を生成します。
GLM Image
GLM Image は自己回帰モデルと拡散モデルを組み合わせたハイブリッド方式で、高忠実度のAI画像を生成し、優れたテキストレンダリングを実現します。
AirMusic
AirMusic.aiは、テキストプロンプトからスタイルやムードのカスタマイズ、ステム(分離トラック)出力をサポートする高品質なAI音楽トラックを生成します。
WhatsApp Warmup Tool
AI 搭載の WhatsApp ウォームアップツールは、大量メッセージ送信を自動化しつつアカウント停止を防ぎます。
TextToHuman
AIテキストを瞬時に自然で人間らしい文体に書き直す無料のAI人間化ツール。サインアップ不要。
Manga Translator AI
AI Manga Translatorは漫画画像をオンラインで瞬時に複数の言語に翻訳します。
Remy - Newsletter Summarizer
Remyはメールを短くて分かりやすい洞察にまとめることでニュースレター管理を自動化します。
Telegram Group Bot
TGDesk は、リード獲得、エンゲージメント向上、コミュニティの成長を支援するオールインワンの Telegram グループボットです。
FalcoCut
FalcoCut:動画翻訳、アバタービデオ、音声クローン、フェイススワップ、短尺動画生成のためのウェブベースAIプラットフォーム。

OpenAIとParadigm、AIでスマートコントラクトを保護するためにEVMbenchを立ち上げ

OpenAIはParadigmと提携し、EVMbenchベンチマークを通じてAIエージェントがブロックチェーンの脆弱性を検出、修正、悪用する能力をテストします。