AI News

GoogleはGemini AI搭載のAuto BrowseをChromeに導入し、ウェブを再定義

Googleは、待望の機能であるAuto BrowseをChrome向けに正式に導入し、「エージェント化されたウェブ(agentic web)」の時代を切り開きました。2026年1月28日に発表されたこのアップデートは、先進的なGemini AIモデル、特に新しいGemini 3のバージョンを世界で最も普及しているブラウザに直接統合します。これにより、Chromeは単なるインターネットへの窓ではなく、ユーザーに代わって複雑で多段階の作業を自律的に実行できる能動的な参加者となります。

この戦略的な展開は、米国のAI ProおよびUltraプランに加入しているGoogleのプレミアム層ユーザーを主な対象としています。ブラウザ基盤にエージェント機能を組み込むことで、GoogleはOpenAIやPerplexityなどの競合に追いつくだけでなく、Chromeの莫大なインストールベースとウェブエコシステムとの深い統合を活かして、むしろ先を行く可能性があります。

受動的なブラウジングから能動的なエージェントへの変化

このアップデートの核心は「検索」から「行動」への転換です。従来のブラウジングでは、ユーザーがウェブサイトを手動で移動し、情報を絞り込み、データを入力する必要がありました。**Auto Browse**はこのパラダイムを一変させます。ユーザーは「シカゴで300ドル以下のブティックホテルを探し、来週末の空き状況を確認する」や「このDIYフォトブースを再現するために必要な備品を購入する」といった多段階の作業をChromeに委任できます。

新しい常駐のGeminiサイドパネルからタスクが開始されると、**Gemini AI**が制御を引き継ぎます。AIは新しいタブを開き、独自の「スパークル」アイコンと可視のカーソルゴーストで区別され、ユーザーはAIがリアルタイムでナビゲート、クリック、スクロール、入力する様子を観覧できます。重要なのは、このプロセスがバックグラウンドで行われる場合があり、ユーザーは他のタブで作業を続けながらエージェントがタスクを完了するのを待つことができる点です。

基盤技術はGemini 3のマルチモーダル機能(multimodal capabilities)と、ドキュメントオブジェクトモデル(Document Object Model、DOM)に対する高度な理解に依拠しています。これによりブラウザは人間のようにウェブページを「見て」相互作用でき、「カートに追加」ボタンを特定したり、複雑なフォームに入力したり、情報を統合するために複数ページを横断したりすることが可能になります。

セーフティレールと人間による介入制御

**AIエージェント(AI Agents)**に関する主な懸念は、特に金銭的取引や通信において意図しない行動が発生する可能性です。Googleはこれに対し厳格な「人間による介入(human-in-the-loop)」プロトコルで対処しています。Auto Browseはチェックアウトページへ移動し、配送情報を入力し、割引コードを適用することはできますが、明示的なユーザー確認なしに最終的な「購入」や「投稿」コマンドを実行することはできません。

さらに、システムは透明性を重視して設計されています。新しいサイドパネルはエージェントのアクションをステップごとにログ表示します(例:「Etsyに移動」、「商品を選択」、「住所を入力」)。ユーザーはいつでも「タスクを引き継ぐ」ボタンをクリックして介入でき、即座にAIを一時停止して手動操作に戻せます。自律性と監督のこのバランスは、ユーザーに代わって行動する**ブラウザ技術(Browser Technology)**への信頼構築に不可欠です。

機能の内訳:標準のChromeとChrome Auto Browseの比較

従来のChromeの体験とこの新しいエージェント型ワークフローとの違いは大きい。以下の表は、このアップデートで導入された主要な運用上の変化を示しています。

Feature Standard Chrome Experience Chrome with Gemini Auto Browse
Task Execution User manually visits sites, clicks links, and inputs data. AI Agents autonomously navigate, scroll, and input data.
Multitasking Requires user focus; active tab must be visible. Runs in background tabs; user can focus elsewhere.
Complex Workflows User manages context across multiple tabs/windows. Gemini holds context across tabs to complete multi-step goals.
Commerce User searches for codes, compares prices manually. Agent applies codes, compares carts, and pre-fills checkout.
Security Model Phishing protection via Safe Browsing API. On-device scam detection via Gemini Nano + Human confirmation.

裏側:Gemini 3とNano Banana

このアップデートは単なるナビゲーション機能の追加にとどまらず、ChromeのAIスタック全体の包括的な見直しを示しています。軽量でデバイス上で動作するインタラクションを支えるのはGemini Nanoで、これがローカルで動作してクラウドにデータを送信することなくリアルタイムで詐欺や悪質なポップアップを検出します。

さらに、このアップデートでは内部コード名「Nano Banana」と呼ばれるブラウザ内画像編集ツールが導入されます。これによりユーザーはウェブ上で見つけた画像を(例:「この商品写真の背景を削除する」)タブ内で直接編集して保存または共有でき、消費と創作の間の摩擦をさらに低減します。

Googleはまた、ShopifyやTargetなどの大手小売業者と共同で開発された標準である「Universal Commerce Protocol(UCP)」のサポートも実装しました。UCPによりAuto Browseエージェントはショッピングカートや商品カタログとより確実に連携でき、エージェントが存在しないボタンをクリックしようとする「幻視(hallucination)」の発生率を低減します。

市場への影響と提供状況

Auto Browse機能は現在、米国のGoogle AI ProおよびUltra加入者に限定して提供されています。この段階的な展開は、少なくとも現時点ではGoogleがエージェント型ブラウジングを標準的なユーティリティではなくプレミアムな生産性ツールとして扱っていることを示唆しています。

この動きは、台頭する「AIネイティブ」ブラウザとGoogleを直接対立させるものです。スタートアップは同様の機能を試みてきましたが、Chromeの優位性はユニークな利点を与えます。それはユーザーにブラウザを乗り換えてもらう必要がなく、既存の体験を単にアップグレードしてもらえばよい点です。ウェブ出版者やSEO専門家にとって、エージェントがサイトをナビゲートしやすくする最適化が、人間の注目を集める最適化と同じくらい重要になるという不安定な未来の到来を示しています。

Gemini AIが進化を続けるにつれ、これらの機能は米国外へと拡大し、将来的には無料プランのユーザーにも降りてくる可能性があり、インターネットは私たちが検索する図書館から、私たちのために働くサービスへと根本的に変わることが期待されます。

フィーチャー
ThumbnailCreator.com
AI搭載のツールで、美しくプロフェッショナルなYouTubeサムネイルを素早く簡単に作成できます。
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AdsCreator.com
任意のウェブサイト URL から、Meta、Google、Stories 向けのブランドに沿った洗練された広告クリエイティブを即座に生成します。
BGRemover
SharkFoto BGRemoverでオンラインで簡単に画像の背景を削除できます。
VoxDeck
視覚革命をリードするAIプレゼンテーションメーカー
Refly.ai
Refly.AI は、非技術系のクリエイターが自然言語と視覚的キャンバスを使ってワークフローを自動化できるようにするプラットフォームです。
Skywork.ai
Skywork AIは、生産性を向上させるための革新的なAIツールです。
Qoder
Qoderは、ソフトウェアプロジェクトの計画、コーディング、テストを自動化するAI駆動のコーディングアシスタントです。
FineVoice
文字を感情に変える — 数秒で表現力豊かなAIボイスをクローン、デザイン、作成しよう。
Flowith
Flowithは、無料の🍌Nano Banana Proやその他の効果的なモデルを提供するキャンバスベースのエージェント型ワークスペースです...
FixArt AI
FixArt AI はサインアップ不要で、無料かつ制限なしの画像・動画生成用AIツールを提供します。
Elser AI
テキストと画像をアニメ風アート、キャラクター、音声、短編映画に変換するオールインワンのウェブスタジオ。
Pippit
Pippitの強力なAIツールでコンテンツ作成を向上させましょう!
SharkFoto
SharkFoto は、動画、画像、音楽を効率的に作成・編集するためのオールインワンの AI 搭載プラットフォームです。
Funy AI
想像をアニメに!画像やテキストからAIでビキニやキスの動画を生成。AI着せ替え機能も搭載。登録不要、完全無料!
KiloClaw
ホステッドの OpenClaw エージェント:ワンクリックでデプロイ、500以上のモデル、セキュアなインフラ、自動化されたエージェント管理をチームと開発者に提供します。
Diagrimo
Diagrimoはテキストをカスタマイズ可能なAI生成の図表やビジュアルに瞬時に変換します。
SuperMaker AI Video Generator
SuperMakerを使って、驚くべき動画、音楽、画像を簡単に作成できます。
AI Clothes Changer by SharkFoto
SharkFoto の AI Clothes Changer は、フィット感、質感、ライティングまでリアルに再現した服を瞬時にバーチャル試着できます。
Yollo AI
AIパートナーとチャット&創作。画像から動画作成、AI画像生成機能も搭載。
AnimeShorts
最先端のAI技術を使用して、魅力的なアニメ短編を簡単に作成できます。
InstantChapters
Instant Chaptersを使って、魅力的な書籍の章を瞬時に生成します。
NerdyTips
AI 搭載のサッカー予測プラットフォーム。世界中のリーグにわたって、データに基づく試合のヒントを提供します。
WhatsApp AI Sales
WABot は、リアルタイムのスクリプト、翻訳、インテント検出を提供する WhatsApp 向けの AI セールス コパイロットです。
happy horse AI
テキストや画像から同期した動画と音声を生成するオープンソースのAI動画生成ツールです。
AI Video API: Seedance 2.0 Here
1つのキーで最先端の生成モデルをより低コストで提供する統合AI動画APIです。
insmelo AI Music Generator
プロンプト、歌詞、またはアップロードを約1分で洗練されたロイヤリティフリーの曲に変換するAI駆動の音楽ジェネレーターです。
wan 2.7-image
正確な顔、配色、テキスト、ビジュアルの一貫性を制御できるAI画像生成ツールです。
BeatMV
楽曲を映画のようなミュージックビデオに変換し、AIで音楽を作成するウェブベースのAIプラットフォームです。
Kirkify
Kirkify AI はミーム作成者向けに、特徴的なネオングリッチ美学を備えた顔入れ替えのバイラルミームを瞬時に生成します。
Text to Music
テキストや歌詞を、AI生成のボーカル、楽器、マルチトラック書き出しを含むフルのスタジオ品質の楽曲に変換します。
UNI-1 AI
UNI-1は視覚的推論と高忠実度の画像合成を組み合わせた統合画像生成モデルです。
Iara Chat
Iara Chat: AIによる生産性とコミュニケーションのアシスタント。
Wan 2.7
プロ仕様のAIビデオモデル。精密な動作制御とマルチビューの一貫性を実現します。
kinovi - Seedance 2.0 - Real Man AI Video
リアルな人物を出力する無料のAI動画ジェネレーター。透かしなし、商用利用権付き。
Tome AI PPT
AI搭載のプレゼン作成ツール。数分でプロフェッショナルなスライドデッキを生成、整形、エクスポートします。
Lyria3 AI
テキストのプロンプト、歌詞、スタイルから高音質で完全に制作された曲を瞬時に作成するAI音楽ジェネレーター。
Video Sora 2
Sora 2 AIはテキストや画像を数分で短く物理的に正確なソーシャル/eコマース向けビデオに変換します。
Atoms
マルチエージェント自動化によりコード不要で数分でフルスタックのアプリやウェブサイトを構築するAI駆動プラットフォーム。
AI Pet Video Generator
AI駆動のテンプレートと即時HD書き出しを使って、写真からバイラルで共有しやすいペット動画を作成します。SNS向けに最適化されています。
Ampere.SH
無料の管理された OpenClaw ホスティング。$500 の Claude クレジットで 60 秒で AI エージェントをデプロイできます。
Paper Banana
学術テキストを即座に投稿準備が整った方法図や正確な統計図に変換する、AI搭載ツールです。
Hitem3D
Hitem3Dは単一の画像をAIで高解像度かつプロダクション対応の3Dモデルに変換します。
HookTide
あなたの声を学習してコンテンツ作成・エンゲージメント・パフォーマンス分析を行うAI搭載のLinkedIn成長プラットフォームです。
GenPPT.AI
AI駆動のPPT作成ツール。数分でスピーカーノートとグラフ付きのプロフェッショナルなPowerPointプレゼンテーションを作成、整形、エクスポートします。
Create WhatsApp Link
分析機能、ブランドリンク、ルーティング、マルチエージェントチャット機能を備えた無料のWhatsAppリンク&QRジェネレーター。
Palix AI
クリエイター向けのオールインワンAIプラットフォーム。統一されたクレジットで画像、動画、音楽を生成できます。
Gobii
Gobii はチームが 24 時間 365 日稼働する自律型デジタルワーカーを作成し、ウェブ調査やルーティンタスクを自動化できるようにします。
Seedance 20 Video
Seedance 2 は、一貫したキャラクター、マルチショットの物語表現、2K のネイティブ音声を提供するマルチモーダルな AI 動画ジェネレーターです。
Veemo - AI Video Generator
Veemo AIは、テキストや画像から高品質な動画と画像を素早く生成するオールインワンプラットフォームです。
AI FIRST
自然言語を通じてリサーチ、ブラウザ作業、ウェブスクレイピング、ファイル管理を自動化する会話型AIアシスタント。
WhatsApp Warmup Tool
AI 搭載の WhatsApp ウォームアップツールは、大量メッセージ送信を自動化しつつアカウント停止を防ぎます。
AirMusic
AirMusic.aiは、テキストプロンプトからスタイルやムードのカスタマイズ、ステム(分離トラック)出力をサポートする高品質なAI音楽トラックを生成します。
GLM Image
GLM Image は自己回帰モデルと拡散モデルを組み合わせたハイブリッド方式で、高忠実度のAI画像を生成し、優れたテキストレンダリングを実現します。
TextToHuman
AIテキストを瞬時に自然で人間らしい文体に書き直す無料のAI人間化ツール。サインアップ不要。
Manga Translator AI
AI Manga Translatorは漫画画像をオンラインで瞬時に複数の言語に翻訳します。
ainanobanana2
Nano Banana 2 は、正確なテキストレンダリングと被写体の一貫性を保ちながら、4~6秒でプロ品質の4K画像を生成します。
Free AI Video Maker & Generator
無料 AI 動画メーカー&ジェネレーター – 無制限、登録不要
Remy - Newsletter Summarizer
Remyはメールを短くて分かりやすい洞察にまとめることでニュースレター管理を自動化します。
Telegram Group Bot
TGDesk は、リード獲得、エンゲージメント向上、コミュニティの成長を支援するオールインワンの Telegram グループボットです。

Google、ChromeにGemini AI搭載の自動ブラウズ機能を導入

GoogleはChromeに自動ブラウズ機能を導入し、米国のAI ProおよびUltra加入者向けにGemini AIが複数ステップのタスクを自律的に実行できるようにします。