
Cohereは、エッジデバイスに高性能な多言語機能をもたらすために設計された、コンパクトな33.5億パラメータのオープンウェイトAIモデルであるTiny Ayaを正式に発表しました。2026年2月20日に発表されたこのリリースは、生成AI(Generative AI)の展望における重要な転換点となり、「大きいほど良い」という教条から、専門化され、効率的で、ソブリンなAIソリューションへと移行することを象徴しています。対応が不十分だったアフリカやインドの言語を含む70以上の言語をサポートするTiny Ayaは、単なる技術的成果としてだけでなく、今年後半に予定されている待望のIPOに向けて加速するCohereにとっての戦略的な防壁として位置付けられています。
このリリースは、最近年間経常収益(Annual Recurring Revenue:ARR)が2億4,000万ドルを超えたカナダのAIユニコーン企業による活発な動きの中で行われました。オンデバイスのプライバシー、低遅延の推論、および言語の包括性の交差点をターゲットにすることで、CohereはOpenAIやGoogleといった競合他社の、クラウドに依存した大規模モデルの支配に直接挑戦しています。Tiny Ayaは、iPhone 17 Proのような標準的な消費者向けハードウェア上で、インターネット接続を必要とせずにローカルで実行できるように最適化されており、通信環境が限られた地域における高度なAIへのアクセスを効果的に民主化します。
本日の発表の核心は、Tiny Ayaアーキテクチャの圧倒的な効率性にあります。業界が歴史的に数兆パラメータの巨大モデルに焦点を当ててきた一方で、Cohereは計算コストの数分の一でエンタープライズ級のパフォーマンスを提供する「小規模言語モデル(Small Language Models:SLM)」に注力してきました。
Tiny Ayaは33.5億のパラメータ数を特徴としており、このサイズは推論能力とポータビリティのバランスを考慮して細心の注意を払って選ばれました。推論に大規模なGPUクラスターを必要とした従来モデルとは異なり、Tiny Ayaはエッジ向けに構築されています。内部ベンチマークと初期のデベロッパーテストによれば、このモデルはiPhone 17 Pro上で最大毎秒32トークンの推論速度を達成しており、これは音声翻訳やインタラクティブなアシスタントなどのリアルタイムアプリケーションにとって重要な閾値です。
このモデルには、特定の言語ファミリー向けに微調整されたTinyAya-FireやTinyAya-Earthといった複数の地域バリアントが用意されています。このきめ細かなアプローチにより、ヨルバ語、マラーティー語、ハウサ語など、欧米中心のAIでは軽視されがちだった言語において優れた性能を発揮します。
Tiny Ayaのアーキテクチャは8kのコンテキストウィンドウを利用しています。サーバーサイドモデルで見られる巨大なコンテキストウィンドウよりも小さいですが、これはRAMが限られたデバイスでの状態保持と検索速度を最大化するための、意図的なエンジニアリング上のトレードオフです。
主な技術的特徴:
SLM市場は、2026年におけるAI覇権を争う新たな戦場となっています。Tiny Ayaの立ち位置を理解するためには、直接の競合であるGoogleのGemma 3やAlibabaのQwen 3と比較することが不可欠です。
Gemma 3は書面上ではより大きなコンテキストウィンドウと幅広い言語サポートを誇っていますが、GlobalMGSM(Multilingual Grade School Math)データセットを使用した独立したベンチマークでは、リソースの少ない言語の推論タスクにおいて Tiny Ayaがライバルを凌駕していることが明らかになりました。これは、パラメータ数よりもデータのキュレーション品質の方が重要であるというCohereの主張を裏付けています。
表1:2026年小規模言語モデルの競合状況
| 特徴 | Cohere Tiny Aya | Google Gemma 3 (4B) | Qwen 3 (4B) |
|---|---|---|---|
| パラメータ数 | 33.5億 | 40億 | 40億 |
| 主な焦点 | エッジ効率と言語の主権 | 幅広い知識と長いコンテキスト | 推論とコーディング |
| コンテキストウィンドウ | 8k | 128k | 32k |
| 言語サポート | 70以上(インド・アフリカ言語に特化) | 140以上(一般的なカバー) | 多言語(中国語・英語に強い) |
| デプロイ対象 | オンデバイス(モバイル・エッジ) | クラウド・ハイブリッド | クラウド・エッジ |
| 推論速度(モバイル) | 約32トークン/秒 | 約24トークン/秒 | 約28トークン/秒 |
注:推論速度は、A17 Proシリコンアーキテクチャ上での標準的なテストに基づいています。
Tiny Ayaは単独で存在するわけではありません。これは、Cohereが過去12ヶ月間にわたって体系的に構築してきた、より広範なエンタープライズ・エコシステムの最新コンポーネントです。このエコシステムを支える2つの重要な柱が、Rerank 4とModel Vaultです。
2025年後半にリリースされたRerank 4は、検索拡張生成(Retrieval-Augmented Generation:RAG)における極めて重要な「ラストワンマイル」の問題に対処します。生成モデルがテキストを作成する一方で、リランカー(再順位付けモデル)は入力されるデータの関連性を保証します。Rerank 4は32kのコンテキストウィンドウを導入しており、これは前世代の4倍の増加です。
この拡張されたウィンドウにより、モデルは1回のパスで約50ページのテキストを処理できます。法務や金融系の企業にとって、これはAIエージェントが回答を生成する前に、契約書全体や四半期報告書を取り込んで関連性を検証できることを意味します。この「クロスエンコーダー」アーキテクチャは、検証済みのデータに基づいて回答を生成することでハルシネーション(幻覚)を大幅に減少させます。これは企業への導入において譲れない要件です。
モデルを補完するのが、セキュリティを重視する企業向けに設計された管理プラットフォームである**Model Vault**です。Model Vaultを使用すると、企業はCohereのCommandモデルやRerankモデルを、分離された仮想プライベートクラウド(VPC)内にデプロイできます。
このアーキテクチャは、データをAIに送るのではなく、AIをデータのある場所に持ってくることを効果的に実現します。医療や防衛のような業界にとって、この「ゼロトラスト」デプロイモデルは画期的です。これにより、機密性の高い知的財産がパブリックインターネットを通過することがなくなり、国家や企業が自らのインテリジェンス・インフラを完全に制御しようとする世界的なトレンドである**ソブリンAI(Sovereign AI)**と完璧に一致します。
Tiny Ayaの立ち上げは、公開市場への進出を目指すCohereの計算されたステップです。同社は2026年にIPOを行うと広く予想されており、その財務健全性は厳しい監視下にあります。最新の数字は有望です。Cohereは2025年のARRを2億4,000万ドルと報告しており、これは前四半期比50%という堅調な成長率を示しています。
この収益成長は、資本効率の高いビジネスモデルによって支えられています。大規模な汎用モデルのトレーニングに数十億ドルを費やすOpenAIやAnthropicとは異なり、Cohereは特化型のエンタープライズモデルに焦点を当てることで、70%近い売上総利益率を維持しています。この違いは、「力任せ」なAIのスケーリングに伴う莫大な運用コストをますます警戒している将来の投資家にとって極めて重要です。
戦略的な企業動向:
Creati.aiの見地から見ると、Tiny AyaのリリースはAI市場の成熟を予感させます。「一つのモデルがすべてを支配する」時代は終わりつつあります。その代わりに、大規模なクラウドモデルが高度な推論を処理し、Tiny Ayaのような専門化されたSLMがエッジタスク、プライバシーに敏感な推論、およびリアルタイム翻訳を処理するという、連合型のエコシステムの台頭を私たちは目の当たりにしています。
Cohereの戦略は、**「効率性が最終的に力任せの物量に勝利する」**という賭けに基づいています。企業や消費者がすでに所有しているハードウェア上で高品質なAIを利用可能にすることで、導入の障壁を大幅に下げています。
しかし、リスクも残っています。ビッグテックの既存プレイヤーは豊富な資金力を持ち、小規模なプレイヤーを締め出すために推論コストを補助する余裕があります。もしGoogleやMetaが同等のエッジモデルを無制限に無料で提供し始めれば、Cohereの利益率は圧迫される可能性があります。
それでも、現時点ではTiny Ayaは、焦点を絞ったエンジニアリングの力の証として存在しています。それは、AIが単なるクラウドサービスではなく、ポケットの中のデバイス上で静かに、そして安全に実行されるユビキタスなユーティリティとなる未来を垣間見せてくれます。今後数週間にわたり、HuggingFaceなどのプラットフォームでの開発者の採用率に注目することで、この「小さな」巨人の真の影響が明らかになるでしょう。
2026年が進むにつれ、ステークホルダーはCohereの成功を示す3つの主要な指標に注目すべきです。
Tiny Ayaはパラメータ数こそ小さいかもしれませんが、ソブリンで、プライベートで、アクセシブルなAIの未来に対するその影響は甚大です。