Google、エージェント時代の新しいAIモデル「Gemini 2.0」を発表

※本サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部が本サイトに還元されることがあります。

Gemini 2.0

Googleが、最先端技術を駆使し、低レイテンシでパフォーマンスを強化した主力モデル「Gemini 2.0」を発表しています。

デベロッパーと信頼できるテスタ向けに最初のバージョンとなる「Gemini 2.0 Flash」が提供開始されます。

Gemini 2.0 FlashはGemini 1.5 Proの2倍の速度でより強力なパフォーマンスを実現し、新しいマルチモーダル出力が含まれ、ネイティブツールの使用が付属しています。

また、リアルタイムのオーディオおよびビデオストリーミングを備えた動的アプリケーションを構築するためのマルチモーダルライブ API も導入されています。

Gemini 2.0 Flash にはネイティブのテキスト読み上げオーディオ出力が搭載されており、開発者は8 つの高品質な音声とさまざまな言語やアクセントから選択して、モデルの読み上げ内容だけでなく読み上げ方もきめ細かく制御できます。

Gemini 2.0 Flash では、ネイティブに画像が生成され、会話型のマルチターン編集がサポートされるようになったため、以前の出力を基にして改良することができます。テキストと画像をインターリーブして出力できるため、レシピなどのマルチモーダルコンテンツで役立ちます。