NEWS

サイバーエージェント、225億パラメータの日本語LLM「CyberAgentLM3」を公開

※本サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部が本サイトに還元されることがあります。

CyberAgentLM3

CyberAgentLM3

サイバーエージェントが、225億パラメータの日本語LLM「CyberAgentLM3」を公開したと発表しています。

サイバーエージェントは、2023年5月に独自の日本語LLMである「CyberAgentLM」を一般公開し、その後、2023年11月にバージョン2となる「CyberAgentLM2」を、2024年6月には視覚を付与したVLM(大規模視覚言語モデル)を公開しています。

これらの技術はサイバーエージェントが提供する「極予測AI」をはじめとするサービスにおいて広く活用されているそうです。

今回公開したモデルは、既存モデルをベースに用いずスクラッチで開発を行なった225億パラメータのCyberAgentLM3-22B-Chatです。

LLMの日本語能力を評価するNejumi LLM リーダーボード3においては、700億パラメータのMeta-Llama-3-70B-Instructと同等の性能となっており、スクラッチ開発のオープンな日本語LLMとしてはトップクラスの性能となるそうです(2024年7月現在)。


関連記事

この記事のハッシュタグ から関連する記事を表示しています。

新着記事