OpenAI、独自のブラウザを使用してタスクを実行できるAIエージェント「Operator」を発表
※本サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部が本サイトに還元されることがあります。
OpenAIが、Web にアクセスしてユーザーに代わってタスクを実行できるAIエージェント「Operator」を発表しています。
Operator は、ユーザーに代わって独立して作業を実行できる AI である当社の最初のエージェントの 1 つです。タスクを与えると、それを実行します。
Operator は、フォームへの記入、食料品の注文、ミームの作成など、さまざまな反復的なブラウザ タスクを処理するよう要求できます。
人間が日常的に使用するのと同じインターフェイスとツールを使用できることで、AI の有用性が広がり、人々が日常のタスクに費やす時間を節約できると同時に、企業にとって新たなエンゲージメントの機会が生まれます。
本日から、Operator は米国のProユーザー向けに「operator.chatgpt.com」で利用できます。
このリサーチ プレビューにより、ユーザーやより広範なエコシステムから学び、改善を重ねることができます。
将来的には、Plus、Team、Enterprise ユーザーにも拡大し、これらの機能を ChatGPT に統合する予定だそうです。
Operator は、Computer-Using Agent (CUA)と呼ばれる新しいモデルを搭載していて、GPT-4o の視覚機能と強化学習による高度な推論を組み合わせることで、CUA は、画面に表示されるボタン、メニュー、テキスト フィールドなどのグラフィカル ユーザー インターフェイス (GUI) を操作するようにトレーニングされます。
Operator は、ブラウザを「表示」(スクリーンショットを通じて)し、「対話」(マウスとキーボードで可能なすべてのアクションを使用)できるため、カスタム API 統合を必要とせずに Web 上でアクションを実行できます。