OpenAI、独自のブラウザを使用してタスクを実行できるAIエージェント「Operator」を発表

※本サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部が本サイトに還元されることがあります。

Operator

OpenAIが、Web にアクセスしてユーザーに代わってタスクを実行できるAIエージェント「Operator」を発表しています。

Operator は、ユーザーに代わって独立して作業を実行できる AI である当社の最初のエージェントの 1 つです。タスクを与えると、それを実行します。

Operator は、フォームへの記入、食料品の注文、ミームの作成など、さまざまな反復的なブラウザタスクを処理するよう要求できます。

人間が日常的に使用するのと同じインターフェイスとツールを使用できることで、AI の有用性が広がり、人々が日常のタスクに費やす時間を節約できると同時に、企業にとって新たなエンゲージメントの機会が生まれます。

本日から、Operator は米国のProユーザー向けに「operator.chatgpt.com」で利用できます。

このリサーチプレビューにより、ユーザーやより広範なエコシステムから学び、改善を重ねることができます。

将来的には、Plus、Team、Enterprise ユーザーにも拡大し、これらの機能を ChatGPT に統合する予定だそうです。

Operator

Operator は、Computer-Using Agent (CUA)と呼ばれる新しいモデルを搭載していて、GPT-4o の視覚機能と強化学習による高度な推論を組み合わせることで、CUA は、画面に表示されるボタン、メニュー、テキストフィールドなどのグラフィカルユーザーインターフェイス (GUI) を操作するようにトレーニングされます。

Operator は、ブラウザを「表示」（スクリーンショットを通じて）し、「対話」（マウスとキーボードで可能なすべてのアクションを使用）できるため、カスタム API 統合を必要とせずに Web 上でアクションを実行できます。