![OpenAI が「Operator」を発表 ― コンピューターを使用するエージェントの新たなマイルストーン](http://tamariba-affiliate.com/wp-content/uploads/2025/01/1-52.jpg)
重要なポイント
Google と Anthropic に続き、OpenAI は Operator でコンピューターを使用するエージェント分野に参入しました。
Operator は、主要なパフォーマンス ベンチマークにおいて Claude Computer Use および Google Mariner を上回ります。
OpenAIは、Operatorが現実世界のニーズに対応できるよう、DoorDash、Instacart、OpenTable、Uberなどと協力したと述べた。
2024年半ば以降、AI開発者は、会話するチャットボットから行動するエージェントへと技術が進化するにつれ、モデルにコンピューターを使用する機能をますます搭載するようになりました。
コンピューターを使用するエージェントを最初にリリースしたのは Google と Anthropic でしたが、業界リーダーのOpenAI が「Operator」をリリースし、新興の AI クラスに新たなパフォーマンス基準を設定しました。
OpenAIがコンピューター利用エージェントを導入
Operator は専用の Web ブラウザを搭載しており、Web ページを表示したり、入力、クリック、スクロールして操作したりできるため、これまでのチャットベースの OpenAI プラットフォームと比べて、まったく新しい可能性が広がります。
OpenAIの発表によると「オペレーターは、フォームの記入、食料品の注文、さらにはミームの作成など、さまざまな反復的なブラウザタスクの処理を求められる可能性があります。」
同社は次のように述べている。「人間が日常的に使用しているのと同じインターフェースやツールを使用できることにより、AI の有用性が広がり、人々が日常業務で時間を節約できると同時に、企業にとって新たな関与の機会が生まれます。」
オペレーター vs. クロード コンピュータ使用 vs. グーグル マリナー
Operator のリリースは、コンピューターを使用するエージェント分野での競争の激化を示している。Operator は、Claude Computer Useや Google のProject Marinerと地位を争っているが、技術的にはまだ 3 つともベータ段階にある。
パフォーマンスベンチマークにより、OpenAI の参入が新たな基準を設定したことが明らかになりました。
この新しいエージェントは、OSWorld のコンピューターインタラクションに重点を置いたベンチマークで 38.1% のスコアを獲得し、22.0% しか達成できなかった Anthropic の Claude Computer Use を上回りました。
エージェントがインターネットをナビゲートしてデータを取得する能力を評価する WebVoyager では、Operator は 87% のスコアを獲得し、Google Mariner の 83.5% を上回りました。一方、Anthropic の Claude Computer Use はわずか 56% 遅れをとりました。
AIコンピュータのユースケース
AI エージェントがコンピューターと対話する能力は、日常的な AI ユーザーと商用または産業用アプリケーションの両方にとって大きな可能性を秘めています。
OpenAIは、潜在的な使用事例を予測し、Operatorが現実世界のニーズに対応できるよう、DoorDash、Instacart、OpenTable、Uberなどと連携したと述べた。
一方、新しいプラットフォームでは、Web サイトの設定などのカスタム指示を追加することで、ユーザーがワークフローをパーソナライズできます。
テクノロジーが進化するにつれ、AI コンピューターの利用における最大の可能性は、おそらく Siri や Alexa などの人気のスマート アシスタントとの統合にあります。
これらのプラットフォームは、従来、サードパーティのアプリケーションをアプリごとに統合してきました。しかし、Operator スタイルの機能で強化されれば、将来のスマート アシスタントは、潜在的に無限のアプリやサービスと対話できるようになります。