クロード 3.5 ソネット、最新の人工知能モデル人間的、コンピューターを制御できるようになりました。 「コンピュータ使用」と呼ばれるこの新機能により、クロードは人間のユーザーと同じように、画面を表示し、カーソルを移動し、ボタンをクリックし、テキストを入力することができます。
API 経由で利用できるこの機能は、開発者に新たな可能性をもたらし、開発者は Claude を使用してタスクを自動化し、より自然な方法でアプリケーションと対話できるようになります。 Anthropic 氏は、この機能はまだ実験段階であり、エラーが発生しやすい可能性があるが、時間の経過とともに急速に改善されることが期待されると強調しています。仕組みを詳しく見てみましょう。
クロード 3.5 ソネットの新しさ
」コンピュータの使用" は、単に画面を「見る」だけでなく、コンピューターとアクティブに対話できる機能において、Microsoft の Copilot Vision や OpenAI の ChatGPT 用デスクトップ アプリなど、他の同様のソリューションとは異なります。Google は、Android 用アプリ Gemini で同様の機能を提供しています。しかし、まだそのようなツールを大規模にリリースしていません。
Anthropic は、Claude がソーシャル メディアとのやり取り、選挙関連の活動、Web ドメインの登録、政府サイトとのやり取りなど、潜在的に悪意のある活動に従事するのを防ぐためのセキュリティ対策を導入しました。
「コンピュータの使用」に加えて、Claude 3.5 Sonnet では、いくつかのベンチマーク、特にコーディングとツールの使用において大幅な改善が導入されています。 SWE ベンチ検証済みのパフォーマンスは 33.4% から 49.0% に増加し、OpenAI o1-preview や特殊なコーディング システムを含むすべての公開モデルを上回りました。ツール使用テストである TAU-bench のパフォーマンスも大幅に向上しました。
これらの改善点についてどう思いますか?以下のコメント欄で LLM Anthropic に関するご意見をお聞かせください。