618ZXW

Claude は大幅なアップグレードを経て、ユーザーが人間のようにコンピューターを制御できるようになりました。

たった今、クロードは大きな動きを見せた――

「コンピューターの使用」という新しい機能がリリースされ、クロードは人間のようにコンピューターを使用できるようになりました。

では、早速例を見てみましょう。

ビデオリンク: https://mp.weixin.qq.com/s/xU...

このフォームへの入力例では、関連するデータがコンピューター上のさまざまな場所に散在しています。これらを一つ一つ手作業で探すとなると、非常に時間と労力がかかります。

今、あなたは Claude に伝えるだけで、Claude はまず画面を「見て」、必要なデータがこのテーブルにないことを見つけ、すぐに CRM に切り替えて必要なデータを検索します。

一致するメッセージが見つかると、Claude は自動的に Web ページをスクロールし、適切なテーブル フィールドに対応するデータを入力します。

デモンストレーションプロセス全体では、人間の介入は一切必要ありませんでした。

たとえば、クロードさんにゴールデン ゲート ブリッジからの日の出を見たいと伝えると、クロードさんはWeb で情報を検索し地図上で最適な場所を見つけルートを計画し、最後に旅行計画をカレンダーに追加します。

ビデオリンク: https://mp.weixin.qq.com/s/xU...

プログラミングも私にとっては問題ありません!

以下の例では、Claude に「90 年代風の個人 Web サイトを作成する」と指示するだけで、まず別のバージョン (Claude の Web サイト) がコンピューター上で開きます。

その後、Claude の Web バージョンはすぐにコードを生成し、Web ページでエフェクトを実行します。

もちろん、Claudeにコードをローカルマシンにダウンロードして、VS Codeを使ってローカルで実行してもらうこともできます。このプロセス中に、Pythonがインストールされていないなどの問題を発見した場合、Claudeはタスクが完了するまで自動的にエラーを見つけて解決してくれます。

ビデオリンク: https://mp.weixin.qq.com/s/xU...

クロード氏の「コンピュータ使用」機能は、本質的にコンピュータを「自動操縦」モードに変えたと言わざるを得ません。

ネットユーザーたちは「すごい」と驚嘆する一方で、次のようなコメントも寄せた。

新たな競争のラウンドが始まりました。

この新たな競争は、AIの対話と生成能力に限定されず、実行運用にさらに重点を置くことになります。

Claude 3.5もアップグレードされました。

コンピュータ使用機能のリリースに合わせて、Anthropic は次のことも発表しました。

Claude 3.5 Sonnetをアップグレードし、新しいClaude 3.5 Haikuモデルを発売します。

まず、Anthropic が発表した公式スコアから、アップグレードされた Claude 3.5 Sonnet が大幅なパフォーマンス向上を達成したことが明らかです。

特にプログラミングにおいては、SWE-bench Verified のパフォーマンスが 33.4% から 49.0% に向上しました。

そのスコアは、OpenAI o1-preview などの推論モデルやプログラミング用に設計された専用システムなど、公開されているすべてのモデルよりも高くなっています。

新しい Claude 3.5 Sonnet では、TAU ベンチ (タスク用エージェント ツール) のパフォーマンスも、小売業界では 62.6% から 69.2% に向上し、より難易度の高い航空業界では 36.0% から 46.0% に向上しました。

次に、新しくリリースされたClaude 3.5 Haikuがあります。公式の説明は次のとおりです。

これは当社最速の次世代モデルです。

Claude 3.5 Haiku は、Claude 3 Haiku と同じコストと速度で、あらゆるスキルセットが向上し、多くのスマート ベンチマーク テストで前世代の最大モデルである Claude 3 Opus を上回っています。

同様に、Claude 3.5 Haiku もプログラミングが特に優れており、SWE-bench Verified で 40.6% のスコアを獲得し、オリジナルの Claude 3.5 Sonnet や GPT-4o など、公開されている最先端モデルを使用する多くのエージェントよりも優れたパフォーマンスを発揮しました。

現在、Claude 3.5 Sonnet はすべてのユーザーが利用可能であり、価格と速度に変更はありません。

Claude 3.5 Haiku については、今月末に API、Amazon Bedrock、Google Cloud の Vertex AI 経由で利用可能になります (最初にプレーン テキスト モデルが利用可能になります)。

もう一つ

Anthropicが大きな話題を呼んでいる間に、 Stability AIにも新たな動きがありました。

これまでで最も強力なモデル、Stable Diffusion 3.5 がリリースされました。

Stable Diffusion 3.5 には、Large、Large Turbo、Medium の 3 つのサイズがあり、コンシューマー ハードウェアで実行できることがわかっています。

現在、Stable Diffusion 3.5 LargeとStable Diffusion 3.5 Large TurboはHugging Faceから、推論コードはGitHubからダウンロード可能です。

Stable Diffusion 3.5 Mediumは10月29日にリリースされます。

公式の評価と実際の結果から判断すると、Stable Diffusion 3.5 は良好な結果を達成しました。

最後に、その夜の AI は本当に興奮したと言わざるを得ません。

参考リンク:
[1]https://www.anthropic.com/new... [2]https://x.com/AnthropicAI/sta... [3]https://stability.ai/news/int... [4]https://x.com/StabilityAI/sta...