618ZXW

Google の Gemini 実験モデルが突如リーダーボードのトップに返り咲きました。GPT-4o がトップに立ったのはたった 1 日だけでした。

GoogleとOpenAIが再び対立している。

GPT-4o の新バージョンがリーダーボードでトップに立ったわずか 1 日後、最新の実験モデルである Gemini-Exp-1121 がリリースされ、再び優勝を果たしました。

注目すべきは、このモデルの以前のバージョンである Gemini-Exp-1114 が、わずか 1 週間前にリリースされたばかりだということです。

これはおそらく、OpenAI が挑戦してくると確信していたため、意図的に切り札を温存していたためだと思われます。

このようにして、OpenAI を誘い込んで GPT-4o の新バージョンをリリースさせ、その後、より優れたモデルを使用してそれに対抗します。

Google の研究者たちは明らかに非常に満足していました。

Google DeepMindの主任科学者ジャック・レイ氏は、これを興味深いトレーニング後の「電撃戦」と呼び、トレーニング後の反復がトレーニング前よりもはるかに高速であることを示唆した。

DeepMindの研究担当副社長オリオール・ヴィニャルズ氏も、ウルトラマンにリモートで尋ねた。「最近、何か提出する予定はありますか?」

雰囲気は緊張しており、彼らは非常に自信があるように見えます。

では、「1121」はどれほどの威力を持つのでしょうか?具体的な性能を見ていきましょう。

コーディング、推論、視覚的理解が全体的に向上しました

公式声明によると、Gemni-Exp-1121は3つの主要なパフォーマンス領域で大幅な改善を実現したという。

  • コーディングスキルが大幅に向上
  • より強い推論能力
  • 視覚的な理解力の向上

スタイルコントロール以外のすべての面でも現在1位にランクされています。

視覚機能の面では、Gemini-Exp-1121 は以前のバージョンよりも改良されています。

スタイル制御による複雑なキューワードに関しては、Gemini-Exp-1121、o1-preview、および New Sonnet 3.5 は同等です。

アリーナでの実際の勝率は以下の通りです。

今すぐ開始して直接体験することができます。

たとえば、Gemini-Exp-1121 と GPT-4o-lastest-1120 に同じコミックについての解釈を尋ねます。

Gemini-Exp-1121 さんの回答はより包括的かつ詳細で、小見出しや重要なポイントの太字化がうまく活用されています。

4o の返信の新しいバージョンは、より簡潔で一般的なものになっています。

古典的な動物が川を渡る論理パズルでは、Gemini-Exp-1121 は完全に正しく答えましたが、新しいバージョン 4o は 3 番目と 4 番目の川渡りを結合するという間違いを犯したため、答えが間違っていました。

問題:農夫はオオカミ、ヒツジ、キャベツを川の向こうへ運ばなければなりませんが、一度に運べるのは一つだけです。オオカミとヒツジは一緒にいることはできませんし、ヒツジとキャベツも一緒にいることはできません。農夫はどうやって川を渡るべきでしょうか?

もう一つ

OpenAI からの新しい情報もあることは言及する価値があります。

ChatGPTの最新ベータ版で、「ライブカメラ」ビデオ機能のコードが初めて発見されました。

具体的には、リアルタイム録音、リアルタイム処理、音声モード統合、視覚認識機能などが含まれます。

高度な音声モードが起動されたとき、一部のユーザーがこの機能を体験しました。

これは、OpenAI がこの機能を開始する準備ができていることを意味します。

Googleも同様のデモを公開していますが、まだリリースされていません。OpenAIのこれまでの実績を考えると、Googleよりも先に大規模展開するのはOpenAIになる可能性が高いでしょう。

来年には、チャットボットとのコミュニケーションの主流は、テキストベースの会話から音声やエージェントへと移行するかもしれません。ライブカメラはその始まりに過ぎないかもしれません。あなたはどう思いますか?

参考リンク:
[1]https://x.com/OfficialLoganK/…
[2]https://x.com/adonis\_singh/status/1859682100569571399
[3]https://x.com/OriolVinyalsML/…
[4]https://x.com/rowancheung/sta...