|
OpenAI Developer Day Singaporeが本日開幕しましたが、予想通り、ChatGPTが再び動き出しました。 Gemini がこの分野でトップの座を維持したのはわずか 1 週間足らずでしたが、ChatGPT の最新バージョンが更新され、1 位の座は再び入れ替わりました。 はい、まだ本格的な O1 ではありませんが、新しい 4O です。 具体的には、この GPT-4o アップデートは「創造的なライティングスキル」に重点を置いており、公式には次のように述べられています。
o1 コア貢献者の Karina Nguyen 氏はさらに説明してくれました。
大規模モデル分野のクリエイティブ ライティング リーダーボードでは、新しいバージョン 4o (ChatGPT-4o-1120) が確かに大幅な改善を遂げ、スコアが以前のバージョンの 1365 から 1402 に増加していることがわかります。 実際の結果については、簡単なテストを行いました。皆さんは何点くらいつけるでしょうか? 1位に返り咲くが40歳新しい 4o バージョンでは、総合ランキングで OpenAI がトップの座を取り戻しただけでなく、特定の機能を反映するさまざまなサブランキングでも向上しました。 クリエイティブライティングでは2位から1位に上昇しました。 コーディング能力では2位から1位に上昇しました。 数学力では4位から3位に上昇(1位は依然O1-プレビュー)。 難しい課題では2位から1位に上昇しました。 そして、スタイルコントロールの後でも、新しい 4o は依然として 1 位にランクされています。 スタイル制御の目的は、リーダーボードのスコアがモデルの問題解決能力をより正確に反映するようにし、モデルが派手な形式を使用したり回答の長さを増やしたりしてスコアを人為的に高めることを防ぐことです。 全体的な勝率ヒートマップを見ると、新しいバージョンの 4o は、以前トップランクだった Gemini-Exp-1114 に対して59% の勝率、Claude 3.5 Sonnet に対して69% の勝率、5 月バージョンの 4o に対して72% の勝率を示しています。 うーん、とても強くて印象的ですが、前に言ったように... 40 です。 DeepSeek からの今日のビッグニュース (オープンソース化の計画を伴う o1 の DeepSeek バージョンが完全リリースされたこと) に関連して、多くのネットユーザーが「新しい素晴らしいモデルが登場した」という Ultraman のツイートを直接嘲笑しました。 はい、DeepSeek は素晴らしいです。 O1 をすぐにリリースして、DeepSeek-R1 と直接比較してみましょう :) 要するに、本格的な O1 が今年発売されるという噂があったのに、今では 2024 年まであと 40 日しか残っていない。OpenAI が密かに O1 4O にアップデートするとはどういうことか? OpenAI の更新パターンを要約しようとする人もいます。
うん、何を期待してるかなんて気にしないよ╭(╯^╰)╮ さらに、一部のネットユーザーが新しい4Oの生成結果をテストしたところ、システムはそれを100%AI生成であると即座に識別しました。 △画像出典:@TuhinChakr しかし、不満の声のなかにも、OpenAIのアップデートを真剣に検討した人もいた。 たとえば、システムの提案語に関して、専門家は OpenAI が実際に ChatGPT にいくつかの機能を密かに追加したことを発見しました。
簡単に言えば、ChatGPT がデリケートな話題について無意味な発言をしないようにするための新しい安全策が追加されます。 したがって、新しい 4o バージョンでどのような「クリエイティブ」なコンテンツが作成できるかを確認したい場合は、今すぐアリーナで無料で試すことができます。 興味深い結果があれば、ぜひコメント欄で共有してください。 参考リンク: - 以上- |
OpenAI がこの分野でトップの座を取り戻しましたが、今回は 4O のおかげです。
関連するおすすめ記事
-
Tison Chen 氏が 2025 年の Apache Software Foundation 取締役に選出されましたことをお祝い申し上げます。
-
シリコンバレーは大騒ぎ!DeepSeekはOpenAIとAnthropicからの攻撃に直面し、アメリカのネットユーザーも激怒している。
-
『白蛇伝 浮世』の総レンダリング時間は2億5200万コア時間に到達!Tencent Cloudが独占技術サポートを提供。
-
[TVMチュートリアル] タプル入力を用いた計算と縮約
-
ソラの中心著者が率いるグーグルの新世界モデルチームが世界中で募集中:初任給100万。
-
給料が払えない?かつてトップセールスだった新エネルギー車メーカーが答える。