|
OpenAI Developer Day Singaporeが本日開幕しましたが、予想通り、ChatGPTが再び動き出しました。 Gemini がこの分野でトップの座を維持したのはわずか 1 週間足らずでしたが、ChatGPT の最新バージョンが更新され、1 位の座は再び入れ替わりました。 はい、まだ本格的な O1 ではありませんが、新しい 4O です。 具体的には、この GPT-4o アップデートは「創造的なライティングスキル」に重点を置いており、公式には次のように述べられています。
o1 コア貢献者の Karina Nguyen 氏はさらに説明してくれました。
大規模モデル分野のクリエイティブ ライティング リーダーボードでは、新しいバージョン 4o (ChatGPT-4o-1120) が確かに大幅な改善を遂げ、スコアが以前のバージョンの 1365 から 1402 に増加していることがわかります。 実際の結果については、簡単なテストを行いました。皆さんは何点くらいつけるでしょうか? 1位に返り咲くが40歳新しい 4o バージョンでは、総合ランキングで OpenAI がトップの座を取り戻しただけでなく、特定の機能を反映するさまざまなサブランキングでも向上しました。 クリエイティブライティングでは2位から1位に上昇しました。 コーディング能力では2位から1位に上昇しました。 数学力では4位から3位に上昇(1位は依然O1-プレビュー)。 難しい課題では2位から1位に上昇しました。 そして、スタイルコントロールの後でも、新しい 4o は依然として 1 位にランクされています。 スタイル制御の目的は、リーダーボードのスコアがモデルの問題解決能力をより正確に反映するようにし、モデルが派手な形式を使用したり回答の長さを増やしたりしてスコアを人為的に高めることを防ぐことです。 全体的な勝率ヒートマップを見ると、新しいバージョンの 4o は、以前トップランクだった Gemini-Exp-1114 に対して59% の勝率、Claude 3.5 Sonnet に対して69% の勝率、5 月バージョンの 4o に対して72% の勝率を示しています。 うーん、とても強くて印象的ですが、前に言ったように... 40 です。 DeepSeek からの今日のビッグニュース (オープンソース化の計画を伴う o1 の DeepSeek バージョンが完全リリースされたこと) に関連して、多くのネットユーザーが「新しい素晴らしいモデルが登場した」という Ultraman のツイートを直接嘲笑しました。 はい、DeepSeek は素晴らしいです。 O1 をすぐにリリースして、DeepSeek-R1 と直接比較してみましょう :) 要するに、本格的な O1 が今年発売されるという噂があったのに、今では 2024 年まであと 40 日しか残っていない。OpenAI が密かに O1 4O にアップデートするとはどういうことか? OpenAI の更新パターンを要約しようとする人もいます。
うん、何を期待してるかなんて気にしないよ╭(╯^╰)╮ さらに、一部のネットユーザーが新しい4Oの生成結果をテストしたところ、システムはそれを100%AI生成であると即座に識別しました。 △画像出典:@TuhinChakr しかし、不満の声のなかにも、OpenAIのアップデートを真剣に検討した人もいた。 たとえば、システムの提案語に関して、専門家は OpenAI が実際に ChatGPT にいくつかの機能を密かに追加したことを発見しました。
簡単に言えば、ChatGPT がデリケートな話題について無意味な発言をしないようにするための新しい安全策が追加されます。 したがって、新しい 4o バージョンでどのような「クリエイティブ」なコンテンツが作成できるかを確認したい場合は、今すぐアリーナで無料で試すことができます。 興味深い結果があれば、ぜひコメント欄で共有してください。 参考リンク: - 以上- |
OpenAI がこの分野でトップの座を取り戻しましたが、今回は 4O のおかげです。
関連するおすすめ記事
-
記録破り!中国の科学者がシュレーディンガーの猫を23分間生き続けさせた。
-
9.9 < 9.11 の本当の理由を見つけよう: 聖書! 神経介入により、反復トレーニングなしで修復が可能。
-
OpenAI幹部人事の内幕:CEOが安全性を無視して4oを急遽立ち上げ、従業員は締め切りに間に合わせるため1日20時間労働、名声と利益の追求が理想主義に打ち勝つ
-
物理学者らが新たなタイプの量子粒子を発見!その挙動はボソンとフェルミオンの中間に位置する | Nature
-
Rokid Glassesは2499元で発売され、ARグラスが消費者時代に急速に参入したことを示しています。
-
DingTalkは本当に勇気があります!AlibabaエコシステムでDeepSeekと統合した最初の企業です。