|
OpenAI Developer Day Singaporeが本日開幕しましたが、予想通り、ChatGPTが再び動き出しました。 Gemini がこの分野でトップの座を維持したのはわずか 1 週間足らずでしたが、ChatGPT の最新バージョンが更新され、1 位の座は再び入れ替わりました。 はい、まだ本格的な O1 ではありませんが、新しい 4O です。 具体的には、この GPT-4o アップデートは「創造的なライティングスキル」に重点を置いており、公式には次のように述べられています。
o1 コア貢献者の Karina Nguyen 氏はさらに説明してくれました。
大規模モデル分野のクリエイティブ ライティング リーダーボードでは、新しいバージョン 4o (ChatGPT-4o-1120) が確かに大幅な改善を遂げ、スコアが以前のバージョンの 1365 から 1402 に増加していることがわかります。 実際の結果については、簡単なテストを行いました。皆さんは何点くらいつけるでしょうか? 1位に返り咲くが40歳新しい 4o バージョンでは、総合ランキングで OpenAI がトップの座を取り戻しただけでなく、特定の機能を反映するさまざまなサブランキングでも向上しました。 クリエイティブライティングでは2位から1位に上昇しました。 コーディング能力では2位から1位に上昇しました。 数学力では4位から3位に上昇(1位は依然O1-プレビュー)。 難しい課題では2位から1位に上昇しました。 そして、スタイルコントロールの後でも、新しい 4o は依然として 1 位にランクされています。 スタイル制御の目的は、リーダーボードのスコアがモデルの問題解決能力をより正確に反映するようにし、モデルが派手な形式を使用したり回答の長さを増やしたりしてスコアを人為的に高めることを防ぐことです。 全体的な勝率ヒートマップを見ると、新しいバージョンの 4o は、以前トップランクだった Gemini-Exp-1114 に対して59% の勝率、Claude 3.5 Sonnet に対して69% の勝率、5 月バージョンの 4o に対して72% の勝率を示しています。 うーん、とても強くて印象的ですが、前に言ったように... 40 です。 DeepSeek からの今日のビッグニュース (オープンソース化の計画を伴う o1 の DeepSeek バージョンが完全リリースされたこと) に関連して、多くのネットユーザーが「新しい素晴らしいモデルが登場した」という Ultraman のツイートを直接嘲笑しました。 はい、DeepSeek は素晴らしいです。 O1 をすぐにリリースして、DeepSeek-R1 と直接比較してみましょう :) 要するに、本格的な O1 が今年発売されるという噂があったのに、今では 2024 年まであと 40 日しか残っていない。OpenAI が密かに O1 4O にアップデートするとはどういうことか? OpenAI の更新パターンを要約しようとする人もいます。
うん、何を期待してるかなんて気にしないよ╭(╯^╰)╮ さらに、一部のネットユーザーが新しい4Oの生成結果をテストしたところ、システムはそれを100%AI生成であると即座に識別しました。 △画像出典:@TuhinChakr しかし、不満の声のなかにも、OpenAIのアップデートを真剣に検討した人もいた。 たとえば、システムの提案語に関して、専門家は OpenAI が実際に ChatGPT にいくつかの機能を密かに追加したことを発見しました。
簡単に言えば、ChatGPT がデリケートな話題について無意味な発言をしないようにするための新しい安全策が追加されます。 したがって、新しい 4o バージョンでどのような「クリエイティブ」なコンテンツが作成できるかを確認したい場合は、今すぐアリーナで無料で試すことができます。 興味深い結果があれば、ぜひコメント欄で共有してください。 参考リンク: - 以上- |
OpenAI がこの分野でトップの座を取り戻しましたが、今回は 4O のおかげです。
関連するおすすめ記事
-
[Tritonチュートリアル] ベクトルの加算
-
Grokの新しい描画機能に不具合があり、ユーザーが人物を間違った形で描画することが頻繁に発生している。ネットユーザーたちはマスク氏にGoogleへの謝罪を求めている。
-
Google の Gemini チームに新しく任命され、完璧な成績で卒業した中国人博士課程の学生が、研究者を目指す人々に 7 つのアドバイスを提供します。
-
GPT-4oは大きくリードしましたが、Googleの新モデルに敗北しました。ChatGPT公式アカウント:皆さん、深呼吸をしてください。
-
わずか1年で、北京にAI時代の発電所が誕生しました。国産チップが組み立てられ、すぐに使えるインテリジェントコンピューティングパワーが完成しました。
-
オープンソース プロジェクト Mono は Microsoft に統合されました。