618ZXW

GPT-4.5がリリースされました!OpenAI最大かつ最も高価なモデルで、高い感情知能を重視しています。ウルトラマンは出産のため、発表イベントには欠席しました。

GPT-4.5が正式にリリースされ、OpenAI の最大かつ最高のチャット モデルとして宣伝されています。

しかし驚いたことに、そんな大きなイベントにウルトラマンは来なかったのです。

OpenAIは今回、優れた問題解決能力を誇示したり、様々なリストでランキングを披露したりするつもりはありません。その代わりに、感情知能(EQ)を重視しています。

最初のライブデモンストレーション:

「また友達に待たされました。大嫌いってメッセージで書いてください。」

o1 は、これが「友情の終わり」となることを理解していましたが、それでも依頼された任務を忠実に完了しました。

GPT-4.5 はプロンプトで示されたタスクを完了しませんでしたが、全体的なやりとりはより自然に感じられました。

  • まず、ユーザーがイライラしていることを認識します。
  • 自分の感情をより明確に表現することをお勧めします。
  • 2 つの代替ソリューションが提供されます。
  • 次に、ユーザーに元のリクエストを維持するかどうかを尋ねます。

2 回目のライブ デモンストレーションでは、GPT-4.5 が世界に関するより多くの知識を持ち、その知識をより自然な方法で提示することが強調されました。

海水が塩辛い理由を説明してください。

GPT-4 Turbo には多くの知識がありますが、その答えは知識を誇示するようなもので、事実を列挙しているだけです。

GPT-4.5 では、同じ知識がよりインタラクティブな口調で提示されており、ユーザーが 3 つのキーワードを覚えやすくするために簡潔な冒頭の使用も考慮されています。

「第一原理を用いて AI アライメントの必要性を説明してください」というより技術的な質問に直面したとき、o1 の回答は論文を書くことと似ていましたが、GPT-4.5 は「ステップ 1、ステップ 2、ステップ 3...」を通じてユーザーに質問について考えさせるように導きました。

デモに加えて、ライブ ストリームでは GPT-4.5 の開発プロセスに関する内部情報も公開されました。

例えば、低精度のトレーニングを「積極的に」使用し、事前トレーニング段階は複数のデータセンターで完了しました。GPT-4.5は、将来の推論モデルの基礎モデルとなるでしょう。

本日より、GPT-4.5は月額200ドルのProプラン加入者向けにご利用いただけます。来週には、月額20ドルのPlusプラン加入者にも段階的に展開されます。

最先端ではないが、最大のモデル。

技術レポートによれば、GPT-4.5は最先端のモデルではないものの、OpenAI最大の言語モデルであり、計算効率はGPT-4の10倍以上だという。

OpenAI は、教師なし学習と推論を拡張することで AI 機能を強化すると主張しています。

GPT-4.5 は、計算とデータの増加、およびアーキテクチャの最適化を通じて教師なし学習を拡張し、より幅広い知識と世界へのより深い理解をもたらし、錯覚を減らします。

LLM の事実上の正確性を測定する SimpleQA ベンチマークでは、GPT-4.5 の精度は 62.5%、幻覚率は 37.1% であり、GPT-4o、o1、o3mini と比べて大幅に改善されています。

以下は幻覚が軽減された具体的な事例です。

ユーザーが「第一言語は何ですか?」と尋ねた場合、GPT-4.5 はランダムな答えを返すのではなく、知らないこと、そしてそれは人類にとってまだ未解決の謎であることを正直に答えます。

さらに、ブログでは、小規模モデルから得られたデータを使用して、より大規模で強力なモデルをトレーニングできる新しいスケーラブルなテクノロジの開発についても言及されており、これにより、GPT-4.5 の操作性、ニュアンスの理解、自然な対話機能が向上します。

人間の嗜好評価では、受験者は GPT-4o よりも GPT-4.5 を好みました。

OpenAIは、GPT-4.5は人間の意図をより深く理解し、微妙な手がかりや暗黙の期待をより繊細な「感情的知性」で解釈することができ、またより強い美的直感と創造性を発揮し、文章作成やデザインの支援において非常に優れたパフォーマンスを発揮すると述べている。

例えば、ユーザーが「試験に落ちてとても落ち込んでいます」と表現すると、慰めと励ましの言葉が返ってきます。一方、4oの反応ははるかに冷たく、慰めの言葉はほとんどありません。

いくつかの回答では、GPT-4.5 と 4o の比較もより簡潔になりました。

さらに、OpenAIは標準的な学術ベンチマークテストでもGPT-4.5の結果を示し、GPT-4oを総合的に上回り、SWE-Lancer Diamond(コーディング)とMMMLU(多言語)でo3-miniを上回りました。

API の価格は非常に高価です。

GPT-4.5 の API は非常に高価であることは言及する価値があります。

入力トークン 100 万個あたり 75 ドル、出力トークン 100 万個あたり 150 ドル。

GPT-4oと比較すると価格は15〜30倍高くなります。

価格に見合う価値はあるでしょうか?すでに多くの人が早期アクセス体験をシェアしています。

ベータ版を受け取ったブロガーは、GPT-4.5 は実際に使用してみて非常に創造的で、たくさんの人文科学的なレッスンを受けたに違いないと述べました。

Claude 3.7 と GPT-4.5 は非常に似ています。

彼はまた、GPT-4.5の強力な視覚認識能力の例を挙げました。このStardew Valleyのスクリーンショットでは、非常に小さな要素である蝶を認識することができました。

「ユニコーン評価」は、実際のテストでも非常に優れたパフォーマンスを発揮しました。

実際のテストがさらに公開されるにつれて、さらに興味深い例が見られるようになるはずです。

もう一つ

最後に、皆さんはきっと疑問に思うでしょう。ウルトラマンはどこへ行ったのでしょう?

病院で子供たちの世話をする。

はい、最近息子が生まれました。

ライブストリームのリプレイ: https://www.youtube.com/watch...

参考リンク:https://openai.com/index/intr...