618ZXW

OpenAI はすべてに対応、o1/GPT は年末までにアップグレード予定! ウルトラマン: 遅いと文句を言うな、問題は計算能力の不足だ。

OpenAIに関するあらゆることに対する公式回答が公開されました。

ちょうど今、CEOのアルトマン氏と他の上級幹部4名がRedditのAMA(質問する)イベントに出演し、OpenAIの主力製品、AGIロードマップ、その他のトピックに関するユーザーからの質問に答えました。

チームには、最高製品責任者のケビン・ウェイル、研究担当上級副社長のマーク・チェン、エンジニアリング担当副社長のスリニヴァス・ナラヤナン、主任科学者のヤクブ・パチョッキが含まれています。

スターが勢ぞろいしたラインナップはたちまち大きな注目を集め、わずか数時間でRedditに4,000件を超えるコメントが寄せられた。

以下はデータ節約バージョンです: このイベントで、 OpenAI チームは主に次のことを明らかにしました

  • 年末にメジャーアップデートが行われますが、GPT-5 という名前にはなりません。
  • 現在のハードウェアはAGIを実装できる
  • コンピューティング リソースの不足は、製品の遅延を妨げる主な要因です。
  • 画像生成モデルDALL-Eの次期アップデートが待望されていますが、現時点ではリリースの予定はありません。
  • ChatGPT がタスクを自律的に実行できるようにすることが、来年の主要な焦点となります。
  • Sora はまだ改良の余地があり、現時点では明確なリリース予定はありません。
  • o1シリーズとGPTシリーズは同時に開発され、将来的には統合される可能性があります。
  • o1 フルバージョン近日公開
  • ...

わぁ、今回は情報密度がすごいですね!おやつを用意して、おしゃべりを続けましょう(doge)。

OpenAIはあらゆることに反応する

ネットユーザーは最初から接近戦を開始し、反対側の OpenAI チームに呼びかけました。

Daming LakeのSora、GPT-4oのビデオ通話、DALL-Aなどをまだ覚えていますか?

これに対して、CEO のアルトマン氏は(本当はそうでもないが)不満を言い始め、コンピューティング能力の不足が同社がより早く製品を提供するのを妨げている主な要因であることを認めた。

最近の報道によれば、アルトマン氏とOpenAIのCFOは、マイクロソフトの対応が迅速ではなく、十分なサーバーを提供していないと従業員に不満を漏らしていたとも伝えられている。

両社の提携関係は徐々に崩れつつあり、お互いをバックアップの選択肢とみなし始めている。

OpenAIは追加のクラウドコンピューティングプロバイダーとしてOracleと提携しており、MicrosoftもGoogleとAnthropicのモデルを自社製品に統合し始めている。

さらに、OpenAIはNvidiaチップへの依存を減らすために、ここ数カ月間Broadcomと協力してAIチップを開発しているが、早くても2026年までは利用可能にならないと予想されている。

複数の兆候が、OpenAI が実際に計算能力の面で圧力に直面していることを示しています。

しかし、それはさておき、ウルトラマンは、現在の人間のハードウェアはすでにAGIを実現できる能力があると自信を持って宣言しました。

一方、主要製品に関する詳細情報が公開されました。

まず、いつものようにウルトラマンは濃い煙幕を張り、年末に重要な商品が発売されるかもしれないと示唆したが、その名前はGPT-5ではないだろう。

同氏は、一方ではモデルがますます複雑化している一方で、限られた計算能力を「多くの素晴らしいアイデア」に割り当てる必要があると述べた。(OpenAIは社内で複数のプロジェクトを同時に進めることに優れていると噂されている。)

OpenAIは現在、既存のGPTとo1シリーズのモデルを同時に開発・リリースする予定だが、将来的に統合される可能性も否定できない。

一方、 o1の本格バージョンはまもなく発売される予定です

なお、皆さんが注目しているビデオ世代モデル「SORA」については、まだ明確な発売予定がありません。

公式の説明によると、Sora にはさらなる改善が必要であり、セキュリティ要因を考慮する必要があるとのことです。(Sora の責任者は最近 Google に移籍しました。)

同様に、OpenAI は、GPT-4o の期待の高いビデオ通話機能や、長い間更新されていない DALL-E シリーズの画像生成モデルについては曖昧なままであり、現在はこれらの分野に重点を置いていないことを示しています。

それで、OpenAI の最近の焦点は何でしょうか?

最新の答えはここにあります:AI検索。

本日、 ChatGPT に、わずかに改良された GPT-4o バージョンでサポートされる検索機能が追加され、Web、モバイル、デスクトップ バージョンが同時にリリースされました。

報道によると、その主な特徴は「正確な回答を素早く取得し、関連するウェブページリンクを提供すること」であり、他の検索エンジンに切り替える必要性をなくすという。

あるネットユーザーがウルトラマンに「ChatGPT検索の利点は何ですか?なぜ従来の検索エンジンを放棄する必要があるのですか?」と質問しました。

これに対してアルトマン氏は、AI 検索は主に、より複雑なシナリオに適用されるべきであり、理想的には、カスタマイズされた Web ページを応答として動的に提示できるはずだと考えています。

さらに、OpenAIはChatGPT検索が依然としてMicrosoftのBingを使用していることを明らかにしました。

最後に、OpenAI の来年の優先事項の 1 つは、 ChatGPT がタスクを自律的に実行できるようにすることです。

ご存知の通り、近所のクロードはもう私たちのコンピューターを乗っ取ってしまうんです。ほんの数個のコマンドで、クロードはピザの注文や旅行の計画、その他様々な作業を手伝ってくれます。(OpenAIさん、頑張ってください!)

ネットユーザーも注目した

こうした社会の関心事に加え、一部のネットユーザーも願い事を言い始めている。

Q: GPT-4o のテキストは拡張できますか? 32k では足りません。

A:頑張ってますよ!

さらに、GPT-4oだけでなく、OpenAIもChatGPTにコンテキストウィンドウを追加する可能性があります。

Q: ChatGPT で現在できていないことは何ですか?

A:人間に代わってタスクを自律的に理解して実行します。

Q: ChatGPT の最適な使用例は何ですか? また、将来的にはどのような分野で特に役立つでしょうか?

A:病気を発見して治療し、新たな科学的発見を加速させることです。

Q: ChatGPT でユーザーがどのように、どのくらいの頻度で引用されているかを確認できる新機能をリリースする予定はありますか?

A:良いアイデアだとは思いますが、現時点では計画はありません。

Q: AGI は既知のニューラル ネットワーク アーキテクチャを使用して実現できますか。それとも、新たな科学的 (基礎的) ブレークスルーが必要ですか?

A:既存の法学修士課程修了者によって建築のブレークスルーが提案された場合、それはカウントされますか?(意味:新しい建築も法学修士課程修了者によって提案される可能性があります)

Q:高度な音声 API のコストは下がりますか?

A:音声機能をはじめとした更なるコストダウンを検討しております。(GPT-4o miniは現在、GPT-3の2%のコストとなっております。)

Q:モデルの幻覚は恒久的な機能になりますか? どのように対処すればよいでしょうか?

A:避けるのは難しいです。OpenAIが採用している解決策としては、情報源の引用強化や強化学習(幻覚を生成しなかった場合にモデルに報酬を与える)などが挙げられます。

Q:来年に向けて大胆な予想はありますか?

A:全てのベンチマークテストを飽和状態にする。(自信をつける)

最後に、誰かが突然ひらめいて、Ultraman に ChatGPT を使用して上記の質問に答えるかどうか尋ねました。

驚いたことに、実際に存在します。(えーと…うーん…)

イリヤは何を見たのでしょうか?

興味深いことに、OpenAI チームが「自由に発言する」と聞いて、全員が一致して同じ質問を再度しました。

イリヤは何を見たのでしょうか?

CEOウルトラマンは、直接対峙すると、避けられないことを知っていたので、素直にこう答えた。

彼は非常に先見の明のある人物で、彼の初期のアイデアのいくつかが最終的に O1 モデルの誕生につながりました。

そうですね、答えはいつも同じように感じますから、この質問については誰もが諦めることができます (doge)。

答えが得られない、本当に答えが得られない...