|
OpenAIは本日、GPT-4o音声合成AIアプリケーションおよびエージェント構築用のリアルタイムAPIのパブリックベータ版をリリースしました。有料開発者は誰でも、低遅延、マルチモーダル、リアルタイムのインタラクティブなエクスペリエンスをアプリケーション内で構築できます。OpenAIはまた、LiveKit、Agora、Twilioの3社との音声APIパートナー契約を発表しました。 Agoraの姉妹会社はAgoraです。両社は2023年5月に分社化され、業界で最も早期かつ徹底的な分社化の一つとなりました。Agoraは中国市場に焦点を当てており、本社は中国・上海にあります。Agoraは米国および国際市場に焦点を当てており、本社は米国カリフォルニア州サンタクララにあります。 リアルタイムAPIのリリースは、OpenAIにとってAI応用分野における大きな前進となります。従来のマルチモデル連結アプローチと比較して、リアルタイムAPIは音声インタラクションの遅延をさらに短縮し、よりリアルな感情表現と情緒表現を可能にし、より自然な会話体験を提供します。 以下はOpenAIへの公式リンクです。 https://openai.com/index/intr... こちらはAgoraの公式リンクです。 https://www.agora.io/en/blog/... |
OpenAI がリアルタイム API をリリース。Agora や Twilio もパートナーに加わる。
関連するおすすめ記事
-
CATLは、400kmの長距離バッテリー、4Cスーパーチャージャー、ナトリウムイオンバッテリーなど、航続距離延長型車両の開発を加速しています。
-
Zhipu AI版Soraがオープンソース化!商用利用可能かつプレイ可能な初のオンラインアプリケーションとして、GitHubでわずか5時間で3,700個のスターを獲得しました。
-
DeepSeek-R1 のフルパワー バージョンに匹敵するパフォーマンスを備えた QwQ-32B のワンクリック デプロイメント チュートリアルが利用可能になりました。
-
深センの街を歩く人型ロボットが海外で話題に! 超人的な歩行力で10メートル以上も連続歩行が可能。価格は10万元以下、2ヶ月以内に発売予定。
-
数千億個のCPUを搭載した大規模なモデルを実行したいですか?コンピューティングパワーベンダーは全力を尽くしています!汎用CPUサーバーが新たな選択肢になりつつあります。
-
最新バージョンのGrado 5を超高速で体験してください!200万人以上のユーザーが利用している、ACCV'24に選ばれたLoLI-Street低照度画像強化データセットが利用可能になりました。