|
OpenAIは本日、GPT-4o音声合成AIアプリケーションおよびエージェント構築用のリアルタイムAPIのパブリックベータ版をリリースしました。有料開発者は誰でも、低遅延、マルチモーダル、リアルタイムのインタラクティブなエクスペリエンスをアプリケーション内で構築できます。OpenAIはまた、LiveKit、Agora、Twilioの3社との音声APIパートナー契約を発表しました。 Agoraの姉妹会社はAgoraです。両社は2023年5月に分社化され、業界で最も早期かつ徹底的な分社化の一つとなりました。Agoraは中国市場に焦点を当てており、本社は中国・上海にあります。Agoraは米国および国際市場に焦点を当てており、本社は米国カリフォルニア州サンタクララにあります。 リアルタイムAPIのリリースは、OpenAIにとってAI応用分野における大きな前進となります。従来のマルチモデル連結アプローチと比較して、リアルタイムAPIは音声インタラクションの遅延をさらに短縮し、よりリアルな感情表現と情緒表現を可能にし、より自然な会話体験を提供します。 以下はOpenAIへの公式リンクです。 https://openai.com/index/intr... こちらはAgoraの公式リンクです。 https://www.agora.io/en/blog/... |
OpenAI がリアルタイム API をリリース。Agora や Twilio もパートナーに加わる。
関連するおすすめ記事
-
OpenAIが最高322万円の給与でロボットエンジニアを募集中!
-
中国のNeolix無人車両が物流業界を席巻:コスト半減、米国はパニックに?
-
DeepSeek-R1 + カーソルが完全統合!Wuwen Chip Domeがフル機能のAPIサービスを開始、国内主要7社のコンピューティングパワーがサポート。
-
ECCV 2024に選出されました!浙江大学は、Microsoft Research Asiaと共同で、異種医療データの障壁を打ち破る統合医療画像事前トレーニングフレームワーク「UniMedI」を提案しました。
-
DeepSeek公式推奨事項:R1構成ガイド
-
明日初公開!ディープラーニングを基盤に、生体高分子とその相互作用の3D構造予測をAlphaFoldよりも高精度に実現。