今年 10 月 24 日の AI に関する興味深い観察結果。

オリジナル Datawhale Datawhale

データホエールのレポート

インサイト：1024のDatawhale

今年は10月24日午前10時です。

iFlytekはSparkテクノロジーの最新アップグレード版を発売した。

この Spark のアップグレードは、主に基本機能とアプリケーションの実装で構成されます。

iFlytek Spark大型モデルがバージョン4.0 Turboにアップグレードされ、iFlytek Sparkプラットフォーム機能に基づく10の製品と革新的なアプリケーションが初めてリリースされました。

最も驚くべき点をいくつか取り上げてお話ししましょう。

ハイライト 1: AI はより感情的になり、デジタルヒューマンにはさらなる応用が生まれます。

デジタルヒューマンの分野では、iFlytekが新しいソリューション「Xiaoxing Chat」を提案した。

Xiaoxing Chat は、AI ビデオ通話、仮想人間インタラクション、マルチモーダルインタラクションを統合し、AI をより人間らしくします。

iFlytek研究所所長のLiu Cong氏によるデモンストレーションでは、音声とビデオの入力もサポートしながら、音声のリズムと意味に基づいて表情や動作を自動生成し、テキスト、音声、表情のクロスモーダルな意味の一貫性を実現することが実証されました。

フェイスクリームの普及活動、お酒やギフトのおすすめ、写真によるストーリー展開など、すべてがスムーズに進み、売上アップにも貢献しました。

カメラを外国語が印刷された化粧品やアルコール製品に向けると、Xiaoxing は画像の中に多言語の製品ブランドや機能情報を統合し、正確な応答を行うことができます。

ハイライト 2: AI 検索により、より包括的でパーソナライズされた回答が提供されます。

デジタルヒューマンについて説明しましたが、2 番目の注目機能である「Spark AI Search」について触れなければなりません。

デジタルヒューマンの基本的な機能は Spark の AI 検索機能に基づいて構築されており、テキストインタラクションから音声インタラクション、そしてオーディオとビデオのストリーミングに至るまで、リアルタイムのマルチモーダルインタラクションを可能にします。

まずはディープサーチを試してみて、Spark に質問に答えてもらいましょう。

ご覧のとおり、iFlytek の AI 検索は45 のオンラインリソースを統合し、最初に私の主要な質問に対する回答を絞り込み、その後、最新の「放送の一時停止と再開」イベントについても言及しながら、回答を拡張します。

彼らは、私が予想していなかったQuan Geのフォロワー数増加に関するデータも提供してくれました。

Spark AI Searchは、アプリ、ウェブ、PCでご利用いただけます。ホームページには、ユーザーが最新の情報やニュースを常に把握できるよう、トレンドニュースセクションも用意されています。

要約すると、Spark の AI 検索では、より多くの Web ページを検索し、より包括的でパーソナライズされた回答を提供できます。

ハイライト3：iFlytek Spark 4.0 Turboの発売

最後に、新モデルのアップグレード版「iFlytek Spark 4.0 Turbo」についてお話しします。

数学的およびコーディング機能の面では、 iFlytek Spark 4.0 Turbo は GPT-4o を上回りました。

この結論は、アレン人工知能研究所やOpenAIなど、国内外で権威のある組織によって発表されました。

理解と推論、総合試験、数学と科学、コーディングなど、さまざまなタスクタイプを網羅した 14 の主要テストセットにおいて、iFlytek Spark 4.0 Turbo は優れたパフォーマンスを発揮し、9 つのテストセットで他を上回り、相対的な効率が 50% 向上しました。

今年の記者会見で、iFlytekの劉清鋒会長は、数学とコーディング能力を強調しました。数学能力に関しては、CAppliedMath-1.0テストセット（実用的な数学タスクに基づいて構築）を用いてテストしたところ、iFlytek Spark 4.0 Turboは、計算、金融、経済、測定など、複数のタスクにおいてGPT-4oを上回りました。

一方、劉青鋒氏は、バージョン4.0 Turboが超長思考連鎖、ツリー探索、自己反省評価といったアルゴリズムの検証に成功したことも明らかにした。今年末までにOpenAI o1と同等の高難易度数学機能を実現すると期待されている。

コード生成機能に関しては、HumanEvalテストセットでのパフォーマンス比較により、iFlytek Spark 4.0 TurboはPython、Java、JavaScriptなどのタスクにおいてGPT-4oをわずかに上回り、C++機能ではGPT-4oを上回ることが明らかになりました。同時に、コード生成とコード補完タスクをサポートするCode 7Bもリリースされました。

ハイライト4：複数の言語と202の方言をカバーする、多言語大規模モデルの最初のリリース。

「言語力」は常にiFlytekの強みです。

記者会見では、英語、ロシア語、日本語、中国語、フランス語、スペイン語、ポルトガル語、ドイツ語など複数の言語をカバーする多言語認知モデルも発表されました。

自動車、家電、事務用品、翻訳などの業界全体のタスクシナリオでは、多言語大規模モデルが GPT-4o よりも優れています。

音声認識は初めて全国の地級市方言の完全カバーを達成し、288の地級市にある202方言をカバーした。

ハイライト 5: API 価格がさらに引き下げられ、大規模モデルの使用コストが大幅に削減されます。

開発者向けには、iFlytekのSpark APIマトリックスがさらに拡張され、大規模モデルの利用コストが削減されました。メインバージョンは100万トークンあたり5元という低価格です。

同時に、大規模評価モデル、多言語対応大規模モデル、カスタマイズ可能なAPI、知識拡張APIなどの製品もリリースされます。

結論: 今日、AI アプリケーションはシナリオベースのアプリケーションのより深い段階に入っています。

iFlytekは今年、特に大規模モデルの実用化に重点を置いています。

共産主義青年団中央委員会が特別に支援する唯一の大規模モデル応用コンテストであるSpark Cupには、世界533の大学から1,656の学生開発チームが参加しました。そのうち、上位20チームのうち8チームがDatawhaleから参加しました。

記者会見全体を通して、iFlytekの思考プロセスが明らかになった。

今日、AI アプリケーションはシナリオベースのアプリケーションのより深い段階に入っています。

確かに、中国にとっては、まずマルチモーダルとDalle 3技術の開発に重点を置く方が現実的だ。

しかし、大規模モデルも大規模応用の時代に入っていることは否定できない。

教育、ヘルスケアなど、iFlytekは人々の生活の基本的な側面に力を入れており、中国の国家AIチームの社会的責任を真に実証しています。

今年、iFlytekが伝えたいキーワードは、空を目指して地に足をつける、自立と制御、汎用技術と専門技術の融合、端末とクラウドの連携、ソフトウェアとハードウェアの統合です。

これは、過去 25 年間にわたる iFlytek の本来の志、職人技、オープン性、革新性を深く表しています。

生産力と想像力を解き放つことはもはや夢ではありません。

いいね！（3件のいいね！）↓

618ZXW

今年 10 月 24 日の AI に関する興味深い観察結果。

関連するおすすめ記事

ランダムにおすすめされた記事

人気のタグ