618ZXW

Wenxin Yiyanは完全に無料になり、ディープサーチ機能もオンラインでご利用いただけます。さあ、実際に試してみましょう。

同日、AI大手2社、OpenAIとBaiduが同時に無料サービスを開始!

Wenxin 5.0 に関するニュースが報じられてから数日後、Baidu は本日突然発表しました。

PCとモバイルアプリをご利用のすべてのユーザーが、Wenxinシリーズの最新モデルを体験できます。Wenxin Yiyanは4月1日午前0時から完全無料になります! PCとモバイルアプリをご利用のすべてのユーザーが、Wenxinシリーズの最新モデルを体験できます。

一方、文鑫易眼はディープサーチ機能をリリースし、その1週間前にはOpenAIがオンライン検索向け大規模モデルの推論能力を披露するライブストリームを緊急開催した。彼らがその機能に慣れる前に、百度が追随し、彼らの防御を突破した。

わあ、最近の大型モデルはロールアップされてるんですね!

最新のディープサーチ機能「推論モデル+検索」は、複雑な質問と回答を専門レベルへと直接引き上げ、より強力な思考力、計画力、そしてツール活用力を提供するとされています。4月1日より無料でご利用いただけます。

QuantumBit はこれを最初に試した企業の 1 つです。

検索を実行するたびに、コードインタープリタ、高度なネットワーキング、AI描画などのさまざまなツールを思考プロセスと行動プロセスに合わせて柔軟に計画して呼び出し、最終的に表、画像、コードを含む高品質のマルチモーダル出力を形成します。

例えば、興行収入が100億人民元を突破しようとしている『哨戒2』に関して言えば、一つ一つ質問するのではなく、聞きたいことを連続して送ることができます。

なぜ『哪 ...

数秒で思考と計画を完了し、各質問に個別に答えて、一連の質問のすべてに正しく答えることができます。

アオ・ビンがアオ・ルンの甥(オレンジ)であるというジョークは理解できます。

さっそく、このトピックについてさらに詳しく見ていきましょう。

最新のディープサーチ機能を実際に試してみた

Wenxin Yiyan の詳細検索の使い方は次のとおりです。

ディープサーチは、通常のAI検索とは異なり、複雑な質問に対して専門家レベルの質疑応答サービスを提供することに重点を置き、専門的な相談質問向けに強化されています。

このプロセスでは、まずユーザーのコアニーズを分析し、問題をステップに分割し、次にツールを使用して情報を検索、検討、整理し、最後に結果を出力します。

深度探索、マルチモーダル出力

まずは食欲をそそる前菜から始めましょう!

哪吒が立ち上がる冒頭から引き続き、人は当然疑問に思うだろう。他にどんな中国の神話物語がアニメ化に適しているのだろうか?

通常の AI 検索エンジンが「中国神話」と聞くと、盤古、女媧、伏羲、神農といった人物をすぐに表示するかもしれません。

ディープサーチは当初、オンライン検索ツールから大量のデータをコピーしていました。たとえば、牛飼いと織姫、女媧による人間の創造、盤古の天地の分離、嫦娥の月への飛行、禹大王による洪水の制御、伏羲による卦の描き方、后羿による太陽の撃墜などです...

しかし、その後の深い探索には思考と分析という追加のステップが含まれ、こうして「最初の試みの成功」が達成されます。

ユーザーが言及した「Nezha 2」の最近の人気は、Nezha というキャラクターが視聴者に深く愛されていることを示しています。そこで私は、Nezha と関連性の高い、豊かなストーリーと個性的なキャラクターを持つストーリー「Havoc in Heaven」を選びました

それは皆の心に響く選択だったと言わざるを得ません。

もう少し複雑になってきますが、神々の叙任式における神々の系譜を確認してみましょう。

徹底的な調査は、封印された最初の神(三界の長であり清浄なる祝福の神である白堅)から始まり、365柱の神すべてを徹底的に調査しました。

次に、いくつかのキャラクターの成長過程をタイムラインに沿って整理し、分析レポートを作成します。

さらに印象的なのは、クエリの結果がまだ不明瞭な場合は、オンラインで見つかった情報に基づいて主要な神々の階層関係を分類することもできることです。

彼らにとって、グラフを描いたり表を作成したりするのは簡単なことです。

このようなツールを使用すると、分析レポートの資料の整理が将来的にはるかに簡単になります。

さらに、オンライン検索はリアルタイムなので、最新のニュースやトレンドのトピックを常に把握でき、天気について質問することもできます。

複数のツール、柔軟なアクセス

ツールの計画と呼び出しの機能が強化されたため、Wenxin Yiyan Deep Search は人々の生活、起業、経済など、より専門的で複雑な問題を分析することもできます。

ディープサーチでは、高度なネットワーキング、コードインタープリター、ドキュメントの質問回答、画像理解、AI描画、ワードクラウド生成などのツールを活用でき、ドキュメントや画像のアップロードをサポートします

例えば、Luckin Coffee の最近のビジネス状況を把握したい場合は、持っている情報をアップロードして一緒に分析させることができます。

Deep Thinking は、ユーザーがアップロードしたデータを組み込むことで自動的にアプローチを計画し、レポートに特定のデータが欠落している場合は高度なオンライン クエリを使用するように自動的に通知します。

思考プロセス中に図やその他のグラフを描く必要がある場合は、コード インタープリターが自動的に起動して描画します。

最後に、テキストと画像の両方を含む包括的な調査レポートが提示されます。

以下のようなクエリの場合、深度検索も役立ちます。

北京に50万人民元の予算でペットフレンドリーなカフェを開店する予定です。以下の点についてご協力をお願いいたします。1) 半径3km圏内の競合店の分析、2) 予想費用と収益の算出、3) 必要な許認可のリストアップ、4) 看板メニューのデザイン。

高度なネットワーキングを使用して、明確かつ組織的な方法で、一度に 1 つの小さな問題を解決してから、高度なネットワーキングを使用して次の問題に取り組みます。

思考プロセスは細部まで詳細に渡っており、費用見積もりでは場所、装飾、設備構成などを見積もる際に使用する基準が明記されます。

さらに、画像をアップロードしてオンライン情報と組み合わせて解釈させることができ、ミームも理解できます。

最後に、バレンタインデーが近づいてきました。彼氏や彼女に贈るプレゼントは何がいいでしょうか?

小規模な慈善活動をテーマにしたプログラムの開発にご協力ください。

大規模モデルの中でも検索に最も優れ、検索エンジンの中でも大規模モデルに最適です。

実際に体験してみると、文鑫易燕の徹底的な調査は実に印象的です。

結局のところ、Baidu は検索から始まり、中国のインターネット分野に深い基盤を持っています。

技術的な観点から見ると、Baidu の大きな利点の 1 つはRAGテクノロジーです。

言語モデルと情報検索を組み合わせたBaidu RAG は、特に中国のインターネットやエンタープライズ サービスなどのシナリオにおいて、深い中国語理解、マルチモーダル検索、垂直ドメイン カスタマイズ、リアルタイムのデータ統合機能などの利点を備えています。

さらに、自社開発の「理解・検索・生成」協調最適化検索強化技術は、質問応答プロセスを3段階に分解し、大規模モデル技術とその応用のパフォーマンスを大幅に向上させます。

昨年初め以来、百度はiRAG技術への取り組みに注力してきた。

iRAG (Image-based Retrieval-Augmented Generation) は、検索と生成を組み合わせて画像生成における錯覚の問題を解決し、生成されるコンテンツの信頼性と精度を向上させる技術です。

その核心は、Baidu の膨大な画像リソースと Wenxin ビッグデータ モデルの生成機能を組み合わせ、共同最適化を通じて、生成された画像をよりリアルで信頼性の高いものにすることです。

iRAG は、映画やテレビ作品、コミック、絵本、ポスター制作など、幅広い分野で応用でき、ユーザーの制作コストを大幅に削減できます。

ディープサーチにはこれらの技術的機能が含まれます。

そうは言っても、百度が無料サービスを提供しようとしたことは、かなり驚きだった。

彼が手を振るだけで、最高のモデルが無料で誰でも利用できるようになるため、オープン化への道に向けて本当に大きな一歩を踏み出したことになります。

これは実際にはWenxin Yiyan のトレーニング コストと推論コストの両方が削減されたためであると理解されています。

最近、ロビン・リーは公の場で次のように述べた。

かつてムーアの法則について語られたとき、性能は18ヶ月ごとに倍増し、コストは半減しました。しかし今日、大規模言語モデルについて語るとき、推論コストはわずか12ヶ月で90%以上削減できます

百度はどのようにしてこのような躍進を遂げたのでしょうか?その主な強みを見てみましょう。

トレーニングの面では、 Baidu はコスト効率の高い Kunlun チップをサポートしており、これにより、より少ないコンピューティング リソースで大規模モデルを実行できるようになり、コンピューティング能力の単位あたりのコストが直接的に削減されます。

Baidu AI Cloudは数万コア規模の大規模クラスタも備えており、3万コアへの拡張を計画していると報じられています。大規模クラスタは、並列タスクスケジューリングと柔軟なコンピューティングパワー管理を通じてコン​​ピューティングリソースの利用率を向上させ、アイドル状態のコンピューティングパワーを回避できるため、全体的なコンピューティングパワーコストをさらに削減できます。

さらに、Baidu は、トレーニング タスクを実行する大規模クラスターの安定性を確保するための包括的な障害診断方法を提供する Baige プラットフォームもサポートしています。

推論の面では、 Baidu は PaddlePaddle ディープラーニング フレームワークもサポートしており、並列推論と量子化推論は大規模モデル推論用の PaddlePaddle 独自開発の技術であり、これも推論コストの削減につながっています。

公開データによると、2024年11月時点で文心易言のユーザー数は4億3000万人に達し、大規模モデルの1日あたりの呼び出し回数は15億回を超えており、2023年と比較して30倍以上増加している。

そこで再び疑問が湧く。Baiduは次に何をするのだろうか?

CNBCは関係筋の話として、百度が今年後半に次世代AIモデル「Ernie 5.0」をリリースする予定で、同モデルではマルチモーダル機能が大幅に強化されると報じた。

ウルトラマンがGPT-5の登場を示唆していることを考えると、ベースモデルの「5.0コンペティション」は2025年後半に開催されるものと思われる。