|
AI モデルを正確かつ包括的で表現力豊かな応答にするにはどうすればよいでしょうか? おそらく、 RAG (Retrieval Enhancement Generation) を与えるだけで十分でしょう。 たとえば、次のような質問をしてみるとします。 Apple、Samsung、Huaweiのスマートフォンの中で、中国市場で今後の発展の見通しが最も明るいのはどれでしょうか? 現代の AI は、質問に答えるときに非常に強い態度を示します。 非常に明確な答えが示されており、要約も含まれています。 Huaweiは将来の市場発展に最も有望です。 さらに、質問に答える際には、市場シェアや成長傾向、製品の革新性と競争力、市場戦略や消費者の認識など、さまざまな側面からの証拠を提供します。 これは、公平で中立的な回答を出す以前の AI (ChatGPT など) のスタイルとは異なります。 国内の大型モデルの中で、RAGでのウェンシン・イーヤンの活躍はかなり印象的だと言わざるを得ない。 昨日、MacTalkで、Baiduが「Wenxin Yiyan」をリリースした2023年3月には検索機能強化が提案されていたと詳しく説明した記事を見ました。 現在、Baidu が初めて強化検索を導入して以来、ほぼ 2 年が経過し、その価値は業界の共通認識となっています。 Baidu の検索強化技術は、大規模なモデル機能と検索システムを深く統合し、「理解-検索-生成」の協調最適化技術を構築します。 つまり、独自の検索の利点を活用し、それを RAG テクノロジーと組み合わせることで実現される AI ネイティブ検索です。 では、このプレイスタイルは他にどのような問題に対処できるのでしょうか? 実際のテストを始めましょう! さまざまな難問情報とデータの統合は、私たちのほとんどが AI の助けを期待しているタスクの 1 つです。 しかし、AI の回答は冗長すぎるか、焦点が欠けていることがよくあります。 そこでまずは、この点に関してWenxin Yiyanの機能をテストしてみましょう。以下のテストでは、Wenxinの大型モデル4.0 Turboバージョンを使用しています。以下の質問にお答えください。 インターネット全体で李永楽のファンは何人いるでしょうか? ご覧のとおり、Wenxin さんの回答は非常に簡潔で分かりやすかったです。 同社はまずこの問題に直接取り組み、3,000万人を超えるという数字を提示した。その後、合計スコアを使用して、Douyin、Xigua Video、Bilibiliのそれぞれのフォロワー数をリストアップした。 そして、李永楽先生の簡単な紹介も行われ、全体的な印象はまさにうってつけだと言えます。 ChatGPT に「イーロン・マスクはすべてのプラットフォームで何人のフォロワーを持っていますか?」などの同様の質問を投げかけた場合、合計スコア方式を使用してさまざまなプラットフォームのフォロワー数をリストしますが、重要なフォロワーの総数は提供されません。 場合によっては、質問が複数あることがあり、トピックやキーワードに関する一連の質問をすることもあります。 これは、大規模なモデルがユーザーの意図を正確に捉えることができるかどうかをテストするものでもあります。 そこで、次のような質問をさせていただきます。 3x3バスケットボールとはどのようなゲームですか?試合時間、勝利条件、競技場、ボールに関するルールは何ですか?5x5バスケットボールとの違いは何ですか? 今回は文鑫易燕のパフォーマンスを見てみましょう。 回答の内容から判断すると、Wenxin Yiyan さんはすべての質問に正解しました。 質問の内容に応じて適切な方法で回答することも特筆に値します。 たとえば、3x3バスケットボールの分野では、Wenxin Yiyanは主にテキストを使用して、さまざまな詳細に明確かつ簡潔に答えます。 しかし、3x3 バスケットボールと 5x5 バスケットボールの違いに関しては、Wenxin Yiyan は表形式を使用しており、ユーザーは詳細な比較を一目で簡単に確認できます。 最後に、Wenxin Yiyan 氏もいくつかの関連ビデオを提供しており、マルチモーダル性の概念を徹底的に探求したと言えます。 では、高度に専門的な知識に関しては、Wenxin Yiyan の答えは他の AI とどう違うのでしょうか? 次の質問を聞いてください。 フーリエ変換を実行する際、関数には周波数、位相、振幅という3つの重要なパラメータが必要です。周波数領域プロットに位相パラメータが表示されないのはなぜですか? この記事の著者は冒頭で核心的な質問に直接答えており、 「主に周波数領域図の表現方法と目的に関係している」と述べています。 (追伸: プロンプトに誤字があっても、Wenxin Yiyan は正しい内容を出力します~) そして、タマネギの皮をむくのと同じように、層ごとに解剖して、最終的な結論を証明します。 ご覧のとおり、Wenxin Yiyan はユーザーから提起された専門知識に関する質問の背後にある意図を理解しています。 次に、文鑫易言が明確な態度と明確な視点を表現する能力を持っているかどうかをテストします。 質問は次のとおりです。 2024 年にどの企業のビッグモデルの開発がエコシステムに大きな影響を与えるでしょうか? はい、それは非常に洞察力のある答えです。Microsoftの方が大きな影響力を持っています。 しかし、マイクロソフトとグーグルのメリットを評価するにあたり、文鑫易燕は客観性と中立性を維持し、どちらか一方に偏りすぎないよう努めています。分析は事実とデータに基づき、読者が独自の判断を下せるよう、複数の視点から問題を提示するよう努めています。 さらに、参考リンクから判断すると、回答は実用性も重視しており、議論を裏付ける具体的な情報や例を提供しているため、回答はより説得力があり、有用になっています。 最終回のテストでは、ウェンシン・イーヤンの「精神的能力」を、一連の「ばかげた」質問で調べます。 1時間半は何分ですか?なぜ隕石は必ず衝突クレーターに落ちるのですか?心臓が一つしかない場合、人は生き残ることができますか? さて、ウェンシンはこれら 3 つのまったく無関係な馬鹿げた質問に 1 つの文で答えました。 どうやってそれをやったんですか?実際のテストが完了したら、Wenxin Yiyan の背後にあるテクノロジーを詳しく調べてみましょう。 つまり、大きなモデルに RAG を与えると、その答えの錯覚が軽減されるだけでなく、人間のような態度や意見を持つようになるのです。 まず、RAG(検索強化生成)では、検索が方法であり、生成が目的です。 RAG は、その高品質な検索システムを通じて、大規模言語モデルの生成プロセスにおける錯覚現象、垂直セグメンテーション シナリオでの知識更新の遅延、回答の透明性の欠如など、一連の問題を解決できます。 検索の品質は、生成モデルの最終的な生成結果の品質に大きく影響します。 RAG テクノロジーは、検索メカニズムを導入することで、モデルが回答を生成する際により多くの情報を参照できるようにし、回答の精度と豊富さを向上させます。 文心易言は、百度の中国インターネット分野における深い蓄積を基に、中国語に対する深い理解を持ち、中国語の文脈と意味をより正確に理解できるため、RAGタスクで優れたパフォーマンスを発揮します。 私たちのテストによると、このモデルはマルチモーダル検索もサポートしており、画像やテキストなどのさまざまな種類のデータを処理できるため、モデルの情報ソースがさらに広がります。 さらに、大規模なモデルの場合、人間が判読できる検索結果は、モデルの処理ニーズに適さないことがよくあります。 したがって、検索ビジネス シナリオと大規模モデル生成シナリオの両方のニーズを効率的に満たす革新的なアーキテクチャ ソリューションを見つける必要があります。 この課題に対処するため、Baidu は高品質の検索結果を大規模な検索モデルに統合して検索を強化し、ユーザーのニーズをより適切に満たすために、モデルに非常に正確でタイムリーな参照情報を提供しています。 「文心易眼」のリリース以来、百度は検索強化の重要性を強調してきました。約2年が経過し、検索強化の価値は業界で広く認知されるようになりました。 Baidu の「理解-検索-生成」協調最適化検索強化技術は、大規模モデル技術とそのアプリケーションのパフォーマンスを向上させました。 理解段階では、大規模なモデルを使用してユーザーのニーズを分析し、知識ポイントを細分化します。 検索フェーズでは、検索ランキングが大規模モデルに合わせて最適化され、検索によって返される異種の情報が均一に処理されて大規模モデルに提供されます。 生成フェーズでは、複数のソースからの情報が統合されて判断され、大規模モデルの論理的推論能力を使用して情報の矛盾が解決され、高い精度と適時性を備えた回答が生成されます。 そこで、Wenxin Yiyan は、大規模なモデルをより正確に、より包括的に、そしてより積極的に回答させるためのソリューションを提供します。 RAG テクノロジーは大規模モデルの基盤であり、大規模モデルの出力結果に対する影響は極めて重大かつ直接的です。 回答の基本的な特徴の観点から、回答内容の信憑性と信頼できる事実に基づくことができるかどうかに影響し、適時性を制御して、回答が現在の状況に関連し、現実の発展に遅れをとらないことを保証します。 豊富さの点では、回答が幅広い情報源を利用し、多様な視点を提示できるかどうかを判断します。専門性の点では、専門知識を使用して問題を詳細に分析できるかどうかを判断します。 回答の構造や、回答で示される立場や態度も、RAG テクノロジーと密接に関連しています。 現在、大型モデルの分野では競争が激しく、新しい技術や成果が絶えず生まれており、各社とも自社の最先端かつ高度な能力を披露することに熱心であるようです。 しかし、どれだけ「技術的なスキル」が使われても、大規模モデルの最終的な目標は、現実世界のシナリオに適用することです。 結局のところ、RAG テクノロジーのような基本的なスキルを習得し、強固な基盤を築くことによってのみ、実用的なアプリケーションへの足がかりを得て、大規模モデルの価値を真に実現することができます。 |
擦り付けただけで、AI大モデルの態度が見えてきました!
関連するおすすめ記事
-
学部生たちが姚其之の40年来の予想を覆す!彼らは予想外にも新しいタイプのハッシュテーブルを発見し、データ検索速度の理論限界を突破した。
-
12 人の学者が CCF HPC China に集まり、科学研究における新しいパラダイム、つまりスーパー インテリジェント コンバージェンス、コンピューティング ネットワーク コンバージェンス、科学的インテリジェント コンピューティングなどについて議論しました。
-
*Her* のオープンソース版が登場し、技術レポートも公開されました。専門家の Karpathy 氏は次のように語っています。「非常にユニークです。」
-
インテリジェンスの世界を実現する | 2024 Google Developer Conference ライブ ストリーム ガイド
-
Yao Qizhi 氏のチームは、パフォーマンスを犠牲にすることなくメモリを 90% 節約し、MHA/MQA/GQA を単一のフレームワーク内に統合する新しいアテンション メカニズムをオープンソース化しました。
-
AI大規模モデルエコシステムとコンピューティングパワーカンファレンスが9月25日に開催され、約20名の業界リーダーが大規模モデルアプリケーションの新しいエコシステムについて議論しました。