618ZXW

車に乗った彼女: 機械的な感じを捨て去り、人間らしくありたいと願うモデル、Geely より。

今日、もしあなたのそばに、早口で機知に富みユーモアがあり、比喩や自虐的なユーモアを使い、時にはあなたに反論するような友人のような大きな対話モデルがいたら、あなたはもっとそのモデルとチャットしたくなりませんか?

実際のパフォーマンスを見てみましょう:

同様のデザインのインスピレーションは、映画『her/世界でひとつの彼女』のサマンサから得られます。AIを題材にしたこの映画では、主人公の日常的な問題を解決するのを手伝うだけでなく、人格、感情、意識も備えた完璧なAIエージェントが誕生しました。それは機械ではなく、人間そのものだったのです。大規模モデリングが爆発的に発展している現代において、最新の大規模自然言語モデル(LLM)の能力は、同様の高度に擬人化された知能エージェントの構築を可能にしました。

自動車業界のリーダーとして、Geely は自動車分野で革新を続けるだけでなく、このエントリー ポイントにも照準を合わせています。つまり、独自のStarwise AI ビッグ モデルを「人間化された」対話と感情的な交際のシナリオに実装し、リアルな対話に焦点を当てて車内に「雰囲気」を作り出すことです。

あらゆる会話がテクノロジーと生活の境界を超越した素晴らしい出会いとなるように、あらゆる旅行がインテリジェントなテクノロジーと深く融合した素晴らしい旅となるように。

Starwise AIの大規模モデルは本当にリアルなソーシャル体験を提供できるのでしょうか?実際に試してみましょう。

大型コックピット模型実測

彼らは夜中にこっそりジョークを暗記しているのではないかと思います!

まったく予測不可能なシェンジンに、私は笑ってしまいました。

他の人にも共感してもらえるだろうと思った脱毛の成長痛は、「少ないほど豊か」という哲学的な考察へと巧みに導かれました。

仕事は終わりましたか?(長文)

社会人の代弁者として新たに起用された彼は、正社員経験者なら誰もが絶賛するほどの実力者。「職場の空気」をしっかりと掴んでいて、一度ハマると抜け出せない。

労働者階級の心は深く動かされたと言えるが、その階級の味覚は「アイスアメリカーノの苦さ」「指導者の描いた空想のパイ」「同僚からの責任転嫁」であった。

「陰陽」もできるんですか?

クライアントの予測不可能な性質が大好きです。彼らはまるで夢想家です!もしAIでなければ、クライアントと常にやり取りをしていて、皮肉とほのめかしを軽々と切り替えているのではないかと思うほどです。彼らの想像力はブラックホールよりも深く、本当に感銘を受けています。

公平であることを拒否する

現在主流の大規模モデル(GPT-4*、Llamaなど)は、人間と機械アシスタント間の対話パラダイムをデフォルトとしています。厳格で冷静なアシスタントとして、テンプレートと定型文がその特徴となっています。実際のチャットシナリオに直面すると、「温かみ」や「魂」が欠けているように見えます。

Xingrui AIの大規模モデルにおいて、楽しさは単なる会話の枠にとどまらず、包括的なアプローチを採用しています。相手の立場に立って考え、相手の気持ちを真に理解することから、問題解決よりもまず感情を伝えることを優先し、何気ない一言一つを真摯に受け止め、すべてのユーザーに心からの感情的なサポートを提供し、すべての返答に深い感情的な裏付けが込められていることを保証します。

同じ質問に対して、Starwise AI Big Modelは一定の共感性とより強いインタラクティブ性を備えています。ユーザーの質問に単純に答えるだけでなく、十分な安心感と配慮を提供し、適切な提案も提供します。

創造的な遊び方 – ユーモアのタッチを加える

従来の大規模モデルは、一般的に統一されたスタイルを維持しています。プロンプトを通じて異なるスタイルの提案を提供することは可能ですが、このスタイルの切り替えはボトルネックとなります。異なるスタイルの要件に合わせてモデルを個別にカスタマイズし、学習させると、関連するコストが比較的高くなります。

スタイルコントロールスイッチを備え、ユーザーがモデルの応答スタイルをリアルタイムで制御できる大型モデルはありますか?Geely AI Labsは、ユーザーにスタイル切り替えの「キーワード」を提供することで、同様の試みを行っています。

ユーモアのレベルをコントロールする

感情の強さをコントロールする

もちろん、理想的な AI 製品はユーザーの好みに応じてカスタマイズされるべきであり、各ユーザーの TA は異なるはずです。

これは非常に包括的な配慮と言えるでしょう。「不快に感じる」から「深く共感する」まで、ワン​​クリックで切り替えられます。Starwise AIの大規模モデルは、真に思いやりのあるAIアシスタントを生み出しました。

彼らはどうやってそれをやったのでしょうか?

Geely AI Labは、大規模モデルとロールプレイング、記憶システム、戦略的意思決定、感情強化、インタラクティブ学習シナリオを組み合わせた最新の研究アプローチを統合しています。人間同士、そして人間と環境間のインタラクティブ学習プロセスを模倣し、チャットスキルと感情的なインタラクションを備えた会話型AIエージェントを構築します。コアモジュールには以下が含まれます。

  • ユーザー状態の認識:各インタラクションにおいて、Starwise AI ビッグモデルはまず、ユーザーの現在の意図と感情を識別し、それをその後の意思決定の潜在変数状態として扱います。
  • 人間の戦略:大規模データを単純に蓄積し、学習を模倣する従来の学習方法とは異なり、Xingrui AIの大規模モデルは、まず人間のドメイン知識を様々な戦略とスキルのライブラリに抽象化します。そして、インタラクションプロセスにおいて、エージェントはどの戦略またはスキルを使用するかを判断し、具体的な応答を生成します。このように問題を階層化・細分化することで、複雑な意思決定の問題が簡素化され、現在普及している高速(システム1)-低速(システム2)思考パラダイムにも合致しています。
  • 記憶モジュール: Starwise AIの大規模モデルは、過去の対話データから構造化された記憶データベースを構築します。このデータベースは、現在のユーザーに関連する固有の記憶と、環境全体とのインタラクションから得られるグループ記憶の2つのカテゴリに分類されます。最終的には、グループ記憶から人間の経験の共通性を学習することで、個々の記憶を通して個々のユーザーの好みとのさらなる整合性を実現します。
  • 感情強化: AIエージェントはユーザーの感情と自身のパーソナリティ設定に基づいて自身の感情変化を判定し、最終的に表現内容を修正します。共感戦略に基づく一般的な感情対話システムとは異なり、Xingrui AIの大規模モデルは、自身のパーソナリティが感情表現に与える影響を考慮します。例えば、ユーザーが悲しみを表現した場合、「冷淡で反抗的な」AIエージェントは直接共感するのではなく、パーソナリティ設定により合致するシャーデンフロイデ(他人の不幸を喜ぶ気持ち)を示します。

モデル評価 – どれくらい「人間になりたい」のか?

ケーススタディだけを見ると誤解を招く可能性があります。Geely AI Labは、モデルの擬人化性能をより科学的に表現するために、様々な視点からの評価も実施しました。

対話の有効性のレベルを競う

会話の有効性を客観的に評価する最も直接的な方法は、当社のXingrui AIビッグモデルを他社製品とチャットコンペティションで競わせ、その後、ブラインドヒューマンテストを実施することです。Geely AI Labはemohaaの評価手法も採用し、業界ベンチマーク製品であるGPT-4だけでなく、GPT-4と当社の擬人化プロンプト(GPT-4+プロンプト)を組み合わせた「高忠実度Xingrui AIビッグモデル」も比較することで、コアソリューション自体がもたらすパフォーマンス向上をより科学的に表現しました。一般的なタスク能力に焦点を当てた従来の評価手法とは異なり、この手法では自然さ、チャットスキル、会話の質など、チャット体験に関連する側面を主に評価します。次のグラフは、Xingrui AIビッグモデルとGPT-4、および高忠実度Xingrui AIビッグモデルの勝率を比較した結果を示しており、Xingrui AIビッグモデルが明らかに優位に立っています。

感情知能や性格も定量化できます。

Geely AI Labは、国内外の著名な評価手法も参考にしました。例えば、有名なチューリングテスト(チャット相手が未知の状況で実際の人間とAIを区別できないかどうかを評価)や、モデルの感情知能(EI)と感情の強さを評価するSECEUテストなどです。SECEUは、500人以上の人間のデータをベンチマークとして使用し、40以上の感情シナリオをカバーし、モデルの感情の強さと人間の感情の強さの類似性(低いほど良い)を測定し、モデルの感情知能スコア(高いほど良い)を算出します。

上の画像に示されているテスト結果は、Xingrui AI の大規模モデルがチューリング テストで Baichuan2、Qwen2、GPT4、GPT-4+prompt を大幅に上回り、人間レベルのパフォーマンスに近づいていることを示しています。

SECEU テストでは、Starwise AI の大規模モデルが、中国語 (cn) と英語 (en) の両方のシナリオで、いくつかのモデルの中で最高の結果を達成しました。

3つのモデルの結果を、ビッグファイブ性格特性、パース共感、感情的自己制御スケールなどの心理学分野の他のテストと比較すると、Starwise AIビッグモデルはGPT4 +プロンプトよりも外向的でオープンであり、感情を制御する能力が大幅に向上していることがわかります。

言語学を用いてモデル応答を分析する

Geely AI Labは、よりローカライズされた評価スキームも検討しました。実際の人間同士の自然な会話から得られたテキストは、言語的特徴の分布における根本的なパターンを明らかにします。そして、特徴の分布頻度が人間のサンプルの分布頻度に近いモデルは、自然と人間の言語習慣に即したものになります。様々な言語研究文献を参照することで、これらの言語的特徴には、音節(単音節 vs. 二音節)、語彙レベル(A、B、C、D)、句読点、逆行語尾、内容語、機能語などが含まれます。

また、この結果は、Starwise AI 大規模モデルの統計分布がほとんどの指標において人間のサンプルの統計分布に近いため、より口語的な表現とより自然な会話方法を提供していることを示しています。

モデルは「ソードガイ」であることが判明しました。

最後に、Geely AI Labは自社モデルで人気のMBTI性格診断テストも実施しました。GPT-4のINTJと比較すると、Starwise AIの大規模モデルは「主人公型性格」のENFJとも呼ばれています。「あまりしゃべりすぎるのは私のスタイルではない」というi型の人から「もっとあなたとおしゃべりしたい」というe型の人まで、冷静な分析から感情や共感への集中まで、より強いJ型の属性と同じような考え方を持つ人こそが、まさに私たちが求める主人公型です。

ENFJ型の人は、卓越したリーダーシップ、鋭い直感、強い共感力、そして独特の魅力を備えています。自信に満ち、落ち着きがありながらも、温かく、話し上手です。小さな太陽が人々を照らすように、ENFJ型の人の愛情は細部に宿ります。情熱、誠実さ、そして信念を植え付ける力。これらこそが、Starwise AIモデルの真の特徴です。

「チャット」以上のもの

テクノロジーの進歩の波の中で、Starwise AIビッグモデルは単なる製品の誕生ではなく、思考と実践の革新的な旅でもあります。AIの応用シナリオをタスク遂行から感情的なインタラクションへと拡大し、ユーザーが運転中により多くの仲間意識と満足感を得られるよう支援し、より高度なインテリジェントな人と車のインタラクションを実現します。

Starwise AI大型モデルは近日中に新エネルギー車に搭載され、オーナーはカーオーナーアプリで直接体験できるようになります。関連論文も近日中に発表される予定です。

もちろん、スーパー人工知能への道のりは依然として長い。第一に、研究者はモデルの本質的な個性をさらに探求し、形作る必要がある。そうすることで、前述のような、単なる模倣や暗記ではなく、深く根付いた思考の結果であるようなケースを回避することができる。第二に、擬人化された性格を持つAIエージェントを構築し、嘲笑や反抗的な行動さえ示すことは、ある意味でAIの安全性に関する価値観との整合性を図る作業と矛盾する。人間と同じように個性豊かで楽しいAIを作りつつ、人類にとって脅威とならないようにすることは、根深く、そして継続的な課題である。

テクノロジーと夢が融合する最前線に立つ Geely は、常にイノベーションを推進し、インテリジェント モビリティの新時代を模索し、Geely Automobile の技術進歩を継続的にサポートすることに尽力しています。

参考リンク:
[1] https://thecinemaholic.com/he... [2] https://www.tsinghua.edu.cn/e... [3] https://www.16personalities.c... [4] https://bigfive-test.com/ [5] https://psychology-tools.com/...