618ZXW

医療アプリ Good Companion AI の実世界テスト: 一流病院の専門家のデジタル版が誰でも利用可能に。AI 主導のヘルスケアへの道がついに開かれたのか?

大規模モデルのトレーニングコストをめぐる戦いに勝利した DeepSeek は、世界の AI 競争環境を再構築しています。

WeChat、Lark、Baidu など、数百の企業が次々と DeepSeek との統合を発表しており、この表面上の盛り上がりは、実際にはさらに多くのアプリケーション シナリオの実装を反映しています。

あらゆる業界のリーダーが AI を全面的に受け入れるにつれ、社会全体、そして私たち一人ひとりが実際に AI とつながっています。

しかし、AI分野の中でも最も有望視され、常に話題となっているAIヘルスケアは、依然として「担い手が不足している」という状況に直面しています。

主な理由は3つあります。

  • ヘルスケア分野におけるAIは、過度に細分化されています。伝統的な漢方薬から画像認識、患者の診察への付き添いから医薬品開発まで、AIの応用分野は多岐にわたりますが、真にニッチな領域から抜け出せているAIはごくわずかです。
  • 大規模な医療 AI モデルの能力を評価するための統一された標準がないため、開発と改善の方向性が明確でなく、試行錯誤のコストが高くなっています。
  • AIヘルスケアは業界の特性上、倫理などの客観的な要素によって厳しく制約されており、メーカーは厳しい許可・資格審査を受けます。

しかし、このような環境下で、杭州を拠点とするテクノロジー企業「智真科技」が、目を引く医療AI機能と差別化された技術を特徴とする製品「Haoban AI」を発売し、人々の注目を集めた。

さらに重要なのは、App Store で誰でも利用できる DeepSeek と同様に、Haoban AI もアプリとして誰でも利用できるようになったことです。

病気ではなく、一般的な健康維持だけを考えているなら、Good Companion AI に診てもらうこともできます。

たとえば、最近受け取った健康診断報告書に専門用語が多すぎて言葉が出ない場合でも、問題ありません。報告書をアップロードするだけで、解釈に役立ちます。

症状があるので、まずは質問したいのですが…

実際の医師の臨床経験、医療記録、研究論文を組み合わせて、一流病院の専門家向けのデジタルアバターを作成し、予約のために争うことなく自宅から医師に相談できるようにします。

ユーザーが急増したため、この AI の詳細な評価を実施することにしました。

「Good Companion AI」を実際に試してみた

この製品は現在、ウェブ版とモバイルアプリ版の両方でご利用いただけます。今回はモバイルアプリでテストさせていただきます。

ホームページは次のようになります。コア機能が一目でわかります。

試験項目1:検査報告書と健康診断報告書の解釈

この最初のハードルとして、最も一般的な検査報告書/健康診断報告書を解釈することから始めます。

複数の画像をアップロードするというたった 1 つの操作で、不可解な 2 つのテスト レポートが数秒で解読されました。

(正確さに対する私の個人的な要求を考慮して、私はじっくりとゆっくり考えることから始めました。)

さらに詳しく調査し、慎重に検討した結果、Good Companion AI は最終的に 2 つの主要な判断を下しました。

  • ビリルビン値の上昇;
  • 乳房の結節については、右側の低エコー結節(BI-RADS 3)と左側の無エコー結節(BI-RADS 2)はともに良性の可能性が高いタイプです。

そして、これらすべてが元のテスト結果と完全に一致しています。

特に気配りが行き届いているのは、対面の医師と同じように、次回の診察時間を明記するだけでなく、応答中にさまざまな注意事項をリマインドしてくれることです。

いくつかの簡単なテストレポートであれば問題ないようです。

では、ハードルをさらに上げて、非常に長い PDF 形式の健康診断レポートを投入してみましょうか。(さまざまな検査レポート、超音波画像、心電図などが含まれています。)

右上の「健康診断報告書の解釈」をクリックすると、2 つのアップロード方法が表示されます。

1 つのオプションは PDF ファイルを直接アップロードすることであり、もう 1 つはレポート リンクをコピーして貼り付けることです。

補足ですが、Good Companion AI の機能を本当にテストするために、事前にレポートから結論ページを削除しました

テスト中、最初に約 2 分かけて PDF を解析し、次に個人の健康状態に関するいくつかの質問 (20 問) に答えるように求められ、その後、さまざまな異常指標について AI 医師とコミュニケーションをとることができました。

詳細なレポートを作成するには、全体のテストに約10分かかります。結果を元の結論と比較すると、すべて完全に一致しています。

ちなみに、注意深い読者の方は、ここに過去の健康診断レポートを収集して整理する履歴レポートレコードもあることに気付いたかもしれません。

これにより、将来いつでも健康履歴を確認しやすくなります。

試験項目2:「デジタルアバター」による一流医師とのオンライン相談

次に、Good Companion AI のもう 1 つのハイライトである医療専門家アバター システムをテストしてみましょう。

彼らの肩書きを見ただけでも、これらの専門家と直接会う予約を取るのは非常に難しいことがわかります。

王立全(浙江大学医学部付属第二病院産婦人科主任医師)、呉霊謙(中南大学湘雅病院産婦人科主任医師)、張偉(復旦大学付属産婦人科病院主任医師)...

ちょっと待ってください。まずは、1 つの質問に答えましょう。これらのデジタル クローンはどこから来るのでしょうか?

これらは、臨床経験、医療記録、研究論文、講義動画など、実際の医師の独自の個人データを統合し、AI技術を使用して作成されたことが判明しました。

王立全博士の「デジタルクローン」と同様に、このデバイスは、王立全博士の 40 本を超える論文と 400 本近くのビデオからの専門知識を備えているだけでなく、王立全博士の診断的思考とコミュニケーション スタイルをシミュレートし、ユーザーに高度にパーソナライズされたアドバイス (妊娠中の健康管理やダウン症スクリーニング レポートの解釈など) を提供します。

本題に戻ると、各デジタルクローンには、それぞれの専門分野を紹介するホームページがあります。

王医師は妊娠合併症を専門としているため、私たちは最近インターネット上で話題になった症例について直接相談しました。

「王医師」は慎重に検討した後、このハイリスク妊婦が手術中に注意する必要のあるポイントを細かくリストアップしました。

さらに、彼の思考プロセスを深く掘り下げることで、トレンドのトピックを見たときに浮かんだ疑問にようやく答えが見つかりました。

羊膜が破れる前に胎児を出産させる必要があるのはなぜですか?(未熟児を保護するためだそうです。)

全体として、この機能は真に専門的な回答を提供するだけでなく、国とその国民にとって非常に有益です。つまり、誰もが差別なく一流の医療専門家のリソースを共有でき、24時間365日のサポートが提供されるということです。

テスト項目3: かかりつけ医の診察は大丈夫か?

もちろん、複雑な問題に対処するために専門家の助けを求めることに加え、より一般的で日常的な医療行為は「一般診療所と診察」です。

Good Companion AIは、730億のパラメータを持つWiseDiag-Z1汎用医療言語モデルを搭載しているためか、実用上非常に優れたパフォーマンスを発揮します。そのため、まるで会話をしているかのように、症状分析、服薬相談、個別化された健康指導など、様々なサポートを依頼できます。

たとえば、働く人間として、肉体的に疲れていると感じるとき、私たちはいつもこう自問したくなります。

気血不足が原因でしょうか? (笑、この質問はソーシャルメディアでよくトレンドになっています)

ランダムに一般開業医を見つけて、診断を行うためのヒントがあるかどうか尋ねてください。

その結果、彼は伝統的な中医学の観点から、顔色、舌、目、髪の毛など、一連の自己診断のヒントを直接教えてくれました。すぐに理解できるはずです!

さらに現代医学の観点から「症状」に基づいた診断もあります。

素晴らしいですね。すべての条件に当てはまる人は言いませんが、最初のアドバイスは、やはり夜更かししないことです。

うーん...実際のテスト中は徹夜していたので、皇后のようにかなり憤慨しています。

しかし、私たちが提案に従えないとしても、感情的な価値は最大化されます。AI は私たちをとても優しく前向きな方法でケアすることができます...

テスト項目 4: コンテキストと長期記憶能力はどうですか?

オンラインヘルスケア製品であるため、ユーザーが毎回同じことを繰り返さなくても済むように、ユーザーの過去の医療記録を記憶し、長期的な「サポート」を提供できなければなりません。

そこでいくつか検査もしました。例えば、随分前に肝機能について話した記憶がぼんやりとあったので、ランダムに検査してみました…

意外にも、最後にこのことについて話したのは6か月前だったと正確に思い出し、近いうちにフォローアップ検査に行くことを提案しました。

もう一度質問させてください。少し前に首が凝ってしまい、まだ良くならないので再度質問させていただきました。

思考プロセスから判断すると、ユーザーは以前から首が凝っていたことを明確に認識していました。

前日に首こりの既往歴があったことは分かっていますが…

状況を記憶し関連付けるこの能力は、本質的に長期的な健康状態の追跡とパーソナライズされたサービスを可能にするものです。

もちろん、優れた製品体験は常に技術的リーダーシップに基づいています。

私たちが Good Companion AI の開発チームと経験を共有したとき、彼らはその背後にある主要なテクノロジーも共有してくれました。

技術原理 = 730億パラメータの医療モデル + 推論

簡単に言えば、基盤モデル製品化という2 つのポイントに要約されます。

モデル面では、あらゆる分野を網羅した総合的な医療基盤モデルであるWiseDiag-Z1を綿密にトレーニングし、製品化面では、市場にある同様の医療AIを全面的に改良しました。

モデルのトレーニングを始めましょう。

まず第一に、垂直分野で真に有用な AI モデルをトレーニングするには、大量の高品質データが不可欠です。

そこでチームは、権威ある教科書(「内科」や「産婦人科」など)、最新の臨床ガイドライン(NCCNや中国医師会シリーズなど)、50万件の医学論文、実際の症例のデータベースなど、 3兆トークンを超える専門医療データをモデルに入力しました。

基礎を築いた後、次の重要なステップはこれらの材料をどのように処理するかです。

ここで、チームは重要なツールであるMed-Embeddingモデルを発表しました。これは、一般的なベクトルコーディングモデルとは異なり、医学用語の臨床的意味を捉え、その情報を高次元ベクトルに変換することで、AIが診断中に重要な詳細を混同しないようにします。

簡単に言えば、日常言語ではいくつかの表現は似ているように見えるかもしれませんが、医療の文脈では、わずかな違いがまったく異なる結果につながる可能性があります。

「38度の熱が3日間続く」と「微熱を繰り返す」のように、前者は急性感染の媒介により近く、後者は慢性です。

これらの重要かつ微妙な違いは、通常のベクトルコーディングモデルでは正確に区別することが難しい場合が多いです。しかし、医療コーディングモデルは、医療知識ベースと臨床コンテキストを組み合わせることで、用語を正確にエンコードします。

それだけではありません。トレーニングプロセス中に、チームは臨床医を招いて詳細な議論に参加してもらいました

教師あり微調整 (SFT) と直接選好最適化 (DPO) を通じて、人間の医師の診断思考ロジック (鑑別診断の優先順位付け、リスクのトレードオフなど) もモデルに導入されます。

最終的に、チームは、730億のパラメータと32Kのコンテキスト長をサポートする、GoodCompan AI向けの包括的な医療基盤モデルであるWiseDiag-Z1を開発しました。

独自の多層推論メカニズムを採用し、熟練した医師のように、詳細かつ綿密な分析と選択肢の検討を行うことができます。病因分析、鑑別診断、治療計画策定といった重要な分野において、最適な解決策が見つかるまで熟練した医師の多層的な思考をシミュレートすることができます。

推論機能を備えたこの強力なプロフェッショナル モデルに基づいて、チームは特定の製品の改良に多大な労力を費やしてきました。

現在市場に出回っている医療 AI を分析すると、次のタイプに分類できます。

  • オンライン診察と投薬: AI は事前に設定されたルールを使用して、いくつかの一般的な病気を診断し、治療します。
  • 医学知識の普及と軽い相談は症状のセルフチェックフォームに限られます。
  • 病院の登録や慢性疾患の管理において、AI は主に情報のマッチングに依存しています。

しかし、形式にかかわらず、それらには共通の欠点があります。1 ) まず、技術が十分に成熟しておらず、ほとんどがまだ非推論モデルを使用しているため、複雑な医学的推論を処理できません (鑑別診断能力が低い)。2 ) トップレベルの医療専門家の供給が限られているため、大規模なサービスを提供することが不可能です。3 ) これらはより汎用的であり、特に個人の身体的状態が大きく異なる場合は、パーソナライズされたサービスを実現できません。

これらの競合他社の欠点に対応して、Good Companion AI は徐々に独自の差別化された機能を開発してきました。

技術的な観点から見ると、730 億のパラメータを持つ WiseDiag-Z1 大規模モデルと医療コーディング モデルを組み合わせることで、マルチモーダル医療データの解析をサポートできます。

例えば、従来の医療AIはキーワードマッチングに依存しているため、川崎病の発疹は一般的なアレルギーと誤診されやすい。しかし、実際には全身性血管炎を主な病理学的変化とする急性発熱性疾患である。

サービス面では、三次病院のトップ医師のデジタルクローンの協力により、AIによる診断と治療がより専門的かつ個別化され、誰もが一流病院で治療を受けられるようになりました。

最も重要なのは、多層メモリストレージと動的知識ベース(12,000 種類の病気)のおかげで、サイクル間の健康追跡も簡単に行えることです。

実技試験セクションで実証されているように、古い医療記録を思い出すのに役立つだけでなく、動的な知識ベースとタイムリーに比較して、潜在的なリスクを迅速に特定することもできます。

実際、先週、Zhizhen Technology はいくつかの記者会見を開催し、3 つのプロフェッショナル モデルを一挙にリリースしました。

  • 一般的な医療言語モデルの標準バージョンである WiseDiag-Z1。
  • 深い推論の拡張バージョンである WiseDiag-Z1 Thinking は、複雑な複数ステップのシナリオに適しています。
  • 量販版の WiseDiag-Z1 Lite は、Z1 よりも高速で安価です。

新星医療AI

記事の冒頭でも述べたように、Zhizhen AIとHaoban AIはともに新たな分野に進出し、話題となっており、AIの宝庫である杭州では新星として注目されている。

実際には、技術と製品はどちらも、Zhizhen Technology の設立以来、高品質の医療をすべての人に提供するという揺るぎない追求と切り離せないものです。

医療資源の不均等な配分と質の高い専門医の不足は、中国だけでなく世界全体での悩みの種となっている。

それとは全く対照的に、誰もが、いつでも診察を受けられる、専門レベルのプライベートな医師を切望しています。

今、Good Companion AI がそれを実現しました。

「医師のアシスタント」としてではなく、一般ユーザーに直接アプローチします。このアプローチは、オッカムの剃刀の原理を忠実に守るだけでなく、一般の人々の医療リソースへの渇望を最大限に満たします。

さらに、ただゼロから何かを作るのではなく、その具体的な機能の一つ一つが人々の心に触れるものなのです。

人々は専門家の評判を認識しており、専門家に相談することを好みます。Good Companion AIは、専門家の能力をデジタルヒューマンに直接再現します。

人々は、AI アシスタントが自分をよりよく理解し、長期的な健康状態を動的に監視してくれることを期待しているので、Good Companion AI には長期記憶が組み込まれています。

人々は専門家に、実用的な助言を提供するだけでなく、親しみやすく、話しやすい存在であることを期待しています。優れたコンパニオンAIは、人々に感情的な価値を提供します…

アプリとして、そして24時間365日オンラインの「ポケット専門家」として、Haoban AIは人々の悩みを正確に解決し、大規模な医療モデルと一般ユーザーとの間のギャップを埋め、誰にとっても必須のアプリとなっています。

全体像を見ると、Good Companion AIは医療へのアクセス障壁を真に下げました。このツールは特に発展途上地域や遠隔地にとって不可欠であり、診断や治療の遅延を防ぐのに役立ちます。

一方、Good Companion AIは医師にとっても大きな解放をもたらします。前述の専門家アバターシステムを通じて、医師の貴重な臨床経験が再利用可能なデジタル資産に変換されます。これにより、医師は複雑で困難な症例にさらに集中し、知的資源を最大限に活用できるようになります。

道のりは長くても、歩き続ければ必ず到着します。多くの困難と不確実性に直面しながらも、Haoban AIはAI + ヘルスケア分野で大きな進歩を遂げ、新たな道を切り開いてきました。

設立からまだ2年も経っていない(2023年6月)にも関わらず、世界最強の医療AIモデルへと成長したことから、現時点で最も急速に成長し、最も価値のある医療AIの1つになる可能性が示唆されています。

ウェブサイトは準備完了、アプリは一般公開ダウンロード可能です。その機能については、ぜひご自身でお試しください!

Web バージョン (アプリ バージョンでは Wisediag AI のダウンロードが必要です): https://chat.wisediag.com