|
本日、百川知能は大規模モデル向けのワンストップ商用化ソリューション、すなわち1+3製品マトリックス(チェーン全体にわたる高品質な汎用トレーニングデータ、Baichuan4-TurboとBaichuan4-Airの2つのモデル、そしてチェーン全体にわたるドメイン拡張ツールチェーン)を発表しました。このソリューションは「豊富なツール、高速性、優れた結果、低コスト」を特徴とし、企業が最小限のコストで最適なプライベート展開を実現できるようにします。また、企業が自社データと百川知能のチェーン全体にわたる高品質なトレーニングデータを組み合わせ、Baichuan4-TurboとBaichuan4-Airモデルの最適化と強化を支援し、業界をリードする96%のマルチシナリオ可用性率を実現します。 多様なシナリオにわたる企業の可用性率は 96% に達し、業界トップにランクされています。よく知られているように、大規模モデルは優れた一般化能力を備えていますが、各企業は独自の専門知識と適用シナリオを持っています。汎用モデルをそのまま適用しても理想的な結果は得られません。モデルを特定のドメインやシナリオの要件に適応させるには、カスタマイズされた最適化が必要です。最適化されたモデルが複数のシナリオにわたってどれほど有用であるかは、その価値を評価する重要な基準です。以前は、企業固有のデータと汎用データを混在させ、汎用モデルのターゲットを絞ったチューニングと強化を行うのが業界の主流でした。しかし、さまざまな制限により、企業は元のモデルに近い汎用トレーニングデータを入手するのに苦労することがよくあります。そのため、最適化後もモデルは汎用性を失い、複数のシナリオに対応できない特化モデルになってしまう可能性が高くなります。 この重要な課題を解決するために、Baichuan Intelligence は、独自の高品質の事前トレーニング データ、SFT 微調整データ、強化学習の一般的なトレーニング データ、および自社開発の自動ハイパーパラメータ検索および調整テクノロジと動的適応型データ マッチング テクノロジを、統合された高品質の一般的なトレーニング データ ソリューションにパッケージ化しました。 Baichuan4-TurboとBaichuan4-AirはどちらもBaichuan Intelligenceが自社開発しているため、これらの高品質な汎用トレーニングデータは両モデルのデータ分布と高い整合性を備えています。ハイパーパラメータ動的探索や適応マッチングなどのアルゴリズムと組み合わせ、企業のプライベートデータで微調整することで、両モデルの複数のシナリオにおける可用性が大幅に向上しました。金融、教育、ヘルスケアなどのシナリオにおける専門サブタスクの平均可用性は96%と高く、業界トップクラスです。 Baichuan4-Turbo の導入コストと Baichuan4-Air の推論コストはどちらも業界最低です。コストは、企業による大規模モデルの適用に影響を与えるもう一つの重要な要素です。企業は、様々なシナリオの様々な段階において、モデルの性能とコストに対する要件が異なります。業界ユーザーの多様なニーズにより適切に対応するために、Baichuan Intelligentは2つのモデルの位置付けを差別化しました。 具体的には、Baichuan4-Turboのコア機能(テキスト生成、知識ベースの質問応答、多言語処理など)は、Baichuan 4と比較して大幅に向上しています。導入には4090コアのコンピューティングパワーカード2枚のみで済むため、GPT-4oと同等の性能を持つモデルの中で最も低コストの導入モデルとなり、複雑なシナリオを検討している企業に最適です。一方、Baichuan4-Airは、大規模トラフィックを伴う既に検証済みのシナリオに適しています。その性能はBaichuan 4とほぼ同等ですが、推論コストは業界最安値で、Baichuan 4のわずか1%、100万トークンのコストはわずか0.98元です。 さらに、両モデルの応答速度が大幅に向上しました。Baichuan 4と比較して、Baichuan4-Turboは初動速度が51%、トークンフローが73%向上しました。Baichuan4-Airは初動速度が77%、トークンフローが93%向上しました。 注目すべきは、Baichuan 4-AirがBaichuan Intelligence初のMoE(Mixture of Experts)モデルとして、PRI(Pyramid, Residual, Interval)アーキテクチャの先駆者となったことです。標準的なMoEアーキテクチャと比較して、Baichuan4-AirはMLP(Multilayer Perceptron)とAttentionメカニズムの内部構造を維持し、ハイブリッドエキスパートMLP層の構成のみを最適化しています。エキスパートの数とアクティベーション戦略を合理的に設定することで、計算負荷のバランスを改善し、計算の複雑さを軽減し、推論速度を向上させます。同一の学習データを用いた場合、Baichuan4-AirはGPT4型およびMixtral型のMoEモデルよりも効率的であるだけでなく、大幅に優れた性能を発揮します。 Baichuan4-エアタイム効率比較テスト効果図 エンドツーエンドのドメイン拡張ツールチェーンはシンプルで使いやすく、モデル展開プロセス全体をカバーします。 企業は、専門的なアルゴリズム人材の不足や、モデル展開時のモデル最適化における高い技術的障壁といった課題にも直面しています。これらの課題に対処するため、Baichuan Intelligenceは、ユーザーフレンドリーなエンドツーエンドのドメイン拡張ツールチェーンを開発しました。このツールチェーンは、データ取得、データクリーニング、データ拡張、モデルトレーニング、モデル評価、モデル圧縮、そしてモデル展開のためのツールを統合しています。企業は、暗号化モデルの展開とトレーニングにおいて、自社のニーズに合わせて適切なツールを自由に選択できます。 さらに、Baichuan Intelligent は多くの適応作業を通じてさまざまなハードウェアの互換性の問題を解決し、現在では NVIDIA 4090/A/H シリーズ、Huawei Ascend、Cambricon、Qualcomm、MTK、Tianshu などのさまざまな主流チップに効率的に適応できるようになりました。 社内テストに参加した顧客の中には、Baichuan Intelligenceのワンストップソリューションを高く評価する声もありました。Xinzhi Softwareは、Baichuanのツールキットによって大規模モデル開発プロセスが大幅に最適化され、自社データの処理だけでなく、Baichuanの高品質な汎用トレーニングデータとの統合もサポートされたと述べています。これにより、モデルパフォーマンスが大幅に向上しました。Xinyadaは、Baichuan4-Turboの実行に必要なのは4090 GPU 2基のみであるため、ハードウェア投資を大幅に削減できると述べています。Baichuan4-Turbo導入後、顧客満足度は15%向上し、運用効率は30%近く向上しました。 現在、百川智能は、Nortel Digital、Perfect World Games、iQiyi、360 Group、Shengxue Education、Aixuetangなど、様々な業界のリーディングカンパニーを含む数千社の顧客にサービスを提供しています。また、Xinyada、Yonyou、iSoftStone、Xinzhi Software、Daguan Data、Huasheng Tianchengといった多くの業界エコシステムパートナー、HuaweiやSugonなどのハードウェアメーカー、China Mobile、China Telecom、China Unicomなどの通信事業者と提携し、百川ビッグモデルエコシステムを共同で構築しています。 公式ウェブサイトリンク:https://platform.baichuan-ai.... *この記事はQuantumBitからの許可を得て公開されており、表現されている見解は著者の見解のみです。 |
BaiChuan Intelligent は、企業が「より効率的、より高速、より優れ、よりコスト効率の高い」大規模モデルを実装できるようにするためのワンストップ ソリューションをリリースしました。
関連するおすすめ記事
-
DouShen Educationが「超人的」AI家庭教師を発表し、言語と文学教育の分野に革命を起こした。
-
1万個のスターを持つオープンソースデータ処理ツールをワンクリックで起動!176言語認識をサポート。18シーンにわたる約2,000本の動画を含む、初の高層ビル落下物検出データセットがオンラインになりました。
-
QwQ-32B のレビューとユーザー ガイドが登場しました。
-
PLMにおける大きな進歩!上海交通大学と上海AIラボの最新の成果がNeurIPS 24に選出されました。ProSSTはタンパク質構造情報を効果的に統合します。
-
周紅一氏のISCが中国初の無料セキュリティ ビッグデータ モデルをリリース。そのセキュリティ機能はGPT-4を上回る。
-
3秒でマルチボイスミキシングとクローン作成を実現!F5/E2 TTSチュートリアルを公開。心理療法士の言語スタイルを正確にシミュレートするPsyDTCorpus 5k心理対話データセットを公開。