618ZXW

アリババの国際翻訳ビッグデータモデルは大規模な商用化を実現し、効果とコストの両面で業界をリードしています。

AI の使用が最も多いシナリオの 1 つである機械翻訳において、Alibaba International の AI チームは新たな進歩を遂げました。

10月16日、アリババ・インターナショナルの副社長兼AI責任者である張開復氏は、ブルームバーグとのインタビューで、同社の最新のMarco翻訳モデルは、中国語、英語、日本語、韓国語、スペイン語、フランス語を含む15の主要グローバル言語をサポートしていると述べた。このモデルはアリババ・インターナショナルのAIウェブサイト「Aidge」で公開されており、世界中のユーザーが利用できる。

広く利用されているオープンソースの評価データセット「Flores」に基づくMarcoの大規模翻訳モデルは、BLEU自動評価指標において、Google翻訳、DeepL、GPT-4といったベンチマーク翻訳製品を凌駕しています。これは、MarcoのAI翻訳能力が世界の競合他社を凌駕し、業界をリードしていることを意味します。

画像:公開されているランキングデータに基づく評価結果

Marcoの最大の強みは、大規模な言語モデルにあります。これにより、文脈に基づいた正確な翻訳が可能になります。文字通りの意味では、曖昧な翻訳や、場合によっては滑稽な翻訳になってしまう可能性があります。「你的宝贝正在路上」(赤ちゃんが生まれます)は、「Your baby is on the way」(赤ちゃんが生まれます)と翻訳されることはなくなります。例えば、インターネットスラングの「尊嘟喜欢」(Zunduが気に入っています)は、一部のAI翻訳製品では「Zunduは気に入っています」と翻訳される可能性がありますが、Marcoの大規模な言語モデルでは「私は本当に気に入っています」と完璧に翻訳されます。

これはどのように実現されるのでしょうか?報道によると、Marco翻訳ビッグモデルは、多言語混合コーパス識別や多次元データ品質評価といった多言語データフィルタリング技術を活用し、高品質で大規模な多言語データを取得します。これに多言語混合エキスパートやパラメータ拡張手法を組み合わせることで、主要言語(中国語や英語など)の性能低下を防ぎながら、他の言語の品質向上を実現します。同時に、モデルの量子化・加速化、マルチモデル削減といった最適化戦略により、ビッグモデルのサービスコストを大幅に削減し、従来の小規模モデルと比較してコスト優位性も実現しています。

現在、Marcoの大規模翻訳モデルは、大規模な商用展開を実現しています。アリババ・インターナショナルの長年にわたる越境ECの経験を活かすMarcoは、この分野において特に優れた実績を誇ります。個人ユーザー向けには、文脈に基づいた読みやすさに優れた高品質な翻訳を提供し、多様な翻訳ニーズに応えるため、様々な翻訳スタイルにも対応しています。

公開メディアの報道によると、アリババ・インターナショナルは昨年AIチームを設立し、過去1年間で40以上のシナリオでAI機能をテストし、50万社の中小企業が1億点の商品を最適化できるよう支援しました。小売業者のAIに対する需要も継続的に高まっており、過去6ヶ月のデータによると、小売業者からのAI要請件数は平均2ヶ月ごとに倍増し、AIの1日あたりの使用回数は1億回を超えています。