618ZXW

わずか 20 秒で、AI が 1 つの文章から 2 つの UI デザイン案を生成します。

ユーザーは文章を入力するだけで、約20秒で2種類のUIデザイン案を生成できます。9月20日、雲奇カンファレンスにおいて、Motiffの研究開発責任者であるファン・カイ氏が講演を行い、AI生成UI機能の最新の進捗状況と開発プロセスについて説明しました。ファン氏は、AI機能の実装においては、TPF(技術と製品の適合性)を早期に発見すること、データの蓄積に留意すること、そしてバックエンドの開発システムを改善することが重要な要素であると強調しました。

Motiff の R&D 責任者 Fan Kai がプレゼンテーションを行っています。

ジェネレーティブAIは、2024年のYunqiカンファレンスで最も話題になったトピックの一つでした。MotiffのAI生成UI機能のリリースは、デザインツールが効率化ツールから生産性向上ツールへと移行することを示しています。「Motiffがデザイン分野における副操縦士としてだけでなく、自動操縦士として、日々のデザインタスクを直接完了させ、さらには完全なデザイン案を生成することさえできるようになることを願っています」とファン・カイ氏は述べています。

Motiffは今年6月にグローバル展開を開始し、UIデザイン分野におけるAI機能のパイオニアとなりました。世界をリードするAI機能の開発には、数多くの技術的課題が伴います。AIを真に実用的な生産性ツールにするには、論理的かつ芸術的なUIデザインをどのように実現するか?大規模モデルの能力の限界はどこにあるか?そして、その強みを活かし、弱点をどう軽減するか?講演の中で、ファン・カイ氏はこれらの機能の背景にあるエンジニアリング上の課題と経験を詳細に共有しました。

Motiff はユーザーが必要とするあらゆる種類のインターフェースを生成でき、生成されたデザイン ドラフトは Motiff のエディターで継続的に調整および最適化できます。

アプリケーション シナリオをターゲットにすることで、テクノロジと製品の互換性の実現が加速されます。

AIGC分野におけるUI生成は、一般的なテキストや画像の生成タスクと比較して非常に特殊です。これは、UIデザインにおいて、厳密な製品ロジック、ピクセルレベルの精度、そして美的に魅力的な視覚効果を保証する必要があるためです。そのため、非常に高い技術力が求められます。

AI生成UIは、AIを用いてページコンテンツ全体をゼロから作成できますが、様々な技術的アプローチが存在するものの、その成果は概して満足のいくものではありません。ファン・カイ氏は、拡散モデルに基づくテキスト画像化技術はデザイン画像を生成できるものの、ピクセルレベルのレイアウト制御とコンテンツ生成能力が不足していることを例に挙げています。HTMLウェブページコードを生成し、それをデザイン案に変換するといった他の手法も、詳細な処理能力が不十分です。

AIアプリケーションにおいては、TPF(技術と製品の適合性)をできるだけ早く見つけることが極めて重要です。「従来のソフトウェア開発と比較して、AIアプリケーションは基盤となる技術の不確実性が高いです。戦略的にはユーザーニーズが原動力となりますが、戦術的には製品設計は技術的な実現可能性に大きく依存します」とファン・カイ氏はカンファレンスで述べました。重要なのは、実際に使用される可能性が最も高いシナリオを迅速に特定し、ユーザーからのフィードバックをできるだけ早く得ることです。

デザイン案を作成するには、全体の構造、ページコンテンツ、UIの詳細という3つの主要な側面を考慮する必要があります。デザイン案には、ナビゲーションバー、検索ボックス、コンテンツリストなどのモジュールに加え、適切なテキスト、画像、アイコンを含め、視覚的に魅力的な効果を生み出す必要があります。汎用的なモックアップは、全体の構造とページコンテンツの作成には適していますが、UIの詳細をコントロールするには不十分な場合が多くあります。

したがって、大規模モデルに適したタスクを見つけることが、問題解決の鍵となります。「大規模モデルは、その強みであるページ全体の構造とコンテンツの生成に集中できます。詳細については、定義済みのコンポーネントライブラリを使用して美観を確保しています」とファン・カイ氏は述べています。コンポーネントライブラリとは、多数のコンポーネントとデザイン仕様をまとめたものであり、このライブラリに基づく生成ソリューションは、カスタムコンポーネントをより容易にサポートします。これにより、ほとんどのUI設計シナリオをカバーできるだけでなく、ユーザーのパーソナライズと柔軟性のニーズにも応えることができます。

これは未来志向の技術的ソリューションでもあります。「ソフトウェア開発コストが下がるにつれて、将来のアプリケーションシナリオはよりパーソナライズされ、より柔軟なインタラクションデザインが求められるようになります。一方で、情報過多なインタラクティブデザインページは実際に減少するでしょう」とファン・カイ氏は予測しました。

データの堀を構築し、デザインオートパイロットの実装を主導する

コンポーネントベースのソリューションを採用したとしても、既存の汎用テンプレートでは高品質なUIデザインを生成するのが依然として困難です。これは、汎用テンプレートがUIデザインに精通しておらず、コンポーネントライブラリの理解が難しいことが原因です。多様な効果を実現するために、コンポーネントライブラリには多数の異なる種類のコンポーネントが含まれています。例えば、リストには数百もの類似したスタイルが存在する場合があり、汎用テンプレートではそれらの微妙な違いを区別することが困難です。

「核心的な課題は、大規模モデルがUIデザインを完全に理解できるようにすることです。そのためには、専門分野に特化した大規模モデルが必要です」とファン・カイ氏は述べています。モティフは最近、自社開発による中国初のマルチモーダルUI大規模モデルを正式にリリースしました。UI分野の高品質データを大量に学習させたこのモデルは、GPT-4oなどの汎用大規模モデルを複数のUIタスクで大幅に上回ります。コンテキストに基づいてインターフェース要素を柔軟に理解できるため、「デザインエキスパート」のレベルに達し、人間のUIインターフェースの理解と表現に最も近いものとなっています。

Motiffは自社開発の大規模モデルのサポートにより、自社開発の大規模モデルの生成能力とコンポーネントライブラリの表現力を効果的に組み合わせ、業界における複数回のブラインド評価で最高の生成効果を達成し、これまでの業界をリードするAI生成UIツールGalileo AI、デザインツールUizard、テキスト画像化ツールIdeogramを凌駕しました。

MotiffのAI生成UI機能における成功は、長年蓄積してきた専門データの恩恵も受けています。「将来、データは最も重要な競争優位性となるでしょう」とファン・カイ氏は述べています。「大規模モデルの能力が向上し、コストが下がり続けるにつれて、専門データはさらに希少なリソースとなり、AIアプリケーションの品質を確固たるものにしてくれるでしょう。」

MotiffはAI機能開発におけるエンジニアリング実装において、貴重な経験を積み重ねてきました。Motiffは、最も複雑なタスクにおいて、プロンプトエンジニアリングよりもフローエンジニアリングの方が効果的であることに気づきました。単一のモデル呼び出しによるブラックボックス操作と比較して、フローエンジニアリングはタスクを複数のステップに分割することで、機能全体の相乗効果を実現し、チームコラボレーションとエンジニアリングにとってより容易です。

AIアプリケーション開発における不確実性への対応を強化するため、Motiffは高効率な実験プラットフォームを構築しました。このプラットフォームは、プロセスとパラメータの容易なカスタマイズをサポートするだけでなく、詳細な中間実験結果を記録するため、チームが迅速に実験と反復作業を行うのに役立ちます。

現在、MotiffのAI生成UIは、指示の遵守とデザインの美しさにおいて業界最先端を走っており、海外のソーシャルメディアで大きな話題を呼んでいます。ファン・カイ氏はカンファレンスで、Motiffは今後も技術ソリューションの改良を続け、年内に新たなAI機能をリリースする予定であると発表しました。