|
今では、大型モデルがパーソナルガイドとして機能し、シティウォークのルートを計画します。 香港大学、MIT、その他の機関が共同でITINERA を立ち上げました。これは、LLM と空間最適化を組み合わせて、パーソナライズされたオープンドメインの都市旅行計画を実現するものです。 たとえば、ユーザーは「『巨福昌』を通り、静安寺で終わる市内散策ルートを計画してください」と入力します。 ITINERA システムは、複数の場所を含むルートを即座に生成し、対応する説明テキストを提供しました。 ITINERAは、「カップルにおすすめのバー」、「アニメやマンガの名所」、「道中の人気写真スポット」など、個別のニーズも理解し、満たすことができます。 これだけ見るとすぐには分からないかもしれないので、ITINERA (左) とGPT-4 CoTによって生成されたルートを直接比較してみましょう。 同じプロンプト:「橋やフェリーを通る、芸術的なルートが欲しいです。」 ご覧のとおり、 ITINERAが生成したルートは、蘇州河沿いの橋や黄浦江の渡し船を経由し、芸術的な雰囲気の多雲書店で終わります。ルートも非常に合理的で、場所が2つの空間クラスターに集中しています。 右の画像では、GPTが選択したPOI(Points of Interest)が、ユーザーが要求した橋やフェリーと完全に一致していないだけでなく、迂回したり、POIが遠すぎるケースも見られます。この例に加え、GPTは幻覚的な動作を見せることもあり、存在しないPOIを生成することがあります。 要約すると、ITINERA には次の機能があります。
ITINERA は、 4 つの都市の旅行日程データセット (1,233 の人気都市ルートと 7,578 の POI) でトレーニングおよび評価されました。 結果は、従来の旅程計画や LLM を直接使用する方法よりも優れた結果を生成できることを示しています。 当該論文がKDD Urban Computing Workshop (UrbComp) 2024に採択されました。 ITINERAは5つの主要モジュールで構成されています次の疑問は、彼らはどうやってそれをやったのか? 下の図に示すように、ITINERA は大規模なモデルによって駆動される 5 つのモジュールで構成されています。 まず、ユーザー所有 POI データベース構築(UPC)モジュールが、ソーシャル プラットフォーム上の旅行コンテンツからユーザーの興味のあるポイントのデータベースを収集して構築します。 ユーザーのリクエストを満たす旅行を計画するために、リクエスト分解(RD)モジュールはユーザーの好みを解釈して整理し、構造化されたデータ形式に変換します。 設定を考慮した POI 検索(PPR)モジュールは、ユーザーの設定に基づいて最も関連性の高い興味のあるポイントを取得します。 旅程の空間的な一貫性を保証するために、著者らは、階層的巡回セールスマン問題を取り上げて、取得した関心地点を空間的にフィルタリングして配置するクラスター対応空間最適化(CSO)モジュールを採用しました。 最後に、旅程生成(IG)モジュールは、候補となる関心ポイント セットを複数の制約と組み合わせて、大規模なモデルを使用してユーザーの要求を満たす空間的に合理的な移動ルートと関連する説明を生成します。 原理は明らかになりましたが、ITINERA は実際にはどのように機能するのでしょうか? この問題を理解するために、著者らは、ユーザーのリクエスト、対応する都市の旅行ルート、詳細な興味のあるポイント (POI) データを含む、4 つの都市の旅行旅程のデータセットを収集しました。 パーソナライズされた POI 推奨の精度、ユーザー要求との一致度、生成されたルートの空間的合理性は、POI リコール (RR)、総距離と理論上の最短経路 (AM) の差、ルート上の交差点の数 (OL)、未知の POIの割合(FR) などの客観的な指標を使用して評価されます。 興味のあるポイントの魅力やユーザー要求の一致度などの側面を定量化できない問題を解決するために、著者らは LLM を採用して、POI の品質、ルートの品質、旅程とユーザー要求の一致度を自動的に評価しました。 ご覧のとおり、ITINERA システムは、GPT-3.5、GPT-4、GPT-4 CoT などの他の方法と比較して、すべてのメトリックで優れたパフォーマンスを発揮します。 ITINERA システムは、ユーザーと専門家による評価で、POI 品質、旅程品質、一致の点でも高いスコアを獲得しました。 全体として、ITINERAは自然言語リクエストから、パーソナライズされ空間的に一貫性のある街歩きルートを直接生成できます。大規模モデル時代のオープンドメインルート計画問題を探求するだけでなく、都市応用における複雑な空間問題を大規模モデルを用いて解決するためのアイデアも提供します。 方法論と実験結果の詳細については、元の論文をお読みください。 |
大型模型がパーソナルツアーガイドとなり、ワンクリックでシティウォークのプランを立てられます。香港大学とマサチューセッツ工科大学(MIT)の共同制作です。
関連するおすすめ記事
-
o1 のリリース後の最も有益な円卓討論会: Yang Zhilin、Jiang Daxin、Zhu Jun が大規模モデルの技術的な道筋を探りました。
-
「最強のオープンソースモデル」という主張は誤りであると証明され、CEOは謝罪に至った。NVIDIAの科学者たちは、既存のベンチマークはもはや信頼できないと述べた。
-
Apple の AI 搭載 iOS は初日から大ヒットを記録しました。チャットは瞬く間に高度な感情知能を備え、大規模なモデルは究極の音声代替となり、Siri は驚くべき変貌を遂げました。
-
マスク氏の「世界最強」Grok 3がアリーナで爆発し、初めて1400ポイントを突破。
-
従業員: AI に仕事をアウトソーシングするなんてナンセンスです!
-
メインフォーラムをちょっと覗いてみよう!オープンソース、オープンライフ - COSCon'24 では、新しいオープンソースライフスタイルが待っています。