618ZXW

ストーリーやキャラクターを自由にカスタマイズできる、大規模モデル生成RPGゲーム!Googleが開発し、作者の一人は上海交通大学の卒業生です。

最初のユーザー入力に基づいて、ゲームシミュレーション環境を設定し、その環境内でキャラクターのアクションを生成できます。

Google とノースカロライナ大学チャペルヒル校による新たな研究によると、彼らが最初に試したゲームは「The Sims」にヒントを得た「Unbounded」というゲームだったようです。

ユーザーはキャラクターの生活をカスタマイズできます。例えば、この魔法使い「アーキバス」の空腹度、エネルギー、興味レベルは、環境に応じて自動的に更新されます。

キャラクターは様々な環境を自由に探索し、幅広いアクションやインタラクションを実行できます。ゲームはインタラクションの速度に基づいて毎秒更新されます。

大規模なモデルを使用して無限のゲームを生成します。

研究チームは、無限ゲームを生成するという概念を導入しました。

「無限ゲーム」とは、ゲームの継続を目的としたゲームのことです。無限ゲームを生成するということは、生成モデルを用いて従来のビデオゲームの限界を超えることを意味します。

Unboundedは、生成モデルに完全にカプセル化されたロールプレイングシミュレーションゲームです。仮想世界の中で、キャラクターに餌を与えたり、遊んだり、導いたりすることで、キャラクターとインタラクトすることができます。ただし、キャラクターの体力を維持する必要があります。

これに基づいて、ゲーム用に生成された主な属性には、キャラクターのパーソナライズ、ゲーム環境の生成、オープンなインタラクション、リアルタイム生成が含まれます。

言語面では、LLMベースのゲームエンジンを開発しました。このエンジンは、ゲームメカニクスの一貫性を維持し、一貫した物語を生成し、状況に応じたキャラクターの反応をリアルタイムで生成することができます。

これらの特殊モデルは、2 つの高度に連携した LLM エージェントによって自動的に生成されたデータに基づいて微調整されており、手動での注釈付けは必要ありません。

Gemma-2B を例にとると、ゲーム エンジンは、微調整後、状態の更新、環境の関連性、ストーリーの一貫性、コマンドのコンプライアンスの点でパフォーマンスが向上します。

ビジュアル生成に関しては、斬新な地域IPアダプタを導入しました。このアダプタは、複数の画像間でビジュアルの一貫性を維持しながら、一貫性のあるキャラクターと環境を生成することができます。

具体的には、ゲーム環境とキャラクターの外観を画像生成の条件として使用し、ゲーム環境とキャラクターの外観は、クロスアテンション層のアテンション出力によって動的にマスクされます。

これは、環境とキャラクター間の干渉を減らし、両方がシーンに確実に表示されるようにするためです。

従来の方法と比較して、地域 IP アダプタはブロック ドロップ テクノロジを使用しており、文字の一貫性と環境の一貫性が高い画像を継続的に生成できます。

上海交通大学の卒業生として

この研究は主に Google とノースカロライナ大学チャペルヒル校のチームによって行われたものです。

著者の一人、Jialu Liは現在、ノースカロライナ大学チャペルヒル校の博士課程5年生です。彼女は上海交通大学で学士号を取得し、その後コーネル大学で修士号を取得しました。

Google のメンターである Nataniel Ruiz 氏は、この研究を踏まえて、生成されたゲームについて楽観的な見方を示し、将来のゲームのほとんどは完全に生成されたゲームで構成されるだろうと述べました。

『ダンジョンズ & ドラゴンズ』のようなテーブルトップ ロール プレイング ゲームの無限性について考えてみましょう。そして、それが『エルダー スクロールズ』や『エルデン リング』のようなゲームにどのように適用できるか想像してみてください。

論文リンク: https://arxiv.org/abs/2410.18975 https://generative-infinite-game.github.io/ 参考リンク: [1]https://x.com/JialuLi96/statu... [2]https://x.com/natanielruizg/s...