|
多くの期待の中、Keling の最新バージョン 1.5 がついに正式にリリースされました。 新世代モデルが追加されただけでなく、画質とダイナミックパフォーマンスも大幅に向上しました。会員の方は追加料金なしで1080Pにアップグレードすることもできます。 既存のモデルにもモーションブラシという新しい機能が追加され、生成されたエフェクトの制御性がさらに向上しました。 ビデオ世代のモデル業界の新星として、ケリングの発表に続いてネットユーザーたちが自分たちの作品を共有した。 このシーンでは、砂時計の砂がひとりでに流れ、遠くの男性が砂時計を見つめるにつれてぼんやりとした輪郭が徐々に明らかになり、プロンプトにある静寂の感覚が生まれます。 △著者:FocusTony 静かな海を上から見た景色もあり、水面に静かに浮かぶ漁船が映し出され、景色に合わせてカメラが自然に回転します。 △著者:FocusTony 動画を再生することに夢中になっていて、1日再生しないと気分が悪くなると冗談を言う人もいます。 さらに、ネットユーザーは非常に熱狂的だったため、すぐにサーバーが圧倒され、遅れて到着した人々はまったくログインできなかった。 この圧倒的な人気を受けて、すでに収容人数を拡大しているとの公式回答が発表されました。 ネットユーザーはケリンの謝罪に対して比較的寛容であり、タイムリーな公式声明によって彼らの懸念は和らげられた。 新しいモデルが現在入手可能で、追加料金なしで 1080P にアップグレードできます。このアップデートでは、Keling ラージ モデルのバージョン 1.5 が導入され、最大解像度が 720P から 1080P に向上しました。 会員は1.5モデルの高画質モードを直接体験でき、価格(必要インスピレーションポイント)は1.0の720Pバージョンと同じで、価格を上げずに品質が向上します。 Kuaishou の内部評価では、バージョン 1.5 はバージョン 1.0 と比較して全体的なパフォーマンスが 95% 向上しました。 まず、画質です。鮮明さが向上しただけでなく、構図もより美しくなっています。公式デモをご覧ください。 ぼやけた夜の街並みを背景に、中国人の少女がゆっくりとカメラを見つめている。目の前に設置された人工光源に照らされ、彼女の顔の特徴が際立っている。カメラはゆっくりと彼女の顔へと移動する。 まずはバージョン1.0の生成結果を見てみましょう。単体では、実際には許容できるレベルです。 ただし、1.5 と比較するとその違いは明らかです。 まず、照明があります。1.0 モデルで生成されたビデオでは、キャラクターの顔がかなり暗く表示されます。 バージョン 1.5 では、ライトがキャラクターの顔に集中しており、テーマが強調されるだけでなく、「主人公が正面にある人工光源で照らされている」というプロンプトの要件も満たされています。 さらに、バージョン 1.0 で生成されたビデオでは、カメラがズームインすると、それに応じて人物のサイズのみが変化しますが、背景は静止したままであり、現実の空間法則に準拠していません。 バージョン1.5では、背景もカメラに合わせて動くようになり、動画全体がより自然になります。 鮮明さが向上しただけでなく、映像のダイナミックな品質も向上し、一部のアクションはよりリアルになりました。 比較して感じてみましょう。以下は、それぞれバージョン1.0と1.5で生成された麺を食べるシーンです。 男が路上でインスタントラーメンを食べている。 バージョン 1.0 で生成されたビデオをよく見ると、麺が半分飲み込まれた時点で跡形もなく消えてしまいますが、バージョン 1.5 ではこの問題は発生しません。 △動画は0.1倍速で再生されます。 バージョン 1.5 では、テキストベースのビデオに加えて、画像ベースのビデオ内の追加のテキスト コマンドに応答する機能も強化されています。 カメラがズームアウトし、小さな男の子がテーブルまで歩いて行き、スプーンを手に取って食べ始めます。 さらに、ビデオのバージョン 1.0 はテキストにほとんど反応しないため、ここでのコントラストはさらに顕著になります。 比較すると、バージョン 1.5 では大幅な改善が見られます。 旧モデルにも機能アップデートが加えられています。1.5 モデルがリリースされた後も、オリジナルの 1.0 バージョンは引き続き提供されるだけでなく、新しいモーション ブラシ機能も追加されました。 このモーションブラシは、画像内の 6 つのオブジェクトの軌道を一度に制御でき、動きと静止を組み合わせたり、固定領域を指定したりすることもできます。 柯玲の作品では、3頭の馬が私たちが描いた3本の軌跡をたどり、必要な旋回動作もすべて反映されています。 さらに、背景とオブジェクト間の相互作用がうまく実行されており、上部の定義された領域も尊重されています。 もちろん、可動範囲が広いため、馬や人間の細かい描写にはまだ改善の余地がかなりあります。 ネットユーザーが作成した作品をいくつか見てみましょう。 私たちのテストと比較すると、ここでの可動範囲ははるかに小さいため、タップとストロークだけで、画像内のキャラクターは指定された軌道に沿って移動でき、対応する脚の動きが自動的に適応されます。 △著者:ハリム・アルラシヒ 一度に最大 4 本のビデオを生成できる機能など、いくつかの小さなアップデートもあり、「カードを引く」際の反復作業が軽減されます (冗談です)。 さらに、従来の5秒の画像から動画への変換が10秒まで延長可能となり、標準モード限定のテールフレーム制御も高性能モードに拡張されました。 Kelingからの最新情報は以上です。ご興味があればぜひご覧ください! ポータル: |
サーバーが過負荷状態です! Keling バージョン 1.5 が正式にリリースされました: 追加料金なしで 1080P にアップグレードし、一度に 4 つのビデオを生成します。
関連するおすすめ記事
-
分散型マルチモデル データベースである KWDB はオープン ソースです。
-
深センで走るロボットが外国人を驚かせている。人間と見分けがつかないほどだ。ネットユーザーからは「北京マラソンで会いましょう!」といったコメントが寄せられた。
-
Geling Vision のビジュアル モデル プラットフォームは OpenAI を上回り、マルチモーダル展開のスケーリング法則を開拓します。
-
フラクタル生成モデルの新たなパラダイムを切り開きました!計算効率が4000倍向上し、初めて高解像度のピクセル単位の生成を実現しました。
-
古いグラフィック カードに朗報!Meituan は、INT8 グラフィック カード向けの初のオープンソース、フルパワー、ロスレス DeepSeek R1 をリリースしました。
-
これはテスラ ロボタクシーを巡る最大の論争です…