618ZXW

AlibabaのTongyiプラットフォームに、新しいPPT作成ツールが登場しました!PC版には3つの「効率化」機能が統合されており、リスニング、リーディング、ライティングをすべて1か所で管理できます。

最近、仕事中に発狂しない人がいるでしょうか?(doge)

例えばPPTを例に挙げましょう。趙小慧氏が「PPTSD」という言葉を発したとき、それは労働者階級の心に深く響きました。

ええ、PPTってすごく高級なものですよね!今はビッグモデルの時代なのに、これを早く上手に作ってくれるAIはないんでしょうか?

働く人は、他の働く人のことを本当に気の毒に思うものです。私たちQuantumBitの編集者は、大規模なモデルを作成するための便利なツールを精力的に探しているのですが、最近、新たな驚異的なツールを発見したんです。

Tongyi は、リアルタイム録画、読み上げアシスタント、PPT 作成といった簡単な機能を備えた新しい「効率」セクションを Web バージョンに直接立ち上げました。

その中でも、 PPT 作成は新たに登場したスキルです。

簡単に言えば、主な機能は大型モデルによって提供されますが、「AI感」はあまりありません。

最も重要なのは、無料だということです

これをできるだけ早くテストする必要があります。

PPTSDを拒否する

具体的には、Tongyi PPT Creation は主に 2 つの PPT 作成方法を提供します。

  • 一文トピックPPT生成:アイデアがなく、一文トピックしかない場合は、そのトピックをプロンプトとして大規模モデルに直接送信できます。もちろん、既に完全なアウトラインがある場合は、最大10万語という非常に長いテキスト入力もサポートしています。
  • ファイルをアップロードして PPT を生成します。ドキュメント、オーディオ、ビデオ ファイルがすべてサポートされています。

1文でPPTを生成する

そこで、まずはゲームは下手だけどプレイするのが大好きな同僚のために、「Black Myth: Wukong」の攻略ガイド(PPT 版)を作成しましょう。

プロンプトは非常に短いです:「Black Myth: Wukong ゲームガイド」。

プロフェッショナルな見た目の PPT アウトラインを数秒で生成できます。

気に入らない点があれば、自分で修正できます。面倒な方は、次のステップ「テンプレートの選択」に進んでください。

Tongyi が生成した PPT は、背景情報を提供せずにどのような効果を達成できますか?

「PPT を生成」をクリックすると、1 分以内に答えが表示されます。

生成されたゲーム紹介にある「Black Myth」の開発者やゲームエンジンなどのキー情報は正しいので、これはTongyi大型モデルのネットワーク検索機能に基づいているはずです。

しかしながら、大型モデル自体は「ネタバレ」されていないようで、具体的なゲーム内容は非常に想像力豊かです。しかし、言葉遣い、デザイン、レイアウトは本当に賞賛に値します。

コピーだけから判断すると、AI っぽい感じはあまりしませんが、かなり本格的なものです。

人間とコンピュータのコラボレーションにより、変更が非常に便利になります。

テキスト ボックスをクリックすると、テキストを直接編集できます。また、1 回のクリックで大きなモデルを呼び出して、コピーを最適化することもできます。

AIによって画像を生成することもできます。

プロンプトを書けなくても心配しないでください。Tongyi PPT には「スペルブック」が組み込まれており、クリックするだけで使用したり、参照として使用したりできます。

毎日上司を騙すには十分すぎるように思えます(実際はそうではありません)。

ファイルをアップロードしてPPTを生成する

えーっと、本題に戻りましょう。Tongyi PPTにもっと詳細なドキュメントを入力したら、どうなるでしょうか?

たとえば、QuantumBit から社内トレーニング マテリアルのセットを送信し、Tongyi PPT を利用してトレーニング プレゼンテーションを作成することができます。

効果の点では、次のようになります。母は、私が会議前に PPT を終えられないのではないかと心配する必要がなくなりました。

PPT によって生成されたコンテンツはアップロードされたファイルとの関連性が高く、基本的にドキュメントのすべての重要なポイントが強調表示されるため、大きな問題なく直接使用できます。

つまり、Tongyi の新しい PPT 作成ツールには次の利点があります。

  • 充実したコンテンツ:生成されるテキストはより自然で共感しやすく(AI的な印象は排除され)、表面的な内容にはならず、ユーザーのニーズとアップロードされたファイルを組み合わせて、有益なPPTコンテンツを出力できます。
  • 豊富なテンプレート: 大学生からオフィスワーカーまで誰もが使用できる美しいデザインで、さまざまなシナリオや業界に適した PPT テンプレートを提供します。
  • インテリジェント レイアウト: プロセス全体を通じてインテリジェント レイアウト機能を提供し、PPT テンプレート レイアウトのリアルタイムのオンライン調整、PPT イメージのインテリジェントな生成、PPT テキストのインテリジェントな書き換えを可能にします。

QuantumBitはさらに調査を行い、Tongyi PPTの基盤モデルはTongyi Thousand Questions Model 2.5であることを発見しました。以前のバージョンと比較して、Qwen 2.5は理解力、論理的推論能力、命令コンプライアンス、コーディング能力がそれぞれ9%、16%、19%、10%向上し、その性能はGPT-4 Turboを上回りました。

長いドキュメントのサポートに関しては、Tongyi PPT は、PPT、PDF、Web ページなど、最大 1,000 万語の長さのドキュメントをサポートします。

マルチモーダル機能に関しては、最大 6 時間のオーディオとビデオのアップロードをサポートし、リンクを入力してオンライン オーディオとビデオをインポートすることもできます。

文勝図機能は、すべてのものを理解する能力をもたらします。

「一般原則と効率」の3つが1つになった

Tongyi Efficiency セクションには、PPT 作成のほかに次の 2 つの機能があることも言及しておく価値があります。

リアルタイムの録音読み取りアシスタント

ご存知ないかもしれませんが、実はこの 2 人は Tongyi ユーザーの古くからの友人なのです。

リアルタイム録音とオリジナル理解は、オーディオおよびビデオ コンテンツ用のこの AI アシスタントの中核です。

アプリケーション シナリオは、教室の録音と会議の録音に重点を置いており、実行できるタスクには、音声からテキストへの変換、話者の区別、インテリジェントな要約などがあります。

インターフェースは非常にシンプルです。言語(中国語、英語、日本語に対応)を選択し、中国語へのリアルタイム翻訳が必要かどうかを確認して、オンラインで録音を開始できます。

外国人講師による授業や国際会議?もう心配する必要はありません。

Tongyi はリアルタイムで録音します。音声録音はリアルタイムで、音声からテキストへの変換もリアルタイムで、英語/日本語の録音はリアルタイムで中国語に翻訳されます。

テキストの転記やタイプミスの修正もリアルタイムで行えます。

本当にリアルタイムです(冗談です)。

話者をうまく区別し、異なる話者に応じて核心部分を整理できるだけでなく、ユーザーが聞きながら中国語の文章を選択し、重要なポイントを自分で強調表示することもできます。

会議中に議事録を取るのは夢ではありません。

インターフェースの右側は、書き込み、描画、メモを取るためのものです。

録音が終了すると、このセクションは次の 3 つの領域に分割されます。

概要: AI が概要、章の概要、ToDo 項目など、オーディオ コンテンツを要約します。

マインド マップ: 音声録音に基づいてマインド マップを作成し、会議の主要なポイントと構造をすばやく把握できるようにします。

メモ: 名前の通り、ユーザーが録音プロセス中に取るメモです。

リアルタイム録音に関して、最後にもう1つ重要なポイントをお伝えしましょう。1日あたり20時間の録音と書き込みをサポートし、しかも無料です!まさに無料です!

読書アシスタントは、オリジナルの Tongyi Zhiwen と同じように機能します。

最初に言われるのは、実際の録音と同様に、これも無料だということです。

読み取りアシスタントは、PDF(スキャンしたコピーを含む)、Word 文書、画像、HTML 文書、Markdown 文書、EPUB 文書、Mobi 文書、Web ページ リンク、ポッドキャスト リンクなど、さまざまな形式の文書/論文/書籍を正確かつ迅速に読み取ることができます。

さらに、さまざまな形式ではファイルサイズが非常に大きくなります。

文書は最大 1,000 万語まで、音声およびビデオの録画は 6 時間から開始できます。

非常に素晴らしい。

実地テスト中、私たちは 2 冊の本を読み込ませました。193 ページの英語版『Metaphors We Live By』と 500 ページの中国語版『Elon Musk』です。

まず第一に、重要な機能は、読書アシスタントが全文翻訳をサポートしており、翻訳速度が非常に速く、ほとんど待つ必要がないことです。

外国語の文学作品を頻繁に読む人にとっては、これは本当に使いやすいです。

第二に、AIが生成した紹介文も中国語に翻訳されます。

このセクションは、完全な概要、要点、スピード ガイドで構成されています。研究論文の場合は、論文の簡単な読み物 (要点の要約) と論文の要約 (記事の利点、方法論の革新、将来の展望) も用意されており、ユーザーがコンテンツをすぐに理解するのに役立ちます。

まだ紹介文が長すぎると感じたら?

問題ありません。指示の横にあるマインドマップを見れば、要点がすぐにわかります。

さらに興味深いのは、読み取りアシスタントにより、ユーザーは原文の単語を強調表示して解釈できるため、重要なポイントを理解するのに役立つことです。

セクションの下部にあるダイアログ ボックスで、ドキュメントに関して理解できない点や不明な点があれば質問することができます。

この機能は、ほぼ「死んだ論文を生き返らせて議論や交換を行う」ことに相当します。

このようにして、リアルタイム記録、読み取り支援、PPT 作成が 3 つの機能を 1 つにまとめた効率的なシステムになります。

リアルタイム録画機能により、あらゆる重要な情報を素早くキャプチャして保存できます。

読書アシスタントはサポートとして機能し、知識をフィルタリングして抽出することで、ユーザーが短時間で核心を理解できるようにします。

一方、PPT 作成では、大規模モデルの AI 機能を活用して、散在する情報を論理的で視覚的にインパクトのあるプレゼンテーション資料に整理することができます。

これら 3 つの要素は互いに補完し合い、情報の整理と読解からコンテンツの作成まで、完全な作業と学習のプロセスを形成します。各ステップは相互に関連しており、仕事でも勉強でも、半分の労力で 2 倍の結果を達成できます。

大規模モデルのアプリケーションには、テクノロジーとユーザー エクスペリエンスの両方が必要です。

上記3つの機能はすべてPC上でスムーズにご利用いただけます。

ちなみに、PPT 作成以外にも、他の 2 つの機能はモバイル デバイスでも利用できます。

「これらのツールを通じて、ユーザーの時間を節約し、仕事と学習の効率を向上させ、無限の創造性を刺激するお手伝いができれば幸いです」と、Tongyi Efficiencyのプロダクトマネージャーである王暁明氏は述べています。王氏はさらに、Tongyiは今後も仕事と学習のシナリオに焦点を当て、AI技術を活用したユーザーの効率向上を支援していくと付け加えました。

一般化の効率は強力な一般化モデルに基づいています

Alibaba の Tongyi Qianwen 大規模モデルは、オープンソース ルートに重点を置いており、大規模なモデル ファミリを持ち、中国の大手プレーヤーであり、複数の世界的な評価リストでトップにランクされることがよくあります。

Tongyiは最近、世界最強のオープンソースモデルであるQwen2-72Bをリリースしました。このモデルは、コード、数学、推論、命令コンプライアンス、そして多言語理解の能力を向上させます。国内外の複数のベンチマークテストにおいて、Qwen2-72Bは中国の大規模モデルとしてはナンバーワンであり、世界最強のオープンソースモデルであることが示されています。

長期にわたる努力を通じて得られた技術的優位性は、Tongyi Efficiency に継続的なイノベーションの源泉を提供してきました。

3つの機能の統合後に開始されたTongyi Efficiencyは、仕事と学習のプロセスに正確に焦点を当て、情報の整理、読解、コンテンツの作成という3つの主要機能をシームレスに結び付け、効率的な仕事と学習の閉ループを形成します。

この閉ループは、ユーザーの創造的思考を刺激するだけでなく、作業効率も大幅に向上させます。

さらに重要なのは、Tongyi Efficiencyが初めてこれらすべての機能を PC に実装し、「需要があれば効率が役割を果たす」という理念を真に実現したことです。

このユーザー中心の設計哲学により、Tongyi Efficiency はユーザーの作業効率を向上させるだけでなく、ユーザー エクスペリエンスを大幅に強化することができます。

もちろん、別の観点から見ると、Tongyi の発売の「効率」は実際には市場の選択とトレンドを反映しています。

大規模モデルの応用は、インテリジェンス、パーソナライゼーション、ワンストップサービス、高効率、手作業の軽減に向けて発展しています。

これはまさに、アプリケーション レベルでの大規模モデルの本質的な表現です。

大規模モデルが人々の日常生活にますます統合されるにつれて、ユーザーは使い始めてからさらに優れたエクスペリエンスを求めるようになります。

技術が十分に進歩しておらず、ユーザーエクスペリエンスが十分でない場合は、ユーザーや市場から見捨てられてしまう可能性が高くなります。

したがって、大規模モデルの応用と推進は、より実用的でユーザーフレンドリーな方向へと進む必要があります。

実際、私たちはこの傾向が展開しているのを目撃しており、一般的な効率性の選択は、その最良の証拠の 1 つです。

これは、ユーザーのニーズを真に満たし、高品質のエクスペリエンスを提供する製品だけが、アプリケーションの実装とプロモーションにおける AI 2.0 モデルとアプリケーションの波の中で確固たる地位を築くことができるということを示しています。