618ZXW

すべての人のためのインテリジェントイノベーション | 今すぐAIイノベーションの旅に出よう

Googleは、AIを活用した製品を責任を持って構築することに尽力しています。さあ、振り返ってみましょう…
2024 Google Developer Conference の AI 基調講演では、複数の AI ツールのアップデートについて検討し、AI の可能性を最大限に引き出す方法を説明し、イノベーションを加速するためのオープンソース コラボレーションを推進しました。

Googleは、生成型AIを誰もが利用しやすくし、世界中のすべての開発者がAIを通じて革新的な可能性を解き放ち、開発効率を向上できるよう支援することに尽力しています。この目標達成のため、Googleは多様なニーズに応えるため、デバイス内タスク向けのGemini Nano 、高負荷タスク向けのGemini 1.5 Flash 、そして幅広い複雑なタスクを処理できるGemini 1.5 Proという3種類のGeminiモデル*を提供しています。


ジェミニ 1.5 プロおよびジェミニ 1.5 フラッシュ

Gemini 1.5 Pro は正常にアップグレードされ、コンテキスト ウィンドウが 200 万トークンに拡張され、すべての開発者が利用できるようになりました。

Gemini 1.5 Proおよび1.5 Flashでは、コンテキストキャッシュが導入されました。開発者はプロンプトの変更されない部分をキャッシュし、後続の呼び出しで簡単に参照できるため、コストを大幅に削減できます。

Google AI Studio には豊富なモデルリソースが統合されており、海外に進出する企業の開発者はこれらの Gemini モデルをより簡単に無料で試用し、Gemini API を自社のアプリケーションに統合して、さまざまなシナリオでイノベーションを実現できます。

*グローバル展開する開発者に最適

Gemmaは、Geminiモデルと同じ研究と技術を用いて構築された、高度で軽量なオープンモデルファミリーです。その規模でありながら最先端のパフォーマンスを提供するGemmaは、開発者のラップトップやデスクトップで実行できるように責任を持って設計されており、フレームワーク、ツール、ハードウェア全体にわたる最適化をサポートしています。開発者や研究者がAIアプリケーションを責任を持って構築・展開できるよう支援します。


ジェマの利点

現在、Gemma ファミリーに新たなメンバーが加わり、次世代のオープン モデルである Gemma 2 により、パフォーマンスと効率性が新たなレベルに引き上げられます。

Gemma 2はパワフルなだけでなく、開発者の既存のワークフローとの統合を容易にする設計となっています。何よりもまず、オープンで使いやすいという点です。Gemma 2は商用利用可能なGemmaライセンスを採用しているため、開発者はイノベーションを共有し、商品化することが容易です。

  • 幅広いフレームワーク互換性を備えた Gemma 2 は、JAX、PyTorch、TensorFlow などの主要な AI フレームワークとシームレスに統合でき、NVIDIA GPU 向けに最適化されています。
  • 簡単なデプロイ: 開発者は、事前に構築されたスターター ノートブックを使用して、Vertex AI または GKE に Gemma 2 を簡単にデプロイおよび管理できるようになりました。
  • 柔軟な微調整により、ユーザーは Google Cloud や Ollam などのプラットフォームのツールチェーンを活用して、Gemma 2 モデルを微調整したり、モデル推論を実行したりできます。

PaliGemma は、画像キャプションの生成、短いビデオのキャプションの作成、視覚的な質問への回答、テキストの読み取り、オブジェクトの検出とセグメンテーションなど、さまざまな視覚言語タスクを実行できるようになりました。

CodeGemma は、Keras、Hugging Face、NVIDIA、MediaPipe、Gemma.cpp などのプラットフォームやフレームワークと完全に互換性があり、Vertex AI で使用できます。

RecurrentGemmaの新しい 9B バリアントは、Gemma シリーズの優れた品質を継承し、同じ API 設計を使用しています。

詳細については、ai.google.dev/gemma にアクセスして、Gemma 探索の旅を始めましょう。

開発者がより効果的にイノベーションを構築できるように、Google はエッジ機械学習テクノロジーと新しいツールをGoogle AI Edgeに統合し、開発者がワンストップ ソリューションでモバイル デバイス、ウェブ デバイス、組み込みデバイス、その他のエッジ デバイス向けのアプリケーションにデバイス上の AI を統合できるように支援します。


エッジアプリケーションシナリオ向けのエンドツーエンドのテクノロジースタック

  • Generative Torch API がリリースされ、開発者はわずか数行のコードで、さまざまなアーキテクチャを使用したモデルをデバイス上で実行できるように簡単に変換できるようになりました。
  • PyTorch のベータ版では、TensorFlow Lite コンバーターを介して 70 を超える一般的なモデル アーキテクチャをすぐに利用できる TFLite 形式に変換でき、さらに多くの操作がサポートされる予定です。
  • Model Explorerは誰でも利用できるオープンなツールで、開発者が機械学習モデルを理解、デバッグ、最適化するのに役立ちます。このフレームワークは、大規模なチャートを直感的な階層形式で視覚化できるだけでなく、小規模なモデルにも適しています。

Gemini APIの強力なデータ処理機能からGoogle AI Studioの統合開発環境、そしてAI技術のクロスプラットフォーム応用に至るまで、GoogleはAIをよりアクセスしやすく、責任ある形で利用できるようにするために、技術の限界を絶えず押し広げています。同時に、Googleはこのオープンなフレームワークの中で積極的に探求に取り組み、AI技術の開発がより幅広い人々に利益をもたらし、イノベーションを推進できるよう努めています。

*グローバル展開する開発者に最適

2024 年の Google Developer Conference 基調講演は継続的に更新されています。
QR コードをスキャンして公式ウェブサイトに直接アクセスし、エキサイティングなリプレイを視聴してください。