|
Apache TVMは、CPU、GPU、そして様々な機械学習アクセラレーションチップに適した、エンドツーエンドのディープラーニング構築フレームワークです。中国語版のTVMドキュメントは、→ https://tvm.hyper.ai/ をご覧ください。 著者:Tianqi Chen TVM は透過的なコード生成をサポートしていますが、一部の畳み込みカーネルに cuDNN を使用し、残りのステージを定義するなど、手書きのコードをパイプラインに統合する必要がある場合があります。 ネイティブTVMはブラックボックス関数呼び出しをサポートしています。具体的には、TVMはDLPackと互換性のあるすべてのテンソル関数をサポートしています。つまり、任意の関数をPOD型(ポインタ、整数、浮動小数点数)を使用して呼び出すか、DLTensorへのポインタを引数として渡すことで呼び出すことができます。 外部テンソル関数の使用次の例では、 ユーザーは、結果の計算方法を記述する関数を提供する必要があります。計算関数は、入力と出力のシンボルプレースホルダーのリストを受け取り、実行されたステートメントを返します。 この場合、登録済みのTVM関数を呼び出すだけで十分です。これはCBLASを呼び出すためです。TVMは外部配列関数の内部を制御せず、ブラックボックスとして扱います。スケジュールされたTVM関数をさらに組み合わせることで、結果にバイアス項を追加できます。 検証結果結果が期待どおりであるかどうかを確認します。 外部コントリビュートラッパーTVM は外部呼び出し用の外部コントリビュート ラッパーを提供します。次のコードは前の例と同等です。 Python関数をexternとしてフックするTVM 内の任意の PackedFunc を呼び出すことができるため、外部関数を使用して Python にコールバックできます。 以下の例では、TVMランタイムシステムにPython関数を登録し、それを用いて計算段階を実行することで、TVMの柔軟性を高めています。例えば、フロントエンドコールバックを挿入することで中間結果をチェックしたり、カスタムコードをTVMに混在させたりすることができます。 出力結果: 要約
Python ソースコードをダウンロード: extern_op.py Jupyter ノートブックをダウンロード: extern_op.ipynb |
[TVMチュートリアル] 外部テンソル関数
関連するおすすめ記事
-
OpenAI が緊急に新機能を追加: ChatGPT に Deep Search が追加され、30 分後に 10,000 語の継続的な思考を実証し、「人類最後のテスト」のチャートでトップに立った。
-
「OpenGoodオープンソース公共福祉事例集」への作品募集を開始しました。
-
Datawhale チームの第 12 期生が合格しました!
-
クロード4が近日発売か!DeepSeekに追い込まれ、ついに切り札まで出てきました。
-
新しいオープンソース ライフスタイルを取り入れて、活気のあるコミュニティを楽しみましょう。COSCon'24 のコミュニティ コラボレーションとオープンソース マーケットプレイスの募集が進行中です。コミュニティの皆様のご参加を心よりお待ちしております。
-
Whale Cloud Technology は、アルゴリズムの優れた能力から現実世界の価値までをカバーする Whale Intelligence BI 大規模モデルをリリースしました。