|
Tritonは並列プログラミングのための言語とコンパイラです。カスタムDNN計算カーネルを効率的に記述し、最新のGPUハードウェア上で最大スループットで実行できるようにするためのPythonベースのプログラミング環境を提供するように設計されています。 Triton の中国語ドキュメントの詳細については、→ https://triton.hyper.ai/ をご覧ください。 Tritonは外部ライブラリからカスタム関数を呼び出すことができます。この例では、libdeviceライブラリを使用してasin関数をテンソルに適用します。利用可能なすべてのlibdevice関数のセマンティクスに関する詳細な情報については、以下のリンクを参照してください。
libdevice.pyでは、同じ計算を実行するもののデータ型が異なる関数をグループ化しようとしています。例えば、__nv_asinと__nv_asinfはどちらも入力の逆正弦の主値を計算しますが、__nv_asinはdouble型で動作し、__nv_asinfはfloat型で動作します。Tritonを使用すれば、tl.math.asinを呼び出すだけで済みます。Tritonは、入力と出力の型に基づいて、呼び出すべき適切なデバイス関数を自動的に選択します。 ASINカーネルデフォルトのlibdeviceライブラリパスを使用するtriton/language/math.py にエンコードされたデフォルトの libdevice ライブラリ パスを使用できます。 外: テンソル([0.4105, 0.5430, 0.0249, ..., 0.0424, 0.5351, 0.8149], libdeviceライブラリパスをカスタマイズするlibdevice ライブラリへのパスは、asin カーネルにパスを渡すことによってカスタマイズできます。 外: テンソル([0.4105, 0.5430, 0.0249, ..., 0.0424, 0.5351, 0.8149], Jupyterノートブックをダウンロード: 07-extern-functions.ipynb Pythonソースコードをダウンロード: 07-extern-functions.py 圧縮ファイルをダウンロード: 07-extern-functions.zip |
[Triton チュートリアル] Libdevice (tl_extra.libdevice) 関数
関連するおすすめ記事
-
ByteDanceと清華大学AIRが共同研究センターを設立し、大規模モデリングにおける産学研究協力を推進。
-
今週の土曜日、AIの首都、杭州でお会いしましょう!
-
大手AIアニメーションスタートアップがAIアルゴリズムのインターン/エンジニアを募集中!創設メンバーはBilibiliと上海交通大学出身です。
-
フォーラム紹介 | COSCon'24における科学のためのAIに焦点を当てたオープンソースAIフォーラム
-
Google は新しいコードの 25% を AI を使用して生成しており、Prompt プロジェクトに熟練したプログラマーの需要が高まっています。
-
大きなモデルは Volcano Ark にあります: データはあなただけに表示されます。あなただけが使用できます。あなただけが所有します。