|
Tritonは並列プログラミングのための言語とコンパイラです。カスタムDNN計算カーネルを効率的に記述し、最新のGPUハードウェア上で最大スループットで実行できるようにするためのPythonベースのプログラミング環境を提供するように設計されています。 Triton の中国語ドキュメントの詳細については、→ https://triton.hyper.ai/ をご覧ください。 Tritonは外部ライブラリからカスタム関数を呼び出すことができます。この例では、libdeviceライブラリを使用してasin関数をテンソルに適用します。利用可能なすべてのlibdevice関数のセマンティクスに関する詳細な情報については、以下のリンクを参照してください。
libdevice.pyでは、同じ計算を実行するもののデータ型が異なる関数をグループ化しようとしています。例えば、__nv_asinと__nv_asinfはどちらも入力の逆正弦の主値を計算しますが、__nv_asinはdouble型で動作し、__nv_asinfはfloat型で動作します。Tritonを使用すれば、tl.math.asinを呼び出すだけで済みます。Tritonは、入力と出力の型に基づいて、呼び出すべき適切なデバイス関数を自動的に選択します。 ASINカーネルデフォルトのlibdeviceライブラリパスを使用するtriton/language/math.py にエンコードされたデフォルトの libdevice ライブラリ パスを使用できます。 外: テンソル([0.4105, 0.5430, 0.0249, ..., 0.0424, 0.5351, 0.8149], libdeviceライブラリパスをカスタマイズするlibdevice ライブラリへのパスは、asin カーネルにパスを渡すことによってカスタマイズできます。 外: テンソル([0.4105, 0.5430, 0.0249, ..., 0.0424, 0.5351, 0.8149], Jupyterノートブックをダウンロード: 07-extern-functions.ipynb Pythonソースコードをダウンロード: 07-extern-functions.py 圧縮ファイルをダウンロード: 07-extern-functions.zip |
[Triton チュートリアル] Libdevice (tl_extra.libdevice) 関数
関連するおすすめ記事
-
オンライン チュートリアル | たった 1 枚の画像で完全なペイント プロセスを生成: Lvmin Zhang の新作「Paints-Undo」がリリースされました。
-
大規模モデリングにおける新たなアプローチは、長所を組み合わせ、短所を補うものであり、既存のルーティング手法を大幅に上回る性能を発揮しました。(SUSTechとHKUST共同制作)
-
学術情報共有 | データ不足にもめげず!上海交通大学ポスドク研究員の周子怡氏が、タンパク質言語モデルのための少数ショット学習法FSFPについて解説
-
クロード氏のチームは、クローラーの名前を変更したり禁止規則を無視したりするなど、データスクレイピングに必要なあらゆる手段を講じたことで世間の激しい怒りを買っている。
-
Google 2024年度博士課程フェローシップ候補者リスト発表
-
医薬品開発会社 Cellaire は、NVIDIA と提携し、最大 100% の成功率で強化学習を使用して標的分子を最適化しています。