|
Tritonは並列プログラミングのための言語とコンパイラです。カスタムDNN計算カーネルを効率的に記述し、最新のGPUハードウェア上で最大スループットで実行できるようにするためのPythonベースのプログラミング環境を提供するように設計されています。 Triton の中国語ドキュメントの詳細については、→ https://triton.hyper.ai/ をご覧ください。 Tritonは外部ライブラリからカスタム関数を呼び出すことができます。この例では、libdeviceライブラリを使用してasin関数をテンソルに適用します。利用可能なすべてのlibdevice関数のセマンティクスに関する詳細な情報については、以下のリンクを参照してください。
libdevice.pyでは、同じ計算を実行するもののデータ型が異なる関数をグループ化しようとしています。例えば、__nv_asinと__nv_asinfはどちらも入力の逆正弦の主値を計算しますが、__nv_asinはdouble型で動作し、__nv_asinfはfloat型で動作します。Tritonを使用すれば、tl.math.asinを呼び出すだけで済みます。Tritonは、入力と出力の型に基づいて、呼び出すべき適切なデバイス関数を自動的に選択します。 ASINカーネルデフォルトのlibdeviceライブラリパスを使用するtriton/language/math.py にエンコードされたデフォルトの libdevice ライブラリ パスを使用できます。 外: テンソル([0.4105, 0.5430, 0.0249, ..., 0.0424, 0.5351, 0.8149], libdeviceライブラリパスをカスタマイズするlibdevice ライブラリへのパスは、asin カーネルにパスを渡すことによってカスタマイズできます。 外: テンソル([0.4105, 0.5430, 0.0249, ..., 0.0424, 0.5351, 0.8149], Jupyterノートブックをダウンロード: 07-extern-functions.ipynb Pythonソースコードをダウンロード: 07-extern-functions.py 圧縮ファイルをダウンロード: 07-extern-functions.zip |
[Triton チュートリアル] Libdevice (tl_extra.libdevice) 関数
関連するおすすめ記事
-
9月13日に北京でお会いしましょう!
-
今日のライブ ストリーム | 清華大学と北京大学の教授と議論: 具現化された知能のデータの課題をどう克服するか?
-
GPT-4.5がリリースされました!OpenAI最大かつ最も高価なモデルで、高い感情知能を重視しています。ウルトラマンは出産のため、発表イベントには欠席しました。
-
世界初!清華大学、上海交通大学などが共同で糖尿病の診断と治療のための大規模視覚言語モデルを開発し、Natureサブジャーナルに掲載されました。
-
1990年代生まれの北京大学卒業生が「ぶら下がった穀物」の仮説を解明し、テレンス・タオが興奮気味にそれをシェア!ネットユーザー:フィールズ賞受賞確実!
-
今夜午後 7 時 | 清華大学のポスドク研究員 Li Yuzhe 氏が、Cell/Nature サブジャーナル論文を詳細に解説し、ゲノミクスにおける AI の応用を探ります。