|
Tritonは並列プログラミングのための言語とコンパイラです。カスタムDNN計算カーネルを効率的に記述し、最新のGPUハードウェア上で最大スループットで実行できるようにするためのPythonベースのプログラミング環境を提供するように設計されています。 Triton の中国語ドキュメントの詳細については、→ https://triton.hyper.ai/ をご覧ください。 Tritonは外部ライブラリからカスタム関数を呼び出すことができます。この例では、libdeviceライブラリを使用してasin関数をテンソルに適用します。利用可能なすべてのlibdevice関数のセマンティクスに関する詳細な情報については、以下のリンクを参照してください。
libdevice.pyでは、同じ計算を実行するもののデータ型が異なる関数をグループ化しようとしています。例えば、__nv_asinと__nv_asinfはどちらも入力の逆正弦の主値を計算しますが、__nv_asinはdouble型で動作し、__nv_asinfはfloat型で動作します。Tritonを使用すれば、tl.math.asinを呼び出すだけで済みます。Tritonは、入力と出力の型に基づいて、呼び出すべき適切なデバイス関数を自動的に選択します。 ASINカーネルデフォルトのlibdeviceライブラリパスを使用するtriton/language/math.py にエンコードされたデフォルトの libdevice ライブラリ パスを使用できます。 外: テンソル([0.4105, 0.5430, 0.0249, ..., 0.0424, 0.5351, 0.8149], libdeviceライブラリパスをカスタマイズするlibdevice ライブラリへのパスは、asin カーネルにパスを渡すことによってカスタマイズできます。 外: テンソル([0.4105, 0.5430, 0.0249, ..., 0.0424, 0.5351, 0.8149], Jupyterノートブックをダウンロード: 07-extern-functions.ipynb Pythonソースコードをダウンロード: 07-extern-functions.py 圧縮ファイルをダウンロード: 07-extern-functions.zip |
[Triton チュートリアル] Libdevice (tl_extra.libdevice) 関数
関連するおすすめ記事
-
スター自動車会社が破産の危機に瀕している。最高時価総額は2000億元で、創業者は詐欺の罪で投獄されている。
-
無料チケット | AI for Science 学術フォーラム開幕カウントダウン:上海交通大学、浙江大学、清華大学、OpenBayesなどの専門家が北京に集結
-
Andrew Ng 氏のエージェント技術における新たな成果が正式に発表されました!ゼロサンプルラベリングにより、画像内の物体検出が可能になります。
-
ByteDanceの最新動画生成モデルが話題沸騰中!ネットユーザーがマーケティングツールとして直接盗用し、Soraの魅力を低下させている。
-
タンパク質構造予測の先行指標であるCASPが5回目の開催を迎えました。南開大学の鄭偉氏は、「競争と難易度が高まっており、実用的な生物学的問題に焦点を当てる必要がある」とコメントしました。
-
Apple の AI 搭載 iOS は初日から大ヒットを記録しました。チャットは瞬く間に高度な感情知能を備え、大規模なモデルは究極の音声代替となり、Siri は驚くべき変貌を遂げました。