-
友情链接:
Powered by 真钱上分老虎机app(中国)官方网站-登录入口 @2013-2022 RSS地图 HTML地图
Copyright Powered by365站群 © 2013-2024
快科技 11 月 12 日音信,摩尔线程文告,精良开源高性能线性代数模板库 MUTLASS,以便建树者好像更高效地针对摩尔线程 GPU MUSA Core、Tensor Core 等单位进行编程,加快基于国产 GPU 的算子建树以及算法篡改。
在此之前,摩尔线程仍是接踵开源 OpenCV-MUSA 谋划机视觉库、MooER 音频衔接大模子、vLLM-MUSA 废话语模子高速推理框架。
▼ MUTLASS 开源地址:
https://github.com/MooreThreads/mutlass
在数值谋划和深度学习界限,矩阵乘法(GEMM)过火变种,比如 FlashAttention、Convolution,是构建复杂表层欺诈的基石。
不够,为了追求更高的算子交融成果,或者更篡改的算法,建树者们常常需要超过措施化谋划接口的扫尾,如措施 BLAS 接口以及芯片厂商的谋划库接口,以收场高性能的定制化算子。
MUTLASS(MUSA Templates for Linear Algebra Subroutines)恰是为自傲这一需求而设想。
当作摩尔线程专为自研 MUSA 架构优化的高性能谋划库,MUTLASS 是基于开源模板库 CUTLASS 进行的 MUSA 适配和定制化建树、优化。
针对矩阵乘法及关连变种,MUTLASS 提供了一系列高性能的 C++ 模板组件,并领受了与 muDNN 库一样的分层看法及数据搬运战略,以确保性能的充分进展。
在本次开源的版块中,摩尔线程适配了 CuTe 后端库,为其增多了第三代 MUSA 架构的 MMA 谋划原语,复旧 TF32/FP16/BF16/INT8 等多种数据精度,并以此为基础,初步收场了矩阵乘法、默许实例库、性能测试器及关连器具包的复旧。
借助 MUTLASS,建树者们既不错机动复用不同层级的模板组件,也不错按需修改各式模板组件的收场细节,以较低的建树资本收场定制化的高性能算子,从而在摩尔线程全功能 GPU 上充分开释性能,并尝试更多的算法篡改。
摩尔线程将执续优化 MUTLASS 的性能,并不停引入新的功能。
真钱上分老虎机游戏app平台
Powered by 真钱上分老虎机app(中国)官方网站-登录入口 @2013-2022 RSS地图 HTML地图
Copyright Powered by365站群 © 2013-2024