6月11日-13日,以“开源赋能,普惠未来”为主题的2023开放原子全球开源峰会在北京举办。张先轶博士受邀在开源工业软件分论坛作《高性能数学库与异构计算软件栈进展》主题报告。
时间:2023/6/12
报告简介
在报告中,张先轶博士首先以CUDA和OpenCL为例,强调了开源未必能胜过闭源,能否构建一个良好的软硬件生态系统才是成功的关键。目前在计算领域,构建得比较成熟的函数库有Intel的MKL、ARM的APL和ACL、NVIDA的CUDA-X等。而国内的计算芯片虽然在科学计算领域已经有了一定的积累,但大多都是各成一家或者向某家靠拢,没有设立统一的接口和标准,大环境不够成熟。
为了解决这一问题,澎峰提出“参与开源,共建生态,立足国内,走向国际”的口号,以万万开源工作者对开源社区的贡献为基础,共同建立良好的开源软件生态,并以开源生态滋养闭源产品。
为此,澎峰做了以下工作:
1.PerfXAPI异构计算软件栈
PerfXAPI 围绕应用侧需求,旨在创建一个开放、基于开源标准的跨架构API编程模型,在面对大量跨各种架构的硬件和复杂工作负载场景时简化开发工作。
优势:1)支持多种异构设备;2)统一API调用接口;3)高性能。
2.PerfMPL高性能数学库
包含Openblas、Libm/PerfMath、BLAS、LAPACK、FTT等基本库。目前已有PerfMPL for ARM、PerfMPL for RISC-V(RVCL)的标准版本。支持为EDA、CFD等应用领域提供定向优化,支持为国产GPU/NPU厂商提供对标cuBLAS、cuFFT、cuMath等的定制服务。
其中,OpenFFT/PerfFFT是完全由澎峰自主研发,不基于FFTW,版权协议可控的FFT库,并支持X86、ARM、RISC-V等主流处理器,相对其他FFT库性能方面均有提升。
优势:1)性能对标国际;2)一致精度;3)安全、可靠、稳定。
3.PerfXPy 新一代科学计算软件
PerfXPy 是一个面向科学家和算法工程师的高性能Python计算平台,兼顾易用性与高性能,支持ARM、RISC-V 通用算力平台和异构加速平台。并有单机版(免费)、SaaS版本、集群版本等多个版本。