基于OpenBLAS实现四精度三角矩阵

资料大小: 0.54 MB

所需积分: 2

下载次数:

用户评论: 0条评论,查看

上传日期: 2017-11-22

上 传 者: 程林他上传的所有资料

资料介绍

标签:OpenBLAS(1)

  在ARMv8 64位多核处理器上基于OpenBLAS实现了四精度三角矩阵求解(QTRSM)。基于两种数据格式分别实现了QTRSM,第一种实现利用GCC编译器对long double数据类型的支持来实现QTRSM,第二种实现采用doubledouble数据格式及其相应的四精度加减法、乘法和除法。以long double数据类型QTRSM为测试基准,就不同矩阵规模下测试结果精度和时间与doubledouble数据格式QTRSM进行比较。实验结果表明:两者得到近似相同精度的数值结果,但doubledouble数据格式QTRSM的性能是long double数据类型QTRSM的1.6倍。随着线程数的增加,两种QTRSM实现的加速比接近2.O,具有较好的可扩展性。
 

下载地址

基于OpenBLAS实现四精度三角矩阵下载

用户评论

查看全部 条评论

发表评论请先 , 还没有账号?免费注册

发表评论

用户评论
技术交流、我要发言! 发表评论可获取积分! 请遵守相关规定。
上传电子资料