0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

鲲鹏DevKit中汇编翻译特性的应用和实现

7riU_gh_3a181fa 来源:华为计算 作者:华为计算 2021-06-01 11:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

5月29日,由InfoQ 主办的全球顶级技术盛会—QCon全球软件开发大会2021北京站正式开启,来自国内外知名企业百余位技术专家,数千名资深工程师、技术管理者、架构师共同分享和交流了当下新技术在行业应用中的最新实践,全方位探讨行业的最新发展趋势。华为鲲鹏计算产品部部长颜叶在大会发表主题演讲,介绍鲲鹏全栈开放创新进展;鲲鹏技术专家团队也分别在技术专场中分享关于鲲鹏开发套件DevKit的各大使能工具,帮助开发者了解软件迁移和调优的关键技术,助力鲲鹏架构的行业应用落地。

鲲鹏全栈开放创新 共铸产业繁荣生态

华为鲲鹏计算产品部部长颜叶在QCon主题演讲中表示,处理器是计算产业的“心”,基础软件就是计算产业的“魂”,华为秉持“硬件开放、软件开源、使能伙伴、发展人才”的策略构建鲲鹏计算生态。经过一年半左右时间的建设,鲲鹏在端到端构筑了产业竞争力,加速区域产业落地,同时在面向政府、金融、电力、大企业等多个国计民生行业已经实现了规模部署,支撑多地数字经济发展。截至目前,全国已落地24家生态创新中心,12家OEM整机伙伴,2700多家合作伙伴,5700多个解决方案认证,40万鲲鹏开发者。

鲲鹏产业生态正在蓬勃发展,为了进一步激发行业创新、促进人才培养、加速产业融合,颜叶说,鲲鹏应用创新大赛2021已经启动报名,全产业的开发者均可参与本次比赛,共同基于鲲鹏技术共同打造鲲鹏全栈解决方案,实现技术与商业创新应用。

华为鲲鹏计算产品部部长颜叶

专家团队深度解析 鲲鹏一站式开发套件DevKit

在各行业基于鲲鹏计算产业生态加速数字化转型的道路上,由传统架构向鲲鹏 ARM 平台的软件迁移是一个非常关键的环节,直接决定了鲲鹏生态应用水平的高低。为了帮助开发人员更快熟悉鲲鹏平台,更好地完成基于传统架构的应用服务迁移工作,鲲鹏发布了开发使能套件DevKit。本次鲲鹏技术专家在 “鲲鹏平台软件迁移和调优实践”专场技术论坛中,为开发者深度解读鲲鹏一站式开发套件DevKit的工具套件和关键技术。

1鲲鹏DevKit中汇编翻译特性的应用和实现

编译器无法编译源码中其它平台的汇编代码,因此如何高效识别x86中的汇编代码并快速迁移到鲲鹏平台上,是鲲鹏生态快速建设和拓展亟需解决的一个技术课题。华为鲲鹏编译技术专家乐永年表示,为了应对自动识别和汇编代码翻译等一系列的技术难题,鲲鹏汇编总体设计方案为“W+二”。

“W”为四个步骤,分别是汇编注解、局部异构平台反编译、编译优化和代码生成,汇编注解解决了汇编样式多样的问题,局部异构平台反编译解决平台差异问题,代码质量由编译器的编译优化和代码生成完成。

“二”是两条快速翻译路径,一条是基于规则的快速指令翻译,用于简单嵌入汇编翻译,另一条是编译器里基于向量化语义函数的SIMD指令翻译。通过这个方案,鲲鹏DevKit中的代码迁移工具能快速实现x86汇编代码到鲲鹏平台的自动迁移,保障应用迁移高效率完成。

华为鲲鹏编译技术专家乐永年

2加速库在业务性能调优中的应用

鲲鹏加速库是基于鲲鹏微架构的加速技术构建的。华为鲲鹏数学库架构师薛永辉介绍说,鲲鹏基于行业常用的软件库,通过软硬协同、算法创新,打破性能瓶颈,充分释放鲲鹏处理器的澎湃算力。目前已经覆盖了压缩库、加解密库、系统库、媒体库、数学库和存储库等常用的基础软件库,为鲲鹏应用提供极致的性能保障。

目前DevKit加速库插件支持加速函数一键识别、智能联想,支撑应用快速集成鲲鹏高性能软件库,为应用迁移后的性能保驾护航。

华为鲲鹏数学库架构师薛永辉

3鲲鹏编译优化技术探索与软件优化实践

毕昇编译器2020年正式发布上线,基于华为编译实验室长期技术积累和项目实践,针对鲲鹏进行深度优化,力求解决目前开发者的痛点,充分释放鲲鹏算力优势:

高性能编译算法。编译深度优化,增强多核并行化,自动矢量化等,大幅提升指令和数据呑吐量。

加速指令集。结合NEON/SVE等内嵌指令技术,深度优化指令编译和运行时库,发挥鲲鹏架构最佳表现。

AI迭代调优。内置AI自学习模型,自动优化编译配置,迭代提升程序性能,完成最优编译。

华为毕昇编译器架构师魏伟表示,毕昇编译器结合鲲鹏架构特点,针对不同场景,不同应用特点,使用不同的编译优化手段,通过深度优化指令编译,引入或增强优化算法等,发挥鲲鹏极致算力。

华为毕昇编译器架构师魏伟

4动态二进制翻译技术原理及应用实践

ExaGear利用动态二进制翻译技术,结合动态二进制优化能力,能够稳定支持无源码的ARM32和x86存量业务运行在鲲鹏平台上。ExaGear主要具有以下优势:

代码0修改。直接加载被翻译执行的二进制应用程序文件,用户无需重新编译或修改二进制应用程序,无需对业务应用进行额外的二次开发,最小化业务迁移成本。

业务无损。经过翻译执行的业务逻辑与原生业务行为一致,保证翻译过程自身透明性,翻译工具无需解释业务逻辑,不直接处理用户数据。

性能领先。集成高性能编译技术,实现一种指令集到另一种指令集的跨指令体系结构实时转换,识别热点指令并在线深度优化热点指令翻译过程,达到指令翻译性能业界领先。

华为二进制翻译技术专家吕研冬博士介绍,开发者使用ExaGear,通过无源码应用迁移,大幅降低了存量业务部署门槛,让用户以最低的人力和时间成本平滑迁移业务,实现了应用业务快速迁移到鲲鹏。

华为二进制翻译技术专家吕研冬博士

QCon首日,华为语言虚拟机技术专家彭成寒也带来了毕昇JDK在大数据场景中的优化实践技术分享。毕昇 JDK 是华为基于 OpenJDK 开发的商用 JDK 版本,是一个高性能、可用于生产环境的 OpenJDK 发行版。毕昇 JDK 已经运行在华为内部 500 多个产品上,积累了大量使用场景和 Java 开发者反馈的问题和诉求,并在 ARM 架构上进行了性能优化,毕昇 JDK 在大数据等场景下可以获得更好的性能。

华为语言虚拟机技术专家彭成寒 以实践驱动技术,技术驱动创新、创新驱动发展,华为围绕着硬件使能、基础使能、应用使能和开发使能层持续投入,通过全栈开放开源,构建鲲鹏计算生态。未来,华为将会把更多优秀的技术推向市场,为企业和开发者提供完备、易用和高效的工具链,加速鲲鹏生态繁荣和产业成功。

原文标题:QCon北京站—鲲鹏全栈开放创新,构筑极致性能、使能极简开发

文章出处:【微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    36185

    浏览量

    262667
  • 软件
    +关注

    关注

    69

    文章

    5356

    浏览量

    91876
  • 鲲鹏
    +关注

    关注

    1

    文章

    150

    浏览量

    9554

原文标题:QCon北京站—鲲鹏全栈开放创新,构筑极致性能、使能极简开发

文章出处:【微信号:gh_3a181fa836b6,微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索SN74LVCE161284:19位IEEE STD 1284翻译收发器

    探索SN74LVCE161284:19位IEEE STD 1284翻译收发器 在电子设计领域,一款性能优异的收发器对于实现数据的高效传输和稳定通信至关重要。今天,我们就来深入了解一下德州仪器
    的头像 发表于 04-18 16:40 497次阅读

    算力海啸之下,鲲鹏如何为企业龙虾打造坚实底座?

    从个人OpenClaw到企业龙虾,鲲鹏为算力海啸筑起堤坝
    的头像 发表于 03-24 01:20 1w次阅读
    算力海啸之下,<b class='flag-5'>鲲鹏</b>如何为企业龙虾打造坚实底座?

    汇编给CH32写了个本机FORTH语言实现

    碎片问题,所以想着换个retro一点的东西,起初看了一下上个世纪的单片机/微机basic实现非常节省内存,但是实现起来有点复杂,后来看有人在单片机上用FORTH,所以自己拿汇编从头实现
    发表于 03-19 11:07

    汇编给CH32写了一个本机代码FORTH实现

    碎片问题,所以想着换个retro一点的东西,起初看了一下上个世纪的单片机/微机basic实现非常节省内存,但是实现起来有点复杂,后来看有人在单片机上用FORTH,所以自己拿汇编从头实现
    发表于 03-19 10:47

    谷歌推出TranslateGemma全新开放翻译模型系列

    我们已正式推出 TranslateGemma,这一全新的开放翻译模型系列基于 Gemma 3 构建,并提供 4B、12B 和 27B 三种参数规模。TranslateGemma 的问世标志着开放翻译领域迈出了重要一步,它可帮助人们跨越 55 种语言进行交流,无论身在何处或
    的头像 发表于 02-26 10:22 727次阅读

    破局「巴别图书馆」算力迷宫——鲲鹏的索引地图

    鲲鹏生态,如何打造算力指引?
    的头像 发表于 12-30 01:27 3015次阅读
    破局「巴别图书馆」算力迷宫——<b class='flag-5'>鲲鹏</b>的索引地图

    软通动力AI医疗智能体荣膺2025年鲲鹏应用创新大赛西北赛区银奖

    近日,2025年鲲鹏应用创新大赛西北赛区决赛圆满收官。软通动力“开源欧拉&鲲鹏AI医疗智能体方案”以突出的创新性、显著的技术领先性以及广阔的商业前景与社会价值,获得专家评审组一致认可,成功斩获企业赛道银奖。
    的头像 发表于 12-19 13:41 435次阅读
    软通动力AI医疗智能体荣膺2025年<b class='flag-5'>鲲鹏</b>应用创新大赛西北赛区银奖

    汇编语言的起源

    一、汇编语言是什么? 我们知道,CPU 只负责计算,本身不具备智能。你输入一条指令(instruction),它就运行一次,然后停下来,等待下一条指令。 这些指令都是二进制的,称为操作码
    发表于 11-20 07:19

    简单的内联汇编介绍

    这次主要学习了使用内联汇编完成一些较为简单的操作。我们思考接下来在程序中插入跳转指令来实现一些想要实现的操作以及对自行设计的硬件进行操作。
    发表于 10-30 08:04

    声智科技AI翻译耳机重塑智能听觉体验

    在日益紧密的全球化浪潮中,跨语言沟通的障碍正在被前沿的声学AI技术逐步瓦解。声智AI翻译耳机,凭借深厚的声学AI积累,率先实现了“跨语种音色与情感复刻技术”在实时翻译场景真实落地。不仅实现
    的头像 发表于 10-21 15:28 1139次阅读
    声智科技AI<b class='flag-5'>翻译</b>耳机重塑智能听觉体验

    奇瑞鲲鹏天擎发动机点火成功

    9月13日,鲲鹏天擎48%热效率发动机点火仪式在奇瑞龙山试验中心动力总成试验室成功举行;
    的头像 发表于 09-15 17:09 1503次阅读

    润和软件亮相鲲鹏昇腾开发者大会2025

    近日,以“心怀挚爱,共绽光芒”为主题的鲲鹏昇腾开发者大会2025在北京中关村国际创新中心成功举办。作为鲲鹏、昇腾生态的紧密合作伙伴,江苏润和软件股份有限公司(以下简称“润和软件”)受邀出席,携手鲲鹏
    的头像 发表于 06-03 16:20 1292次阅读

    华为鲲鹏昇腾开发者大会2025:鲲鹏昇腾深度开放,加速创新者创新

    [中国,北京,2025年5月23日]以“心怀挚爱,共绽光芒”为主题的鲲鹏昇腾开发者大会2025(KADC2025)在北京中关村国际创新中心成功举办。大会现场发布一系列新技术、新工具和新平台,使能伙伴
    的头像 发表于 05-26 16:35 1418次阅读
    华为<b class='flag-5'>鲲鹏</b>昇腾开发者大会2025:<b class='flag-5'>鲲鹏</b>昇腾深度开放,加速创新者创新

    润和软件发布鲲鹏+openGauss全栈智能体解决方案

    近日,江苏润和软件股份有限公司(以下简称“润和软件”)携手鲲鹏,于鲲鹏开发者创享日上海站共同发布“以鲲鹏算力为基座、深度协同openGauss开源数据库”的AgentRUNS全栈智能体解决方案,赋能企业打造场景驱动的智能业务引擎
    的头像 发表于 05-14 12:01 1189次阅读

    盾华电子获华为鲲鹏技术认证携手Kunpeng 920,共筑智慧城市新标杆

    盾华电子获华为鲲鹏技术认证携手Kunpeng 920,共筑智慧城市新标杆
    的头像 发表于 05-07 10:07 1196次阅读
    盾华电子获华为<b class='flag-5'>鲲鹏</b>技术认证携手Kunpeng 920,共筑智慧城市新标杆