0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Go 1.21的PGO正式GA,性能提升,更快更猛!

OSC开源社区 来源:OSC开源社区 2023-06-28 16:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Go 1.21 首个 RC 已发布。

虽然这是 Go 1.21 的第一个 RC,但它的版本号却是go1.21rc2。因为开发团队在为 RC1 打上 tag 后就发现了一个 bug,所以他们马上基于该版本进行了修复并发布更新。

2cf80ca8-14d6-11ee-962d-dac502259ad0.png

Go 1.21 主要变化包括:提升性能、改进工具链和添加新的标准库,以及语言方面的变更。

其中值得关注的一大更新是——在 1.20 中处于预览阶段的启用配置文件引导优化 (PGO) 功能现已正式 GA。

2d344fce-14d6-11ee-962d-dac502259ad0.png

Profile-guided optimization (PGO) 是计算机编程中的一种编译器优化技术,翻译过来是使用配置文件引导的优化。

PGO 也被称为:

Profile-directedfeedback (PDF)

Feedback-directed optimization (FDO)

它的原理是编译器使用程序的运行时 profiling 信息,生成更高质量的代码,从而提高程序的性能。

PGO 作为一项通用的编译器优化技术,不局限于某一门语言。比如Rust 编译器也在探索使用 PGO,微软则采用LTO+PGO 来优化 Linux 内核。

在 Go 语言中,最初关于 PGO 的提案是建议向 Go GC 工具链增加对配置文件引导优化 (PGO) 的支持,以便工具链能根据运行时信息执行特定于应用程序和工作负载的优化。

对于刚刚发布的 Go 1.21,根据 Go 团队的介绍,如果主软件包目录中存在名为default.pgo的文件,go命令将使用它来启用 PGO 构建。

他们还测试了 PGO 对多种 Go 程序的影响,发现性能提高了 2-7%。

此外,Go 编译器本身已经在 1.21 中启用 PGO 进行了重建,因此它构建 Go 程序的速度也提高了 2-4%,不过这具体取决于主机架构。

Go 1.21 其他变化:

语言变更

添加新的内置函数:min, max 和 clear

对泛型函数的类型推断进行了多项改进,包括扩展和解释清楚规范中类型推断的描述

在未来版本中,开发团队计划解决 Go 编程中最常见的问题之一:循环变量捕获 (loop variable capture)。Go 1.21 附带了此功能的预览版,目前可以使用环境变量在代码中启用该功能。

添加新的标准库

log/slog 包:用于结构化日志记录

slices 包:增用于对任何元素类型的切片进行常见操作,这个包比 sort 包更快、更符合人体工程学

maps 包:用于对任何类型 key-value 进行常见操作

cmp 包:用于比较有序值 (ordered values)

优化性能

除了启用 PGO 时的性能改进之外:

Go 编译器本身已经在 1.21 中启用 PGO 进行了重建,因此它构建 Go 程序的速度提高了 2-4%,具体取决于主机架构

由于垃圾收集器的调整,某些应用程序的尾部延迟可能会减少高达 40%

现在使用runtime/trace收集跟踪在 amd64 和 arm64 上产生的 CPU 开销要小得多

支持 WASI

Go 1.21 已实验性支持WebAssembly System Interface (WASI), Preview 1 (GOOS=wasip1,GOARCH=wasm)。

为了方便编写更通用的 WebAssembly (WASM) 代码,编译器还支持从 WASM 主机导入函数的新指令:go:wasmimport。

提到 WebAssembly,刚好本周六 (7.1)举办的「源创会」有一个和它相关的演讲分享。

演讲主题:Moonbit 编程语言平台简介

主题内容:Moonbit 是由张宏波老师带领的基础软件中心团队开发的一个专为云计算、边缘计算设计的编程语言平台,这个项目包括了面向 WebAssembly 生态设计的一款应用型编程语言及其相关完整的配套工具链。

本次演讲主要介绍这个项目动机背景、宏观方向上的设计考量,以及目前的进展,并且会有现场 demo 进行一些编程语言特性的演示。

嘉宾介绍:张钰,粤港澳大湾区数字经济研究院开发工程师,Moonbit 平台核心开发人员,编程语言理论爱好者

是的,我们正式重启了和大家阔别已久的「源创会」——2023 年首场于本周六(7.1)在深圳举办,诚邀各位 oscer 们前来赴约。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编译器
    +关注

    关注

    1

    文章

    1672

    浏览量

    51907
  • go语言
    +关注

    关注

    1

    文章

    159

    浏览量

    9848

原文标题:Go 1.21的PGO正式GA,性能提升,更快更猛!

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    CAN信号提升能力(SIC)可以移除CAN共模电感吗

    关于“CAN信号提升能力(SIC)”中提到:TJA146x系列积极提升了CAN信号,确保在大型网络中以更快的比特率实现稳定通信。大大减少了信号振铃(一种带无端口短截线的大型复杂网络的产物),消除
    发表于 04-17 10:17

    PIC24FJ64GA004 系列 16 位闪存微控制器:高性能与多功能的完美结合

    PIC24FJ64GA004 系列 16 位闪存微控制器:高性能与多功能的完美结合 在电子设计领域,选择合适的微控制器对于项目的成功至关重要。PIC24FJ64GA004 系列 16 位闪存微控制器
    的头像 发表于 04-08 18:10 1030次阅读

    PIC24FJ128GA010 系列 16 位闪存微控制器:高性能与多功能的完美结合

    PIC24FJ128GA010 系列 16 位闪存微控制器:高性能与多功能的完美结合 在电子设计领域,选择一款合适的微控制器至关重要。今天,我们来深入了解 Microchip 推出
    的头像 发表于 04-08 18:05 1005次阅读

    LTM9001-GA:16位IF/基带接收器子系统的深度解析

    LTM9001-GA:16位IF/基带接收器子系统的深度解析 在电子工程领域,高性能的接收器子系统对于处理宽动态范围信号至关重要。LTM9001-GA作为一款集成式的16位IF/基带接收器子系统
    的头像 发表于 04-01 11:55 202次阅读

    Go 语言高并发服务设计与性能调优实战:从万级到百万级并发的演进之路

    () } func (wp *WorkerPool) Close() { close(wp.jobs) } 二、高性能网络服务设计 2.1 HTTP 服务优化 go 体验AI代码助手 代码解读 复制代码
    发表于 02-18 19:19

    英飞凌BGS18GA14 SP8T分集天线开关:特性与应用解析

    的产品,下面我们就来详细了解一下它的特性和应用。 文件下载: BGS18GA14E6327XTSA1.pdf 一、关键特性 1. 高性能端口 BGS18GA14拥有8个高线性、可互换的RX端口,能够实现低插入损耗和低谐波生成,同
    的头像 发表于 01-31 16:05 762次阅读

    低成本TLI4971/TLE4971电流传感器评估套件——MS2Go与S2Go

    低成本TLI4971/TLE4971电流传感器评估套件——MS2Go与S2Go 在电子工程师的日常工作中,电流传感器的评估和应用是一个重要的环节。今天我们要介绍的是英飞凌(Infineon
    的头像 发表于 12-19 16:50 1135次阅读

    GA-H81M-DS2 Rev3.0 VGA电路图资料

    GA-H81M-DS2 Rev3.0 VGA电路图
    发表于 12-19 11:39 33次下载

    KIT_XMC14_2GO开发板:功能特性与硬件解析

    KIT_XMC14_2GO开发板:功能特性与硬件解析 在电子开发领域,一款性能出色且功能丰富的开发板对于工程师来说至关重要。今天,我们就来详细探讨一下KIT_XMC14_2GO开发板,它配备了英飞凌
    的头像 发表于 12-19 10:20 592次阅读

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:开启3D磁传感器评估之旅

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:开启3D磁传感器评估之旅 在电子工程师的日常工作中,评估和开发磁传感器是一项常见且重要的任务。英飞凌(Infineon
    的头像 发表于 12-18 17:15 1300次阅读

    RT-Thread软件包,RyanMqtt 2.0 发布,全面重构:更轻、更快安全、更可靠 | 技术集结

    RyanMqtt2.0RT-Thread社区精品软件包RyanMqtt发布2.0新版本!更轻、更快安全、更可靠,为你的物联网连接注入新动力。
    的头像 发表于 12-09 18:27 5970次阅读
    RT-Thread软件包,RyanMqtt 2.0 发布,全面重构:更轻、<b class='flag-5'>更快</b>、<b class='flag-5'>更</b>安全、更可靠 | 技术集结

    Altera发布 Quartus® Prime 专业版和 FPGA AI 套件 25.3 版:编译更快,智能更强

    更快速的编译 。 相较于 25.1 版,25.3 版可进一步提供 行业领先的编译时间 、 显著提升的设计效率 和 更少的时序收敛迭代 ,并 加速产品上市 。 编译速度提升多达 6%,自 Agilex 7
    的头像 发表于 11-13 09:24 7.6w次阅读
    Altera发布 Quartus® Prime 专业版和 FPGA AI 套件 25.3 版:编译<b class='flag-5'>更快</b>,智能更强

    树莓派5超频指南:安全高效地提升性能

    为什么要对树莓派5进行超频?对树莓派进行超频,可通过提高CPU和GPU的时钟频率来释放额外的性能。在需要额外处理能力以提高响应速度、减少延迟或处理繁重工作负载的场景中,超频尤其有益。性能提升
    的头像 发表于 08-14 17:45 2876次阅读
    树莓派5超频指南:安全高效地<b class='flag-5'>提升</b><b class='flag-5'>性能</b>!

    能效提升3倍!异构计算架构让AI跑得更快省电

    电子发烧友网报道(文/李弯弯)异构计算架构通过集成多种不同类型的处理单元(如CPU、GPU、NPU、FPGA、DSP等),针对不同计算任务的特点进行分工协作,从而在性能、能效和灵活性之间实现最优平衡
    的头像 发表于 05-25 01:55 4271次阅读

    快手上线鸿蒙应用高性能解决方案:数据反序列化性能提升90%

    近日,快手在Gitee平台上线了鸿蒙应用性能优化解决方案“QuickTransformer”,该方案针对鸿蒙应用开发中广泛使用的三方库“class-transformer”进行了深度优化,有效提升
    发表于 05-15 10:01