0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

拒绝“爆雷”!GaussDB(for MySQL) 新上线了这个功能

jf_94205927 来源:jf_94205927 作者:jf_94205927 2023-06-30 09:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摘要:智能把控大数据量查询,防患系统奔溃于未然

什么是最大读取行

一直以来,大数据量查询是数据库 DBA 们调优的重点,DBA 们通常十八般武艺轮番上阵以期提升大数据查询的性能:例如分库分表、给表增加索引、设定合理的 WHERE 查询条件、限定单次查询的条数……

然而,DBA 再厉害,应用程序千千万,写代码的程序员万码奔腾,大数据量的查询像地雷,不定什么时候就爆了。比如隐藏在某段代码里的查询,因为一个新手程序员的经验不足,查询代码写得欠佳,没有 WHERE 子句或缺少索引引发了不必要的多行读取,甚至全表扫描,给服务器带来了过度的压力,导致业务执行缓慢,甚至最后服务器 OOM 崩溃。

为了避免这种“爆雷”,GaussDB(for MySQL)近期上线了最大读取行特性。优化器产生执行计划后,如果优化器预估的读取行数超过了所设置的最大读取行阈值,则自动中止查询,将雷的导火索切断。

这种机制的优点在于:执行计划阶段就对查询进行了干预,而不是语句开始执行后在执行过程中进行中断。既杜绝了劣质查询对服务器和业务运行造成的风险,又大大节省了时间和资源。

如何设置最大读取行

在 GaussDB(for MySQL)中,设置 rds_max_row_read,指定查询允许读取的最大行数。GaussDB(for MySQL)收到查询指令,执行查询之前,会对查询要读取的行数进行估计。当估值超过所设置的最大读取行时,将中止查询,即查询没有机会运行,提前规避不必要的资源消耗。

下面是一份测试数据,说明了开启最大读取行前后的差异。

假设表 t1 有 4M 大小的行,当开发人员或应用程序尝试运行以下查询时,运行需要 7 分钟。

mysql> SELECT * FROM t1;

WHERE 子句的缺失致使需要全表扫描,查询耗时长。对于更大的表,这类查询将需要更多的耗时,使服务器消耗更多资源,查询耗时甚至可能高达数小时。

最大读取行特性的使用,可以节省宝贵的时间和资源。比如假设将最大读取行数指定为 1000000:

mysql> set rds_max_row_read =1000000;

Query OK, 0 rows affected (0.00 sec)

修改后,重新运行不含 WHERE 子句的查询,收到了读取行超限的提示,查询被停止。

mysql> SELECT * FROM t1;

ERROR HY000: Expected number of read rows exceeds the maximum allowed (see @@rds_max_row_read)

通过最大读取行,相当于拥有了一个工具,DBA 或者软件工程师根据业务情况可以自如设置和调整限制规则,保证业务正常运行的同时,限制次优查询,避免性能异常。

适用范围

适用于 SELECT、CREATE SELECT 和 INSERT SELECT。

功能开启

默认情况下,该功能是禁用的,只有当 rds_max_row_read 设置了值时,该功能才会被激活。

为了功能的稳定,避免无心的错误设置对业务造成不必要的影响,rds_max_row_read 做了最低值限制,不允许用户设置比最低值更低的值。

实现原理

wKgaomSeNQ2AcdSfAAEnhwCko5k152.png

GaussDB(for MySQL)通过遍历每个查询块并聚合各查询块的贡献来整体评估查询的读取行数:也就是对各 join 对象的读取行数评估后累加。

如果在累加评估过程中的某一刻,估计值超过了所设置的限制,查询将被终止。

对于关联子查询,评估办法为:评估子查询的读取行数,然后乘以查询被执行的次数。

需要特别说明的是,对每个 JOIN 对象的估计是执行计划预估返回的行数,可能与真实执行返回的行数有偏差。这虽然是一个相对简单的评估模型,但是我们坚信其具有足够的鲁棒性。

对于复杂查询,GaussDB(for MySQL)还通过 optimizer trace 提供了更多信息以帮助您确定优化器做决策的原因及如何优化查询。

示例

示例 1

mysql> EXPLAIN format=tree SELECT * FROM table_1, table_2;

+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

| EXPLAIN |

+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

| -> Inner hash join (no condition) (cost=6.50 rows=54)

-> Table scan on table_1 (cost=0.19 rows=9)

-> Hash

-> Table scan on table_2 (cost=0.85 rows=6)

|

+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

1 row in set (0.00 sec)

mysql> SET rds_max_row_read =20;

Query OK, 0 rows affected (0.00 sec)

mysql> SELECT * FROM table_1, table_2;

ERROR 1888 (HY000): The expected number of read rows exceeds the allowed maximum (see @@rds_max_row_read)

查询读取的行太多,我们尝试在 optimizer trace 的帮助下寻找原因:

SET optimizer_trace="enabled=on";

SELECT * from table_1, table_2;

SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;

在 optimizer trace 中,可以找到:

{

"Max_row_read": {

"select#": 1,

"current_estimate_of_rows": 54,

"rows_contributed_by_this_query_block": 54

}

}

这表示此查询中的唯一查询块,行读取数为 54。

执行计划中的这个评估有多准确呢?

执行如下查询查看语句实际被执行的次数:

mysql> show status like "handler_read_rnd_next";

+----------------------------+-------+

| Variable_name | Value |

+----------------------------+-------+

| Handler_read_rnd_next | 17 |

+----------------------------+-------+

1 rows in set (0.00 sec)

handler_read_rnd_next 显示实际上的读取是 17 行,而不是 54 行。

这个 17 是怎么来的呢?

这是一个哈希连接:

-遍历整张表时,左表有 9 行数据+1 行额外行。

-右表有 6 行+1 行额外行。

优化器中会预估返回读取行,例如,54。在这个示例中,它并没有很好地猜测到返回的行数,它高估了行读取的数量。在大多数情况下,读取行数的估计不够精确,但可以肯定的是,它是足够稳健的,能达到相应的目的。

示例 2

创建例表 t1:

mysql> CREATE TABLE t1(a INT);

在表中填充 1536 行数据后。将 rds_max_row_read 设置为 500,进行以下测试查询:

mysql> SELECT * FROM t1 WHERE a>6;

ERROR HY000: Expected number of read rows exceeds the maximum allowed (see @@rds_max_row_read)

在 optimizer trac 的帮助下,可以看到优化器估计的读取行数是 512 行,因此查询被终止。如果在 a 字段上添加索引(这是一件明智的事情),同一查询的估计读取行数是 1,查询检测顺利通过。

这个简单的示例说明:最大读取行能帮助您编写更加优质的查询语句。

结论

最大读取行特性针对读取过多行的查询,识别和过滤出效率低下的查询。用户可以为读取行数设置阈值,超过该阈值则终止查询。为了识别此类查询,GaussDB(for MySQL)在优化器中进行了读取总行数的粗略估计。当查询终止时,可以检查 optimizer trace,从中收集线索,以帮助重写更高效的查询。

简而言之,最大读取行为用户提供了一个工具,使他们可以更充分地利用手上的资源。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为云
    +关注

    关注

    3

    文章

    2804

    浏览量

    19089
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    iPhone 17!今年下半年看什么新技术、新趋势?

    iPhone 17!今年下半年看什么新技术、新趋势?
    的头像 发表于 09-23 10:48 258次阅读
    iPhone 17<b class='flag-5'>爆</b><b class='flag-5'>了</b>!今年下半年看什么新技术、新趋势?

    科技云报到:坏了!数字人真要改百业

    科技云报到:坏了!数字人真要改百业
    的头像 发表于 08-14 14:41 460次阅读

    MySQL 8.0性能优化实战指南

    作为一名运维工程师,MySQL数据库优化是我们日常工作中最具挑战性的任务之一。MySQL 8.0作为当前主流版本,在性能、安全性和功能上都有显著提升,但如何充分发挥其潜力,仍需要我们
    的头像 发表于 07-24 11:48 544次阅读

    远程访问内网MySQL数据库?这个方案更简单

    各位开发者朋友们,是否还在为无法随时随地访问内网MySQL数据库而烦恼?今天分享一个超实用的方法,通过容器部署 MySQL 结合 ZeroNews 内网穿透,让你在任何地方都能安全访问和管理数据库
    的头像 发表于 07-04 18:06 653次阅读
    远程访问内网<b class='flag-5'>MySQL</b>数据库?<b class='flag-5'>这个</b>方案更简单

    MySQL数据库采集网关是什么?有什么功能

    MySQL数据库采集网关是一种用于连接、采集、处理并传输数据到MySQL数据库的中间设备或软件系统,通常部署在数据源与MySQL数据库之间,作为数据交互的桥梁。它在工业物联网、智能楼宇、能源管理等
    的头像 发表于 05-26 15:20 462次阅读

    便携式电源EMC整改:户外储能设备EMC“”频发

    深圳南柯电子|便携式电源EMC整改:户外储能设备EMC“”频发
    的头像 发表于 05-12 14:21 709次阅读
    便携式电源EMC整改:户外储能设备EMC“<b class='flag-5'>爆</b><b class='flag-5'>雷</b>”频发

    除了增删改查你对MySQL还了解多少

    我们都知道MySQL服务器的默认端口为3306,之后就在这个端口号上等待客户端进程进行连接(MySQL服务器会默认监听3306端口)。
    的头像 发表于 04-14 17:20 513次阅读

    华为云GaussDB助力统计现代化改革

    ,依托华为云GaussDB对全国范围内的1亿多普查对象进行普查数据采集与处理,为国家宏观经济决策提供重要基础数据。
    的头像 发表于 02-12 10:59 683次阅读

    从Delphi、C++ Builder和Lazarus连接到MySQL数据库

    平台。 基于 MyDAC 的应用程序可以直接连接到 MySQL 服务器或通过 MySQL 客户端库工作。MySQL 数据访问组件旨在帮助程序员更快、更轻松地开发 MySQL 数据库应用
    的头像 发表于 01-20 13:47 1318次阅读
    从Delphi、C++ Builder和Lazarus连接到<b class='flag-5'>MySQL</b>数据库

    使用插件将Excel连接到MySQL/MariaDB

    使用插件将 Excel 连接到 MySQL/MariaDB 适用于 MySQL 的 Devart Excel 插件允许您将 Microsoft Excel 连接到 MySQL 或 MariaDB
    的头像 发表于 01-20 12:38 1129次阅读
    使用插件将Excel连接到<b class='flag-5'>MySQL</b>/MariaDB

    适用于MySQL和MariaDB的Python连接器:可靠的MySQL数据连接器和数据库

    适用于 MySQL 和 MariaDB 的 Python 连接器 Python Connector for MySQL 是一种可靠的连接解决方案,用于从 Python 应用程序访问 MySQL
    的头像 发表于 01-17 12:18 844次阅读
    适用于<b class='flag-5'>MySQL</b>和MariaDB的Python连接器:可靠的<b class='flag-5'>MySQL</b>数据连接器和数据库

    适用于MySQL和MariaDB的.NET连接器

    功能。例如 SSL 和 SSH 连接、嵌入式服务器、压缩协议、HTTP 隧道等。 与各种 MySQL 和 MariaDB 版本以及NET平台的广泛兼容 ORM 支持:EF Core、Dapper、NHibernate、LinqConnect 等。 完全符合 ADO.N
    的头像 发表于 01-16 14:17 793次阅读
    适用于<b class='flag-5'>MySQL</b>和MariaDB的.NET连接器

    MySQL数据库的安装

    MySQL数据库的安装 【一】各种数据库的端口 MySQL :3306 Redis :6379 MongoDB :27017 Django :8000 flask :5000 【二】MySQL 介绍
    的头像 发表于 01-14 11:25 860次阅读
    <b class='flag-5'>MySQL</b>数据库的安装

    华为云 Flexus X 实例评测使用体验——MySQL 安装全过程 +MySQL 读写速度测试

     前言 我这里我使用的默认公共镜像 Huawei Cloud EulerOS,因为这里有个标识说是可以对数据库添加加速功能,例如 Redis 和 MySQL 数据库都可以加速,我这里先测
    的头像 发表于 12-31 10:38 807次阅读
    华为云 Flexus X 实例评测使用体验——<b class='flag-5'>MySQL</b> 安装全过程 +<b class='flag-5'>MySQL</b> 读写速度测试

    云服务器 Flexus X 实例 MySQL 应用加速测试

      小结论   概要 在探索华为云强大的云服务生态时,我深入体验 EulerOS 镜像对 MySQL 应用的显著加速效果。不仅简化了部署流程,更在性能上实现质的飞跃。恰逢华为云 828 B2B
    的头像 发表于 12-24 12:19 798次阅读
    云服务器 Flexus X 实例 <b class='flag-5'>MySQL</b> 应用加速测试