0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SQL大宝剑-已燃尽所有SQL的理解

京东云 来源:京东物流 向往 作者:京东物流 向往 2024-12-26 10:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:京东物流 向往

一、背景

从事数据开发将近四年,过程中有大量任务交接或阅读同事代码的场景。在这些场景中发现有些SQL读起来赏心悦目,可以一目了然地了解业务逻辑,一些复杂的业务需求实现方法也可以做到简洁优雅,同时在性能上也有良好表现。而有些SQL读起来非常艰难,时常要跨越几百行寻找WHERE条件或者关联字段,甚至充斥着大量相同的子查询命名,除了作者可能少有人能快速看懂。

为此,基于个人经验、理解与实践,我总结了一些方法和技巧,能让SQL尽量变得优雅,即兼顾代码可读性和执行性能两方面的提升。

二、方法与技巧

1.子查询与谓词下推

很多同事在写关联逻辑时,习惯于直接将原表关联,随后在最下方用一大段WHERE语句进行条件过滤,如下示例:

// -------------------- Bad Codes ------------------------

SELECT
    f1.pin,
    c1.site_id,
    c2.site_name
FROM
    fdm.fdm1 AS f1
LEFT JOIN cdm.cdm1 AS c1
ON
    f1.erp = lower(c1.account_number)
LEFT JOIN cdm.cdm2 AS c2
ON
    c1.site_id = c2.site_code
WHERE
    f1.start_date <= '""" + start_date + """'
    AND f1.end_date > '""" + start_date + """'
    AND f1.status = 1
    AND c1.dt = '""" + start_date + """'
    AND c2.yn = 1
GROUP BY
    f1.pin,
    c1.site_id,
    c2.site_name

这段SQL主要有两个问题:

1.cdm1和cdm2的条件写在LEFT JOIN之后,因为cdm1和cdm2是NULL补充表(NULL 补充表: 右表被称为 NULL 补充表,意味着它的存在是为了补充左表中可能缺失的值。即使在右表中没有与左表匹配的行,左表中的行仍然会被返回,右表的相关列会填充为 NULL),那么19和20行无法进行谓词下推,这会导致关联时fdm1和cdm1,cdm2先进行全表关联,再按照WHERE条件过滤分区。如果cdm1是每天全量的表,先关联全表所扫描的数据量可想而知是相当大的。

2.全表关联时没有对关联键进行NULL值处理,如果相关表的对应字段存在大量NULL值,会引起数据倾斜。

第一个问题涉及SQL的谓词下推,即写条件时,应该在不影响结果的情况下,尽量将过滤条件下推到join之前进行(“下推”指将条件推到靠近数据源的位置而不是SQL语句的方位)。谓词下推后,过滤条件在map端执行,减少了map端的输出,降低了数据在集群上传输的量,节约了集群的资源,也可以提升任务的性能。

对于常用的INNER JOIN和LEFT OUTER JOIN,谓词下推规则如下:

INNER JOIN LEFT OUTER JOIN
左表 右表 左表 右表
ON条件 下推 下推 不下推 下推
WHERE条件 下推 下推 下推 不下推

如果使用上述示例的写法,主要关注的是LEFT OUTER JOIN时WHERE语句里的条件是否会引起谓词不下推。如果不想记这些看起来很复杂的规则怎么办?可以如下所示直接使用子查询:

// -------------------- Good Codes 

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SQL
    SQL
    +关注

    关注

    1

    文章

    807

    浏览量

    46914
  • null
    +关注

    关注

    0

    文章

    19

    浏览量

    4337
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    郭燕涛SQL Server 全能管理员在线课程分享

    在企业的数字化浪潮中,有一种极其畸形的现象:企业愿意花费数百万采购最顶级的硬件服务器,愿意支付高薪聘请业务开发团队去构建花哨的前端应用,却往往将掌管所有核心数据的数据库,交由一个缺乏系统训练
    发表于 04-19 16:28

    MySQL 删库后怎么恢复?binlog2sql 之外,NineData 还能做什么

    很多团队遇到 MySQL 误删、误更新时,第一反应都是搜 binlog2sql。它确实能解决一部分问题,但企业生产环境中真正缺的,往往不是单点回滚脚本,而是从变更提交、预检、审批、执行到追踪和回滚
    的头像 发表于 04-15 11:49 42次阅读
    MySQL 删库后怎么恢复?binlog2<b class='flag-5'>sql</b> 之外,NineData 还能做什么

    NineData SQL AI 智能补全上线:写 SQL,不必每次都从头敲

    NineData推出SQLAI智能补全功能,通过AI技术实现上下文感知的SQL语句智能提示。该功能不仅能补全关键字,还能根据当前输入内容预测后续查询意图,显著提升多表关联、复杂条件等场景下的编写效率
    的头像 发表于 04-01 20:19 259次阅读
    NineData <b class='flag-5'>SQL</b> AI 智能补全上线:写 <b class='flag-5'>SQL</b>,不必每次都从头敲

    SQL分析选型:DMS/DAS与NineData该如何选择

    阿里云 DMS 的慢SQL 趋势、DAS 的 SQL 审计能力成熟,可满足阿里云用户基础需求。NineData 侧重跨云统一工作台、研发与 DBA 协同,打通慢日志分析、性能诊断、规范审核、索引建议全链路,更适配企业级慢查询持续治理。
    的头像 发表于 03-25 17:20 1524次阅读
    慢<b class='flag-5'>SQL</b>分析选型:DMS/DAS与NineData该如何选择

    NineData 社区版的慢SQL分析,比查看日志+看EXPLAIN适合中小团队

    本文探讨 NineData 社区版在 MySQL 慢 SQL 场景对中小团队的适用性。与 “查看日志 + 看 EXPLAIN” 传统方式不同,它将慢 SQL 按模板聚合,能从大盘、模板、诊断等多维
    的头像 发表于 03-17 14:07 108次阅读
    NineData 社区版的慢<b class='flag-5'>SQL</b>分析,比查看日志+看EXPLAIN适合中小团队

    MySQL 慢 SQL 排查这件事,NineData 社区VS DBeaver/ Navicat 技术分析

    DBeaver Community 和 Navicat Premium Lite 都是很有价值的客户端工具,在单条 SQL 的查询和验证上,依然是 DBA 最顺手的入口。 但 NineData
    的头像 发表于 03-17 11:53 116次阅读
    MySQL 慢 <b class='flag-5'>SQL</b> 排查这件事,NineData 社区VS DBeaver/ Navicat 技术分析

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025构建高性能AI应用

    在 Microsoft Ignite 2025 大会上,随着 Microsoft SQL Server 2025 的发布,AI 就绪型企业数据库愿景成为现实,为开发者提供强大的新工具,例如内置向量
    的头像 发表于 12-01 09:31 1013次阅读
    使用NVIDIA Nemotron RAG和Microsoft <b class='flag-5'>SQL</b> Server 2025构建高性能AI应用

    不用编程不用联网,实现倍福(BECKHOFF)PLC对接SQL数据库,上报和查询数据的案例

    ​IGT-DSER智能网关模块,支持各种PLC、智能仪表、远程IO与数据库之间双向通讯,既可以读取设备的数据上报到SQL数据库,也可以从数据库查询数据后写入到设备;数据库软件支持MySQL
    发表于 10-10 11:14

    数据库慢查询分析与SQL优化实战技巧

    今天,我将分享我在处理数千次数据库性能问题中积累的实战经验,帮助你系统掌握慢查询分析与SQL优化的核心技巧。无论你是刚入门的运维新手,还是有一定经验的工程师,这篇文章都将为你提供实用的解决方案。
    的头像 发表于 09-08 09:34 1217次阅读

    SQL 通用数据类型

    SQL 通用数据类型 数据库表中的每个列都要求有名称和数据类型。Each column in a database table is required to have a name and a
    的头像 发表于 08-18 09:46 850次阅读

    Text2SQL准确率暴涨22.6%!3大维度全拆

    摘要 技术背景:Text2SQL 是将自然语言查询转为 SQL 的任务,经历了基于规则、神经网络、预训练语言模型、大语言模型四个阶段。当前面临提示优化、模型训练、推理时增强三大难题,研究
    的头像 发表于 08-14 11:17 814次阅读
    Text2<b class='flag-5'>SQL</b>准确率暴涨22.6%!3大维度全拆

    不用编程序无需联外网,将Rockwell罗克韦尔(AB)PLC的标签数据存入SQL数据库

    的编程软件从PLC导出CSV文件,然后复制到配置表,如下图: 再打开Navicat查看数据库中的数据,如下图: 网关支持西门子、三菱、欧姆龙、施耐德等几乎所有的PLC品牌,通过以上参数软件自行切换即可;关于网关模块的详细介绍可查看用户手册。 配置文件和软件:*附件:CIP-SQL
    发表于 07-31 10:33

    数据库数据恢复—SQL Server数据库被加密如何恢复数据?

    SQL Server数据库故障: SQL Server数据库被加密,无法使用。 数据库MDF、LDF、log日志文件名字被篡改。
    的头像 发表于 06-25 13:54 824次阅读
    数据库数据恢复—<b class='flag-5'>SQL</b> Server数据库被加密如何恢复数据?

    达梦数据库常用管理SQL命令详解

    达梦数据库常用管理SQL命令详解
    的头像 发表于 06-17 15:12 7612次阅读
    达梦数据库常用管理<b class='flag-5'>SQL</b>命令详解

    大促数据库压力激增,如何一眼定位 SQL 执行来源?

    你是否曾经遇到过这样的情况:在大促活动期间,用户访问量骤增,数据库的压力陡然加大,导致响应变慢甚至服务中断?更让人头疼的是,当你试图快速定位问题所在时,却发现难以确定究竟是哪个业务逻辑中的 SQL
    的头像 发表于 06-10 11:32 649次阅读
    大促数据库压力激增,如何一眼定位 <b class='flag-5'>SQL</b> 执行来源?