0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种比线段树还高效的区间算法

算法与数据结构 来源:小K算法 作者:小K算法 2022-04-11 09:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

01 故事起源

有N个数排列成一排,给定一个区间,如何快速找出区间内最大的数是多少呢?

34f9dfbe-b7a6-11ec-aa7f-dac502259ad0.jpg

02 分析

首先想到的自然是从区间头开始,依次遍历完区间内的元素,这样就可以找出结果了。但这个复杂度是O(n),肯定不是我们想要的。

350a9016-b7a6-11ec-aa7f-dac502259ad0.jpg

再来分析一下有什么特点呢?

这些数不会更改,所以每个区间的结果是不会变的,是否可以把所有的区间结果先计算出来?

3524ef60-b7a6-11ec-aa7f-dac502259ad0.jpg

如果数据规模很小确实可以,一旦数据过大肯定就不行了,因为时间和空间都是O(n^2)。

353e0d1a-b7a6-11ec-aa7f-dac502259ad0.jpg

再考虑一下,区间的最值是有很强的传递关系,这就引导我们可以把大问题化为小问题。

355903ea-b7a6-11ec-aa7f-dac502259ad0.jpg

很显然,这就是一个标准的线段树模型,不过今天我们再换一个更加高效的算法,稀疏表。 03 稀疏表稀疏表的思想就是提前预处理数据,所以主要针对数据不变的情况,而线段树更加灵活,可以动态维护数据的变化。

首先还是将区间划分成很多的小区间。那如何划分更合理?

第2章节中,我们枚举了所有的区间情况,可以看出其实有很多重复的情况,比如下面[0,3]其实可以通过[0,1]和[2,3]组合出来。

356cb1c4-b7a6-11ec-aa7f-dac502259ad0.jpg

可以根据长度划分区间。

设数组为a[i],f[i][j]表示区间[i,j]的最大值。

则长度为1的区间总共有n个,f[i][i]=a[i]。

3584108a-b7a6-11ec-aa7f-dac502259ad0.jpg

长度为2的区间总共有n-1个。

358f1458-b7a6-11ec-aa7f-dac502259ad0.jpg

因为之前已经求出了长度为1的区间的最大值,所以区间长度为2的最大值可以通过区间长度为1的结果直接推出来。

359f34aa-b7a6-11ec-aa7f-dac502259ad0.jpg

接下来就考虑长度为3的区间了吗?

其实并不是,因为前面已经有了长度为1和2的,所以可以组合出长度为3和4的。

35ae665a-b7a6-11ec-aa7f-dac502259ad0.jpg

那就直接考虑长度为5的吗?

如果考虑为5的,那你怎么计算呢,前面的也推不出长度为5的结果啊,至少得有3个区间才能推出来

35c94380-b7a6-11ec-aa7f-dac502259ad0.jpg

所以接下来考虑长度为4的区间才是正解,总共有n-3个。

35dd169e-b7a6-11ec-aa7f-dac502259ad0.jpg

再接下来自然就是考虑长度为8的区间了,总共有n-7个。

但这里有个很明显的问题,就是我们的数组f[i,j]定义的不合理,因为里面很多的小区间没有用上,比如长度为3,5,6,7等,所以需要重新定义。 04 状态压缩可以将第二维用于表示区间长度,第一维表示区间起点,对第二维就可以进行状态压缩。

设f[i,j]表示从i开始,长度为2^j的区间的最大值,即区间[i,i+2^j-1]。

35f43f5e-b7a6-11ec-aa7f-dac502259ad0.jpg

则长度为2^j的区间就可以通过左右2个长度为2^(j-1)的区间推出结果。时间和空间的复杂度都为O(nlogn)。

3609f2ea-b7a6-11ec-aa7f-dac502259ad0.jpg

05 区间分解

那查询结果的时候要怎么处理呢,我们只计算了长度为2^j的区间,并没有计算长度为3、5、7等区间的结果。

所以这个处理和线段树的思想也类似,需要进行区间分解。不过线段树可能分解成很多个区间,而稀疏表只需要分解成2个区间就可以了。

对于任意区间[a,b],长度为b-a+1,总可以找到2个长度为2^j的区间,这2个区间组合起来可以完全覆盖[a,b],其中j的值为log(b-a+1)。

左边的区间左端点从a开始,长度为2^j,即区间[a,a+2^j-1]。右边的区间右端点从b开始,长度为2^j,即区间[b-2^j+1,b]。

则区间[a,b]的最大值就是这两个区间中更大的那个,即max(f[a,j],f[b-2^j+1,j])。

36223a6c-b7a6-11ec-aa7f-dac502259ad0.jpg

06 代码实现

代码实现了最大值和最小值的获取。

6.1变量定义

int high[50000][17], low[50000][17], n, q;

6.1预处理

void solve() {

// 枚举区间长度,2^j《=n

for (int j = 1; (1 《《 j) 《= n; ++j) {

// 枚举左端点i,右端点i+2^j-1《=n-1

for (int i = 0; i + (1 《《 j) 《= n; ++i) {

high[i][j] = max(high[i][j - 1], high[i + (1 《《 (j - 1))][j - 1]);

low[i][j] = min(low[i][j - 1], low[i + (1 《《 (j - 1))][j - 1]);

}

} }

6.1main函数

int main() {

cin 》》 n 》》 q;

for (int i = 0; i 《 n; ++i) {

cin 》》 high[i][0];

low[i][0] = high[i][0];

}

solve();

for (int i = 0; i 《 q; ++i) {

int a, b;

cin 》》 a 》》 b;

a--;

b--;

int j = (int) (log(b - a + 1.0) / log(2.0));

int minHeight = min(low[a][j], low[b - (1 《《 j) + 1][j]);

int maxHeight = max(high[a][j], high[b - (1 《《 j) + 1][j]);

cout 《《 maxHeight - minHeight 《《 endl;

}

return 0; }

07 总结

对于数据不变的情况,可以用稀疏表预处理,这种属于离线算法。如果要动态维护变化,动态查询,那就得用在线算法,比如线段树。但稀疏表的效率确实高,有状态压缩和动态规划的思想,值得深入研究学习。

--- EOF ---

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4760

    浏览量

    97144
  • 函数
    +关注

    关注

    3

    文章

    4406

    浏览量

    66838

原文标题:一种比线段树还高效的区间算法

文章出处:【微信号:TheAlgorithm,微信公众号:算法与数据结构】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    8常用的CRC算法分享

    CRC 计算单元可按所选择的算法和参数配置来生成数据流的 CRC 码。有些应用中,可利用 CRC 技术来验证数据的传输和存储的完整性。 8 常用的 CRC 算法,包括: CRC16_IBM
    发表于 11-13 07:25

    SM4算法原理及分享1

    SM4算法一种分组密码算法。其分组长度为128bit,密钥长度也为128bit。加密算法与密钥扩展算法均采用32轮非线性迭代结构,以字(
    发表于 10-30 06:54

    查找表与多项式近似算法实现初等函数

    查找表与多项式近似结合算法一种把查找表算法和多项式近似算法综合到起的算法。这种
    发表于 10-28 08:10

    BLDC与PMSM电机控制算法的联系与区别

    脉动小、更加平稳顺滑,因此广泛应用于对控制性能要求高的场合,如工业伺服系统、电动汽车驱动等。 二、 核心控制算法解析​ 六步换相法​​ l原理: 一种简单直接的控制方法。它将电机的电周期分为六个区间
    发表于 10-27 09:23

    一种高效智能的光伏电站管理平台

    体化(集成多种储能管理功能等)。用户根据自身场景和需求,选择合适光伏电站管理平台及功能应用配置,从而实现发电效率最大化、运维成本最小化及碳中和目标。 光伏电站管理平台作为一种智能光伏管理系统,通过光伏智能管理
    的头像 发表于 07-18 09:20 831次阅读
    <b class='flag-5'>一种</b><b class='flag-5'>高效</b>智能的光伏电站管理平台

    怎么利用matlab得到95%,80%和70%的置信区间,并生成不同区间下的功率误差贝塔分布?

    matlab仿真 matlab新手,怎么利用matlab得到95%,80%和70%的置信区间,并生成不同区间下的功率误差贝塔分布
    发表于 04-09 01:21

    一种基于分数阶 PID 直流电机调速的 AGV 控制系统

    为设计一种低成本、抗干扰、稳定可靠的 AGV,提出一种基于磁带导航的 AGV 系统。采用 Megawin 公司的80C51单片机为控制核心,以并排对称设计的霍尔传感器实现循迹和纠偏,红外光
    发表于 03-25 15:10

    科技在物联网方面

    科技在物联网领域有多方面的涉及和发展,以下是些具体信息: 传感器技术合作 与传感器公司合作:宇科技与些传感器技术公司有合作,例如奥
    发表于 02-04 06:48

    xgboost的并行计算原理

    在大数据时代,机器学习算法需要处理的数据量日益增长。为了提高数据处理的效率,许多算法都开始支持并行计算。XGBoost作为一种高效的梯度提升
    的头像 发表于 01-19 11:17 1571次阅读

    飞凌嵌入式ElfBoard ELF 1板卡-初识设备之设备组成和结构

    项技能。设备的起源设备(Device Tree)是一种描述硬件资源的数据结构,它由uboot传递给Linux内核,被内核解析,内核根据设备
    发表于 01-07 09:16

    请问ADS5474是一种什么架构?

    请问ADS5474是一种什么架构
    发表于 01-02 07:27

    ADS1292测量ECG,三个导联测量,测得的心电信号波形,对多数人的测量结果都是T波R波还高而且很宽,为什么?

    使用TI官方方案ADS1292测量ECG,三个导联测量,测得的心电信号波形,对多数人的测量结果都是T波R波还高而且很宽,只有对少数人才正常,是什么原因?
    发表于 12-24 07:55

    一种新型高效率的服务器电源系统

    一种新型高效率的服务器电源系统
    发表于 12-19 16:45 1次下载

    常见的加密算法有哪些?它们各自的优势是什么?

    常见的加密算法及其优势如下: AES(Advanced Encryption Standard): AES是一种对称加密算法,采用分组密码体制,支持128位、192位和256位密钥长度。AES的优势
    的头像 发表于 12-17 15:57 1727次阅读

    DAC的高次谐波为什么都会折叠回第奈奎斯特区间

    如题,在看到的DDS和DAC的资料上都会提到DAC内部的非线性造成的高次谐波会被折叠回第奈奎斯特区间。不太理解的地方是DAC里并没有采样的过程啊?DAC只是个乘以sin(x)/x和低通滤波
    发表于 12-11 07:05