0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

排序算法merge-sort的基础知识

星星科技指导员 来源:NVIDIA 作者:Richmond Alake 2022-04-07 17:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据科学家每天都在处理算法。然而,数据科学学科作为一个整体已经发展成为一个不涉及复杂算法实现的角色。尽管如此,从业者仍然可以从对算法的理解和掌握中获益。

本文介绍、解释、评估和实现了排序算法merge-sort 。本文的目的是为您提供有关合并排序算法的可靠背景信息,该算法是更复杂算法的基础知识。

尽管合并排序不被认为是复杂的,但是理解该算法将有助于您认识到选择最有效的算法来执行与数据相关的任务时需要考虑的因素。创建于 1945 年的 约翰·冯·诺依曼 使用分治方法开发了合并排序算法。

分而治之

要理解合并排序算法,您必须熟悉分治范式,以及递归的编程概念。计算机科学领域中的递归是指定义用于解决问题的方法在其实现体中调用自身。

换句话说,函数会反复调用自身。

poYBAGJOtXKAPxgQAAAqvv39_RU043.png

图 1 。递归的视觉图解——作者的图像 .

分治算法(合并排序是一种)在其方法中使用递归来解决特定问题。分治算法将复杂问题分解为更小的子部分,其中定义的解决方案递归地应用于每个子部分。然后分别求解每个子部分,并重新组合解决方案以解决原始问题。

分而治之的算法设计方法结合了三个主要元素:

将较大的问题分解为较小的子问题。(分开)

递归使用函数来解决每个较小的子问题。(征服)

最终的解决方案是对较大问题的较小子问题的解决方案的组合。(合并)

其他算法使用分治范式,如快速排序、二进制搜索和 Strassen 算法。

合并排序

在按升序对列表中的元素进行排序的上下文中, merge-sort 方法将列表分成两半,然后迭代新的两半,不断地将它们进一步分成更小的部分。

随后,对较小的一半进行比较,并将结果组合在一起,形成最终的排序列表。

步骤和实施

合并排序算法的实现分为三步。分而治之,然后结合。

分而治之方法的分而治之部分是第一步。这个初始步骤将整个列表分成两个较小的部分。然后,列表被进一步分解,直到它们不能再被分割,在每个减半的列表中只留下一个元素项。

合并排序的第二阶段中的递归循环与按特定顺序排序的列表元素有关。在这种情况下,初始数组按升序排序。

在下图中,您可以看到合并排序算法中涉及的分割、比较和组合步骤。

poYBAGJOtWuAAqNRAAB0QxnjTUg246.png

图 2 。按作者划分合并排序算法图像的组件插图。

pYYBAGJOtWWAFxt2AABUOZMpew4102.png

图 3 。征服和结合的组成部分形象的作者。

要自己实现这一点:

创建一个名为 merge _ sort 的函数,该函数接受整数列表作为参数。以下所有说明均在此功能范围内。

首先把清单分成两半。记录列表的初始长度。

检查记录的长度是否等于 1 。如果条件的计算结果为 true ,则返回列表,因为这意味着列表中只有一个元素。因此,不需要划分清单。

获取元素数大于 1 的列表的中点。使用 Python 语言时,//执行除法,不带余数。它将除法结果四舍五入到最接近的整数。这也被称为楼层划分。

使用中点作为参考点,将列表拆分为两半。这是分而治之算法范例的分而治之的一面。

Recursion is leveraged at this step to facilitate the division of lists into halved components. The variables ‘left_half’ and ‘right_half’ are assigned to the invocation of the ‘ merge_sort’ function, accepting the two halves of the initial list as parameters.

“ merge_sort ”函数返回对一个函数的调用,该函数将两个列表合并,以返回一个组合的排序列表。

  • 序列表。
def merge_sort(list: [int]): list_length = len(list) if list_length == 1: return list mid_point = list_length // 2 left_half = merge_sort(list[:mid_point]) right_half = merge_sort(list[mid_point:]) return merge(left_half, right_half)
  • 创建一个‘merge’函数,该函数接受两个整数列表作为其参数。此函数包含分治算法范例的征服和合并方面。以下所有步骤均在此函数体中执行。
  • 为保存已排序整数的变量“ output ”分配一个空列表。
  • 指针‘i’‘j’分别用于为左列表和右列表编制索引
  • 在 while 循环中,对左列表和右列表的元素进行比较。每次比较后,输出列表将填充在两个比较的元素中。追加元素列表的指针递增。
  • 要添加到排序列表的其余元素是从当前指针值到相应列表末尾的元素。
def merge(left, right): output = [] i = j = 0 while (i < len(left) and j < len(right)): if left[i] < right[j]: output.append(left[i]) i +=1 else: output.append(right[j]) j +=1 output.extend(left[i:]) output.extend(right[j:]) return output unsorted_list = [2, 4, 1, 5, 7, 2, 6, 1, 1, 6, 4, 10, 33, 5, 7, 23]
sorted_list = merge_sort(unsorted_list)
print(unsorted_list)
print(sorted_list)

性能和复杂性

大 O 表示法是一种标准,用于定义和组织算法在空间需求和执行时间方面的性能。

合并排序算法在最佳、最差和平均情况下的时间复杂度相同。对于大小为 n 的列表,合并排序算法要完成的预期步骤数、最小步骤数和最大步骤数都是相同的。

正如本文前面提到的,合并排序算法分为三个步骤:划分、征服和合并。“分割”步骤涉及到列表中点的计算,无论列表大小如何,它都只需要一个操作步骤。因此,该操作的符号表示为 O(1) 。

“征服”步骤包括划分和递归求解子数组—— logn 表示这一点。“合并”步骤包括将结果合并到最终列表中;此操作执行时间取决于列表大小,并表示为 O(n) 。

平均、最佳和最差时间复杂度的合并排序表示法是 log n * n * O ( 1 ) 。在大 O 表示法中,低阶项和常数可以忽略不计,这意味着合并排序算法的最终表示法是 O ( n 日志 n ) 。有关合并排序算法的详细分析,请参阅 article 。

评价

合并排序在对大型列表进行排序时表现良好,但在较小列表上使用时,其操作时间比其他排序解决方案慢。合并排序的另一个缺点是,即使初始列表已经排序,它也会执行操作步骤。在链表排序的用例中,合并排序是最快的排序算法之一。合并排序可用于外部存储系统(如硬盘)中的文件排序。

关键外卖

本文描述了合并排序技术,将其分解为组成操作和逐步过程。

合并排序算法是常用的,与其他排序算法相比,该算法背后的直觉和实现相当简单。本文包括 Python 中合并排序算法的实现步骤。

您还应该知道,在不同情况下,合并排序方法的执行时间的时间复杂度在最佳、最差和平均情况下保持不变。建议在以下情况下使用合并排序算法:

处理较大的数据集时,请使用合并排序算法。与其他排序算法相比,合并排序在小数组上的性能较差。

链表中的元素引用了列表中的下一个元素。这意味着在合并排序算法操作中,指针是可修改的,使得元素的比较和插入具有恒定的时间和空间复杂性。

确定数组是未排序的。即使在排序的数组上, Merge-sort 也会执行其操作,这是对计算资源的浪费。

当考虑到数据的稳定性时,使用合并排序。稳定排序涉及保持数组中相同值的顺序。与未排序的数据输入相比,稳定排序中整个数组中相同值的顺序在排序后的输出中保持在相同的位置。

关于作者

Richmond Alake 是一名机器学习计算机视觉工程师,他与多家初创公司和公司合作,整合深度学习模型,以解决商业应用中的计算机视觉任务。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109094
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    C语言的常见算法

    # C语言常见算法 C语言中常用的算法可以分为以下几大类: ## 1. 排序算法 ### 冒泡排序 (Bubble
    发表于 11-24 08:29

    视觉工程师必须知道的工业相机基础知识

    工业相机基础知识概述。
    的头像 发表于 09-19 17:04 893次阅读
    视觉工程师必须知道的工业相机<b class='flag-5'>基础知识</b>

    最易读懂的理工科基础丛书——图解电机基础知识入门

    本书深人浅出地介绍了电动机的基础知识、应用和发展,其内容包括电动机的用途、电动机的基础知识及应用、电流和磁场的关系、直流电动机的结构和作用、交流电动机的结构和作用、特殊电动机的结构和作用
    发表于 04-07 18:28

    1-半导体基础知识(童诗白、华成英主编)

    介绍了半导体基础知识,二极管,三极管。
    发表于 03-28 16:12

    效果器的基础知识

    电子发烧友网站提供《效果器的基础知识.doc》资料免费下载
    发表于 03-26 14:30 6次下载

    开关电源的基础知识题目及答案(免积分)

    本文含有开关电源的基础知识题目及答案,下载附件即可查看!
    发表于 03-06 15:52

    【北京迅为】iTOP-RK3568OpenHarmony系统南向驱动开发GPIO基础知识

    【北京迅为】iTOP-RK3568OpenHarmony系统南向驱动开发GPIO基础知识
    的头像 发表于 03-06 11:23 1008次阅读
    【北京迅为】iTOP-RK3568OpenHarmony系统南向驱动开发GPIO<b class='flag-5'>基础知识</b>

    DC-DC基础知识 + 硬件电路

    一、DCDC简易电路原理DCDC电路是直流转直流电路,将某直流电源转变为不同电压值的电路,分为升压电路和降压电路。1.1电容、电感基础知识1.1.1电容电容两端电压不能突变。通交流、阻直流;通
    的头像 发表于 02-26 13:54 1672次阅读
    DC-DC<b class='flag-5'>基础知识</b> + 硬件电路

    功率器件热设计基础知识

    功率器件热设计是实现IGBT、碳化硅SiC等高功率密度器件可靠运行的基础。掌握功率半导体的热设计基础知识,不仅有助于提高功率器件的利用率和系统可靠性,还能有效降低系统成本。本文将从热设计的基本概念、散热形式、热阻与导热系数、功率模块的结构和热阻分析等方面,对功率器件热设计基础知识
    的头像 发表于 02-03 14:17 1254次阅读

    PCB绘制基础知识

    电子发烧友网站提供《PCB绘制基础知识.pdf》资料免费下载
    发表于 01-21 15:20 8次下载
    PCB绘制<b class='flag-5'>基础知识</b>

    详解Linux sort命令之掌握排序技巧与实用案例

    在linux系统使用过程中,提供了sort排序命令,支持常用的排序功能。 常用参数 sort命令支持很多参数,常用参数如下:   短参数 长参数 说明 -n – number-
    的头像 发表于 01-09 10:10 1581次阅读

    EMC基础知识-华为

    EMC基础知识-华为
    发表于 01-06 14:09 5次下载

    TimSort:一个在标准函数库中广泛使用的排序算法

    在计算机科学的领域,排序算法是每位学生必学的基础,而排序的需求是每位程序员在编程过程中都会遇到的。 在你轻松调用 .sort() 方法对数据进行排序
    的头像 发表于 01-03 11:42 954次阅读

    万字长文,看懂激光基础知识

    深入介绍激光基础知识,帮助您轻松理解激光领域的关键概念和原理。
    的头像 发表于 12-20 09:49 2101次阅读
    万字长文,看懂激光<b class='flag-5'>基础知识</b>!

    华为-射频基础知识培训

    课程目标z 熟悉和掌握射频基本概念和知识z 了解无线射频系统结构z 了解天馈系统的概念和知课程内容第一章 无线通信的基本概念第二章 射频常用计算单位简介第三章 射频常用概念辨析第四章 射频系统介绍第五章 天线传播基础知识简介
    发表于 12-10 13:39 1次下载