漫画 | 程序媛小姐姐带你一次了解什么是排序算法
来源 | 小齐本齐
封图 | CSDN 付费下载自视觉中国
插入排序
借用《算法导论》里的例子,就是我们打牌的时候,每新拿一张牌都会把它按顺序插入,这,其实就是插入排序。
齐姐声明:虽然我们用打牌的例子,但是可不能学胡适先生啊。
对于数组来说怎么做呢?
有一个重要的思想,叫做挡板法,就是用挡板把数组分成两个区间:
挡板左边:已排序
挡板右边:未排序
那么排序分三步走:
最初挡板是在数组的最左边,保证已排序区间里一个数都没有,或者也可以包含一个数啦;
核心思想就是:
依次遍历未排序区间里的元素,在已排序区间里找到正确的位置插入;重复这个过程,直到未排序区间为空。
举个例子:{5, 2, 1, 0}
第一步,挡板最初在这里:
第二步, 把 2 插入已排序区间的正确位置,变成:
重复这个步骤,把 1 排好:
最后把 0 排好:
那代码也很简单:
public void insertionSort(int[] input) {if(input == null || input.length <= 1) {return;}for(int i = 1; i < input.length; i++) {int tmp = input[i];int j = i - 1;while(j >= 0 && input[j] > tmp) {input[j+1] = input[j];j --;}input[j+1] = tmp;}
}
我们来分析一下这个算法的时空复杂度。
时间复杂度
关于时间复杂度大 O 有两个要点:
是描述随着自变量的增长,所需时间的增长率;
是渐近线复杂度,就是说
不看系数
只看最高阶项
那么我们关心的 worst case 的情况就是:
如果数组是近乎倒序的,每次插入都要在数组的第一个位置插入,那么已排序区间内的所有的元素都要往后移动一位,这一步平均是 O(n),那么重复 n 次就是 O(n^2).
空间复杂度
重点是一个峰值的概念,并不是累计使用的空间。
这里是 O(1) 没什么好说的。
引入一个概念:sorted in place,也就是原地排序。
原地排序就是指空间复杂度为 O(1) 的算法,因为没有占用额外的空间,就是原地打转嘛。
其实 in-place 的思想并不是只在排序算法里有,只不过排序算法是一个最广为人知的例子罢了。本质上就是一个节省使用空间的思想。
但是对于排序算法,只分析它的时空复杂度是不够的,还有另外一个重要指标:
稳定性
意思是元素之间的相对顺序是否保持了不变。
比如说:{5, 2, 2, 1, 0}
这个数组排序完成后这里面的两个 2 的相对顺序没有变,那么这个排序就是一个稳定排序。
那有同学可能就想,顺序变了又有什么关系呢?
其实,在实际工作中我们排序的对象不会只是一个数字,而是一个个的对象 (object),那么先按照对象的一个性质来排序,再按照另一个性质来排序,那就不希望原来的那个顺序被改变了。好像有点抽象,我们举个例子。
比如在股票交易系统里,有买卖双方的报价,那是如何匹配的呢?
先按照价格排序;
在相等的价格中,按照出价的时间顺序来排序。
那么一般来说系统会维持一个按时间排序的价格序列,那么此时只需要用一个具有稳定性的排序算法,再按照价格大小来排序就好了。因为稳定性的排序算法可以保持大小相同的两个对象仍维持着原来的时间顺序。
那么插入排序是否是稳定性的排序呢?
答案是肯定的。因为在我们插入新元素的时候是从后往前检查,并不是像打牌的时候随便插一个位置不能保证相对顺序。
大家可以看下面的动画[1] 就非常清楚了~
优化
插入排序其实是有很大的优化空间的,你可以搜一下“希尔排序”。
在刚开始学习的时候,深度固然重要,但因为广度不够,如果学的太深可能会很痛苦,一个知识点就无穷无尽的延展,这并不是一个高效的学习方式。
所以如果时间有限,就要做好深度和广度的平衡:
在常用常考的知识点上多花时间精力,追求深度;
在一些拓展性的知识点上点到为止,先知道有这么回事就行。
保持 open minded 的心态,后期就会有质的提高。
选择排序
选择排序也是利用了“挡板法”这个经典思想。
挡板左边是已排序区间,右边是未排序区间,那么每次的“选择”是去找右边未排序区间的最小值,找到之后和挡板后面的第一个值换一下,然后再把挡板往右移动一位,保证排好序的这些元素在挡板的左边。
比如之前的例子:{5, 2, 0, 1}
我们用一个挡板来分隔数组是否排好序,
用指针 j 来寻找未排序区间的最小值;
第一轮 j 最初指向 5,然后遍历整个未排序区间,最终指向 0,那么 0 就和挡板后的第一个元素换一下,也就是和 5 交换一下位置,挡板向右移动一位,结束第一轮。
第二轮,j 从挡板后的2开始遍历,最终指向1,然后1和挡板后的第一个元素 2 换一下,挡板向右移动一位,结束第二轮。
第三轮,j 从2开始遍历,最终指向2,然后和2自己换一下,挡板向右移动一位,结束第三轮。
还剩一个元素,不用遍历了,就结束了。
选择排序与之前的插入排序对比来看,要注意两点:
挡板必须从 0 开始,而不能从 1 开始。虽然在这两种算法中,挡板的物理意义都是分隔已排序和未排序区间,但是它们的已排序区间里放的元素的意义不同:
选择排序是只能把当前的最小值放进来,而不能放其他的;
插入排序的第一个元素可以为任意值。
所以选择排序的挡板左边最开始不能有任何元素。
在外层循环时,
选择排序的最后一轮可以省略,因为只剩下最大的那个元素了;
插入排序的最后一轮不可省略,因为它的位置还没定呢。
class Solution {public void selectionSort(int[] input) {if(input == null || input.length <= 1) {return;} for(int i = 0; i < input.length - 1; i++) {int minValueIndex = i;for(int j = i + 1; j < input.length; j++) {if(input[j] < input[minValueIndex]) {minValueIndex = j;}}swap(input, minValueIndex, i);}}private void swap(int[] input, int x, int y) {int tmp = input[x];input[x] = input[y];input[y] = tmp;}
}
时间复杂度
最内层的 if 语句每执行一次是 O(1) ,那么要执行多少次呢?
当 i = 0 时,是 n-1 次;
当 i = 1 时,是 n-2 次;
...
最后是 1 次;
所以加起来,总共是:
(n-1) + (n-2) + … + 1 = n*(n-1) / 2 = O(n^2)
是这样算出来的,而不是一拍脑袋说两层循环就是 O(n^2).
空间复杂度
这个很简单,最多的情况是 call swap() 的时候,然后 call stack 上每一层就用了几个有限的变量,所以是 O(1)。
那自然也是原地排序算法了。
稳定性
这个答案是否定的,选择排序并没有稳定性。
因为交换的过程破坏了原有的相对顺序,比如: {5, 5, 2, 1, 0} 这个例子,第一次交换是 0 和 第一个 5 交换,于是第一个 5 跑到了数组的最后一位,且再也无翻身之地,所以第一个 5 第二个 5 的相对顺序就已经打乱了。
这个问题在石头哥的那篇谷歌面经文章里有被考到哦,如果还没有看过这篇面经文章的,在公众号里回复「谷歌」二字,就可以看到了。
优化
选择排序的其中一步是选出每一轮的最小值,那么这一步如果使用 heapify() 来优化,就可以从 O(n) 优化到 O(logn),这其实就变成了 heapSort.
推荐阅读
追忆童年,教你用Python画出儿时卡通人物
如何用NLP辅助投资分析?三大海外机构落地案例详解
Gary Marcus:因果熵理论的荒诞和认知科学带给AI的11个启示 | 文末赠书
AI 终极问题:我们的大脑是一台超级计算机吗?
借助大数据进行社交媒体营销,企业们得这么玩!
力挺比特币的世界第2交易员:仅次于索罗斯,连续25年无亏损
你点的每个“在看”,我都认真当成了AI
相关文章:

POJ 1207 The 3n + 1 problem
题目链接:http://poj.org/problem?id1207 题目大意:给你一个数x,规定一个函数F(x),如果x为1则F(x)1,否则如果x是偶数,F(x)F(x/2),x为奇数F(x)F(3*x1)计算给定x到变换到1的步数。 注意点&#x…

PopupWindow响应返回键的问题
假设情景是这样的:在一个Activity中弹出一个PopupWindow,要求在按返回键时关闭该PopupWindow。 如果该PopupWindow是无焦点的(默认情况),那么可以在Activity中响应返回键(onBackPressed)&#x…

Unix / Linux世界里的4-2-1
Unix / Linux世界里的4-2-1 在Unix / Linux世界里,4代表可读( r ),2代表可写入 ( w ),1代表可执行 ( x ) 如果拥有7 421 的权限,即代表这个人可以对档案完全控制。 以0777为例: 去掉0,第一个7代表着拥有者…
深度学习概述:NLP vs CNN
作者 | Manish Kuwar译者 | 苏本如,责编 | 郭芮头图 | CSDN 下载自视觉中国出品 | CSDN(ID:CSDNnews)以下为译文:当今,人工智能已经不仅仅是一个技术术语了。这项技术在过去十年的时间内几乎将其影响扩展到…

oracle 求A中不存在于B的记录
oracle 求A中不存在于B的记录 select * from a minus select * from b 是求A中不存在于B的记录select * from a union select * from b 是求A和B的DISTINCT的并集select * from a union all select * from b 是求A和B的冗余并集那么A和B的交集是什么函数来的?交集是 INTERSE…

正则表达式grep、egrep--already
第一式 grep是什么 #man grepgrep(global search regular expression(RE)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。UNIX的grep家族包括grep、egrep和fgrep。egrep和fgrep的命令…
万字长文综述目标检测领域,你要的都在这里
来源 | AI专栏(ID: pursue-Y-future)目标检测是计算机视觉中的一个重要问题,近年来传统检测方法已难以满足人们对目标检测效果的要求,随着深度学习在图像分类任务上取得巨大进展,基于深度学习的目标检测算法逐渐成为主…

ASP.net随机数应用实例
家可能都用过Chinaren的校友录,不久前它的留言簿上加了一个防止灌水的方法,就是系统每次产生一个由随机的数字和字母组成的图片,每次留言必须正确地输入这些随机产生的字符,否则不能添加留言。这是一个很好的防止恶意攻击的方法&a…

PreferenceActivity是什么?
我们看到Android系统本身就大量用到了PreferenceActivity来对系统进行信息配置和管理,那么它是怎么保存数据的呢,如何创建PrefenceActivity的呢?创建Android项目,并添加一个pref.xml文件(先建一个xml名的Folder)。注意,这次选择的…
坑系列 --- 时间和空间的平衡
这是坑系列的最后一弹了,这篇文章非常长,希望你能看完,要是看完有很酣畅的感觉就最好了。这一篇的坑主要来说说架构中时间和空间的平衡吧,这里的时间指代比较广,可能是开发时间,但大部分指的是执行时间&…

C#中调用Windows API的要点
在.Net Framework SDK文档中,关于调用Windows API的指示比较零散,并且其中稍全面一点的是针对Visual Basic .net讲述的。本文将C#中调用API的要点汇集如下,希望给未在C#中使用过API的朋友一点帮助。另外如果安装了Visual Studio .net的话&…
线上直播丨Hinton等6位图灵奖得主、百余位顶级学者邀你群聊AI
Geoffrey Hinton等6位图灵奖得主亲临,百余位顶级学者邀请你加入群聊「2020北京智源大会」,深入系统探讨「人工智能的下一个十年」。自2009年深度学习崛起以来,第三波人工智能浪潮席卷全球,推动了新一波技术革命。在这波澜壮阔的11…

ServerSocket
ServerScoket 这个类用于与 Socket 进行通信。 在实例化ServerSocket 的时候,服务器相当于已经开始了,但是还需要通过socket来accept (socket serverSocket.accept())以使服务器选择性与某一Client进行连接。如果有指定了允许连接…

NDK开发 - C/C++ 访问 Java 变量和方法
上一篇有提到 JNI 访问引用数组,涉及了 C/C 访问 Java 实例的方法和变量。虽然在之前的开发中,并没有用到 C/C 范围 Java 层数据,但是这部分内容还是很有用的。传送门:NDK开发 - C/C 访问 Java 变量和方法 C/C 访问 Java 层的方法…

在C#中应用哈希表(Hashtable)
一,哈希表(Hashtable)简述 在.NET Framework中,Hashtable是System.Collections命名空间提供的一个容器,用于处理和表现类似key/value的键值对,其中key通常可用来快速查找,同时key是区分大小写;value用于存储对应于key的…
俄罗斯自研Elbrus CPU参数曝光,CEO年近九旬仍未退休
导语:俄罗斯自研 CPU 参数最近曝光,虽然比起主流产品仍存在较大差距,但是这也是俄罗斯在自研道路上的一大进展。虽说自研 CPU 并非易事,但为了避免被美国牵制,很多国家都在这方面投入了巨大的人力与资金。战斗民族俄罗…

停止Password Manager Agent服务导致应用程序启动缓慢
在一个实施环境中,部署了Password Manager用来实现单点登录功能,但是由于Password Manager的提示基本都是以英文为主,而且配置也比较麻烦,普通用户看见会比较影响用户体验,所以用户决定暂时关闭Password Manager功能&a…

web 前端常用组件【06】Upload 控件
因为有万恶的IE存在,所以当Web项目初始化并进入开发阶段时。 如果是项目经理,需要知道客户将会用什么浏览器来访问系统。 明确知道限定浏览器的情况下,你才能从容的让手下的封装必要的前端组件。 本篇文章试图从常见的上传方式和组件进行分析…
性能超越最新序列推荐模型,华为诺亚方舟提出记忆增强的图神经网络
作者 | Chen Ma, Liheng Ma等译者 | Rachel出品 | AI科技大本营(ID:rgznai100)用户-商品交互的时间顺序可以揭示出推荐系统中用户行为随时间演进的序列性特征。用户与之交互的商品可能受到用户曾经接触的商品的影响。但是,用户和商…

ASP.net 中的页面继承实现和通用页面的工厂模式的实现
最近用.Net做web项目的时候遇到了一些问题,就是很多的页面的处理一样的,不一样的就是我们写的存储过程不同,为了考虑代码的重复利用和可维护性和可 扩展性,于是写了一个对于单据页面的工厂模式,采用界面的继承技术&…

5502的时钟组
5502有四个时钟组,分别为: C55x Subsystem Clock GroupFast Peripherals Clock GroupSlow Peripherals Clock GroupExternal Memory Interface Clock Group1、C55x Subsystem Clock Group该时钟组包括C55X CPU core、内存(DARAM和ROM…

遇到的浏览器兼容问题及应对方法
前言: 上周天的时候有个学长找我帮忙做三张页面,因为没有数据交换之类的,只是单纯的前端页面,想着好久没做东西, 看书都看烦了,所以就接了也当是练手。之前因为没有系统的看书,所以其实很多问题…

浅谈权限设计(来自深空老大)
2019独角兽企业重金招聘Python工程师标准>>> By 深空, 2009-09-13 21:45:07 PHPChina的专家版在谈权限设计,苦于没有权限回帖,特发此博文谈谈简单的权限设计。讨论在这里。 最简单的权限验证,应该是登录态的验证,如果登…
5年Python功力,总结了10个开发技巧
作者 | 写代码的明哥来源 |Python编程时光(ID: Cool-Python)如何在运行状态查看源代码?查看函数的源代码,我们通常会使用 IDE 来完成。比如在 PyCharm 中,你可以 Ctrl 鼠标点击 进入函数的源代码。那如果没有 IDE 呢&…

怎样给目录加权限0777
# chmod -R 0777 /var/www/html/子目录

php学习,一个简单的Calendar(2) 一个简单的活动页面
有了前面的基础,后面就是将页面展示出来。 预览图如下:1号和31号分别有活动,会一并显示出来 这里需要搞定几个问题,一个就是数据库的连接,我们用\sys\class\class.db_connect.inc.php <?php /* * 数据库操作&#…
涨见识了,在终端执行 Python 代码的 6 种方式
作者 | BRETT CANNON译者 | 豌豆花下猫Python猫为了我们推出的 VS Code 的 Python 插件[1],我写了一个简单的脚本来生成变更日志[2](类似于Towncrier[3],但简单些,支持 Markdown,符合我们的需求)。在发布过…

ASP.NET中DataGrid鼠标经过感知以及点击行弹出窗口
选择自 xujh 的 Blog 作者Blog:http://blog.csdn.net/xujh/ 很多人说很难,其实就这几行代码。只要在DataGrid1的ItemDataBound中写入下代码即可 private void DataGrid1_ItemDataBound(object sender, System.Web.UI.WebControls.DataGridItemEventAr…

python中的module
Python中的Module是比较重要的概念。常见的情况是,事先写好一个.py文件,在另一个文件中需要import时,将事先写好的.py文件拷贝到当前目录,或者是在sys.path中增加事先写好的.py文件所在的目录,然后import。这样的做法&…

找子串替换(kmp)poj1572
题目链接:http://poj.org/problem?id1572 输入数据时要注意,这里是string型 用getline(cin,origin[i]); #include <string> #include <iostream> #include <algorithm> #include <stdio.h>using namespace std;const int maxn …