0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

古人哲学与现代计算机信息编码不谋而合

Q4MP_gh_c472c21 来源:嵌入式ARM 作者:嵌入式ARM 2020-12-03 09:47 次阅读

1. 中国古老的阴阳八卦

首先我们看看《易传·系辞上传》,“易有太极,是生两仪,两仪生四象,四象生八卦。”从以下这个图就很好理解:

细心的你也许会发现,这是二进制的级数增长,这不就是1,2,4,8么!

再看看,《道德经》:道生一,一生二,二生三,三生万物。 这段话,其实跟《易传》的很像,意思是:

道是独一无二的,道本身包含阴阳二气,阴阳二气相交而形成一种适匀的状态,万物在这种状态中产生。

理工科出身的我,很容易想到,阴阳便是0和1,阴阳的相交,即0和1的组合,便可产生万物(计算机里面的一切)。 很多书都讲这是古人的宇宙生成论或者是朴素的哲学概念,但这跟计算机里面的二进制原理为什么这么相似,这么巧合? 2. 过去的信息传递在没有电话和计算机的年代,人们是怎么记录或传递信息的?狼烟烽火用来传递敌情(有和无)

类似的,还有纸鸢(风筝)。现在中国风筝有俩流派,即“北潍坊,南阳江”。

结绳

人们用来计数记事和传递信息。文字产生之前人们用来记数记事和传递信息的方法。相传大事打大结,小事打小结。

击鼓鸣金看《三国演义》就会知道,里面多次提到击鼓和鸣金。不同的方式和节奏传递不同的信息。

旗语在军事上也用的非常多。

故夜战多火鼓,昼战多旌旗,所以变人之耳目也。

《孙子兵法》

诸如此类的,还有很多很多,如飞鸽传书、鱼传尺素等。 3. 近现代的电子信息首先看看电报

欧洲的科学家在18世纪逐渐发现电的各种特质。同时开始有人研究使用电来传递讯息的可能。早在1753年,一名英国人便提出使用静电来拍发电报。

还有摩斯密码

摩尔斯电码也被称作摩斯密码,是一种时通时断的信号代码,通过不同的排列顺序来表达不同的英文字母、数字和标点符号。它发明于1837年,是一种早期的数字化通信形式。不同于现代化的数字通讯,摩尔斯电码只使用零和一两种状态的二进制代码,它的代码包括五种:短促的点信号“・”,读“滴”(Di)保持一定时间的长信号“—”,读“嗒”(Da)表示点和划之间的停顿、每个词之间中等的停顿,以及句子之间长的停顿。

电子计算机到1946年,世界第一台电子计算机诞生了。它是一个庞然大物,用了18000个电子管,占地170平方米,重达30吨,耗电功率约150千瓦,每秒钟可进行5000次运算。 这个功能性能,从现在看来虽然很渣,但是其诞生具有划时代意义。 发明计算机的同学们用8个晶体管的“通”或“断”组合出一些状态来表示世间万物。

在这里,不得不提一个人——冯·诺依曼。他是匈牙利裔美籍数学家、物理学家、计算机科学家,在计算机、博弈论、核武器和生化武器等领域的全才之一,被后来人称为“计算机之父”和“博弈论之父”。 我们今天用到的计算机,都是基于冯诺依曼体系结构的。4. 字节讲了这么多,现在开始讲字节,开始之前,先复习下几个概念:

比特(bit):也可称为“位”,是计算机信息中的最小单位,是 binary digit(二进制数位)的缩写,指二进制中的一位

字节(Byte):计算机中信息计量的一种单位,一个位就代表“0”或“1”,每8个位(bit)组成一个字节(Byte)

字符(Character):文字与符号的总称,可以是各个国家的文字、标点符号、图形符号、数字等

字符集(Character Set):是多个字符的集合

编码(Encoding):信息从一种形式或格式转换为另一种形式的过程

解码(decoding):编码的逆过程

字符编码(Character Encoding):按照何种规则存储字符

我们知道字节(Byte)是计算机信息存储的基本单位,它由8个位(bit)组成。但是,为什么是8个位,而不是三个四个,也不是九个十个? 网上很多都说是因为ASCII,其实不是,这不是因果关系。 位(bit),一个位只有两种状态,0和1,可表示晶体管的“通”和“断”,计算机的存储和逻辑就是通过这些晶体管的“通”和“断”来表达。 早期的计算机是用来做数学运算的,数字就0~9,其实4个bit就足够了,可以通过BCD码的方式来表达数字。 但是,不能用4个bit来表示一个Byte啊,4个bit表示数字还好,其他字母呢,那得用两个byte来表示,跨byte访问,会降低效率啊。 历史上,早期的Byte的大小没有固定的标准,其很大程度依赖于硬件设计,使用1到48位的情况都有,但比较常用的是6位(BCDIC)。使用6位和9位的计算机在19世纪60年代非常常见,这些系统通常具有12、18、24、30、36、48或60位的存储。

4位和6位也是在早期比较常用的,它们当时被用在美国陆军(FIELDATA)和海军常见的可打印图形模式。这些表示包括字母数字字符和特殊的图形符号。这些集合在1963年扩展为7位编码,称为美国信息交换标准代码(ASCII),称为联邦信息处理标准,取代了1960年代美国政府和大学不同部门使用的不兼容的电传打印机代码。这个就是ASCII的由来。呵呵,ASCII字符其实用7位就够了,不是8位哦。

那么今天的8位Byte是怎么来的呢? 这就要提到System/360了。在十九世纪60年代初期,IBM同时积极参与ASCII标准化,同时在System/360产品线中引入了八位扩展二进制编码十进制交换码(EBCDIC),这是对六位二进制编码十进制(BCDIC)的扩展。IBM突出的表现,逐渐就让8位Byte普及开来了。

但是呢,这个EBCDIC和ASCII是不一样的哦。 十九世纪70年代八位微处理器的发展普及了这种存储容量。早期的计算机如Intel的8088、8086是可以通过4位访问的哦,那时叫做半字节。 也许你用过8位单片机,但是你听说过4位单片机吗?哈哈!5. 进制我们最熟知的是十进制,从小接触的数字和算术计算用的都是十进制。然后学到信息计算机相关知识了,就开始接触或认识二进制。上面也提到了,阴阳八卦用的就是二进制。其实二进制普遍存于大自然中,也存在于生活中。 那么除了十进制、二进制,还有哪些进制呢?八进制、十六进制等等。

这些都是程序员熟悉的。 讲了这么多,什么是进制? 进制就是进位计数制,是人为定义的带进位的计数方法。十进制是逢十进一,二进制是逢二进一,十六进制是逢十六进一,那么X进制就是逢X进一了。 进制在数字上怎么表示? 也很简单,进制小于10的,用阿拉伯数字就很容易表达出来。

如:十进制:0, 1, 2, 3,4, 5, 6, 7, 8,9,10。这个10就是逢十进一变成两位数了。八进制:0, 1,2,3,4,5, 6,7,10。这个10就是逢八进一变成两位数了,按数值计算,这个八进制的10相当于十进制的9,是表达形式变了。二进制:0, 1,10。这个10就是逢二进一变成两位数了。 那么进制大于10的呢,如十六进制怎么表示?十六进制:0, 1,2,3,4,5, 6,7,8,9,A, B, C, D, E, F, 10。这个10就是逢十六进一变成两位数了。因为阿拉伯数字没有单一数字表达的10, 11, 12, 13, 14, 15,所以采用A, B, C, D, E, F来表达,只是表达形式不一样而已。 上面我们提到了个BCD码,啥是BCD码?十六进制又是什么鬼?

十进制 二进制 八进制 十六进制
0 0 0 0
1 1 1 1
2 10 2 2
3 11 3 3
4 100 4 4
5 101 5 5
6 110 6 6
7 111 7 7
8 1000 10 8
9 1001 11 9
10 1010 12 A
11 1011 13 B
12 1100 14 C
13 1101 15 D
14 1110 16 E
15 1111 17 F
16 10000 100 10

于是,可以约定,这些进制的表达方式,不然10到底是几进制的表达的数字是多少都不知道。 二进制用B(Binary)来表达,如1001B,但是编程语言中最小的单位是Byte,所以没有约定表达二进制的方法。 八进制用O(Oct)来表达,写成123O?这个O和0写法相近,会让人误解的,好困惑哦。在编程语言中,通常在数字前面加个0,即0123表示八进制的123,注意跟十进制的123不相等哦。 十六进制用H(Hex)表示,如2BH,编程语言中用0x开头来表示,如0x2B。 这里为什么提二进制、十进制、八进制和十六进制呢?

十进制刚才说了,是最常见接触最多的进制,而二进制是计算机的基本进制,但计算机通常以8 Bit的Byte来作为基本单位,那么一个Byte的刚好可以表示16个数,所以,十六进制是非常常用的,而八进制就是对于半个Byte了。 好了,问题来了,除了这些常见了,有没有三进制呢,十七进制呢?答案是有的,随你喜欢,多少都行。 Python中有个int的内置函数,可以转换各种进制。以下看看100这个数在各个进制中对应的十进制数值是多少。

>>> int('100', 2)4>>> int('100', 3)9>>> int('100', 4)16>>> int('100', 7)49>>> int('100', 8)64>>> int('100', 10)100>>> int('100', 16)256>>> int('100', 17)289>>> int('100', 35)1225>>> int('100', 36)1296>>> int('100', 55)Traceback (most recent call last): File "", line 1, in ValueError: int() base must be >= 2 and <= 36这个内置函数int只能算大于等于2并小于等于36进制的数。6. BCD码上文提到了个BCD码,这是什么鬼?

BCD码(Binary-Coded Decimal‎),用4位二进制数来表示1位十进制数中的0~9这10个数码,是一种二进制的数字编码形式,用二进制编码的十进制代码。

如果不懂这个概念,要认真读几次上面这段话。简单地理解为,1位十进制数码用4位二进制数来表示,但根据这1位十进制数码和4位二进制数的对应关系(或者表达关系)不一样而有不同的形式,如8421码、2421码、5421码和余3码、余3循环码、格雷码,其中前面三种是有权码,后面三种是无权码。

有权码,自然二进制代码是按照二进制代码各位权值大小,以自然向下加一,逢二进一的方式来表示数值的大小所生成的代码。

显然,n位自然二进制代码共有2^n种状态取值组合,由于代码中各位的位权值分别为2^3,2^2,2^1,2^0,即8421,所以也称为8421码。这样每位二进制码元都有确定位权值的编码,称为有权码,属于恒权代码。相应的,没有确定位权值的编码叫无权码,也叫非恒权代码。

百度百科——有权码

8421码8421 BCD码是最基本和最常用的BCD码,0~9的8421码与4位自然二进制形式完全一样,即用0000~1001分别代表它所对应的十进制数。要计算一个多位的8421码可以每位单独拆分出来,并算出对应的二进制码(不足四位前面补0),然后拼起来即可。举个例子: 8421码:235,拆分出来是2、3、5,分别对应二进制是0010、0011、1001,拼起来是0010 0011 1001。

5421和2421

5421 BCD码和2421 BCD码,这两种有权BCD码中,有的十进制数码存在两种加权方法,例如,5421 BCD码中的数码5,既可以用1000表示,也可以用0101表示;2421 BCD码中的数码6,既可以用1100表示, 也可以用0110表示。这说明5421 BCD码和2421 BCD码的编码方案都不是惟一的。 下面列举8421码、2421码、5421码和一位十进制数的对照关系。

十进制数 8421码 5421码 2421码
0 0000 0000 0000
1 0001 0001 0001
2 0010 0010 0010
3 0011 0011 0011
4 0100 0100 0100
5 0101 1000 1011
6 0110 1001 1100
7 0111 1010 1101
8 1000 1011 1110
9 1001 1100 1111

余3码和余3循环码余3码实很简单,是8421 BCD码的每个码组加3(0011)形成的。为什么有余3码这个东西呢,实际上其常用于BCD码的运算电路中。 余3循环码实际上是变权码,每一位的1并不代表固定的数值,十进制数的余3循环码就是取4位格雷码中的十个代码组成。 那么什么是格雷码?格雷码格雷码(Gray Code),其由很多曾用名,如格莱码、戈莱码、循环码、反射二进制码、最小差错码等。 格雷码有很多种表现形式

为什么要用格雷码呢?

格雷码是一种具有反射特性和循环特性的单步自补码,其循环和单步特性消除了随机取数时出现重大错误的可能,其反射和自补特性使得对其进行求反操作也非常方便,所以,格雷码属于一种可靠性编码,是一种错误最小化的编码方式,因此格雷码在通信和测量技术中得到广泛应用。

格雷码属于可靠性编码,是一种错误最小化的编码方式。因为,虽然自然二进制码可以直接由数/模转换器转换成模拟信号,但在某些情况,例如从十进制的3转换为4时二进制码的每一位都要变,能使数字电路产生很大的尖峰电流脉冲。

格雷码Gray Code详解(https://www.cnblogs.com/zhuruibi/p/8988044.html)

怎么计算格雷码? 二进制码→格雷码(编码): 此方法从对应的n位二进制码字中直接得到n位格雷码码字,步骤如下:

对n位二进制的码字,从右到左,以0到n-1编号

如果二进制码字的第i位和i+1位相同,则对应的格雷码的第i位为0,否则为1(当i+1=n时,二进制码字的第n位被认为是0,即第n-1位不变)

责任编辑:xj

原文标题:古人哲学居然与计算机信息编码不谋而合?

文章出处:【微信公众号:嵌入式ARM】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 二进制
    +关注

    关注

    2

    文章

    705

    浏览量

    41248
  • 编程
    +关注

    关注

    88

    文章

    3440

    浏览量

    92385
  • 信息编码
    +关注

    关注

    0

    文章

    9

    浏览量

    9219

原文标题:古人哲学居然与计算机信息编码不谋而合?

文章出处:【微信号:gh_c472c2199c88,微信公众号:嵌入式微处理器】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【量子计算机重构未来 | 阅读体验】+ 了解量子叠加原理

    中的处理器(CPU)就是由许多逻辑门电路组成的。 量子计算机与电子计算机最大的区别在于它们使用量子比特(qubit)不是电子比特(bit)来表示信息。在量子
    发表于 03-13 17:19

    【量子计算机重构未来 | 阅读体验】+量子计算机的原理究竟是什么以及有哪些应用

    计算方法的区别传统方法是,按照不走枚举所有情况,量子计算是一次处理所有情况,是一步到位。但是这里又有疑惑了,量子计算如何实现的一步到位呢, 这里引入了量子比特和传统
    发表于 03-11 12:50

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    欣喜收到《量子计算机——重构未来》一书,感谢电子发烧友论坛提供了一个让我了解量子计算机的机会! 自己对电子计算机有点了解,但对量子计算机真是一无所知,只是听说过量子纠缠、超快的运算速
    发表于 03-05 17:37

    量子计算机 未来希望

    自己从事语音识别产品设计开发,量子技术和量子计算机必将在自然语言处理方面实现重大突破,想通过此书学习量子计算技术,储备知识,谢谢!
    发表于 02-01 12:51

    量子计算机的作用有哪些

    量子计算机是一种基于量子力学原理的新型计算机,它利用量子比特(qubit)进行信息处理,具有传统计算机无法比拟的计算能力和潜力。量子
    的头像 发表于 12-30 14:32 675次阅读

    工业计算机的应用

    工业计算机在半导体设备上的应用,具体在哪一方面。比如说图像处理使用什么样的计算机,工业控制使用哪一方面的计算机
    发表于 09-12 14:19

    计算机组成与设计

    计算机组成与设计 计算机组成与设计是计算机科学中最基础的课程之一,它主要阐述了计算机的组成原理和设计方法。随着计算机技术的快速发展,
    的头像 发表于 08-17 12:37 930次阅读

    人工智能和计算机的区别

    人工智能和计算机都是现代技术领域中重要的概念,是计算机科学和信息技术中的两个重要领域。虽然这两个概念都与计算机有关,但它们之间具有不同的含义
    的头像 发表于 08-09 08:09 1533次阅读
    人工智能和<b class='flag-5'>计算机</b>的区别

    人工智能和计算机的区别

     人工智能和计算机都是现代技术领域中重要的概念,是计算机科学和信息技术中的两个重要领域。虽然这两个概念都与计算机有关,但它们之间具有不同的含
    的头像 发表于 08-06 16:42 7119次阅读

    通俗点什么叫量子 量子计算机原理及用途

     量子计算机是一种基于量子力学原理设计的计算机,它使用量子比特(qubit)而非传统计算机中的比特来存储和处理信息
    发表于 06-14 17:34 2462次阅读

    计算机网络功能

    计算机网络的功能主要目的是实现计算机之间的资源共享、网络通信和对计算机的集中管理。计算机网络是指将多台计算机通过通信线路互相连接起来,实现
    发表于 05-10 16:21 941次阅读

    计算机通信的基本特点

    计算机通信是一种以数据通信形式出现,在计算机计算机之间或计算机与终端设备之间进行信息传递的方式。它是
    发表于 05-09 17:07 784次阅读

    计算机通信的特点

    计算机网络通信的一个显著特点是“间歇性、突发性”;网络通信是通过网络将各个孤立的设备进行连接,通过信息交换实现人与人,人与计算机计算机计算机
    发表于 05-09 16:58 707次阅读

    计算机通信的规则

    计算机通信的规则主要是网络协议,它定义了计算机如何在通信中进行数据交换和通信的规范和格式。现代计算机通信中使用最广泛的协议是TCP/IP协议。
    发表于 05-09 16:51 1446次阅读

    计算机通信的简单概念

    计算机通信指的是在两个或多个计算机之间进行数据传输和信息交换的过程。计算机通信可以分为点对点通信和广播通信两种模式。在点对点通信模式下,数据从一个
    发表于 05-09 16:48 1209次阅读