0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浮点数在内存中的存储

Q4MP_gh_c472c21 来源:C语言与CPP编程 2020-09-20 10:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1 前言

我们在学习 C语言时,通常认为浮点数和小数是等价的,并没有严格区分它们的概念,这也并没有影响到我们的学习,原因就是浮点数和小数是绑定在一起的,只有小数才使用浮点格式来存储。

其实,整数和小数可以都使用定点格式来存储,也可以都使用浮点格式来存储,但实际情况却是,C 语言使用定点格式存储整数,使用浮点格式存储小数,这是在 “数值范围” 和 “数值精度” 两项重要指标之间追求平衡的结果。

2 什么是浮点数?

浮点型简单讲就是实数的意思。浮点数在计算机中用以近似表示任意某个实数。具体的说,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是 2)的整数次幂得到,这种表示方法类似于基数为 10 的科学记数法。

3 浮点数在内存中的存储

首先明确一点,无论是整型、浮点型还是字符等等数据类型在计算机底层都是以二进制的方式存储的。

浮点数在内存中的存储和整数不同,因为整数都可以转换为一一对应的二进制数据。而浮点数的存储是由符号位 (sign) + 指数位 (exponent) + 小数位 (fraction) 组成。

类型符号位指数尾数

int 和 float 同样占据四个字节的内存,但是 float 所能表示的最大值比 int 大得多,其根本原因是浮点数在内存中是以指数的方式存储。

浮点数转换到内存中存储的步骤分为如下三步:

将浮点数转换成二进制

用科学计数法表示二进制浮点数

计算指数偏移后的值

对于第3点:计算指数时需要加上偏移量(后面有介绍为什么使用偏移量),而偏移量的值与浮点数的类型有关( float 偏移量值为 127 ,double 偏移量值为 1023)。比方对于指数 6,float 与 double 类型偏移后的值分别为:

float : 127 + 6 = 133

double:1023 + 6 = 1029

4 实例

浮点数19.625用float是如何存储的:

将浮点数转换成二进制:10011.101(将 19.625 整数部分采用除 2 取余,小数部分采用乘 2 取整法);

用科学计数法表示二进制浮点数:1.0011101*2^4;

计算指数偏移后的值:127 + 4 = 131 (10000011);

拼接综上所述,float 类型的 19.625 在内存中的值为:0 - 10000011 - 001 1101 0000 0000 0000 0000。

5 float与double范围和精度

范围

float和double的范围是由指数的位数来决定的。(因为表示的时候都是1.x * 2^Y的形式,所以忽略了1.x的效果,直接取指数表示浮点数的范围)

float:

1bit(符号位) 8bits(指数位) 23bits(尾数位)

double:

1bit(符号位) 11bits(指数位) 52bits(尾数位)

于是,float的指数范围为-127~+128,而double的指数范围为-1023~+1024,并且指数位是按补码的形式来划分的。

其中负指数决定了浮点数所能表达的绝对值最小的非零数;而正指数决定了浮点数所能表达的绝对值最大的数,也即决定了浮点数的取值范围。

float的范围为-2^128 ~ +2^128,也即-3.40E+38 ~ +3.40E+38;

double的范围为-2^1024 ~ +2^1024,也即-1.79E+308 ~ +1.79E+308。

精度

float和double的精度是由尾数的位数来决定的,尾数越多能表示的小数点后面有效数字就越多,因此精度就越高。浮点数在内存中是按科学计数法来存储的,其整数部分始终是一个隐含着的“1”,由于它是不变的,故不能对精度造成影响。

float:2^23 = 8388608,一共七位,这意味着最多能有 7 位有效数字,但绝对能保证的为 6 位,也即float的精度为 6~7 位有效数字;

double:2^52 = 4503599627370496,一共 16 位,同理,double的精度为 15~16 位。

6 解剖:为什么要用偏移量的方式来计算指数?

如果不采用偏移量的方式:

8 位 2 进制数表示的有符号数范围有两个区间:0000 0000~0111 1111和1000 0000~1111 1111,分别为0~+127和-127~0。

大家看到这里的问题了吧,有两个 0 ,一个正 0 和一个负 0。

如果采用偏移量的方式:

127 转化为二进制是:0111 1111

那么

当我们要表示 -127,则有127-127即0111 1111 - 0111 1111 = 0000 0000

当我们要表示 -126,则有127-126即0111 1111 - 0111 1110 = 0000 0001

当我们要表示 -2,则有127-2即0111 1111 - 0000 0010 = 0111 1101

当我们要表示 -1,则有127-1即0111 1111 - 0000 0001 = 0111 1110

当我们要表示 0,则有0+127即0000 0000 + 0111 1111 = 0111 1111

当我们要表示 1,则有1+127即0000 0001 + 0111 1111 = 1000 0000

当我们要表示 2,则有1+127即0000 0010 + 0111 1111 = 1000 0001

当我们要表示128,则有128+127即1000 0000 + 0111 1111 = 1111 1111

由上面的例子,我们可以得出规律,采用移位存储技术,我们可以使用 8 位二进制来表示从-127~+128共计 127 个负数+零(0)+ 128 个正数总共 256 个数,看来使用移位存储既没有 +0 和 -0 的问题,又能充分使用新生成的8位二进制数最大限度的表示单精度浮点数的幂指数,是非常合理的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 二进制
    +关注

    关注

    2

    文章

    809

    浏览量

    42799
  • C语言
    +关注

    关注

    183

    文章

    7642

    浏览量

    144612
  • 浮点数
    +关注

    关注

    0

    文章

    62

    浏览量

    16354

原文标题:浮点数的秘密

文章出处:【微信号:gh_c472c2199c88,微信公众号:嵌入式微处理器】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用VScode的PIO开发GD32VF103,但是串口无法打印浮点数怎么解决?

    我最近在使用VScode的PIO开发GD32V,使用的是longan的模板,但是我将串口输出重定义到printf函数,发现无法使用%f输出浮点数,想问问应该怎么配置,我看到的一种说法是在
    发表于 11-06 06:49

    点数表示实数的方法以及定点数在硬件上的运算验证

    ’b110_0000_0000_0000_0000_0000时,表示为十进制小数0.75( 2^(-1)+2^(-2) )。E是指数,为了能够表示负指数、IEEE754标准规定浮点数的实际指数为E-127。从32位浮点数编码结
    发表于 10-28 08:13

    E203添加浮点数方法:译码和派遣模块设计

    的数据来自于整数寄存器还是浮点数寄存器。 派遣模块与其他模块的连接方式如下图: 左图只选取了有代表性的信号展示出来,即只展示了源操作数和写寄存器的地址是如何在这些模块传递的。右图是 dispatch
    发表于 10-24 13:54

    浮点指令(三)

    Convert to Single from Double). R-type, RV32D and RV64D. 把寄存器 f[rs1]的双精度浮点数转化为单精度浮点数,再写入 f[rd]
    发表于 10-24 13:38

    E203添加浮点数方法:FPU控制逻辑

    指令的全部运算都集中在了 FPU 当中。对于指令周期的设计,笔者将除了除法、开方和浮点数存取指令以外的指令都设计为单周期指令(实际为2周期,原因在于 OITF 的原理),这也是为什么原 E203 代码
    发表于 10-24 13:28

    蜂鸟E203扩展浮点指令设计(2)

    fmv.w.x rd, rs1 • fmv.x.w 指令将通用浮点寄存器 rs1的单精度浮点数读出,然后写回通用整数寄存rd。 • fmv.w.x 指令将通用整数寄存器 rs1
    发表于 10-24 11:56

    蜂鸟E203扩展浮点指令设计(1)

    )相加所得。 • flw 指令从存储读回一个单精度浮点数,写回寄存器 rd 。 • fsw 指令将操作数寄存器 rs2 的单精度
    发表于 10-24 10:00

    浮点数是如何实现开平方运算的

    1位。 ###### 浮点数的平方根运算步骤为:浮点数的平方根运算步骤为: 1.从指数减去偏置分量,求绝对差。 2.将结果右移一位,然后计算最后的指数。 3.找到尾数的平方根,考虑隐藏的部分
    发表于 10-24 08:42

    浮点数指令添加——长指令写回仲裁

    浮点数指令添加——长指令写回仲裁 在增加浮点数指令时,我们会遇到一些需要写回寄存器的指令,此时就需要对原先的写回功能模块做更改。 写回功能主要集中在这两个模块
    发表于 10-24 06:07

    risc-v浮点运算单元的使用及其设计考虑

    的应用。 在RISC-V浮点运算单元分为单精度浮点数(32位)和双精度浮点数(64位),通常包括以下几种基本功能: 加法器/减法器:用于执行浮点
    发表于 10-21 14:46

    大彩讲堂:VisualHMI-LUA教程-获取设置单精度浮点数函数的应用

    软件开发各种协议对浮点数数据进行获取和赋值处理。get_float(vtype,addr)读取单精度浮点数(float)寄存器,返回有符号单精度浮点数·vtype:数
    的头像 发表于 10-16 00:00 1236次阅读
    大彩讲堂:VisualHMI-LUA教程-获取设置单精度<b class='flag-5'>浮点数</b>函数的应用

    PRINTF函数无法打印出浮点数内容是为什么?

    1、MCXN947低功耗adc,历程中使用官方提供的PRINTF无法打印出浮点数内容。 2、同样在mcuxpresso ide 也不可以打印浮点数,这是为什么呢? 3、使用的历程是lpadc历程。
    发表于 03-20 08:06

    labview数据类型与PLC 数据类型之间的转换(来自于写入浮点数到汇川 PLC的数据转换关键的修改)

    为32位无符号整型U32 2、将U32拆分为两个U16,分高低位写入PLC 3、在PLC,将低位寄存器设置为浮点数数据类型 4、结果:PLC中一直无法正确转换。 原因及解决方法: 1、labview
    发表于 02-24 19:01

    西门子TIA Portal如何比较两个浮点数相等

    概述: 由于浮点数的定义规则,导致浮点数不能通过二进制精确表示,所以在浮点数计算过程,会出现两个值一样的浮点数进行比较相等计算时结果并不相
    的头像 发表于 01-06 10:07 1161次阅读
    西门子TIA Portal如何比较两个<b class='flag-5'>浮点数</b>相等

    ADS1282采集到的数据传到PC上应该怎么转为浮点数

    我最近在用ADS1282,采集到的数据传到PC上应该怎么转为浮点数?比如说通过串口调试助手收到一个采样点的数据为 FF FF 9D 17,它的真实浮点数是多少呢?我知道ADC是以补码形式存的,是要将数据倒转为17 9D FF FF,再与上0xFF,再float()吗?还
    发表于 12-13 06:23