0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

剖析提升字符串格式化效率的小技巧

FPGA之家 来源: IOT物联网小镇 作者:道哥 2021-04-30 13:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一、前言

嵌入式项目开发中,字符串格式化是很常见的操作,我们一般都会使用 C 库中的 sprintf 系列函数来完成格式化。

从功能上来说,这是没有问题的,但是在一些时间关键场合,字符串的格式化效率会对整个系统产生显著的影响。

例如:在一个日志系统中,吞吐率是一个重要的性能指标。每个功能模块都产生了大量的日志信息,日志系统需要把时间戳添加到每条日志的头部,此时字符串的格式化效率就比较关键了。

天下武功,唯快不破!

这篇文章就专门来聊一聊把数字格式化成字符串,可以有什么更好的方法。也许技术含量不高,但是很实用!

二、最简单的格式化

#include #include #include #include

int main(){ char buff[32] = { 0 }; sprintf(buff, "%ld", LONG_MAX); printf("buff = %s ", buff);}

其中,LONG_MAX 表示 long 型数值的最大值。代码在眨眼功夫之间就执行结束了,但是如果是一百万、一千万次呢?

三、测试1:手动格式化数字

1. 获取系统时间戳函数

我的测试环境是:在 Win10 中通过 VirtualBox,安装了 Ubuntu16.04 虚拟机,使用系统自带的 gcc 编译器。

为了测试代码执行的耗时,我们写一个简单的函数:获取系统的时间戳,通过计算时间差值来看一下代码的执行速度。

// 获取系统时间戳long long getSysTimestamp(){ struct timeval tv; gettimeofday(&tv, 0); long long ts = (long long)tv.tv_sec * 1000000 + tv.tv_usec; return ts; }

2. 实现格式化数字的函数

// buff: 格式化之后字符串存储地址;// value: 待格式化的数字void Long2String(char *buff, long value){ long tmp; char tmpBuf[32] = { 0 }; // p 指向临时数组的最后一个位置 char *p = &tmpBuf[sizeof(tmpBuf) - 1]; while (value != 0) { tmp = value / 10; // 把一个数字转成 ASCII 码,放到 p 指向的位置。 // 然后 p 往前移动一个位置。 *--p = (char)('0' + (value - tmp * 10)); value = tmp; } // 把临时数组中的每个字符,复制到 buff 中。 while (*p) *buff++ = *p++;}

这个函数的过程很简单,从数字的后面开始,把每一个数字转成 ASCII 码,放到一个临时数组中(也是从后往前放),最后统一复制到形参指针 buff 指向的空间。

3. 测试代码

int main(){ printf("long size = %d, LONG_MAX = %ld ", sizeof(long), LONG_MAX); // 测试 1000 万次 int total = 1000 * 10000; char buff1[32] = { 0 }; char buff2[32] = { 0 }; // 测试 sprintf long long start1 = getSysTimestamp(); for (int i = 0; i < total; ++i) sprintf(buff1, "%ld", LONG_MAX); printf("sprintf ellapse: %lld us ", getSysTimestamp() - start1); // 测试 Long2String long long start2 = getSysTimestamp(); for (int i = 0; i < total; ++i) Long2String(buff2, LONG_MAX); printf("Long2String ellapse: %lld us ", getSysTimestamp() - start2); return 0;}

4. 执行结果对比

long size = 4, LONG_MAX = 2147483647sprintf ellapse: 1675761 us Long2String ellapse: 527728 us

也就是说:把一个 long 型数字格式化成字符串:

使用 sprintf 库函数,耗时 1675761 us;

使用自己写的 Long2String 函数,耗时 527728 us;

大概是 3 倍左右的差距。当然,在你的电脑上可能会得到不同的结果,这与系统的负载等有关系,可以多测试几次。

四、测试2:混合格式化字符串和数字

看起来使用自己写的 Long2String 函数执行速度更快一些,但是它有一个弊端,就是只能格式化数字。

如果我们需要把字符串和数字一起格式化成一个字符串,应该如何处理?

如果使用 sprintf 库函数,那非常方便:

sprintf(buff, "%s%d", "hello", 123456);

如果继续使用 Long2String 函数,那么就要分步来格式化,例如:

// 拆成 2 个步骤sprintf(buff, "%s", "hello");Long2String(buff + strlen(buff), 123456);

以上两种方式都能达到目的,那执行效率如何呢?继续测试:

int main(){ printf("long size = %d, LONG_MAX = %ld ", sizeof(long), LONG_MAX); // 测试 1000 万 次 const char *prefix = "ZhangSan has money: "; int total = 1000 * 10000; char buff1[32] = { 0 }; char buff2[32] = { 0 }; // 测试 sprintf long long start1 = getSysTimestamp(); for (int i = 0; i < total; ++i) sprintf(buff1, "%s%ld", prefix, LONG_MAX); printf("sprintf ellapse: %lld us ", getSysTimestamp() - start1); // 测试 Long2String long long start2 = getSysTimestamp(); for (int i = 0; i < total; ++i) { sprintf(buff2, "%s", prefix); Long2String(buff2 + strlen(prefix), LONG_MAX); } printf("Long2String ellapse: %lld us ", getSysTimestamp() - start2); return 0;}

执行结果对比:

long size = 4, LONG_MAX = 2147483647sprintf ellapse: 2477686 us Long2String ellapse: 816119 us

执行速度仍然是 3 倍左右的差距。就是说,即使拆分成多个步骤来执行,使用 Long2String 函数也会更快一些!

五、sprintf 的实现机制

sprintf 函数家族中,存在着一系列的函数,其底层是通过可变参数来实现的。之前写过一篇文章一个printf(结构体指针)引发的血案,其中的第四部分,使用图片详细描述了可变参数的实现原理,摘抄如下。

1. 可变参数的几个宏定义

typedef char * va_list; #define va_start _crt_va_start#define va_arg _crt_va_arg #define va_end _crt_va_end #define _crt_va_start(ap,v) ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) ) #define _crt_va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) #define _crt_va_end(ap) ( ap = (va_list)0 )

注意:va_list 就是一个 char* 型指针。

2. 可变参数的处理过程

我们以刚才的示例 my_printf_int 函数为例,重新贴一下:

void my_printf_int(int num, ...) // step1{ int i, val; va_list arg; va_start(arg, num); // step2 for(i = 0; i < num; i++) { val = va_arg(arg, int); // step3 printf("%d ", val); } va_end(arg); // step4 printf(" ");} int main(){ int a = 1, b = 2, c = 3; my_printf_int(3, a, b, c);}

Step1: 函数调用时

C语言中函数调用时,参数是从右到左、逐个压入到栈中的,因此在进入 my_printf_int 的函数体中时,栈中的布局如下:

e34592a8-a95f-11eb-9728-12bb97331649.png

Step2: 执行 va_start

va_start(arg, num);

把上面这语句,带入下面这宏定义:

#define_crt_va_start(ap,v)(ap=(va_list)_ADDRESSOF(v)+_INTSIZEOF(v))
宏扩展之后得到:

arg = (char *)num + sizeof(num);

结合下面的图来分析一下:首先通过 _ADDRESSOF 得到 num 的地址 0x01020300,然后强转成 char* 类型,再然后加上 num 占据的字节数(4个字节),得到地址 0x01020304,最后把这个地址赋值给 arg,因此 arg 这个指针就指向了栈中数字 1 的那个地址,也就是第一个参数,如下图所示:

e36fc1d6-a95f-11eb-9728-12bb97331649.png
Step3: 执行 va_arg

val = va_arg(arg, int);

把上面这语句,带入下面这宏定义:

#define_crt_va_arg(ap,t)(*(t*)((ap+=_INTSIZEOF(t))-_INTSIZEOF(t)))
宏扩展之后得到:

val = ( *(int *)((arg += _INTSIZEOF(int)) - _INTSIZEOF(int)) )

结合下面的图来分析一下:先把 arg 自增 int 型数据的大小(4个字节),使得 arg = 0x01020308;然后再把这个地址(0x01020308)减去4个字节,得到的地址(0x01020304)里的这个值,强转成 int 型,赋值给 val,如下图所示:

e3be21f0-a95f-11eb-9728-12bb97331649.png

简单理解,其实也就是:得到当前 arg 指向的 int 数据,然后把 arg 指向位于高地址处的下一个参数位置。

va_arg 可以反复调用,直到获取栈中所有的函数传入的参数。

Step4: 执行 va_end

va_end(arg);

把上面这语句,带入下面这宏定义:

#define _crt_va_end(ap) ( ap = (va_list)0 )

宏扩展之后得到:

arg = (char *)0;

这就好理解了,直接把指针 arg 设置为空。因为栈中的所有动态参数被提取后,arg 的值为 0x01020310(最后一个参数的上一个地址),如果不设置为 NULL 的话,下面使用的话就得到未知的结果,为了防止误操作,需要设置为NULL。

六、总结

这篇文章描述的格式化方法灵活性不太好,也许存在一定的局限性。但是在一些关键场景下,能明显提高执行效率。

如果文中演示代码有什么问题,或者你有更好的方法,欢迎分享给大家!

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • C语言
    +关注

    关注

    183

    文章

    7642

    浏览量

    144696
  • 函数
    +关注

    关注

    3

    文章

    4408

    浏览量

    66905
  • 代码
    +关注

    关注

    30

    文章

    4945

    浏览量

    73212

原文标题:天下武功,唯快不破:提升字符串格式化效率的小技巧

文章出处:【微信号:zhuyandz,微信公众号:FPGA之家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    字符串关联数字变量如何使用?我们的地址都是16位数据,可以使用16位数字变量显示字符串吗?

    字符串关联数字变量如何使用?我们的地址都是16位数据,可以使用16位数字变量显示字符串吗?
    发表于 12-15 08:24

    飞凌嵌入式ElfBoard-标准IO接口之格式化输入

    格式化输入用于从不同输入源中获取数据并根据格式化字符串format转换为对应的格式代码并存储在对应的类型中。格式化输入函数:即按特定的
    发表于 11-12 08:35

    飞凌嵌入式ElfBoard-标准IO接口之格式化输出

    ( const char *format, ... );3)参数format:表示C 字符串,包含了要打印的格式化数据。...:表示附加可变参数,根据不同的 format 字符串,函数可能需要一系列的附加
    发表于 11-11 08:43

    求助,关于使用sprintf函数格式化浮点数的安全问题求解

    (); return n; } 经过测试,未关闭调度之前,线程被打断再恢复之后,格式化的数据可能是一些乱码,甚至程序跑飞了.如果使用这个字符串很容易死机,主要是data abort异常.加入关闭调度之后,能够得到
    发表于 10-09 08:22

    labview如何生成一个带字符串返回的dll

    labview如何生成一个dll,如下图,要求一个输入,类型是字符串,返回类型也是字符串
    发表于 08-28 23:20

    在Python中字符串逆序有几种方式,代码是什么

    对于一个给定的字符串,逆序输出,这个任务对于python来说是一种很简单的操作,毕竟强大的列表和字符串处理的一些列函数足以应付这些问题 了,今天总结了一下python中对于字符串的逆序输出的几种常用
    的头像 发表于 08-28 14:44 797次阅读

    harmony-utils之StrUtil,字符串工具类

    harmony-utils之StrUtil,字符串工具类 harmony-utils 简介与说明 [harmony-utils] 一款功能丰富且极易上手的HarmonyOS工具库,借助众多实用工具类
    的头像 发表于 07-03 11:32 400次阅读

    FB08 1对7 U盘拷贝格式化机——高效数据复制工具

    FB08 1对7 U盘拷贝格式化机,采用台湾捷美原厂工艺,具备25MB/s的高速拷贝速度和8口同步复制功能,支持加密U盘免解密拷贝及USB 2.0/3.0设备。支持FAT16/FAT32格式化,兼容
    的头像 发表于 02-08 13:51 800次阅读
    FB08 1对7 U盘拷贝<b class='flag-5'>格式化</b>机——高效数据复制工具

    FB16 1对15 U盘拷贝格式化机——高效数据复制工具

    FB16 1对15 U盘拷贝格式化机,采用台湾捷美原厂工艺,具备25MB/s高速拷贝速度和16口同步复制功能,支持加密U盘免解密拷贝及USB 2.0/3.0设备。支持FAT16/FAT32格式化
    的头像 发表于 02-07 17:36 780次阅读
    FB16 1对15 U盘拷贝<b class='flag-5'>格式化</b>机——高效数据复制工具

    字符串在数据库中的存储方式

    固定长度的空间,适合存储长度变化不大的字符串。 可变长度字符串 :如VARCHAR类型,它根据字符串的实际长度动态分配空间,适合存储长度变化较大的字符串。 文本类型 :如TEXT类型,
    的头像 发表于 01-07 15:41 1270次阅读

    字符串在编程中的应用实例

    字符串在编程中有着广泛的应用,它们被用于表示文本数据、处理用户输入、构建动态内容等。以下是一些字符串在编程中的应用实例: 1. 用户输入与输出 用户输入 :程序通常需要从用户那里获取输入,这些输入通
    的头像 发表于 01-07 15:33 1152次阅读

    字符串字符数组的区别

    在编程语言中,字符串字符数组是两种基本的数据结构,它们都用于存储和处理文本数据。尽管它们在功能上有一定的重叠,但在内部表示、操作方式和使用场景上存在显著差异。 1. 内部表示 字符串 字符串
    的头像 发表于 01-07 15:29 1711次阅读

    字符串反转的实现方式

    在编程中,字符串反转是一个基础而重要的操作,它涉及到将一个字符串中的字符顺序颠倒过来。这个操作在多种编程语言中都有不同的实现方式,本文将探讨几种常见的字符串反转方法。 1. 递归方法
    的头像 发表于 01-07 15:27 1269次阅读

    字符串处理方法 字符串转数字的实现

    在编程中,将字符串转换为数字是一个常见的需求。不同的编程语言有不同的方法来实现这一功能。以下是一些常见编程语言中的字符串转数字的实现方法: Python 在Python中,可以使用内置的 int
    的头像 发表于 01-07 15:26 1423次阅读

    EE-347:使用Blackfin处理器将格式化打印到UART终端

    电子发烧友网站提供《EE-347:使用Blackfin处理器将格式化打印到UART终端.pdf》资料免费下载
    发表于 01-07 13:51 0次下载
    EE-347:使用Blackfin处理器将<b class='flag-5'>格式化</b>打印到UART终端