0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

protobuf怎么发现的?

科技绿洲 来源:了不起 作者:了不起 2023-09-25 11:26 次阅读

最近我们在项目中,通过使用 protobuf 格式作为存储数据的一个载体。一个不小心就给自己埋了个大坑,还是过了好久才发现。

protobuf 简介

protobuf 全名叫 Protocal buffers. 它是由 Google 研发的,一种可跨语言、可跨平台、可扩展的序列化数据的机制。类似于 XML ,但是它更小、更快、更简单。你只需要定义一次你希望的数据如何被结构化,然后你可以使用它的生成工具,生成包含一些序列化和反序列化等操作的源代码。可以轻松地从各种数据流和使用各种编程语言写入和读取结构化的数据。

proto2版本支持在JavaPython、Objective-C和C++中生成代码。使用新的proto3语言版本,你还可以使用Kotlin、Dart、Go、Ruby、PHP和C#,还有更多的语言。

怎么发现的?

在我们的新项目中,我们通过使用 protobuf 格式来存储项目运行的数据。这样我们在调试过程中,可能根据现场录制的数据进行本地的调试。

message ImageData {
// ms
int64 timestamp = 1;
int32 id = 2;
Data mat = 3;
}

message PointCloud {
// ms
int64 timestamp = 1;
int32 id = 2;
PointData pointcloud = 3;
}

message State {
  // ms
  int64 timestamp = 1;
  string direction = 2;
}

message Sensor {
repeated PointCloud point_data = 1;
repeated ImageData image_data = 2;
repeated State vehicle_data = 3;
}

我们定义了这样一组数据, 然后存储的时候,因为Sensor 这3个数据源的帧率不一样,因此存储的时候,单个 Sensor 中其实只包含了一组数据,另外两个类型的数据并没有包含进去。

当我们只录制单个 pack 的时候,我们并没有遇到问题。直到我们觉得单个包,不能长时间录制,我们需要找一种解决方法来分割包 。

当时觉得这个一定是很简单的,我们就设定了一个包达到 500M 的时候,我们就让后面的数据存到新的包中。很顺利的写完,然后放到现场进行数据录制。录制一段时间之后,我们把包拿回来进行模拟测试我们的新程序。发现有些包的数据解析出来是有问题的。程序运行到一半会卡在那里不动。经过多次测试,发现是部分包有这个问题。

我们一开始怀疑的是,判断文件大小的方式不对,影响到了分包。因为判断文件大小的时候,会去打开文件。但是经过好几种其他的不打开文件的方式判断,从而进行分割。还是遇到了部分录制的包有问题。

这时我才怀疑到 protobuf 对存储数据会有一些特殊的要求。后来看了一些文章,了解到 protobuf 存储多组数据到一个文件需要有标志符。要不然后面从文件解析回来的时候,protobuf 因为不知道单个数据的停止符在哪里,导致数据解析出错。

到这里,这个坑出现了。我们存储了一系列的数据到单个包中,没有做任何分隔符的操作。protobuf在解析的时候,把文件中所有的内容都解析成了单个Sensor。Sensor 中包含里所有数据, protobuf 主动合并了所有存储的数据。

在这时,我才发现以前单包录制的时候,数据都是对的,那真的是我运气好。protobuf恰好解析成功了。

怎么解决呢?

既然知道 protobuf 会这么操作,那我们就只要知道 protobuf 怎么分割就行了。这个方法还真不好找,因为像我们这样使用的人太少了。中文搜索完全搜不到这一块的内容,可能大家都不会使用protobuf来存储数据吧,大家使用的方式应该都是多个服务中进行交互的场景吧。

最终通过stackoverflow上的一些回答找到了答案,从回答中得知,这个解决办法在 protobuf 3.3 的时候,才正式被合并进去。看起来这个功能真的很少用啊。

bool SerializeDelimitedToOstream(const MessageLite& message,
                                                 std::ostream* output);
bool ParseDelimitedFromZeroCopyStream(
    MessageLite* message, io::ZeroCopyInputStream* input, bool* clean_eof);

通过这一对方法,可以对文件进行按照数据流一个一个的存储读取。再也不用担心数据被合并读取。

当然通过这种方式存储的数据,不能被原来的解析方式所解析,存储的而进行格式完全变了。这种方式会先存储二进制数据的大小,再存储二进制数据。

结束语

经过一番折腾,终于搞定了这个分割的坑。使用场景可能比较小众,导致了很多资料根本找不到。靠自己看源码才发现这些问题。C++ 的源码真不好读,有很多的模板方法、模板类容易错过一些细节。最后还是看的C#的代码,才完全确认的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编程语言
    +关注

    关注

    9

    文章

    1878

    浏览量

    33153
  • 源代码
    +关注

    关注

    95

    文章

    2929

    浏览量

    66064
  • 代码
    +关注

    关注

    30

    文章

    4556

    浏览量

    66814
  • 存储数据
    +关注

    关注

    0

    文章

    73

    浏览量

    14031
收藏 人收藏

    评论

    相关推荐

    【LeMaker Guitar试用体验】8.Lemuntu系统中编译protobuf源代码和简单示例

    本帖最后由 xble 于 2016-2-17 11:42 编辑 protobuf是什么东东?http://blog.csdn.net/menuconfig/article/details
    发表于 02-17 11:42

    请教关于z-stack linux gateway 中更新protobuf-c的问题

    我下载了z-stack linux gateway 然后尝试编译到PC机去执行,按照流程,我下载了 protobuf2.6.1版本。protobuf-c1.2.1版本,并且在ubuntu上也安装
    发表于 08-09 08:11

    请问liunx gate编辑出错怎么处理?

    目标平台MTK-76281.根据手册,需要编译protobuf下载源码后,./configure --build=i386-pc-linux --host=mipsel-openwrt-linux
    发表于 08-18 07:12

    Go Protobuf资源的可读化 ,看完你就懂了

    Go Protobuf资源的可读化 ,看完你就懂了
    发表于 06-15 09:08

    利用protobuf通信原理

    一、利用protobuf通信原理最近项目中需要用到stm32与H6(移植了linux)进行数据交互,H6端是用C++编写的串口底层驱动,与stm32的串口连接并通信。-串口间的通信协议定为采用
    发表于 08-20 07:25

    什么是protobuf?怎么使用?

    什么是protobuf-c 之前的文章:《Protobuf:一种更小、更快、更高效的协议》详细介绍了protobufprotobuf-c。这里再简单提一下:Protocol Buff
    发表于 12-16 06:03

    如何去解决S5P6818交叉编译protobuf报错的问题

    /arm-cortex_a9-linux-gnueabi-g++ supports C++11 features with -h std=c++0x... noS5P6818交叉编译protobuf报错编译器不支持C++11怎么办开发板是OK6818-C,也可以使用吗
    发表于 01-06 06:39

    protobuf在STM32平台的移植使用方法

    说在前面的话 这是一篇2020年欠下的文章,一直搁置着,现在还上。之前分享了两篇关于Protobuf的笔记:Proto...
    发表于 01-11 06:26

    protobuf是什么?protobuf有什么作用支持什么数据类型?

    protobuf是google旗下的一款平台无关,语言无关,可扩展的序列化结构数据格式。所以很适合用做数据存储和作为不同应用,不同语言之间相互通信的数据交换格式,只要实现相同的协议格式即同一
    发表于 09-27 16:29 3次下载

    Dubbo 在跨语言和协议穿透性方向的探索:支持 HTTP/2 gRPC

    Dubbo 在跨语言和协议穿透性方向上的探索:支持 HTTP/2 gRPC 和 Protobuf 本文整理自刘军在 Dubbo 成都 meetup 上分享的《Dubbo 在多语言和协议穿透性方向
    发表于 12-02 23:07 3682次阅读
    Dubbo 在跨语言和协议穿透性方向的探索:支持 HTTP/2 gRPC

    深入剖析ProtoBuf原理与工程实践

    ProtoBuf 作为一种跨平台、语言无关、可扩展的序列化结构数据的方法,已广泛应用于网络数据交换及存储。随着互联网的发展,系统的异构性会愈发突出,跨语言的需求会愈加明显,同时 gRPC 也大有取代
    的头像 发表于 11-16 09:15 1272次阅读
    深入剖析<b class='flag-5'>ProtoBuf</b>原理与工程实践

    Intellij IDEA插件idea-plugin-protobuf

    ./oschina_soft/idea-plugin-protobuf.zip
    发表于 05-18 11:09 2次下载
    Intellij IDEA插件idea-plugin-<b class='flag-5'>protobuf</b>

    使用Protobuf实现客户端与服务器之间的通信协议层

    本系列是关于用Rust构建一个KV Server的系列文章,内容包括用tokio做底层异步网络通讯、使用toml文件做配置、protobuf做传输协议、内存/RockDB做数据存储、事件通知、优雅关机、并发连接限制及测量监控等。
    的头像 发表于 09-14 09:26 2106次阅读

    结构化数据:ProtoBuf试用与JSON的比较

    XML、JSON 也可以用来存储此类结构化数据,但是使用ProtoBuf表示的数据能更加高效,并且将数据压缩得更小。
    发表于 03-08 15:43 1504次阅读

    protobuf的编码和存储方式

    一、protobuf简介: 1.1 protobuf的定义: protobuf是用来干嘛的? protobuf是一种用于 对结构数据进行序列化的工具,从而实现 数据存储和交换。 (主要
    的头像 发表于 11-09 09:27 460次阅读
    <b class='flag-5'>protobuf</b>的编码和存储方式