0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI简报:内存256KB设备也能人脸检测!

RTThread物联网操作系统 来源:RTThread物联网操作系统 作者:RTThread物联网操作 2021-01-13 16:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1. 内存256KB设备也能人脸检测!微软提出用RNN代替CNN | NeurIPS 2020

88f29dbc-4421-11eb-8b86-12bb97331649.png

Github:
https://github.com/microsoft/EdgeML/blob/master/pytorch/edgeml_pytorch/graph/rnnpool.py

https://github.com/microsoft/EdgeML/tree/master/examples/pytorch/vision

Paper:
https://www.microsoft.com/en-us/research/publication/rnnpool-efficient-non-linear-pooling-for-ram-constrained-inference/

为了让更多IoT设备用上AI,在条件“简陋”的单片机上跑图像识别模型也成为一种需求。

但是图像识别对内存有较高的要求,一般搭载MCU的设备内存都不高,怎样才能解决这个问题呢?

最近,微软提出了一种RNNPool方法,甚至可在内存只有256 KB的STM32开发板上运行人脸检测模型。它可以在不损失准确度的情况下大幅降低激活图的采样率。

RNNPool在语法上等效于池化算子,可以快速减小中间图的大小。它的模型层数更少,对内存要求更低,可以在内存受限的小型设备上分析图像。

RNNPool由两个学习递归神经网络(RNN)组成,它们以每个模块为单个向量,在水平和垂直方向上扫过激活图的每个模块。

8938ff28-4421-11eb-8b86-12bb97331649.gif

RNNPool获取一个激活图的模块并将其汇总为1×1体素,然后逐步执行下采样步骤。RNNPool可以支持8×8,甚至16×16的模块大小,并且可以以步长s = 4或s = 8采样,而不会显著降低精度。

2. 1瓦功耗,5GHz频率:全球最快Risc-V芯片出世,效率超越苹果M1

根据全球半导体行业知名媒体 EE Times 的报道,前些天,一家位于加州森尼维尔的小型电子设计公司 Micro Magic 宣称:他们设计、生产出了全世界最快的 64 位 RISC-V 内核,比苹果的 M1 芯片和 Arm Cortex-A9 表现还要出色。

Micro Magic 的声明中提到,这款原型 CPU 在 1.1v 电压下可以达到 5GHz 的时钟速度,远高于运行速度为 3.2GHz 的英特尔 Xeon 服务器芯片 E7,CoreMarks 跑分达到 13000 分。而 1.1 伏时,该芯片只需要消耗 1 瓦的功率,不到英特尔 Xeon 功率的 1%。此外,单个 Micro Magic 核心在 0.8V 下可以达到 4.25GHz,CoreMarks 跑分达到 11000 分,但消耗的功率仅为 200mW。

这款 RISC-V 芯片的速度和能效也超过了 Exynos 4。Exynos 4 是三星电子为其智能手机生产的顶级部件,基于 ARM Holdings Plc 提供的计算核心,是英特尔的主要竞争对手。

这款芯片不仅在低功耗下速度更快,在基准得分上也赶超英特尔和三星的芯片。在 CoreMark 基准测试中,这款 RISC-V 芯片的得分为 13000 分,是基于 ARM 的 Exynos 单核性能得分的两倍多。虽然英特尔 Xeon 名义上单核性能更高,达到 26009 分,但 Xeon 需要更多线程,120 个线程才能达到上述结果。

图灵奖获得者,计算机体系结构先驱 David Patterson:「这真是太神奇了。」

3. VS Code竟然能约会!找对象不看脸,看编程水平

8a4af678-4421-11eb-8b86-12bb97331649.gif

VS Code现在居然可以用来谈恋爱了。

为了用最硬核的方式找到男(女)朋友,23岁的程序员Ben Awad在VS Code里打造一个约会软件VSinder。

顾名思义,VSinder = VS Code + Tinder,就是把约会软件集成到了代码编辑器里,简直太对程序员胃口了。

VSinder和Tinder的操作逻辑一样,左滑把不喜欢的人pass掉,右滑收藏喜欢的人。

这款插件一上线,就快速赢得程序员们的认可,GitHub上已收获800 Star,3天的下载量超过9000次。

既然是面向程序员的约会软件,自然不能和其他约会App一样,一定要有特色。

VSinder的特点就是,可以根据编程语言和代码风格筛选对象。

比如你用的是Python,她用的是C,那么你们之间可能没有共同语言。(以免将来为哪种语言最好吵架。)

4. AI把特朗普变成了dancer,跟着蔡徐坤跳起了『鸡你太美』

“好家伙!”

“现在的Paper也是越来越皮了”。正在开心摸鱼的同事,边说边给我发过来一段Demo。

原来『宝藏男孩』特朗普又被玩坏了。

『被逼着』跟蔡徐坤跳起了“鸡你太美”(谐音梗)。

逼着川宝大秀舞姿的是上海科技大学研究团队的最新AI,这篇AI论文名:

《Liquid Warping GAN with Attention:A Unified Frame work for Human Images Synthesis》

简单理解就是,基于特定框架的AI,能够完成运动仿真、外观转换以及新视图合成等人体图像处理任务。上面特朗普的舞蹈Demo是AI合成的最终演示效果。

5. 57.3 AP!刷新COCO目标检测和实例分割新记录!谷歌提出 Copy-Paste 大法

8e84615c-4421-11eb-8b86-12bb97331649.png

Paper:https://arxiv.org/abs/2012.07177

上个月,Scaled-YOLOv4刚刚刷新COCO 目标检测的新记录:55.8% AP!

昨天该数据又双叒叕被打破了!

谷歌拿下COCO目标检测和实例分割双项第一名!其中:

目标检测数据刷到57.3 AP;

实例分割数据刷到49.1 AP!

本文主要创新点:

1. Blending Pasted Objects

公式:I1 × α + I2 × (1 - α)

2. Large Scale Jittering

3. Self-training Copy-Paste

这三点其实很容易理解(不用翻译,直接看懂),没有花哨的处理,但实验证明涨点明显!

6. Github Star 7.2K,超级好用的OCR数据合成与半自动标注工具,强烈推荐!

Github:

https://github.com/PaddlePaddle/PaddleOCR

OCR 方向的工程师,一定需要知道这个 OCR 开源项目:PaddleOCR。短短几个月,累计 Star 数量已超过 7.2K,频频登上 Github Trending 日榜月榜,称它为 OCR 方向目前最火的 repo 绝对不为过。

8eb94386-4421-11eb-8b86-12bb97331649.gif

10 月,发布 PP-OCR 算法,开源 3.5M 超超轻量模型,再下 Paperswithcode 趋势榜第一

12 月,它又带来四大新发布与升级,核心内容先睹为快:

全新发布数据合成工具 Style-Text:可以批量合成大量与目标场景类似的图像,在多个场景验证,效果均提升 15% 以上。

全新发布半自动数据标注工具 PPOCRLabel:有了它数据标注工作事半功倍,相比 labelimg 标注效率提升 60% 以上,社区小规模测试,好评如潮。

多语言识别模型效果升级:中文、英文、韩语、法语、德语、日文识别效果均优于 EasyOCR。

PP-OCR 开发体验再升级:支持动态图开发(训练调试更方便),静态图部署(预测效率更高),鱼与熊掌可以兼得。

7. TensorFlow 2.4 正式发布!提供GPU支持的新功能,推出 tf.experimental.numpy

TensorFlow 2.4 正式发布!随着对分布式训练和混合精度提供更多支持,加入新的 Numpy 前端及用于监控和诊断性能瓶颈的工具,这个版本的亮点在于推出新功能,以及对性能和扩展方面的增强。

TensorFlow 2.4 以 tf.experimental.numpy 形式,实验性引入了对 NumPy API 子集的支持。您可借此模块,运行由 TensorFlow 加速的 NumPy 代码。由于此 API 基于 TensorFlow 构建而成,因此可支持访问所有 TensorFlow API,与 TensorFlow 实现无缝互操作,并会通过编译和自动矢量化开展优化。例如,TensorFlow ND 数组可以与 NumPy 函数进行交互,同样地,TensorFlow NumPy 函数也可以接受包括 tf.Tensor 和 np.ndarray 在内的不同类型的输入。

8efd19ee-4421-11eb-8b86-12bb97331649.png

8. 保姆级教程: 个人深度学习工作站配置指南 | 稚晖@知乎

本文记录了组装深度学习工作站过程中的超详细操作流程,文章分为

硬件篇
1.1 工作站配置选型

1.2 电脑组装

系统篇 - Ubuntu20.04

DL开发环境配置篇

工作站的维护

供有类似需求的同学作为参考。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54423

    浏览量

    469307
  • 微软
    +关注

    关注

    4

    文章

    6752

    浏览量

    108081
  • 图像识别
    +关注

    关注

    9

    文章

    534

    浏览量

    40183

原文标题:【20201218期AI简报】内存256KB设备也能人脸检测!

文章出处:【微信号:RTThread,微信公众号:RTThread物联网操作系统】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    LX2160添加 pstore 功能来调试内核遇到的问题求解

    0x00200000>; // 2MB record-size = <0x00040000>; // 256KB console-size = <
    发表于 04-16 09:35

    使用NORDIC AI的好处

    Nordic 的 Edge AI 主要有以下几个好处(基于官方资料总结): 极低功耗、延长电池寿命 在本地运行 AI,减少无线传输次数,而无线收发是最耗电的部分。设备只需上传“结果/事件”,而不是
    发表于 01-31 23:16

    【「Linux 设备驱动开发(第 2 版)」阅读体验】+读深入理解Linux内核内存分配

    系统中地址范围极大,因此高端内存没有存在的意义,其中的内存拆分不再有意义。由此可见,如果是AI到来之前,一般的应用对内存的需求不是那么高,
    发表于 01-16 20:05

    Everspin256Kb串行SPI接口MRAM芯片分享

    电子和物联网设备提供了理想的存储解决方案。这款256Kb容量、SPI接口的非易失性存储器,正在重新定义嵌入式存储的性能标准。
    的头像 发表于 11-13 11:23 655次阅读

    【CPKCOR-RA8D1】关于AI人脸检测移植遇到的一些问题

    + CPKEXP-EKRA8X1 扩展板(OV7725 摄像头、4.5\" MIPI-DSI 屏)。 移植详情【CPKCOR-RA8D1】AI人脸检测 - 瑞萨单片机论坛 - 电子技术论坛 - 广受欢迎的专业
    发表于 10-31 13:39

    基于级联分类器的人脸检测基本原理

    本次分享的内容是基于级联分类器的人脸检测基本原理 1) 人脸检测概述 关于人脸检测算法,目前
    发表于 10-30 06:14

    【CPKCOR-RA8D1】AI人脸检测

    在瑞萨 RA8D1 开发板上集成 AI 人脸检测功能 1. 项目概述 该项目是根据官方AI人脸检测
    发表于 10-29 17:59

    新唐 M2354 系列,RTU 应用的最佳选择

    的 RTC作功耗低于 0.5 μA。 M2354 系列电源效率: 3. 大内存 M2354 系列集成了 1024KB 的 FLASH 和 256KB 的 SRAM,可实现高效的数据处理和存储
    发表于 09-05 08:25

    科普:什么AI 内存技术

    AI 内存是一种专为人工智能 (AI) 应用设计的新型内存技术。与传统的通用内存(如 DDR5 或 LPDDR5)不同,
    的头像 发表于 09-03 15:44 1648次阅读

    【Milk-V Duo S 开发板免费体验】人脸检测

    多张人脸识别 针对画面中存在多张人脸的情况进行测试 识别效果较好,速度较快。 同时终端输出检测到的人脸数量 动态效果见底部视频。 总结 本文介绍了 Milk-V Duo S 开
    发表于 07-27 16:53

    【Milk-V Duo S 开发板免费体验】人脸检测测试(视频)

    运行/mnt/system/usr/bin/ai/sample_vi_fd /mnt/cvimodel/scrfd_768_432_int8_1x.cvimodel 检测人脸时打印 视频中会框选
    发表于 07-11 22:33

    【BPI-CanMV-K230D-Zero开发板体验】AI 算法模型(人脸检测、躯干检测、车牌识别)

    K230D 支持多种 AI 应用,并且内置于 CanMV 镜像中,分为单模型应用和多模型应用两种,内容涵盖物体、人脸、人手、人体、车牌、OCR、音频(KWS、TTS)等多个应用领域。 这里选择几种
    发表于 07-05 00:52

    重磅更新 | HPM_SDK v1.10.0 发布

    版本更新概况[New]增加HPM5E00系列MCU以及HPM5E00EVK支持增加flash_xip_hybrid构建,在该模式下AXI_SRAM被用作FLASH前256KB的缓存,位于FLASH前256KB的代码拥有RAM级别的访问性能。1、新增/更新的中间件(Midd
    的头像 发表于 07-02 15:07 1590次阅读
    重磅更新 | HPM_SDK v1.10.0 发布

    【BPI-CanMV-K230D-Zero开发板体验】03 摄像头调用+AI人脸检测

    aidemo.face_det_post_process() 将模型输出结果转换为人脸检测框。 内部实现解码 Anchor;根据置信度筛选;执行 NMS 去重。 2.5 nncase_runtime 支持 AI2D 格式、推理
    发表于 07-01 22:43

    【BPI-CanMV-K230D-Zero开发板体验】人脸检测、手势识别、车牌识别

    【BPI-CanMV-K230D-Zero开发板体验】人脸检测、手势识别、车牌识别 本文介绍了香蕉派 CanMV K230D Zero 开发板结合 MIPI 摄像头实现人脸检测
    发表于 06-30 20:44