0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI变身大厨:看一眼就知道这道菜怎么做的

Hf1h_BigDataDig 来源:YXQ 2019-06-21 11:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

通过一张简单的食物照片你能看到什么?当时和你一起吃饭的人?用餐的那个餐馆播放的爵士乐?或者是怀念那一口美味的,自己却做不出吃不到的家乡菜?

Facebook最新研究,使用AI技术,只需要一张食物的图片就可以洞悉它的烹饪方法。

该系统通过新颖的架构预测成分作为集合,在不强加任何顺序的情况下对其依赖性进行建模,然后通过同时处理图像及其推断成分来生成烹饪指令。

AI变身大厨:看一眼就知道这道菜怎么做的

一份优秀的菜谱不仅能够写清楚配料,还要有清晰的烹饪步骤,例如大火爆炒几分钟,小火慢炖几分钟,是切丝还是切块等等。

之前,传统的做法是将图片转图谱问题看做一种“检索任务”,即根据图片的相似度从食谱谱数据集中匹配烹饪方案。

这类系统的性能在很大程度上取决于数据集的大小和多样性,以及图片的质量。如果数据集中压根没有图片对应食谱的时候,显然这个系统非常失败。

将图片到食谱看成条件生成问题可以很好的解决传统系统的难题。换句话说,与直接的图片匹配不同,后者更多的是预测配料的成分,然后根据配料和其对应的美食图片生成烹饪步骤。

更重要的进步:除了食谱,之后可能还能识别卡路里

从食品图片到菜谱,需要获得超越仅仅是可见的图片之外的信息,这对于当前的计算机视觉系统无疑是一个巨大挑战。

与单纯理解自然图像相比,视觉成分预测需要的还有高级推理和先验知识,例如,羊角面包中含有黄油。 因为食品具有比较高的类别内可变性 intra-class variability,食物的形态在烹饪过程中发生改变,一道煮熟的菜肴和生的原料的样子可能天差地别。

逆烹饪的实现是迈向更广泛的食品理解系统的第一步,接下来也许就可以通过照片实现系统对于食物的卡路里估算和自动创建食谱。

成分预测也可以用于解决更广泛的问题,例如实现图像到集合的预测。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41370

    浏览量

    302744
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    59387

原文标题:Facebook最新研究:逆烹饪!从食物照片倒推食谱

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    SMA连接器批次性能差太多?教你一眼筛掉劣质品的方法

    及螺纹手感的细节对比,揭示了精密加工公差对高频段阻抗稳定性的决定性影响。文内附带优质与劣质 SMA 物理特征对比表,助你一眼看穿劣质品,守住射频系统的性能底线。
    的头像 发表于 04-29 15:26 167次阅读
    SMA连接器批次性能差太多?教你<b class='flag-5'>一眼</b>筛掉劣质品的方法

    款靠谱的蓝牙信标,芯片应该哪些参数?

    nRF52810和nRF52832款靠谱的蓝牙信标它芯片应该哪些参数?硬件选型的时候,最怕听到句话:“这芯片参数挺好的,为什么我的
    的头像 发表于 04-28 16:00 111次阅读
    <b class='flag-5'>做</b><b class='flag-5'>一</b>款靠谱的蓝牙信标,芯片应该<b class='flag-5'>看</b>哪些参数?

    Token烧了几十亿,代码还是团乱!AI原生开发该怎么管理?

    你与大模型聊天干活的记录,或许可用于次新的“MBTI”性格测试。当驾驭工程的不少事儿都能交给 AI 工具去做,我们只需要“观测”与“控制”,迎接“人人都是技术管理者”的时代。以前,写代码的都是
    发表于 04-14 19:50

    车载网关测试:CAN/CANFD收到信号后,通过以太网转发给座舱域控制器,交联验证怎么做

    车载网关测试:CAN/CANFD收到信号后,通过以太网转发给座舱域控制器,交联验证怎么做
    的头像 发表于 04-01 15:11 236次阅读
    车载网关测试:CAN/CANFD收到信号后,通过以太网转发给座舱域控制器,交联验证<b class='flag-5'>怎么做</b>?

    光峰科技助力闪极科技发布loomos AI显示眼镜S1

    2025年12月29日,闪极科技发布loomos AI显示眼镜S1,闪极S1聚焦“主动AI提醒助手”,通过传感器持续感知环境、精准识别用户意图,在关键时刻可推送信息提示,实现“关键时刻,一眼就够”的极致体验。
    的头像 发表于 01-06 09:15 819次阅读

    雷达LD2451如何“一眼看三车道”

    远距探测,更支持蓝牙无线调参,轻松覆盖三车道宽度,为道路监测与车辆感知带来了真正“智慧之”。、功能亮点HLK-LD2451采用FMCW调频连续波雷达技术,具备
    的头像 发表于 12-15 11:46 742次阅读
    雷达LD2451如何“<b class='flag-5'>一眼看</b>三车道”

    STM32L476低功耗怎么做

    STM32L476低功耗怎么做
    发表于 11-11 16:48

    如何精准驱动品识别模型--基于米尔瑞芯微RK3576边缘计算盒

    计算盒开发的品识别安卓Demo应用。该案例完整展示了从特征库构建到实时识别的全流程,充分体现了设备在端侧AI应用中的实用性与高性能。 4.1 特征注册 特征注册是构建可扩展品识别系统的关键第
    发表于 10-31 21:19

    米尔RK3576边缘计算盒精准驱动品识别模型性能强悍

    ❝在人工智能与边缘计算深度融合的今天,将AI模型高效部署于终端设备已成为产业智能化的关键。本文将分享基于米尔MYD-LR3576边缘计算盒子部署品识别安卓Demo的实战经验。该设备凭借其内置的强劲
    的头像 发表于 10-30 08:05 5150次阅读
    米尔RK3576边缘计算盒精准驱动<b class='flag-5'>菜</b>品识别模型性能强悍

    AI模型的配置AI模型该怎么做

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    请问有办法在嵌入式单片机上实现对片外Flash的数据增删功能吗?

    客户有个需求, 想要删除已保存的数据, 单片机使用的是STM32F407, 存储的是有序的递增数据, 删除功能我直不知道怎么做空间回收, Flash的擦除寿命有影响吗, 单片机内存
    发表于 09-23 06:10

    海外大厂是怎么做AI玩具芯片的?

    电子发烧友网综合报道 随着AI玩具市场的愈发火爆,不仅是中国厂商在积极推进相关芯片产品,因此,不少全球知名的企业也开始大力推广相关解决方案。   例如Nordic推出的nRF54H20,该产品集成
    的头像 发表于 08-18 07:48 4527次阅读

    文读懂高速信号

    图是个统计叠加的概念,是系列数字信号在示波器上积累而显示的图形,通过它可以观察出码间串扰和噪声对系统的影响,从而估计系统优劣。个完整的
    的头像 发表于 07-30 17:33 6187次阅读
    <b class='flag-5'>一</b>文读懂高速信号<b class='flag-5'>眼</b>图

    大促数据库压力激增,如何一眼定位 SQL 执行来源?

    语句成为了性能瓶颈。面对这样的困境,本篇文章提出了对 SQL 进行 “染色” 的方法来帮助大家 一眼定位问题 SQL,而无需再在多处逻辑中辗转腾挪 。本文的思路主要受之前郭忠强老师发布的 如何一眼定位SQL的代码来源:款SQ
    的头像 发表于 06-10 11:32 689次阅读
    大促数据库压力激增,如何<b class='flag-5'>一眼</b>定位 SQL 执行来源?

    企业部署AI大模型怎么做

    当下,AI大模型已成为驱动决策自动化、服务智能化与产品创新的核心引擎。然而,企业面对动辄数百亿参数的大模型部署时,常陷入算力不足、响应延迟高、成本失控等困境。如何突破瓶颈,实现高效、稳定的AI部署呢?下面,AI部落小编为您分享。
    的头像 发表于 06-04 09:26 1040次阅读