0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型+影像:智能手机“上春山”

脑极体 来源:脑极体 作者:脑极体 2024-02-23 09:24 次阅读

这个春节假期,一首《上春山》火了。吃瓜群众热热闹闹学了一个假期的“春山学”,了解了抢占C位的各种技巧。

假期过去,开工大吉,手机行业开始抢占今年的C位。那么问题来了,今年智能手机最大的机会点在哪里?答案呼之欲出,当然是AI大模型。去年下半年,手机厂商陆续推出端侧大模型。春节刚过,OPPO发布了全新的AI战略,宣布进入AI时代。魅族宣布不再生产“传统智能机”,全面拥抱AI时代。显然,大模型就是手机行业的那座“春山”。

但根据“春山学”相关知识,跟着大家一起上山是不够的,必须更上一层才能稳站C位。在大模型+手机的众多结合点中,有一项能力是C位中的C位,妥妥的“真·春山无双”——大模型+手机影像。

wKgZomXXg4iAfxxqAABnh9WIRfA414.jpg

据说在这个春节,一线城市的写真店纷纷转变了商业模式。原本大家都是去拍写真,店家负责拍摄和修图。现在都是去拍AIGC照片,店家摇身一变为AI提示工程师,用各种AIGC平台来实现用户种种匪夷所思的需求。

回来对比照片,也不是比你这张光打得不错,你这张P得更自然,而是你这张照片用的什么提示词,你这张一看就模型泛化性比较强……

总之,AI之风正经由照相馆、写真店、小程序、APP,强烈地吹拂着我们的影像生活。

但是问题来了,这些强烈的AIGC影像需求,真的必须去线下店才能完成吗?为什么不能在手机端一键搞定?最近手机新品动辄搭载几十亿参数的端侧大模型,它们闲着干嘛呢?

事实上,手机里的大模型肯定是闲不住的。目前拥抱AI大模型的手机,基本情况是大模型是大模型,影像是影像,但这种分裂局面必然会很快得到改变。

“大模型与移动影像”的融合赛道,是2024年智能手机行业最为清晰的风口,也是手机厂商急切想要上,也必须上了就不能下来的,具有战略意义的那座“春山”。

大模型+手机影像,这座春山怎么上?我们来弄清其中的“春山学”问题吧。

六年之后,AI影像再上山

首先我们需要明确一点,那就是AI+影像绝不是什么新鲜事物,甚至很多人都已经习惯了AI与影像的结合。

这个概念开始受到业界重视,是早在2018年的时候。那一年4月,华为发布了P20手机。这款手机利用麒麟芯片的NPU端侧算力,首次在拍照中搭载了AI功能,能够识别包括宠物、人像、风景、美食等19种场景,覆盖500多个识别目标。在AI识别这些目标物后,会自动调整摄影模式和参数设置。

随后,这种AI摄影模式一度爆火,成为当时最具热度的手机技术升级,并且逐渐为全行业所接受。随着几年发展,AI影像变得越来越复杂,可识别物越来越多,并且加入了动态抓取、去除反光等AI能力,还与此后流行的计算摄影概念结合,成为手机影像系统中的基础能力之一。

但到这个层面,AI摄影的能力依旧有显著的局限性。它对图片的作用集中于“美化”,而不是“修改”和“生成”。我们也探访过一些AI摄影相关赛道的开发者,他们很希望能够利用手机的AI能力做出更具创意的应用,但端侧算力和模型能力是主要的限制。

而伴随着AI大模型的爆火,模型能力的关隘被突破了。在大模型的加持下,用户可以对影像系统提出复杂的指令,影像系统也能够更完整理解用户交互逻辑与意图指向。在能力上,大模型可以帮助完成高精度的图像元素替换,甚至加入AI生成的影像。

或许可以这样说,最初用户听闻AI影像概念的时候,脑海中设想的影像能力,其实是在今天才有可能实现的大模型影像。

伴随着大模型能力落地手机,AI影像终于可以完成关键一跃,实现那些早就许下的诺言。

大模型,就是AI影像的必须上的那座山。

春山上,风景如何?

春节还没过去,世界就感受到了来自Sora的视觉震撼。AI行业有句话,叫语言模型为打榜,视觉模型能赚钱。机器视觉能力是让用户感受到AI魅力最快速也最有效的方案。

长期以来,手机影像可谓一卷再卷,卷无可卷,但用户始终能做的只是拍摄图片。AI大模型能力的加入,可以让用户获得无门槛修改图片,以及将AIGC影像与手机拍摄影像结合的能力。AI大模型+手机AI计算能力+手机影像系统的组合,极大拓展了手机影像的边界,既继承了手机厂商多年来的技术与供应链布局,同时还获得了新的增长空间。

目前阶段,这条赛道已经迅速铺开。比如三星就通过图片助手功能,让用户实现了移动图片中目标,自动填充空缺,生成新图片的能力,从而让手机影像具备更大的构图自由。

wKgaomXXg4qAEPVlAAGLEbamVoM650.jpg

而OPPO Find X7系列则实现了通过AI大模型来提供AIGC消除功能。就像我们最近在广告里看到的那样,用户可以把春节聚会时不想看到的人从合影中消除,同时依靠AIGC补齐背景。目前,Find X7已经可以支持最多6个主体单独提取。除此之外,OPPO还更新了AI超清合影功能,可以智能识别并增强合影中人脸的清晰度。

wKgZomXXg4qAPViLAAM7H6DiqAw326.jpg

可以预见的是,接下来我们会看到大量基于AI大模型实现的影像功能,比如AI抠图,AI替换,AI扩图等。整体而言,大模型+手机影像会呈现三大发展趋势:

1.AIGC内容与拍摄内容结合。AIGC的文生图平台,在过去一年快速赢得了用户青睐,将这种能力与手机本身影像能力融合,是AI手机赛道上最关键的争夺战。

2.AI能力从应用侧上移,与手机本身的影像系统结合。目前,AI大模型带来的视觉能力,更多还是单独的软件应用。接下来,手机厂商会将这些能力上移到系统侧,成为产品本身的差异化卖点。

3.手机影像能力可以OTA。AI大模型的加入,一定程度上让手机自身的影像能力成为可升级,可迭代的软件。让手机自身的系统级能力也可以持续更新,持续运营,是AI大模型带给手机的一种新变化。

总体来看,大模型与手机影像的结合,有着非常充沛的创意发挥空间,有源源不断的可能性。想要抓住这个机会,客观上将带来手机厂商之间新一轮的技术竞赛。

那座山,就是下一个战略高地

目前阶段,还没有厂商将“大模型+影像”这个概念旗帜鲜明地提出来,但这个概念以各种不同的名称落地,应该已经为期不远。

需要注意的是,在端侧部署大模型,以及发展出一些创意性的AI影像玩法都很容易,但要将AI大模型+影像真正发展为长期赛道,构成品牌的用户心智支点,那还需要厂商投入巨大的精力,来展开一场全新的智能手机行业竞赛。

其原因在于,大模型+手机影像是一场名副其实的综合考验。它需要硬件侧的算力配合,需要影像系统的支撑,同时也需要模型侧的算法加持,更需要应用开发创意以及AIGC专属的视觉审美。从务实到务虚,从底层硬件到顶层应用,大模型+手机影像的竞赛近乎覆盖了手机行业的每个层级。

而重点来看,抢占大模型+影像的战略高地,需要手机厂商在三个方面集结重兵:

1.AI基础设施更新。这个基础设施包括了AI算力与AI算法两个部分。涉及芯片能力,端云协同能力,以及基础算法能力。手机的AI基础设施更新需求,也将带动产业链展开新一轮洗牌。

2.AI应用的准确把握。AI大模型能够手机影像带来的可能性不是太少,而是太多了。如何在有限的算力条件下,给用户最准确,最吸引人的AI影像应用,将成为手机厂商面对的头一道考题。

3.AI审美能力的建设。最近很多人注意到Sora团队有专门的艺术人才加入。艺术与审美能力在AIGC时代非常重要。随着产业发展,算法能力会趋同,审美能力的差异化则会暴露出来。手机厂商过去更重视的是设计能力,这与艺术表达、审美判断等能力是存在一定差异的。构建属于AI手机的新审美能力,是一项全新的赛事。

最后,说一个有点反常识的判断:大模型+手机影像这座“春山”,其实还是很容易上的。其门槛远没有手机厂商宣传得那么夸张,但如果你最近用心学习了“春山学”教材,就会知道真正困难的不是上山,而是赖在山上不下来。

如何把大模型+手机影像从一个年度噱头,变成可以多年发展的长期赛道,甚至变成改写产业格局的锚点,那才是真正的考验。

不过好消息是,有春山可上至少证明了一件事:包裹手机行业的坚冰正在技术暖风的吹拂下开裂、消融。能否就此别冬入春,选择权在从业者手中。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能手机
    +关注

    关注

    66

    文章

    18062

    浏览量

    177064
  • AI
    AI
    +关注

    关注

    87

    文章

    26450

    浏览量

    264066
  • 大模型
    +关注

    关注

    2

    文章

    1525

    浏览量

    1116
收藏 人收藏

    评论

    相关推荐

    OPPO,锐思智芯,高通三方携手,共同推动智能手机影像AI Motion变革

    ®传感器来更高效地提取运动信息和图像数据,从而帮助进一步改善拍照性能并实现影像的AI Motion功能。   三方将合作开发一套完整方案,包括从Hybrid Vision Sensor获取原始视觉信息,传输至骁龙® 移动平台,并搭配专用算法。该合作方案将帮助实现智能手机
    发表于 01-11 09:07 402次阅读
    OPPO,锐思智芯,高通三方携手,共同推动<b class='flag-5'>智能手机</b><b class='flag-5'>影像</b>AI Motion变革

    手机和电脑的配置没有去深入的了解。。。 先说智能手机

    手机和电脑的配置没有去深入的了解。。。 先说智能手机吧 1.玩网游/一般应用需要的运行内存多大才算可以?6+2是啥意思? 2.玩网游/一般应用选择什么处理器?多少核?多少GHZ? 3.玩网游/一般
    发表于 12-17 12:19

    智能手机天线调谐器的 ESD 规范

    智能手机天线调谐器的 ESD 规范
    的头像 发表于 11-30 17:55 306次阅读
    <b class='flag-5'>智能手机</b>天线调谐器的 ESD 规范

    佰维存储助力智能手机实现卓越性能

    当前,随着智能手机行业不断向前发展,各大品牌厂商纷纷在软硬件升级方面展开布局。例如,推出自研操作系统,升级影像系统、引入最新的显示技术等。从市场趋势中可以窥见,极致的用户体验背后需要强大的硬件与先进
    的头像 发表于 11-23 16:33 520次阅读

    智能手机:2050年是否将成为最后的疯狂?

    智能手机行业资讯
    北京中科同志科技股份有限公司
    发布于 :2023年11月14日 09:49:23

    长电科技:已看到智能手机市场复苏

    在这样的背景下,长电科技表示,最近在财务报告电话会议上观察到了智能手机市场的复苏。不仅智能手机的数量增加了,智能手机的硬件也在进化,支持新的应用程序,特别是llm(大容量语言模式),这种模式正逐渐流入高级
    的头像 发表于 11-10 10:08 284次阅读

    智能手机中快速充电技术的应用

    电子发烧友网站提供《智能手机中快速充电技术的应用.pdf》资料免费下载
    发表于 10-27 11:01 0次下载
    <b class='flag-5'>智能手机</b>中快速充电技术的应用

    高通骁龙8 Gen 3:智能手机未来的强大引擎

    智能手机高通骁龙
    北京中科同志科技股份有限公司
    发布于 :2023年10月25日 09:38:49

    智能手机等小型电子设备中的使用事例

    智能手机等小型电设备中的使用事例
    的头像 发表于 08-18 14:30 301次阅读
    在<b class='flag-5'>智能手机</b>等小型电子设备中的使用事例

    使用智能手机对arduino进行编程

    电子发烧友网站提供《使用智能手机对arduino进行编程.zip》资料免费下载
    发表于 07-05 11:10 0次下载
    使用<b class='flag-5'>智能手机</b>对arduino进行编程

    智能手机连接家庭门锁

    电子发烧友网站提供《智能手机连接家庭门锁.zip》资料免费下载
    发表于 07-03 09:33 0次下载
    <b class='flag-5'>智能手机</b>连接家庭门锁

    AI、5G+开启智能手机创新周期 荣耀提出端侧大模型

    AI、5G+开启智能手机创新周期  荣耀提出端侧大模型  智能手机的创新瓶颈或者被AI打破,荣耀CEO赵明智能手机新的一轮创新周期或将到来,荣耀要抓住这些机会,在AI、通信、显示、续航
    的头像 发表于 06-29 21:19 694次阅读

    智能手机控制灯

    电子发烧友网站提供《智能手机控制灯.zip》资料免费下载
    发表于 06-29 09:57 0次下载
    <b class='flag-5'>智能手机</b>控制灯

    如何使用支持NFC的智能手机从带有密码的标签中读取数据?

    我有一个 NFC NTAG 213 我用密码保护它并将访问权限更改为 80 以启用密码读取 但是我无法使用密码读取数据,但是当我尝试使用密码对其进行身份验证时,它返回 PACK 00:00 如何使用支持 NFC 的智能手机从带有密码的标签中读取数据。
    发表于 05-16 07:06

    陶瓷电容在智能手机中常见的应用场景

    这段时间各大手机品牌的新型智能手机纷纷开售,其中备受关注的还是小米旗下的红米note12turbo智能手机
    的头像 发表于 05-06 17:01 774次阅读