电子发烧友网报道(文/梁浩斌)今年在手机行业,“AI手机”的概念已经成为了最核心的卖点之一。对于AI手机而言,大模型性能是一方面,而更重要的是如何用AI能力打造一款“产品”,这更加考验终端厂商的软件能力。

那么由一家拥有顶级互联网产品能力,同时还拥有头部AI大模型的公司,所打造出来的“AI手机”会是怎样的?12月1日,豆包官宣发布豆包手机助手,并同步发售搭载豆包手机助手技术预览版的努比亚M153手机。
但这并不意味着字节要进入手机硬件领域,豆包官网的演示视频最后强调:“我们没有自研手机的计划,目前主要在和多家手机厂商洽谈豆包手机助手的合作。”
豆包手机助手,有什么特别?
团队表示,豆包手机助手项目从2024年开始启动,是基于豆包APP,与手机厂商在操作系统层面进行合作开发的手机语音助手。与传统手机助手相比,豆包手机助手能够实现更方便的交互和更丰富的能力,例如用户可以通过语音在系统层面直接唤醒豆包,使用手机侧面的AI键耳机与豆包对话,并针对屏幕上的内容获取更多信息。此外,还能够进行多模态生成模型的应用,如处理照片编辑任务,以及嵌入常用功能如语音通话、视频通话和屏幕共享等。
简单来说,相比于目前所有手机都能够下载的豆包APP,豆包手机助手的最大区别在于更深入地嵌入操作系统中,拥有了更高级别的权限,代替了品牌手机原本自带的语音助手。

比如,豆包手机助手可以在激活时读取屏幕内容,可以直接询问当前手机屏幕显示信息的相关问题。
同时,也将语音通话、视频通话和屏幕共享这些豆包APP内的热门功能都嵌入到豆包手机助手中,通过手机AI按键激活。

利用豆包的多模态能力,可以在相册或是其他APP的界面,直接呼出手机助手来进行修图等任务。
不难发现,上述功能其实都是目前主流手机品牌的手机助手所支持的功能,并不新鲜。实际上,豆包手机助手的“杀手级”功能是真正让AI拥有了操作手机的能力,甚至可以完成一些复杂操作,从演示的效果来看已经可以称之为“AI Agent”了。

比如在社交平台上看到一款洗发水,可以直接呼出手机助手,让它帮我把这瓶洗发水在我所有的购物软件上比个价,选个最便宜的下单。
最关键的部分来了,在发出指令后,通过大模型分析需求,手机助手不是通过各大APP的API来读取商品信息(避免购物平台算法干预),而是能够自动识别产品,并自主操作手机打开不同的购物APP,并搜索相关产品,对比各个平台价格。当遇到一些产品细节需要提供额外信息,或者是到了支付等高敏感步骤,手机助手会通知用户手动处理。
这种逻辑是不是有点像目前的智能驾驶?当遇到无法处理的路况,或是临时改变出行计划,需要驾驶员去手动接管,但对于点到点的任务,已经可以做到90%以上的场景自主完成。
在演示视频中,还展示了更加复杂的场景,包括打开车辆的前备箱、在飞书上提交出差申请、定高铁票、下载安装多个软件、一键查询所有购物软件的物流进度,自动领券,批量下载文件并整合等等。这些指令都不需要第三方的APP适配,而是手机助手可以自动打开APP,找到相应的入口并完成相关操作。

另外,豆包手机助手还加入了一个“记忆”能力,但这里的记忆跟OPPO的小布记忆和vivo的小V记忆完全是两回事。目前其他品牌手机的“记忆”功能,主要的触发方式是主动式,也就是需要通过按钮来记录当前屏幕内显示的内容,并提炼关键信息记录下来,生成提醒、备忘录或是记账。
而豆包手机助手在开启“屏幕记忆”后,会持续识别、感知屏幕信息,豆包会将记录的内容转换为文本记录并保存在本地,智能的识别出纪要、总结或关键日程,并基于此生成代办提醒等,整个过程从“主动式”变成“被动式”,自然地形成记忆。
这些记忆可以包括自己的座位号、取件码或车位位置、聊天记录内提到的信息等,甚至可以通过记忆功能简化重复指令的操作流程,提高执行效率。
当然,实时读取屏幕信息,对个人信息安全是一个很大的威胁,豆包表示所有个人数据均在端侧存储并严格加密,研发人员不会查看和分析,完全遵循隐私保护措施。同时该功能需要单独授权和开启,也可以按需随时关闭。

有意思的是,结合记忆功能,豆包还在探索操作手机Pro功能,在基础的操作手机功能上,可以直接调用工具,并在执行任务的过程中降低询问你的频率,使得整体用户体验更顺滑。
但豆包团队也强调,受制于大模型的不确定性,这次演示虽然是实际录制,但并非可以百分百复现,当前的模型能力和用户体验还有很多的提升空间。而大众关注的隐私问题,在豆包手机助手官网上也上线了《豆包手机助手白皮书》,展示了当前豆包在隐私保护方面的成果和进展。
总结下来,目前豆包手机助手提供两种模式:标准模式速度更快,提供模拟点击能力,基于用户偏好提供服务,需要更多用户辅助和接管;Pro 模式能力强,支持全部本地记忆使用和直接调用工具,可实现更复杂的操作。
不做手机,用软件能力改变AI手机格局?
此前其实有不少传言称,字节要推出自研手机,考虑到字节过去收购锤子、Pico,推出Ola Friend AI智能体耳机等操作,自研手机确实不意外。但从今天公布的信息来看,字节是希望基于豆包手机助手的能力,通过与手机厂商合作令其“AI入口”覆盖到更广泛的设备。
相比其他手机厂商自研的助手,豆包手机助手的核心壁垒是跨应用的Agent 能力、屏幕感知和全局交互、个性化记忆与自动化任务,这些均依赖大模型的自然语言理解、多模态处理与系统级权限调用能力。选择做软件,能让豆包集中资源打磨这些不可替代的 AI 能力,形成差异化竞争优势。
像谷歌Gemini在三星手机上的合作模式,以及OpenAI和苹果的合作等,硬件厂商采用合适的AI技术供应商,能够让手机厂商的产品快速跟进AI能力,形成良好的分工协作模式。
对于字节而言,此前推出的自研AI耳机Ola Friend也能够与搭载豆包手机助手的手机实现对话、操作手机任务的能力,一定程度上构成了更好的使用体验。

而首发搭载豆包手机助手的产品,是豆包与努比亚合作开发的努比亚M153技术预览版,尽管豆包在官网强调这是“供行业、尝鲜者试用豆包手机助手的手机产品。”“软件方面尚无法保证成熟手机产品的功能完善度,比如影像功能完善度与市场主流旗舰机可能存在差距等。”但“可作为主力机日常使用”这一句又令人对该产品的完成度抱有期望。

实际上从硬件上看,M153确实还不错,搭载了高通骁龙8至尊版移动平台,以及6.78英寸1.5K LTPO屏幕,后摄采用了三颗5000万像素CMOS传感器,包括主摄的豪威OV50H、超广角的豪威OV50D、长焦的三星JN5。电池6000mAh,支持90W有线快充、15W无线充电和5W反向充电。
加上3499元,16GB+512GB的价格,单从硬件来看性价比甚至非常高。当然软件方面可能仍未完善,豆包表示nubia M153 的软件,将在发售起至 2026 年第一季度末保持每两周左右(除节假日)一次的更新频率,此后的更新频率将届时告知。
写在最后:
从去年开始,苹果自研AI进展不顺,开始寻找外部AI供应商,最终在海外使用ChatGPT,而国行版本的合作商传闻不断,至今仍未正式落地。而今天豆包推作为软件供应商实现了真正的“AI手机”,将豆包APP与操作系统深度融合后所展现出来的能力,对当前手机人机交互模式的颠覆(过去只存在PPT上的交互成真),真的有一种隐约的“AI手机时代的iPhone时刻”即视感。
或许今天的豆包手机助手,就是苹果曾经自己想象中“Apple Intelligence”的模样。
-
字节
+关注
关注
0文章
43浏览量
14327 -
ai手机
+关注
关注
0文章
49浏览量
3515
发布评论请先 登录
机智云亮相字节豆包AIoT开源生态沙龙
豆包×涂鸦智能:10分钟快速打造爆款AI硬件
小豆包API:AI最新大模型,新增GPT-4.5-Preview,对比官方优惠60%
字节豆包大模型团队提出稀疏模型架构
字节豆包大模型团队推出UltraMem稀疏架构
字节跳动否认赵明加盟及自研手机传闻
字节豆包大模型团队成立AGI长期研究团队Seed Edge
字节跳动豆包大模型1.5 Pro发布
豆包大模型降价后毛利率仍达50%
字节跳动发布豆包大模型1.5 Pro
字节跳动与努比亚合作开发AI手机
艾为芯片赋能字节跳动AI智能体耳机Ola Friend

字节不做手机,但是豆包要颠覆AI手机行业了
评论