0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声正式发布新一代通用大语言模型U2

云知声 来源:云知声 2026-06-08 16:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

刚刚,云知声正式发布新一代通用大语言模型——U2。

作为我们面向个人、开发者与组织打造的原生智能体大模型,U2的技术主张极为纯粹:高智能密度 × 高Token价值。它不再盲目堆叠参数,而是追求高智能密度,用更少激活资源承载更强能力;不再简单比拼输出长度,而是追求高Token 价值,让每一次调用都更接近交付结果。

与传统大模型更偏向单轮问答或短链路生成不同,U2 更强调面向真实任务的连续执行能力。在复杂办公、软件工程、深度研究与多工具协同场景中,U2 能够自主拆解并推进 100+ 步复杂工作流,将需求理解、任务规划、环境交互、工具调用、过程纠错与结果验收串联为完整闭环,从“给出答案”进一步走向“完成任务”。

1权威评测进入第一梯队,U2展现硬核实力

在最新发布的一系列国内外权威能力评测中, U2已经在多个关键能力方向进入主流大模型第一梯队:

536cc7ba-62d6-11f1-90a1-92fbcf53809c.png

在衡量知识与复杂推理能力的 GPQA Diamond 上,U2 取得 87.9 分,超过 GLM-5.1、Hy3 preview、DeepSeek-V4-Flash(High)和 MiniMax M2.7,展现出对高难度知识问题的稳定理解、推理与求解能力。

在衡量真实软件工程能力的 SWE-Bench Verified 上,U2 取得 75 分,进入主流模型第一梯队。

而在面向自主 Agent 端到端执行能力的 Claw-Eval(pass@3) 上,U2 取得 76.9 分,超过 Hy3 preview、DeepSeek-V4-Flash(High)和 MiniMax M2.7,进一步验证了其在工具调用、流程编排与任务交付中的稳定表现。

在面向真实办公与知识工作交付能力的 GDPval 上,U2 取得 72.9 分,展现出扎实的专业办公能力。相比传统问答式评测,GDPval 更关注模型能否完成真实工作场景中的高价值交付,包括资料分析、报告撰写、表格处理、图表生成、幻灯片制作等典型办公任务。

这组成绩背后,传递出一个重要信号:U2并不是以单点能力取胜,而是在推理、代码、Agent和办公交付等多项关键能力上形成了系统性表现。

2混合思考 + Harness 联合训练:让模型原生能力进入真实工作流

对云知声而言,U2 不只是一个模型代号,更是我们对 AI 2.0 时代大模型价值的重新思考。我们认为,衡量今天的大模型价值,不能再单纯比拼参数规模和内容生成长度。当 AI 真正进入真实工作流,用户关心的不再只是模型能否给出一个漂亮回答,而是它能否真正把任务完成。

因此,U2 从设计之初,就不是一个单纯面向聊天场景的通用模型,而是一款面向任务执行的原生智能体大模型。

要让模型真正完成任务,仅靠更大的参数并不够。真实工作流往往复杂、动态且长链路:模型既要能够快速理解目标、拆解任务、搜索路径,也要能在关键节点进行逻辑校准、约束检查和结果验证。传统显式思维链虽然具备较强可解释性,但往往需要生成大量中间推理文本,带来更高 Token 消耗与推理延迟;而完全依赖隐空间推理,虽然效率更高,却可能在复杂任务中出现逻辑漂移,缺乏足够的可控性与验证能力。

为了解决这一矛盾,U2 创新引入混合思考机制。它并不是在显式 CoT 与隐式推理之间二选一,而是在同一推理过程中,根据任务阶段、复杂度和不确定性动态切换思考形态。

在任务早期,U2 优先在隐空间中进行高效探索,完成路径搜索、任务拆解、候选方案生成与执行规划,避免把每一步中间思考都解码为可见 Token;当任务进入关键判断、复杂约束处理或结果收敛阶段,模型则切换到显式推理,通过可读、可校验的推理过程完成逻辑校准、过程验证与最终决策。

进一步地,U2引入可控隐空间展开(Bounded Latent Rollout)与熵感知切换(Entropy-aware Switching)机制,使模型能够根据推理过程中的不确定性动态调整思考方式:当隐式探索稳定时,模型保持高效推理;当不确定性升高、推理路径可能发散时,则及时回到显式思维链,通过确定性 Token 完成精准推导与结果收敛。

这意味着,U2 并不是简单缩短思维链,而是重构了模型的思考分工:把开放探索、路径规划等高消耗环节更多内化到隐空间,把逻辑验证、约束校准和结果收敛留给显式推理。由此,U2 能够在减少无效推理步骤和冗余中间文本的同时,保持复杂任务中的可靠性与可控性,实现“少 Token,深思考”。

在知识底座上,U2 进一步通过高知识密度数据精筛提纯技术,过滤重复、低质与幻觉数据,完成知识点级精炼萃取;并结合稀疏知识编码与知识蒸馏架构,压缩模型冗余参数,将高价值知识能力固化到更高效的模型结构中。

在任务执行层面,U2 引入 Agent-Harness 协同训练范式。我们认为,Harness 不应只是外部套壳,而应该与模型能力共同进化。因此,U2 将模型原生 Agent 能力提升与 Harness 迭代优化纳入同一训练闭环:一方面,Harness 根据 U2 的模型特点持续优化任务执行链路;另一方面,真实任务中产生的高质量执行轨迹,又反过来强化模型的任务规划、工具调用、过程纠错和结果验收能力。

而这一系列完整的闭环,最终要落到一套务实的训练体系上。我们没有让 U2 只盯着正确答案死记硬背,而是通过课程学习、过程监督、轨迹对比与多维奖励,教会它在复杂任务中如何规划、执行、纠错、验收。配合 Agent-Harness 协同演进,U2 能够在真实任务轨迹中持续强化长链路执行能力,真正从“能聊天”走向“能完成任务”。

3三大核心能力,支撑任务交付闭环

围绕真实任务交付,U2重点强化了Reasoning、Coding和Agent三大核心能力。

在Reasoning方面,U2强调低偏差执行和长程逻辑稳定性。面对复杂、多步骤任务时,模型不仅要能回答局部问题,更要能够持续保持目标一致,动态权衡预算、时间、约束条件和可行路径,最终输出更优方案。

在Coding方面,U2不再局限于代码生成,而是面向端到端工程交付。它能够根据自然语言需求生成代码,也能够理解多文件项目结构,保持接口、依赖和调用逻辑一致,并在环境调试和自主Debug中持续推进任务完成。

在Agent方面,U2重点提升了多工具协同、长流程编排和环境交互能力。面对开放式目标,它能够拆解任务优先级,理解API能力边界,组合调用不同工具,并根据外部系统反馈调整执行策略。

这三类能力共同构成了U2的任务交付闭环:先理解和规划,再执行和协作,最后校验和交付。也正因为如此,U2更适合被放到真实工作场景中检验,而不是只停留在单轮对话或单点能力展示中。

4场景展示:从单次回答到任务完成

为了验证 U2在真实工作流中的表现,我们围绕个人办公、开发者与企业组织的高频需求,进行了多类智能体任务的 Demo 场景测试:

1. 全形态界面设计

U2能够根据设计需求,生成具备生产级布局、真实导航流程和完整交互状态的应用界面,能力覆盖响应式网页布局、移动端原生组件开发、色彩与样式规范约束、事件绑定及双端适配等常见产品形态,实现从视觉设计到前端代码的端到端自动化输出。

Case 1. PC端网页设计

Prompt:

参考 [anotherescape.com](https://anotherescape.com/),构建一个体现水獭和虎鲸智慧与魅力的中文网站。

要求:

- 纯原生 HTML/CSS/JS,多页面(首页 + 6 个 Story 详情页),共享 CSS/JS

- 内容/图片通过网络搜索获取,下载到本地 images/,不依赖图床

- 编辑式极简风格,深海蓝+米白+珊瑚橙配色,响应式

- Story 页参考 anotherescape.com 文章页结构:面包屑 → 标题/作者 → 头图 → 正文 → 分享 → 相关推荐

- 提供 package.sh一键打包为 tar.gz / zip / 图片-base64 内嵌的单文件 HTML

Case 2. 移动端应用开发

Prompt:

目标:构建一个Instagram风格的社交应用,包含feed流,stories,发帖入口,通知,个人主页,图片网格和移动端的底部导航。

名称改为 unistgram ,采用和instgram类似的花体来展现;需要制作feed流页面,可以点击打开的story,发帖入口可以实际新增帖子到时间线,个人主页页面需要有一些实际的内容。

所需要用到的图片,资源,参考网页等从互联网搜索获得,并拉取到本地使用。

时间线和story中应当包含水獭和虎鲸相关的帖子。

技术:以web app来制作,最终面向移动端浏览器展现。

2. 深度研究分析

U2 具备跨行业数据检索、多源信息清洗与专业文献深度结构化分析能力。支持面向前沿复杂领域,输出符合行业合规排版要求的 PPT、Word文档甚至是具备动态交互图表的 HTML 深度研究网页,满足多格式、多场景的专家级文本交付需求。

Case.中国低空空域管理与安全体系演进趋势研究

3. 沉浸式可交互游戏开发

依托长程工作编排与自主纠错机制,U2 能够独立跑通算法设计、代码编写、环境调试 、报错修复的研发闭环,完成包括经典俄罗斯方块、基于物理公式的多摆混沌系统模拟器等应用交付。

Case 1. 俄罗斯方块游戏

Case 2. 多摆混沌系统模拟器

4. 高效办公

模型能够接入并处理复杂的组织业务数据,跨系统完成核心指标的抓取、交叉校验与可视化看板生成,全自主编排并交付经营分析报告与季度复盘报告,实现组织周期性核心业务复盘的流程自动化。

Case 1. 经营报告分析

Case 2. 新能源汽车行业全景分析

对云知声而言,U2 的发布不只是一次常规的模型升级,更是我们在原生智能体大模型长跑中的一次关键落子。

从榜单上的实测数据,到真实场景的交付闭环,我们希望用更高智能密度、更高Token价值,让每一次调用都转化为实实在在的生产力。

目前,U2 已经正式上线云知声Token Hub,全面面向个人、开发者及组织开放。

欢迎体验:

https://maas.unisound.com/models/u2

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 软件
    +关注

    关注

    69

    文章

    5415

    浏览量

    92195
  • 云知声
    +关注

    关注

    0

    文章

    337

    浏览量

    9539
  • 大模型
    +关注

    关注

    2

    文章

    3912

    浏览量

    5347

原文标题:云知声发布 U2:为执行而生的原生智能体大模型,可自主拆解并完成 100+ 步复杂真实工作流

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    山海医慧保大模型重磅发布

    、安全性、可追溯性提出极致要求。AI 如何真正读懂复杂病历、穿透海量单据、助力医保基金监管和商保医疗风控?今天,交出破局答卷——
    的头像 发表于 05-09 16:20 3877次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>山海<b class='flag-5'>知</b>医慧保大<b class='flag-5'>模型</b>重磅<b class='flag-5'>发布</b>

    商汤科技发布并开源新一代原生理解生成统模型SenseNova U1系列

    近日,商汤科技发布并开源新一代原生理解生成统模型SenseNova U1系列,随后壁仞科技、寒武纪、昆仑芯、摩尔线程、中科海光等10家国产
    的头像 发表于 05-08 16:26 718次阅读

    智谱新一代旗舰模型GLM-5.1上线华为

    4月8日,智谱正式发布新一代旗舰模型GLM-5.1,发布当天已上线华为,并成功对接华为多款产
    的头像 发表于 04-10 10:11 508次阅读

    阿里发布新一代千问Qwen3.6-Plus,媲美Claude系列最强模型

    继今年2月16日,阿里发布Qwen3.5 Plus之后,4月2日,阿里发布
    的头像 发表于 04-03 14:00 1.2w次阅读
    阿里<b class='flag-5'>云</b><b class='flag-5'>发布</b><b class='flag-5'>新一代</b>千问Qwen3.6-Plus,媲美Claude系列最强<b class='flag-5'>模型</b>

    正式推出Unisound U1-OCR文档智能基础大模型

    就在刚刚,正式推出 Unisound U1-OCR 文档智能基础大模型。作为首个工业级文档智能基座,该
    的头像 发表于 02-26 17:28 1005次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>正式推出Unisound <b class='flag-5'>U</b>1-OCR文档智能基础大<b class='flag-5'>模型</b>

    发布“山海·知音”大模型2.0,医疗AI加速落地驱动业绩高增长

    今年1月,正式发布其自研大模型“山海·知音”2.0版本,并同步披露2025年度业绩预告——全年营收预计同比增长超60%,净利润实现扭亏
    发表于 02-06 10:28 1177次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b>声<b class='flag-5'>发布</b>“山海·知音”大<b class='flag-5'>模型</b>2.0,医疗AI加速落地驱动业绩高增长

    与嘉会医疗达成战略合作

    2月5日下午,国内人工智能技术与服务领军企业智能科技股份有限公司(以下简称“
    的头像 发表于 02-06 09:05 2663次阅读

    山海知音大模型2.0重磅发布

    随着智能体时代到来,在“山海·Atlas”通用智算基座持续演进基础上,年前实现了“山海·医”5.0医疗大
    的头像 发表于 01-27 14:08 425次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>山海知音大<b class='flag-5'>模型</b>2.0重磅<b class='flag-5'>发布</b>

    荣登MedAIBench优秀国产医疗大模型榜单

    12月20日,国家人工智能应用中试基地(医疗)·浙江正式发布《MedAIBench测评榜(优秀国产医疗大模型)》。在这具备行业权威性与临床导向性的严格测评中,
    的头像 发表于 12-29 14:36 1009次阅读

    山海医疗大模型问鼎MedBench4.0三项榜首

    12月16日,中文医疗大模型权威评测平台MedBench4.0发布最新评测结果。自主研发的“山海医疗大
    的头像 发表于 12-29 14:35 3645次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>山海医疗大<b class='flag-5'>模型</b>问鼎MedBench4.0三项榜首

    推出医疗领域专家大模型“山海·医大模型5.0”

    刚刚,正式推出医疗领域专家级大模型全新力作——“山海・医大模型5.0”。这
    的头像 发表于 12-24 18:12 4741次阅读

    论文入选自然语言处理顶会EMNLP 2025

    近日,自然语言处理(NLP)领域国际权威会议 ——2025 年计算语言学与自然语言处理国际会议(EMNLP 2025)公布论文录用结果,
    的头像 发表于 11-10 17:30 994次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>论文入选自然<b class='flag-5'>语言</b>处理顶会EMNLP 2025

    【内测活动同步开启】这么小?这么强?新一代模型MCP开发板来啦!

    【内测活动同步开启】这么小?这么强?新一代模型MCP开发板来啦! 聆思全新一代六合芯片「LS26系列」,搭载WIFI / BLE & BT / NPU,与「小聆AI」强强
    发表于 09-25 11:47

    在港交所成功上市

    近日,智能科技股份有限公司(以下简称“”)于香港联合交易所主板挂牌上市,股份代号:0
    的头像 发表于 07-03 17:41 1256次阅读

    与商汤科技达成战略合作

    近日,智能科技股份有限公司(以下简称“”)与上海商汤智能科技有限公司(以下简称“商汤
    的头像 发表于 06-20 14:52 1233次阅读