0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声三款核心标准化Skill正式上架ClawHub社区

云知声 来源:云知声 2026-03-13 15:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当文档能深度“认知”业务,语音识别可精准“理解”语境,合成语音能传递温度与多元表达,AI智能体的办公赋能便有了全新可能。

即日起,云知声三款核心标准化Skill正式上架ClawHub社区,U2-doc-parser、U2-audio-file-transcriber与U2-TTS相关能力重磅开放,将高精准文档解析、业界领先的全场景ASR语音识别与高度拟人化的TTS语音合成能力注入OpenClaw生态,为开发者打造“眼明耳聪善言”的智能体工作流,让AI智能体真正看懂各类文档、听懂多元语音、说出贴合场景的话语,加速办公自动化与智能体应用从原型到工业级落地。

此次上架的三款Skill,均源自云知声在多模态交互与文档智能领域的核心技术沉淀,依托自研“大模型体系”打造,具备企业级可靠、快速部署、无缝编排、场景深度适配等优势,开发者可在OpenClaw中直接调用,无需自建服务、管理环境依赖,轻松为智能体装上专业“眼睛”、灵敏“耳朵”与灵动“嘴巴”。

01U2-doc-parser:高精准文档解析,信息提取更精准

Skill直达地址:https://clawhub.ai/aaiccee/u2-doc-parser

作为云知声UnisoundU1-OCR大模型落地的标准化Skill,U2-doc-parser主打高精准文档解析,兼具全场景适配能力,实现了从“字符感知”到“文档认知”的质的飞跃,成为智能体处理各类复杂文档的核心“视觉”能力,尤其在医疗文书、财务报表、学术论文等专业场景表现突出。

该Skill拥有两大核心优势:

1.多项测评领先:在多项权威评测中表现优异,在表格识别、跨页关联、微小文本检测等高难任务上优势显著。

2.语义驱动的结构理解:首创“语义驱动+动态聚焦”策略,像人类专家一样先梳理文档结构、构建“语义地图”,精准识别标题、图表、正文的从属关系,即便面对排版混乱、图文混排、多语言混排的极端文档,也能条理清晰提取信息,彻底解决传统OCR“只读文字、不懂排版”的痛点。

在智能体工作流中,U2-doc-parser可直接将PDF、图片等多格式文档,包括拍照模糊、满屏水印、弯折的非标准文档,转化为结构化Markdown数据,无需二次处理即可供下游任务直接消费,完美适配医疗单据处理、财务报销审核、企业知识库构建等办公场景。

02U2-audio-file-transcriber:全场景语音识别,从 “听字” 到 “理解事” 的交互进化

Skill直达地址:https://clawhub.ai/aaiccee/u2-audio-file-transcriber

基于云知声“山海・知音”大模型2.0打造的U2-audio-file-transcriber,是智能体的专业“听觉”核心,实现了从单纯语音转写到语境理解、专业适配、全场景兼容的能力跃迁,能在复杂噪音、方言口音、专业术语等高难度场景下精准识别,真正做到“不是听字,而是理解事”。

这款Skill以三大核心能力直击行业痛点:

1.极端场景高准确率:在复杂背景音环境下识别准确率业内首次突破90%,相比主流ASR模型,在复杂噪音、方言口音等高难场景下性能提升2.5%-3.6%,轻松适配室内近场、远场嘈杂、公共场景等全场景语音交互需求。

2.多语言多方言全覆盖:支持30余种中文方言+14种国际语言精准转写,无论是粤语、闽南语、上海话等晦涩方言,还是英、日、韩、泰等国际语言,均可实现高精准转写,适配多方言混切的商务会议、跨境沟通等办公场景。

3.专业术语+上下文推理:可针对医疗、汽车、金融等领域显式注入专业术语进行定向增强,如医疗场景的“依帕司他”“二甲双胍”、汽车场景的“半幅方向盘”,识别精度提升30%;同时具备强大的上下文逻辑推理能力,能根据语境补全未明确提及的关键信息,避免语义断裂。

在智能体工作流中,U2-audio-file-transcriber可实现会议录音实时转写、嘈杂环境下语音指令识别、专业场景对话转录、多语言语音内容解析等功能,转录结果可直接触发智能体后续动作,适配智能会议助手、语音指令办公、客户沟通智能记录等多元办公场景。

03U2-TTS:声动进化,让AI说话有温度、多维度

Skill直达地址:https://clawhub.ai/aaiccee/u2-tts

依托云知声“山海・知音”大模型2.0打造的智能U2-TTS,作为智能体的“嘴巴”,以“高度拟人+创意多元”为核心,让语音合成兼具真实感与创造力,让科技的表达更有温度,完美适配智能播报、有声创作、场景化语音交互等办公需求。

这款Skill以三大核心优势让AI表达更加多元:

1.多语种多方言全覆盖,表达更贴合场景:支持多种中文方言与国际语言的语音合成,粤语、四川话等方言还原地道,日语“促音”、泰语“声调变化”等小语种语音韵律经过专项优化,合成自然度接近母语使用者,适配文旅宣传、跨境办公沟通、方言场景播报等需求。

2.情感与风格多元,还原真实人际表达:可切换12种普通话风格,温柔、干练、亲切等风格随心选择,还能自然还原笑声、呼吸声等细节,实现高兴、沉稳、急切等多情感表达,让AI的语音输出贴合不同办公场景的情绪与氛围需求。

3.高效创作与低延迟交互,适配办公全流程:支持一句话声音复刻,可融合不同样音的音色与情感特征生成定制化音频,赋能办公场景下的有声内容创作、视频配音、儿童伴读等需求;同时依托纯因果注意力机制的流匹配模块与端到端纯流式推理架构,在不损失合成质量的前提下显著降低系统延迟,低并发场景下首包延迟压缩至90毫秒以内,达到业界领先的实时交互水平,适配智能语音播报、实时语音回复等低延迟办公需求。

在智能体工作流中,智能U2-TTS可将智能体的文字输出转化为自然、贴合场景的语音,实现智能会议纪要语音解读、报销流程语音提醒等功能,让智能体的交互从“文字”延伸到“语音”,提升办公场景的交互效率与体验。

04快速集成 + 无缝编排,开发者轻松打造工业级智能体

云知声三款Skill专为OpenClaw生态打造,最大化降低开发者的集成与使用成本,让智能体开发从“能用”走向“好用”:

1.企业级可靠性,告别Demo阶段

三款Skill均来自云知声真实商业业务沉淀,经过医疗、金融、办公等多场景大规模验证,提供稳定可预期的效果输出与官方持续维护、版本演进,让智能体真正走出Demo,落地工业级生产环境。

2.快速部署,开箱即用

开发者可以在OpenClaw中以标准化Skill节点直接调用,一键为智能体注入文档解析、语音识别与语音合成能力,无需投入大量精力进行技术研发与环境搭建。

3.无缝编排组合,打造定制化智能工作流

三款Skill可与ClawHub生态内其他能力自由组合、灵活编排,成为智能体开发的“能力积木”,轻松构建定制化办公智能体:

智能会议助手:U2-audio-file-transcriber转录会议录音提取关键信息,U2-doc-parser解析会议PPT、报表等文档,智能体自动关联语音与文档内容生成结构化会议纪要,再通过智能U2-TTS将纪要语音解读,将1小时的整理工作缩短至数分钟,实现会议全流程智能化。

医疗单据处理智能体:U2-doc-parser高精准解析医疗发票、费用清单、入院记录等单据并提取结构化数据,结合业务规则完成合规校验,再通过智能U2-TTS语音播报审核结果,实现医疗单据自动化处理与语音反馈。

财务报销智能体:U2-doc-parser识别报销发票、清单关键信息并校验,U2-audio-file-transcriber接收员工语音报销说明,智能体自动生成报销申请单,最后通过智能U2-TTS语音提醒报销进度,实现“拍照+语音”的极简报销流程。

从高精准文档解析到全场景语音交互,再到拟人化语音合成,云知声此次将三大核心能力以标准化Skill形式登陆ClawHub,是其AI技术在开源生态的重要落地,更是为办公自动化、智能体开发提供的全方位核心能力支撑。云知声始终秉持“真正的智能,不是炫技,而是融入生活”的理念,与OpenClaw生态携手,让更多高效、智能的AI智能体应用落地千行百业,重构智能办公新效率。

即日起,开发者可通过ClawHub官网直达相关Skill地址,一键调用云知声高水准的文档解析、ASR语音识别与TTS语音合成能力,轻松打造“眼明耳聪善言”的智能体工作流!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40940

    浏览量

    302515
  • 智能体
    +关注

    关注

    1

    文章

    551

    浏览量

    11642
  • 云知声
    +关注

    关注

    0

    文章

    325

    浏览量

    9460

原文标题:云知声三大核心Skill登陆ClawHub,文档解析+全场景ASR+TTS三重赋能智能体高效办公

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智科技语音交互插件上线ClawHub

    核心突破:填补生态空白近日,智科技自主研发的语音交互插件,包含ASR(自动语音识别)与TTS(语音合成)正式通过ClawHub官方审核并接入服务;与此同时,智自研的LLM(大语言模
    的头像 发表于 04-08 17:55 1110次阅读

    与AMD ROCm Lab签署战略合作协议

    3月25日,江苏科技有限公司(以下简称“”)与南京超威开源科技有限公司(以下简称“A
    的头像 发表于 04-01 11:21 798次阅读

    CEO黄伟博士做客斯坦福“与AI同行”系列讲座

    近日,斯坦福成长创新圈联合斯坦福上海校友会举办的斯坦福“与AI同行”系列讲座马年首场线上活动圆满落幕,CEO黄伟博士作为特邀嘉宾,结合近30年AI领域深耕经验与
    的头像 发表于 03-13 15:46 437次阅读

    成功中标某头部财险集团两项重点项目

    近日,AGI技术产业领军企业(股票代码:9678.HK)传来重磅捷报——单日斩获两大核心项目中标佳绩!携手某头部财险集团,一边落地医
    的头像 发表于 02-24 17:33 1880次阅读

    与嘉会医疗达成战略合作

    2月5日下午,国内人工智能技术与服务领军企业智能科技股份有限公司(以下简称“”)与中
    的头像 发表于 02-06 09:05 2484次阅读

    斩获DoNews 2025灵犀奖优秀企业奖

    (09678.HK)凭借持续迭代的核心技术实力与规模商业落地能力,从众多参评企业中脱颖而出,获评“2025灵犀奖——优秀企业奖”,
    的头像 发表于 01-07 18:15 1352次阅读

    入选2025爱分析Agent厂商全景报告大领域

    12月11日,国内权威数字市场研究与咨询机构爱分析正式发布《2025爱分析・Agent厂商全景报告》。(09678.HK)凭借在智能问答Agent、交通Agent及行业大模型
    的头像 发表于 01-06 16:53 1177次阅读

    山海医疗大模型问鼎MedBench4.0项榜首

    12月16日,中文医疗大模型权威评测平台MedBench4.0发布最新评测结果。自主研发的“山海医疗大模型(UniGPT‑Med)”展现出全面领先的技术实力,一举斩获医疗智能体、医疗大语言模型、医疗多模态大模型
    的头像 发表于 12-29 14:35 3542次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>山海医疗大模型问鼎MedBench4.0<b class='flag-5'>三</b>项榜首

    荣膺2025年浙江省服务业领军企业

    。此次获评,标志着已深度融入浙江省数字经济创新提质进程,也充分彰显了其全栈AGI技术在长角地区的广泛落地与应用成效。
    的头像 发表于 11-13 17:49 1407次阅读

    广凌标准化考场建设方案的核心模块

    一套完整的校园标准化考场建设方案,不仅是技术的集成,更是教育公平与现代治理的体现。通过智能、绿色的手段,标准化考场体系为考试安全筑起坚
    的头像 发表于 11-07 18:10 408次阅读
    广凌<b class='flag-5'>标准化</b>考场建设方案的<b class='flag-5'>核心</b>模块

    标准化考场是什么?

    很多现在都在建设标准化考场,标准化考场究竟是什么呢?
    的头像 发表于 09-05 16:45 1807次阅读
    <b class='flag-5'>标准化</b>考场是什么?

    兽牙智能体平台通过华为昇腾技术认证

    近日,(09678.HK)自主研发的兽牙智能体平台v1.0成功通过华为昇腾应用开发技术认证,获得Ascend Native认证证书及认证徽标的使用权。这一认证标志着
    的头像 发表于 07-11 18:20 1582次阅读

    在港交所成功上市

    近日,智能科技股份有限公司(以下简称“”)于香港联合交易所主板挂牌上市,股份代号:0
    的头像 发表于 07-03 17:41 1176次阅读

    AGI龙头企业港股上市,市值达147亿港元

    为147.44亿港元。   图:创始人董事长CEO黄伟博士在现场致辞表示:从今天起,我们将以香港为支点,将中国AGI产品带向全世界——用更敏捷的创新、更好的商业和更开放的心胸,
    的头像 发表于 06-30 11:44 3736次阅读
    AGI龙头企业<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>港股上市,市值达147亿港元

    与商汤科技达成战略合作

    近日,智能科技股份有限公司(以下简称“”)与上海商汤智能科技有限公司(以下简称“商汤
    的头像 发表于 06-20 14:52 1121次阅读