0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤大模型开“卷”长文本,支持100万字处理

微云疏影 来源:综合整理 作者:综合整理 2024-05-29 11:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据悉,商汤科技将于近日完成其每日新的重大升级,以提升长文本处理能力。据悉,升级后的大模型可支持超过100万字的超长文本,此外,它还能同时分析高达50份以上的文本材料。

知情者透露,此次升级的日日新大模型还具备跨平台操作特性,在Web和App端都可以使用。App端更是新增了粤语口语语音对话功能,进一步提升了模型对粤语及香港本土文化的理解。

自今年以来,AI大模型企业纷纷加大对长文本处理能力的研发力度。在月之暗面长文本处理能力引发关注之后,阿里巴巴、百度、腾讯以及360等互联网巨头也相继宣布支持相关技术。

值得注意的是,在月之暗面首次公布该项能力后,A股市场出现了多只股票涨停的情况。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    55

    文章

    11321

    浏览量

    108872
  • 商汤科技
    +关注

    关注

    8

    文章

    591

    浏览量

    37328
  • 大模型
    +关注

    关注

    2

    文章

    3449

    浏览量

    4974
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    万字长文AI智能体:17种体架构详细实现

    数据科学AI智能体领域发展迅猛,但许多资源仍然过于抽象和理论化。创建此项目的目的是为开发者、研究人员和AI爱好者提供一条结构化、实用且深入的学习路径,以掌握构建智能系统的艺术。
    的头像 发表于 11-07 13:16 304次阅读
    <b class='flag-5'>万字长文</b>AI智能体:17种体架构详细实现

    3万字长文!深度解析大语言模型LLM原理

    我们正在参加全球电子成就奖的评选,欢迎大家帮我们投票~~~谢谢支持本文转自:腾讯技术工程作者:royceshao大语言模型LLM的精妙之处在于很好地利用数学解决了工业场景的问题,笔者基于过往工程经验
    的头像 发表于 09-02 13:34 3099次阅读
    3<b class='flag-5'>万字长文</b>!深度解析大语言<b class='flag-5'>模型</b>LLM原理

    爆款应用背后的商汤大装置

    由想法流打造的“造梦次元”,是由多模态AI驱动的新一代内容平台,得益于商汤大装置AIGC解决方案从算力到模型的端到端支持,通过算力和模型模型
    的头像 发表于 06-18 16:44 810次阅读

    商汤科技日日新大模型SenseNova上线声网云市场

    日前,商汤科技日日新大模型SenseNova即将正式上线声网云市场,开发者和企业用户可通过声网的实时互动云服务进行调用,将商汤领先的模型能力集成到各类应用场景中,快速构建基于日日新大
    的头像 发表于 04-08 17:24 1321次阅读

    NVIDIA RTX 5880 Ada显卡部署DeepSeek-R1模型实测报告

    DeepSeek-R1 模型在 4 张 NVIDIA RTX 5880 Ada 显卡配置下,面对短文本生成、长文本生成、总结概括三大实战场景,会碰撞出怎样的性能火花?参数规模差异悬殊的 70B
    的头像 发表于 03-17 11:12 2611次阅读
    NVIDIA RTX 5880 Ada显卡部署DeepSeek-R1<b class='flag-5'>模型</b>实测报告

    商汤大装置DeepSeek企业版上线

    今年2月,商汤大装置象平台正式上线了DeepSeek-R1、DeepSeek-V3等模型,并为免费版提供3个月内千万Token额度,受到客户的热烈响应。
    的头像 发表于 02-25 10:07 787次阅读

    飞凌RK3588开发板上部署DeepSeek-R1大模型的完整指南(一)

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效能跃迁、多模态扩展规划、嵌入式适配等技术维度
    的头像 发表于 02-21 14:55 2996次阅读
    飞凌RK3588开发板上部署DeepSeek-R1大<b class='flag-5'>模型</b>的完整指南(一)

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    生成 支持常规代码生成 优化逻辑严谨性(长代码链、算法实现) 多语言支持 多语言均衡能力(中/英/小语种) 侧重中英文,尤其在技术术语上更精准 长文本处理 标准上下文窗口(约32K tokens
    发表于 02-14 02:08

    商汤大装置接入DeepSeek系列模型

    即日起,企业客户和开发者可在商汤大装置象平台中,快速部署DeepSeek-V3、DeepSeek-R1等模型,可享受3个月内1000tokens免费使用权益。
    的头像 发表于 02-10 10:16 1335次阅读

    阿里云通义开源长文本模型Qwen2.5-1M

    近日,阿里云通义宣布了一项重大开源举措,推出了支持100Tokens上下文的Qwen2.5-1M模型。这一新模型
    的头像 发表于 02-05 14:01 791次阅读

    商汤“日日新”融合大模型荣获双料冠军

    近日,商汤科技正式推出了其创新力作——“日日新”融合大模型。该模型在技术上实现了原生融合模态的突破,使得其深度推理能力和多模态信息处理能力均得到了显著提升。这一成果的发布,标志着
    的头像 发表于 01-13 16:10 847次阅读

    商汤科技推出“日日新”融合大模型

    刚刚,商汤正式推出“日日新”融合大模型,领先实现原生融合模态,深度推理能力与多模态信息处理能力均大幅提升,并在两大权威评测榜单夺得第一,成为“双冠王”。
    的头像 发表于 01-10 15:59 1139次阅读

    【6千字长文】车载芯片的技术沿革与趋势分析

    【本文是读者投稿。6千字长文,规格严谨。】01什么是芯片?什么是汽车芯片?芯片,通俗地说,就是一块小硅片集成了许多微小的电子元件,如晶体管、电阻、电容等元件通过复杂的电路连接在一起,形成一个功能强大
    的头像 发表于 12-31 22:37 2050次阅读
    【6千<b class='flag-5'>字长文</b>】车载芯片的技术沿革与趋势分析

    商汤日日新多模态大模型权威评测第一

    刚刚,商汤科技日日新SenseNova多模态大模型,在权威综合评测权威平台OpenCompass的多模态评测中取得榜单第一。
    的头像 发表于 12-20 10:39 1505次阅读

    万字长文,看懂激光基础知识!

    深入介绍激光基础知识,帮助您轻松理解激光领域的关键概念和原理。
    的头像 发表于 12-20 09:49 2120次阅读
    <b class='flag-5'>万字长文</b>,看懂激光基础知识!