0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

360开源70亿参数模型,助力360k长文本输入

微云疏影 来源:综合整理 作者:综合整理 2024-03-29 15:54 次阅读

近日,360公司创始人周鸿祎透露,他们即将发布基于360智脑7B的新版本(70亿参数模型),并支持全文字符长度达360K(50万字)的文本输入。

周鸿祎指出,近期大模型产业正在以数据量为竞争重点,百万字文本处理能力“有望成为未来标配”。他表示,360决定发布这项功能,以避免相关行业研发者重复投入精力,同时360K作为长度单位也是象征性的选择。

此外,周鸿祎也被视为“开源信徒”,他深信开源的力量。

据悉,360智脑的长文本处理能力已经落实在他们的大模型产品——360AI浏览器上。周鸿祎亦提及其对小型模型的看法,即小型模型优势在于速度和用户体验良好,且只需单机单卡运行,具有较高的性价比。

当前,360AI浏览器已经向用户提供100万字的长文本处理能力和网页、中英论文等常见文档、音频视频处理服务,帮助用户快速实现要点总结、思维导图生成等操作。

据先前的信息披露,京东推出的模型Kimi以及其他国产品牌大模型都已纷纷加入“长文本”战场,包括百度文心一言预计下月升级后将开放200至500万字的长文本能力;360智脑正在试验500万字长文本,即将发布至360AI浏览器;阿里通义千问则宣布面向所有用户提供1000万字长文档处理免费服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浏览器
    +关注

    关注

    1

    文章

    975

    浏览量

    34429
  • 开源
    +关注

    关注

    3

    文章

    2991

    浏览量

    41723
  • 大模型
    +关注

    关注

    2

    文章

    1543

    浏览量

    1139
收藏 人收藏

    评论

    相关推荐

    单日获客成本超20万,国产大模型开卷200万字以上的长文本处理

    更精准的推理和高并发流量以外,似乎已经没有太多值得厂商大肆宣传的特性了,直到最近超长文本处理的爆火。   国产大模型的新卷法,长文本处理   当下将大模型
    的头像 发表于 03-27 00:53 2761次阅读
    单日获客成本超20万,国产大<b class='flag-5'>模型</b>开卷200万字以上的<b class='flag-5'>长文本</b>处理

    科大讯飞创新推出长文本、长图文、长语音大模型,解决落地难题

    近期,科大讯飞推出了首个支持长文本、长图及语音大数据处理的大模型,该系统融合了多元化数据源,包括海量文字、图片以及会议音频等,能为各行业场景提供专业化、精准化的答案。
    的头像 发表于 04-28 09:32 76次阅读

    Kimi爆火背后的技术奥秘 大模型长文本能力的技术难点

    当用户认为在国内的大模型中,长文本=kimi的时候,除非竞争对手能以绝对的实力碾压几个量级,但凡与kimi打平或者是微弱超越,都很难威胁到kimi在用户心目中的地位。
    发表于 04-17 10:11 146次阅读
    Kimi爆火背后的技术奥秘 大<b class='flag-5'>模型</b><b class='flag-5'>长文本</b>能力的技术难点

    360集团和哪吒汽车合作 将共同发布NETA GPT大模型

    360集团和哪吒汽车合作 将共同发布NETA GPT大模型 3月1日,360集团与哪吒汽车签署战略合作协议,双方计划共同发布大模型产品NETA GPT,预计发布时间在4月份。届时将会把
    的头像 发表于 03-02 15:51 702次阅读

    快速全面了解大模型长文本能力

    那关于LLM的长文本能力,目前业界通常都是怎么做的?有哪些技术点或者方向?今天我们就来总结一波,供大家快速全面了解。
    发表于 02-22 14:04 307次阅读
    快速全面了解大<b class='flag-5'>模型</b><b class='flag-5'>长文本</b>能力

    Meta发布CodeLlama70B开源模型

    Meta发布CodeLlama70B开源模型 Meta发布了开源模型CodeLlama70B
    的头像 发表于 01-31 10:30 967次阅读

    求助,关于ADuCM360与AD7903使用官网例程问题

    ( sckx)不接入千人360时可以从ad7903获取数据,而且得到的数据可以随着输入变化而变化,这是什么原因呢?毕竟sdox 和 sdox 键是根据sccx( sckx)来输出数据的。 图 3 不接
    发表于 12-05 07:29

    阿里云通义千问720亿参数模型宣布开源

    12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。与此同时,他们还开源了18亿参数模型Qwen-1.8B和音频大模型Qwe
    的头像 发表于 12-01 17:08 859次阅读

    港中文贾佳亚团队联手MIT发布超长文本扩展技术,打破LLM遗忘魔咒

    它代表着业界对长文本大语言模型的重新思考和关注,有效扩展了大语言模型的上下文窗口,允许模型考虑和处理较长的文本序列,是大语言
    的头像 发表于 10-18 15:54 314次阅读
    港中文贾佳亚团队联手MIT发布超<b class='flag-5'>长文本</b>扩展技术,打破LLM遗忘魔咒

    如何获取电容的S参数模型

    使用Sigirty进行PDN仿真时,比较关键的一步是设置电容的S参数模型,近来有不少同学和同行朋友来要一些电容的S参数模型
    的头像 发表于 10-02 15:04 1245次阅读
    如何获取电容的S<b class='flag-5'>参数模型</b>?

    达观曹植大模型正式对外公测!专注于长文本、多语言、垂直化发展

    处理工程实践经验,已开发出具有长文本、多语言、垂直化三大特点的专用国产“曹植”大语言模型。7月伊始,达观正式对外发布“曹植”大语言模型应用公测版,可在达观数据官网申请试用! 申请通道与规则 1 申请通道 公司官网申请通道
    的头像 发表于 07-12 15:04 606次阅读
    达观曹植大<b class='flag-5'>模型</b>正式对外公测!专注于<b class='flag-5'>长文本</b>、多语言、垂直化发展

    北京君正应用案例:3K高清、360云台摄像机8Max评测

    ​ ​   现在各种视频拍摄设备都很卷,手机做到了2亿像素,行车记录都要求4K高画质了,现在也轮到云台摄像机了。   家里有宠物或者宝宝保姆看管的朋友估计都会安装这种摄像机。其实这类摄像机的使用环境
    发表于 06-21 18:26

    360智脑大模型应用发布 周鸿祎数字分身上任“360发言人”

    周鸿祎预告,下一步360计划发布插件平台,将进一步推动大模型产业生态发展。
    的头像 发表于 06-13 17:46 467次阅读
    <b class='flag-5'>360</b>智脑大<b class='flag-5'>模型</b>应用发布 周鸿祎数字分身上任“<b class='flag-5'>360</b>发言人”

    Meta开源文本如何生成音乐大模型

    年初,谷歌推出了音乐生成大模型 MusicLM,效果非常不错。有人称这比大火的 ChatGPT 还重要,几乎解决了音乐生成问题。近日,Meta 也推出了自己的文本音乐生成模型 MusicGen,并且
    的头像 发表于 06-12 15:11 549次阅读
    Meta<b class='flag-5'>开源</b><b class='flag-5'>文本</b>如何生成音乐大<b class='flag-5'>模型</b>

    将客户360度系统与GPT API集成:技术架构视角

    Customer 360 是跨多个接触点了解和管理客户数据的综合方法。组织必须全面了解客户的交互、偏好和需求,以便提供个性化的体验和服务。集成 GPT API 等 AI 驱动的语言模型可以显著增强
    发表于 06-09 09:20 340次阅读
    将客户<b class='flag-5'>360</b>度系统与GPT API集成:技术架构视角