0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通义千问开源千亿级参数模型

CHANBAEK 来源:网络整理 2024-05-08 11:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

通义千问近日开源了其首个千亿级参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源模型。Qwen1.5-110B模型继承了Qwen1.5系列的Transformer解码器架构,并在技术上引入了分组查询注意力方法(GQA),极大地提升了模型在推理时的效率。

这款拥有1100亿参数的模型支持高达32K的上下文长度,同时展现出了卓越的多语言能力。无论是中文、英文、法语、德语、西班牙语、俄语,还是日语、韩语、越南语和阿拉伯语等,Qwen1.5-110B都能提供精准、流畅的语言处理体验。这一里程碑式的开源模型,无疑将为AI领域的科研人员、开发者和爱好者提供更为强大、灵活的工具。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4037

    浏览量

    45578
  • 通义千问
    +关注

    关注

    1

    文章

    37

    浏览量

    527
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里通义发布小尺寸模型Qwen3-4B,手机也能跑

    电子发烧友网综合报道 8月7日,阿里通义宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。目前新
    的头像 发表于 08-12 17:15 6310次阅读
    阿里<b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b>发布小尺寸<b class='flag-5'>模型</b>Qwen3-4B,手机也能跑

    请问InDTU IHDMP协议使用的CRC校验使用的什么参数模型

    InDTU IHDMP协议使用的CRC校验使用的什么参数模型
    发表于 08-06 07:57

    广和通加速通义Qwen3在端侧全面落地

    6月,广和通宣布:率先完成通义Qwen3系列混合推理模型在高通QCS8550平台端侧的适配部署。广和通通过定制化混合精度量化方案与创新硬件加速算法,成功突破Qwen3新型架构在边缘
    的头像 发表于 06-25 15:35 779次阅读

    比亚迪座舱接入通义模型,未来将联合打造更多AI智能座舱场景

    高质量壁纸,随时间自动调节光影与色调,打造行业首创的个性化车载体验;基于通义星尘,上线“心理伴聊”等场景,结合智能语音对话系统,为车主提供情感陪伴、心理疗愈,打造“温暖”座舱;在营销服务领域,比亚迪基于阿里云百炼调用通义
    的头像 发表于 06-12 08:52 500次阅读

    Arm CPU适配通义Qwen3系列模型

    近日,阿里巴巴开源了新一代通义模型 Qwen3,Arm 率先成为首批成功适配该模型的计算平台
    的头像 发表于 05-12 16:37 1104次阅读

    NVIDIA使用Qwen3系列模型的最佳实践

    阿里巴巴近期发布了其开源的混合推理大语言模型 (LLM) 通义 Qwen3,此次 Qwen3 开源
    的头像 发表于 05-08 11:45 2601次阅读
    NVIDIA使用Qwen3系列<b class='flag-5'>模型</b>的最佳实践

    上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

    开源新一代通义模型Qwen3。据悉,Qwen3模型参数
    的头像 发表于 04-30 16:08 1131次阅读

    壁仞科技完成阿里巴巴通义Qwen3全系列模型支持

    4月29日,阿里巴巴通义发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen3发布后数小时内,壁仞科技完成全
    的头像 发表于 04-30 15:19 1357次阅读

    低至¥2.27/h!就能使用全球最强开元模型—— QwQ-32B

    ABSTRACT摘要捷智算平台上新全球最强开元模型——QwQ-32B。JAEALOT2025年3月18日3月17日,阿里通义
    的头像 发表于 03-19 12:34 883次阅读
    低至¥2.27/h!就能使用全球最强开元<b class='flag-5'>模型</b>——<b class='flag-5'>千</b><b class='flag-5'>问</b> QwQ-32B

    阿里最新消息:国家超算互联网平台、广州算力中心、多所高校接入通义模型

    QwQ-32B是阿里通义团队最新开源的推理模型QwQ-32B发布后稳居全球最大AI开源社区
    的头像 发表于 03-14 11:54 1138次阅读

    Manus与阿里通义达成合作

    据媒体报道,火爆异常的AI Agent新秀Manus和阿里云旗下大语言模型通义达成合作。双方将基于通义
    的头像 发表于 03-12 15:47 1224次阅读

    摩尔线程支持阿里云通义QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义QwQ-32B。摩尔线程在该模型发布后2小时内,
    的头像 发表于 03-07 17:48 1124次阅读
    摩尔线程支持阿里云<b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b>QwQ-32B<b class='flag-5'>开源</b><b class='flag-5'>模型</b>

    广和通基于阿里云通义模型推出随身智能解决方案,赋能消费电子终端行业

    2月,广和通与全球领先的云解决方案提供商阿里云达成合作:广和通AI模组及解决方案,基于阿里云通义模型,推出“随身智能解决方案”,赋能消费电子行业。
    的头像 发表于 03-03 17:55 1051次阅读
    广和通基于阿里云<b class='flag-5'>通义</b>大<b class='flag-5'>模型</b>推出随身智能解决方案,赋能消费电子终端行业

    阿里云通义Qwen2.5-Max模型全新升级

    )模型领域的最新探索成果。该模型经过了超过20万亿tokens的预训练数据洗礼,展现出了极强劲的综合性能。在多项公开主流模型评测基准上,Qwen2.5-Max均取得了高分,全面超越了目前全球领先的
    的头像 发表于 02-05 14:07 1179次阅读

    阿里云通义开源长文本新模型Qwen2.5-1M

    近日,阿里云通义宣布了一项重大开源举措,推出了支持100万Tokens上下文的Qwen2.5-1M模型。这一新模型在处理长文本任务中展现出了卓越的性能,稳定超越了GPT-4o-mini
    的头像 发表于 02-05 14:01 787次阅读