0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微信大模型扩容并开源,推出首个中英双语文生图模型,参数规模达15亿

微云疏影 来源:综合整理 作者:综合整理 2024-05-14 17:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

腾讯于5月14日宣布将混元文生图大模型升级并公之于众,已发布至Hugging Face以及Github之上,包括模型权重、推理代码、模型算法等全方位数据,均向企业与个人开发者提供免费商业使用权限。

升级版混元文生图大模型采取了与Sora相同的DiT架构设计。腾讯强调,这是全球首个中英双语DiT架构。

基于Diffusion Transformer的混元DiT是一种文本到图像生成模块,具备中英细粒度理解能力,能与用户进行多轮对话,根据上下文生成并完善图像。

此外,它还是业界首个中文原生DiT架构文生图开源模型,支持中英文双语输入及理解,参数规模高达15亿。

运行该模型需配备支持CUDA的NVIDIA GPU,单次运行混元DiT所需最低显存为11GB;若要同时运行DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元DiT,则至少需32GB显存。腾讯表示,他们已在Linux环境下对NVIDIA的V100和A100 GPU进行过测试。

国内首次官方“大模型标准符合性评测”结果出炉,腾讯混元大模型成功入选首批通过评测的国产大模型行列,其他通过评测的大模型还包括阿里通义千问、360智脑和百度文心一言。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4761

    浏览量

    97147
  • 图像
    +关注

    关注

    2

    文章

    1095

    浏览量

    42162
  • 大模型
    +关注

    关注

    2

    文章

    3442

    浏览量

    4969
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技正式发布开源全新多模态模型架构NEO

    商汤科技正式发布开源了与南洋理工大学S-Lab合作研发的全新多模态模型架构 —— NEO,为日日新SenseNova 多模态模型奠定了新一代架构的基石。
    的头像 发表于 12-08 11:19 316次阅读
    商汤科技正式发布<b class='flag-5'>并</b><b class='flag-5'>开源</b>全新多模态<b class='flag-5'>模型</b>架构NEO

    今日看点:象帝先推出首款量产Imagination DXD GPU显卡;小米汽车累计交付突破 50 万台

    英伟发布专注于自动驾驶的视觉语言动作模型 近日,英伟宣布发布了 Alpamayo-R,这是一款面向自动驾驶研究的开源推理型视觉语言模型
    发表于 12-02 10:24 697次阅读

    规模专家并行模型在TensorRT-LLM的设计

    DeepSeek-V3 / R1 等模型采用大规模细粒度混合专家模型 (MoE) 架构,大幅提升了开源模型的质量。Llama 4 和 Qwe
    的头像 发表于 09-06 15:21 925次阅读
    大<b class='flag-5'>规模</b>专家并行<b class='flag-5'>模型</b>在TensorRT-LLM的设计

    华为宣布开源盘古7B稠密和72B混合专家模型

    电子发烧友网综合报道 2025年6月30日,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿
    的头像 发表于 07-06 05:51 7100次阅读

    华为正式开源盘古7B稠密和72B混合专家模型

    [中国,深圳,2025年6月30日] 今日,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿
    的头像 发表于 06-30 11:19 1114次阅读

    华为助力中国石油发布3000亿参数昆仑大模型

    昆仑大模型完成备案,成为中国能源化工行业首个通过备案的大模型,到2024年11月发布700亿参数昆仑大
    的头像 发表于 05-29 09:19 896次阅读
    华为助力中国石油发布3000<b class='flag-5'>亿</b><b class='flag-5'>参数</b>昆仑大<b class='flag-5'>模型</b>

    上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

    开源新一代通义千问模型Qwen3。据悉,Qwen3模型参数量仅为DeepSeek - R1的1/3,能够大幅降低成本,而且性能全面超越R1、OpenAI - o1等全球顶尖
    的头像 发表于 04-30 16:08 1128次阅读

    NVIDIA发布全球首个开源人形机器人基础模型Isaac GR00T N1

    NVIDIA 宣布推出一系列全新技术,助力人形机器人开发。其中包括全球首个开源且完全可定制的基础模型NVIDIA Isaac GR00T N1,该
    的头像 发表于 03-20 14:34 1221次阅读

    英伟GROOT N1 全球首个开源人形机器人基础模型

    英伟GROOT N1 全球首个开源人形机器人基础大模型
    的头像 发表于 03-20 11:05 1709次阅读

    NVIDIA 发布全球首个开源人形机器人基础模型 Isaac GR00T N1——推出加速机器人开发的仿真框架

    18 日 ——NVIDIA 今日宣布推出一系列全新技术,助力人形机器人开发。其中包括全球首个开源且完全可定制的基础模型 NVIDIA Isaac GR00T N1,该
    发表于 03-19 09:30 602次阅读
    NVIDIA 发布全球<b class='flag-5'>首个</b><b class='flag-5'>开源</b>人形机器人基础<b class='flag-5'>模型</b> Isaac GR00T N1——<b class='flag-5'>并</b><b class='flag-5'>推出</b>加速机器人开发的仿真框架

    腾讯混元大模型开源成绩斐然,GitHub Star数近1.4万

    内外部技术的开源共享,旨在促进技术创新与生态发展。 据悉,腾讯混元大模型已经在多个模态上实现了开源,包括语言大模型文生
    的头像 发表于 12-26 10:30 1057次阅读

    腾讯混元文生登顶智源FlagEval评测榜首

    榜首。 FlagEval作为智源研究院推出的大模型评测体系及开放平台,一直致力于评估基础模型及训练算法的性能。此次评测范围涵盖了国内外100余个开源和商业闭源
    的头像 发表于 12-25 10:06 1191次阅读

    云知声山海大模型多项评测名列前茅

    近日,智源研究院发布解读了国内外100余个开源和商业闭源的语言、视觉语言、文生文生视频、语音语言大
    的头像 发表于 12-24 10:29 764次阅读

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    设置为1的块中添加 Ghost 模块,以进一步提高 ESNet 的性能(b)。 2.2.2 Neural Architecture Search(NAS) Picodet 提出首个针对目标检测器
    发表于 12-19 14:33

    开源AI模型库是干嘛的

    开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练,能够执行特定的任务。以下,是对
    的头像 发表于 12-14 10:33 1295次阅读