0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

快手自研文生图大模型“可图”开放,支持AI图像创作及定制

微云疏影 来源:综合整理 作者:综合整理 2024-05-31 10:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

5月30日最新动态,快手于近日向公众推出其自主研发的文生图大模型命名为“可图”。该模型具备文生图及图生图两种功能,适用于AI图像创作及AI形象定制。

用户可以通过微信小程序或网页版访问“可图”。据界面新闻报道,这是快手首次公开其自研大模型。据悉,“可图”大模型参数规模高达十亿级别,数据来源包括开源社区、快手内部构建及自研AI技术合成,涵盖了千万级别的中文实体概念。

此外,该模型采用强化学习和奖励模型技术(RLHF),有效解决了长文本和复杂语义文本输入下的效果问题。

快手内部今年确定了大模型应用策略,主要聚焦于理解、互动和生成三个方向,具体应用场景包括全域大模型内容理解、AI互动、商业场景的数字人和AIGC等。

实际测试结果显示,“可图”提供的功能包括“文生图”,以及多款动漫主题、写实人像风格,如上世纪流行的“红钻贵族”、近年热门的“粘土世界”风格,以及多种绘画样式。用户每次最多可生成4张图片。

早前报道,快手创始人兼CEO程一笑在今年3月表示,有信心在未来半年内,使大模型的综合性能达到GPT4.0的水平。同时,他还透露,快手文生图大模型“可图”的综合性能已经超越Midjourney V5。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1097

    浏览量

    42492
  • AI
    AI
    +关注

    关注

    91

    文章

    41966

    浏览量

    303061
  • 大模型
    +关注

    关注

    2

    文章

    3862

    浏览量

    5295
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    直播预告|玄铁 x Canonical:从本地推理到 AI 工厂,基于 RISC-V 的 AI 基础设施创新路径探讨

    模型浪潮下,AI 算力正向“本地推理”与“AI 工厂”两极延伸,而传统架构在低延迟与规模化之间往往顾此失彼。RISC-V 的定制特性,提
    发表于 05-15 12:15

    AI模型小龙虾-OpenClaw-0基础从入门到实战

    。OpenClaw 教程的适用优势在于其极低的“试错成本”。零基础用户可以通过拖拽式的流程编排,快速将“文本生成”与“图像生成”模型串联起来。输入一段简单的设定,几分钟内就能看到图文并茂的初稿。它让创作者不再受制
    发表于 05-06 16:04

    沐曦股份曦云C系列GPU产品Day 0适配百度文心ERNIE-Image文生模型

    4月15日,百度文心大模型团队重磅推出ERNIE‑Image文生模型,沐曦股份曦云 C 系列 GPU 已完成对 ERNIE‑Image 的Day 0 深度适配,同步
    的头像 发表于 04-15 17:39 597次阅读

    海光DCU Day0适配百度文心ERNIE-Image文生模型

      今天,百度文心大模型团队发布ERNIE-Image文生模型,海光DCU同步完成Day0适配与深度调优。全球开发者、科研机构和企业现可免费在光合开发者社区下载
    的头像 发表于 04-15 15:47 392次阅读

    安信AI语音模组支持MCP模型上下文协议

    安信 PalChat 系列(V1/V2)支持 MCP(模型上下文协议),工程师只需写几十行 C 代码,就能让 AI 模型直接控制硬件设备。
    的头像 发表于 04-15 09:54 612次阅读

    加快进程!Meta计划2027年底前推出四代AI芯片

    用于支持公司内部的AI训练和推理任务。   AI 芯片的推进进程   目前,MTIA 300已进入量产阶段,主要应用于内容排序和推荐系
    的头像 发表于 03-16 08:57 1.2w次阅读

    定制AI智能眼镜_带摄像头翻译导航大模型ai眼镜硬件方案

    AI眼镜硬件方案能满足高性能、低功耗、全场景交互需求,采用联发科(MTK)专属智能穿戴芯片方案作为核心算力支撑,整合1600万高清摄像头与2/3/5通道定制麦克风阵列,搭载
    的头像 发表于 02-02 19:46 398次阅读
    <b class='flag-5'>定制</b><b class='flag-5'>AI</b>智能眼镜_带摄像头翻译导航大<b class='flag-5'>模型</b>的<b class='flag-5'>ai</b>眼镜硬件方案

    使用NORDIC AI的好处

    提升能效,适合音频、图像和高采样率传感器等更重的 AI 负载。[Axon NPU 技术页] 模型更小、更快、更省电 Neuton 模型相较 TensorFlow Lite:* 内存
    发表于 01-31 23:16

    AI功能(SC171开发套件V3)2026版

    /28530.html *附件:文档:图像超分辨率(real esrgan x4plus)案例_V2.0.pdf 见文档说明 4 语音识别案例----基于广和通语音识别模型 10分
    发表于 01-15 11:18

    SeaVerse发布全球首个AI Native平台,“All in AI Native”引领AI创作前瞻革命

    2026年1月10日,SeaVerse宣布全球发布SeaVerse AI平台。这是全球首个AI原生的创建和部署平台,集合大语言模型图像生成、视频生成、Agent等多方面的能力,通过全
    的头像 发表于 01-14 17:41 1585次阅读

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVIDIA Omniverse 库和 Co
    的头像 发表于 12-01 09:25 1619次阅读

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    能够有效捕捉AI生成图像与真实手绘扫描图像在纹理、笔触、光影、全局一致性等方面的细微差异。 边缘端部署:将模型量化、编译,最终高效运行在算力有限的MaixCAM-Pro开发板上。 实时
    发表于 08-21 13:59

    亚马逊云科技现已上线OpenAI开放权重模型

    开放权重模型,向数百万亚马逊云科技客户开放。 客户可利用这些全新开放权重模型的先进推理能力,支持
    的头像 发表于 08-06 19:29 1023次阅读

    英伦科技10.1英寸裸眼3D数码相框升级了,玩转AI文生太cool了!

    此次升级将AI内容生成与裸眼3D显示深度结合,解决了传统3D内容制作成本高的痛点,使普通用户也能轻松创作个性化立体图像。配合无线传输、智能转化等成熟功能,该产品已成为集科技、艺术与情感于一体的创新载体。
    的头像 发表于 07-03 11:31 13.5w次阅读
    英伦科技10.1英寸裸眼3D数码相框升级了,玩转<b class='flag-5'>AI</b><b class='flag-5'>文生</b><b class='flag-5'>图</b>太cool了!

    4K、多模态、长视频:AI视频生成的下一个战场,谁在领跑?

    电子发烧友网报道(文/李弯弯) 6月11日,豆包App上线视频生成模型豆包Seedance 1.0 pro。这是字节跳动最新视频模型支持文字与图片输入,生成多镜头无缝切换的1080
    的头像 发表于 06-16 00:13 7635次阅读