0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个令人惊艳的ChatGPT项目,开源了!

CodeSheep 来源:CodeSheep 2023-03-31 11:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近在GitHub上发现了一个爆火的开源项目,star数一顿暴增。

好家伙,凑近一看,居然还是由微软开源,并且和最近炙手可热的ChatGPT息息相关。

项目的名字叫做:Visual ChatGPT。

https://github.com/microsoft/visual-chatgpt

fe346fe4-cf69-11ed-bfe3-dac502259ad0.png

https://github.com/microsoft/visual-chatgpt

这个项目最早是3月上旬微软开源的,项目宣布开源后仅用了短短一周,就斩获了2w+ star。

fe3c0cd6-cf69-11ed-bfe3-dac502259ad0.png

截止到目前,距离当初项目开源仅仅过去了3周多,仓库star数则来到了27k+,亦可谓是火箭式上涨。

众所周知,ChatGPT自2022年11月推出以来,持续走红。

fe62158e-cf69-11ed-bfe3-dac502259ad0.jpg

ChatGPT具备强大的会话能力,可以理解文字、聊天、写小说、解答问题、编写代码... 但是目前还并不能直接处理或生成图像。

而Visual ChatGPT这个项目则可以把ChatGPT和一系列视觉基础模型(VFM,Visual Foundation Model)给联系起来,以便实现在ChatGPT聊天的过程中来发送和接收图像,也使得ChatGPT能够处理更为复杂的视觉任务。

fe73407a-cf69-11ed-bfe3-dac502259ad0.gif

讲白了,就是通过Visual ChatGPT,可以把一系列视觉基础模型给接入ChatGPT,使得ChatGPT能胜任更为复杂的视觉处理任务。

fe90c992-cf69-11ed-bfe3-dac502259ad0.jpg

Visual ChatGPT的整体技术架构图如上所示,我们可以清楚地看到ChatGPT和视觉基础模型(VFM,Visual Foundation Model)分别位于其中的位置。

一方面,ChatGPT(或LLM)作为一个通用接口,继续发挥它本身的优势,提供对不同话题的智能理解。

另一方面,基础视觉模型VFM则通过提供特定领域的深入知识来充当领域专家,它们通过交互管理模块(Prompt Manger)进行连接和适配。

这样聊可能比较抽象,我们可以拿官方给的一个例子来进行说明:

feb5352a-cf69-11ed-bfe3-dac502259ad0.png

1、首先是用户:输入一张黄色的向日葵图片,并且要求ChatGPT根据该图像预测深度来生成一朵红花,然后再一步一步将其做成卡通画。

2、接着是交互管理模块(Prompt Manger)发挥作用,在它的协调和控制下,VFM模块开始发挥作用:

首先需要运用深度估计模型来预测并生成图像的深度信息;

然后需要运用深度图像模型来生成对应空间深度的红花图像;

最后运用Stable Diffusion的风格迁移模型来完成图像风格的变换。

3、最后Visual ChatGPT系统再将最终结果返回给用户,完成本次对话。

说到这里,有兴趣的小伙伴可以可以看看微软给出的一篇有关Visual ChatGPT的论文:https://arxiv.org/pdf/2303.04671.pdf

fed2f54c-cf69-11ed-bfe3-dac502259ad0.png

https://arxiv.org/pdf/2303.04671.pdf

里面关于这部分的流程解释得非常详细,而且还给出了多轮对话的案例、以及实验结果,有兴趣的小伙伴可以看看。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4341

    浏览量

    46435
  • 视觉
    +关注

    关注

    1

    文章

    182

    浏览量

    24864
  • ChatGPT
    +关注

    关注

    31

    文章

    1600

    浏览量

    10391

原文标题:一个令人惊艳的ChatGPT项目,开源了!

文章出处:【微信号:CodeSheep,微信公众号:CodeSheep】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    开放原子开源基金会旗下项目亮相FOSSASIA Summit 2026,中国开源力量闪耀曼谷

         近日,亚洲重要开源技术盛会FOSSASIA Summit 2026在泰国曼谷举行。作为国际开源交流合作的重要平台,大会吸引全球开源开发者、技术专家、社区组织及产业伙伴参与,
    的头像 发表于 04-15 17:55 45次阅读
    开放原子<b class='flag-5'>开源</b>基金会旗下<b class='flag-5'>项目</b>亮相FOSSASIA Summit 2026,中国<b class='flag-5'>开源</b>力量闪耀曼谷

    开源鸿蒙项目顺利孵化毕业

    2025年11月21日,2025开放原子开发者大会在北京隆重启幕。作为本次大会的重磅环节和核心焦点之,在大会开幕式上,开放原子开源基金会(以下简称“基金会”)宣布开源鸿蒙项目达成
    的头像 发表于 11-27 14:36 699次阅读

    开源欧拉项目达成开源孵化目标顺利毕业

    11月21日,2025开放原子开发者大会在北京隆重启幕。作为本次大会的重磅环节和核心焦点之,在大会开幕式上,开源欧拉项目达成开源孵化目标、顺利毕业。
    的头像 发表于 11-25 17:40 1231次阅读

    开源鸿蒙项目达成开源孵化目标顺利毕业

    11月21日,2025开放原子开发者大会在北京隆重启幕。作为本次大会的重磅环节和核心焦点之,在大会开幕式上,开源鸿蒙项目达成开源孵化目标、顺利毕业,这是
    的头像 发表于 11-25 17:36 1256次阅读

    开放原子开源基金会与11项目完成捐赠签约

    11月21日,在2025开放原子开发者大会开幕式上,开放原子开源基金会与11开源项目完成捐赠签约,涵盖人工智能、量子计算、机器人、操作系统、物联网等多个关键技术方向。此举既是基金会完
    的头像 发表于 11-25 17:26 1014次阅读

    开源鸿蒙和开源欧拉成为开放原子开源基金会首批毕业项目

    11月21日,在2025开放原子开发者大会开幕式上,开放原子开源基金会宣布旗下开源鸿蒙(OpenHarmony)与开源欧拉(openEuler)成为首批毕业项目
    的头像 发表于 11-25 17:22 966次阅读

    开源鸿蒙技术大会2025丨以智能化为主旋律,擘画开源鸿蒙下一个五年发展技术蓝图

    ,与来自学术界和产业界的专家们共同回顾开源鸿蒙五年来走过的非凡历程,发布开源鸿蒙6.0版本,并展望面向未来的智能终端操作系统关键技术创新方向,呼吁与会专家以智能化发展为主旋律,共同擘画开源
    的头像 发表于 11-10 18:13 1665次阅读
    <b class='flag-5'>开源</b>鸿蒙技术大会2025丨以智能化为主旋律,擘画<b class='flag-5'>开源</b>鸿蒙下<b class='flag-5'>一个</b>五年发展技术蓝图

    deepin IDE入选Gitee最有价值开源项目

    近日,deepin IDE 成功入选 Gitee 最有价值开源项目(GVP)!
    的头像 发表于 10-14 18:10 1456次阅读

    我做了智能高速隔离的USBHub...开源

    设计的,但由于旋转编码器和USB-A的位置限制,因此不能放在推荐位置上(位置3、4)。 8 声明 本项目由作者在业余时间开发并开源。虽然尽力保证其可靠性和兼容性,但受限于个人精力,声明如下
    发表于 08-09 16:01

    开源项目!FourThirdsEye 开源 M4/3 相机模块

    FourThirdsEye 是开源相机板,专为树莓派5 (Raspberry Pi 5) 和树莓派计算模块4 (Raspberry Pi Compute Module 4) 设计,采用微型
    发表于 07-30 13:43

    开放原子开源基金会发布150余开源项目应用案例

    近日,在2025开放原子开源生态大会开幕式上,开放原子开源基金会发布150余开源项目应用案例
    的头像 发表于 07-28 17:10 1280次阅读

    开放原子开源基金会与新开源项目完成捐赠签约

    近日,在2025开放原子开源生态大会开幕式上,开放原子开源基金会与新开源项目完成捐赠签约,涵盖人工智能、具身智能、基础软件、区块链等多个
    的头像 发表于 07-28 17:04 1136次阅读

    普华基础软件荣膺优秀开源项目

    近日,2025上海开源创新菁英奖评选结果正式揭晓。普华基础软件开源安全车控操作系统小满EasyXMen凭借在开源技术创新与产业应用实践方面的突出表现,荣获“优秀开源
    的头像 发表于 07-28 16:48 1044次阅读

    Amazing Hand:开源的3D打印仿真机械手项目

    “  本文介绍款名为 Amazing Hand 的开源仿人机械手项目。该项目旨在解决市面上机器人手普遍昂贵且表现力不足的问题,提供
    的头像 发表于 07-21 11:22 6707次阅读
    Amazing Hand:<b class='flag-5'>一</b><b class='flag-5'>个</b><b class='flag-5'>开源</b>的3D打印仿真机械手<b class='flag-5'>项目</b>

    RT-Thread荣获2025优秀开源项目 | 新闻速递

    6月底,RT-Thread睿赛德受邀参与由上海开源信息技术协会主办的2025上海开源创新精英荟。上海市商委副主任张杰出席会议并致辞。RT-Thread嵌入式操作系统项目凭借其卓越的技术创新与
    的头像 发表于 07-04 09:04 2813次阅读
    RT-Thread荣获2025优秀<b class='flag-5'>开源</b><b class='flag-5'>项目</b> | 新闻速递