0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个令人惊艳的ChatGPT项目,开源了!

CodeSheep 来源:CodeSheep 2023-03-31 11:00 次阅读

最近在GitHub上发现了一个爆火的开源项目,star数一顿暴增。

好家伙,凑近一看,居然还是由微软开源,并且和最近炙手可热的ChatGPT息息相关。

项目的名字叫做:Visual ChatGPT。

https://github.com/microsoft/visual-chatgpt

fe346fe4-cf69-11ed-bfe3-dac502259ad0.png

https://github.com/microsoft/visual-chatgpt

这个项目最早是3月上旬微软开源的,项目宣布开源后仅用了短短一周,就斩获了2w+ star。

fe3c0cd6-cf69-11ed-bfe3-dac502259ad0.png

截止到目前,距离当初项目开源仅仅过去了3周多,仓库star数则来到了27k+,亦可谓是火箭式上涨。

众所周知,ChatGPT自2022年11月推出以来,持续走红。

fe62158e-cf69-11ed-bfe3-dac502259ad0.jpg

ChatGPT具备强大的会话能力,可以理解文字、聊天、写小说、解答问题、编写代码... 但是目前还并不能直接处理或生成图像。

而Visual ChatGPT这个项目则可以把ChatGPT和一系列视觉基础模型(VFM,Visual Foundation Model)给联系起来,以便实现在ChatGPT聊天的过程中来发送和接收图像,也使得ChatGPT能够处理更为复杂的视觉任务。

fe73407a-cf69-11ed-bfe3-dac502259ad0.gif

讲白了,就是通过Visual ChatGPT,可以把一系列视觉基础模型给接入ChatGPT,使得ChatGPT能胜任更为复杂的视觉处理任务。

fe90c992-cf69-11ed-bfe3-dac502259ad0.jpg

Visual ChatGPT的整体技术架构图如上所示,我们可以清楚地看到ChatGPT和视觉基础模型(VFM,Visual Foundation Model)分别位于其中的位置。

一方面,ChatGPT(或LLM)作为一个通用接口,继续发挥它本身的优势,提供对不同话题的智能理解。

另一方面,基础视觉模型VFM则通过提供特定领域的深入知识来充当领域专家,它们通过交互管理模块(Prompt Manger)进行连接和适配。

这样聊可能比较抽象,我们可以拿官方给的一个例子来进行说明:

feb5352a-cf69-11ed-bfe3-dac502259ad0.png

1、首先是用户:输入一张黄色的向日葵图片,并且要求ChatGPT根据该图像预测深度来生成一朵红花,然后再一步一步将其做成卡通画。

2、接着是交互管理模块(Prompt Manger)发挥作用,在它的协调和控制下,VFM模块开始发挥作用:

首先需要运用深度估计模型来预测并生成图像的深度信息

然后需要运用深度图像模型来生成对应空间深度的红花图像;

最后运用Stable Diffusion的风格迁移模型来完成图像风格的变换。

3、最后Visual ChatGPT系统再将最终结果返回给用户,完成本次对话。

说到这里,有兴趣的小伙伴可以可以看看微软给出的一篇有关Visual ChatGPT的论文:https://arxiv.org/pdf/2303.04671.pdf

fed2f54c-cf69-11ed-bfe3-dac502259ad0.png

https://arxiv.org/pdf/2303.04671.pdf

里面关于这部分的流程解释得非常详细,而且还给出了多轮对话的案例、以及实验结果,有兴趣的小伙伴可以看看。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    2989

    浏览量

    41720
  • 视觉
    +关注

    关注

    1

    文章

    140

    浏览量

    23678
  • ChatGPT
    +关注

    关注

    27

    文章

    1409

    浏览量

    4749

原文标题:一个令人惊艳的ChatGPT项目,开源了!

文章出处:【微信号:CodeSheep,微信公众号:CodeSheep】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛,还可以语音对话

    感谢发烧友论坛和Sipeed举办的本次活动,让我有机会可以体验到Longan Pi 3H这块超迷你的H618开发板。我打算用这块板子作为服务器,实现可以对话交互并且具备可视能力的ChatGPT
    发表于 04-12 12:41

    3月全志芯片开源项目分享合集

    基本的Linux派和语音扩展模板组成,非常简单。语音扩展模块提供基本的麦克风输入和功放,同时提供锂电池充放电系统,达到便携的目的,
    发表于 04-01 11:21

    在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

    当下AI人工智能崛起,很多开发领域都可看到ChatGPT的身影,FPGA设计中,是否也可以用ChatGPT辅助设计呢?
    发表于 03-28 23:41

    【国产FPGA+OMAPL138开发板体验】(原创)6.FPGA连接ChatGPT 4

    嗨,亲爱的工程师、学生和爱好者们,我来啦!欢迎来到神秘的星嵌世界!如果你是位FPGA工程师或者对嵌入式异构技术感兴趣,那么你来到的地方绝对没错!今天,我们将起探索
    发表于 02-14 21:58

    开源FPGA项目有哪些

    请问开源FPGA项目有哪些?
    发表于 12-26 12:09

    ChatGPT原理 ChatGPT模型训练 chatgpt注册流程相关简介

    ChatGPT注册没有外国手机号验证怎么办? ChatGPT作为近期火爆网络的AI项目,受到了前所未有的关注。我们可以与AI机器人实时聊天,获得问题的答案。但受ChatGPT服务器及相
    的头像 发表于 12-06 16:28 388次阅读
    <b class='flag-5'>ChatGPT</b>原理 <b class='flag-5'>ChatGPT</b>模型训练 <b class='flag-5'>chatgpt</b>注册流程相关简介

    不到1分钟开发GPT应用!各路大神疯狂整活,网友:ChatGPT就是新iPhone

    这个说法并不准确。尽管ChatGPT等语言模型已经在定程度上改变了我们获取信息、学习知识的方式,但它们并不能替代人类进行创造性思考和创造性活动。 虽然些人可能会利用ChatGPT
    发表于 11-19 12:06

    ESP32开源项目

    电子发烧友网站提供《ESP32开源项目.zip》资料免费下载
    发表于 07-13 10:47 3次下载
    ESP32<b class='flag-5'>开源</b><b class='flag-5'>项目</b>

    聊聊自己做过的开源项目

    起讨论自己做过的开源项目
    发表于 06-19 16:16

    乐高兼容小夜灯开源项目

    电子发烧友网站提供《乐高兼容小夜灯开源项目.zip》资料免费下载
    发表于 06-19 14:23 0次下载
    乐高兼容小夜灯<b class='flag-5'>开源</b><b class='flag-5'>项目</b>

    智能设备开源项目

    电子发烧友网站提供《智能设备开源项目.zip》资料免费下载
    发表于 06-14 11:39 1次下载
    智能设备<b class='flag-5'>开源</b><b class='flag-5'>项目</b>

    ChatGPT对话语音识别

    ChatGPT
    YS YYDS
    发布于 :2023年05月30日 22:13:10

    3 个令人惊艳ChatGPT项目开源了!

    此外,Stable Diffusion 母公司 Stability AI 也在 GitHub 开源了一款 AI 图像生成平台 StableStudio,未来将陆续接入多个图像生成大模型,让大家均可免费部署一个类似 Midjourney 的 AI 绘画平台。
    的头像 发表于 05-24 16:16 1460次阅读
    3 个<b class='flag-5'>令人</b><b class='flag-5'>惊艳</b>的<b class='flag-5'>ChatGPT</b><b class='flag-5'>项目</b>,<b class='flag-5'>开源</b>了!

    学术科研专用ChatGPT来了!刚开源,GitHub斩获34k+星

    最近,一位开发者在GitHub上开源的「科研工作专用ChatGPT项目大受好评。论文润色、语法检查、中英互译、代码解释等等一键搞定。
    的头像 发表于 05-19 15:07 1062次阅读
    学术科研专用<b class='flag-5'>ChatGPT</b>来了!刚<b class='flag-5'>开源</b>,GitHub斩获34k+星

    重磅!微软开源Deep Speed Chat,人人拥有ChatGPT……

    关注微软科技视频号 了解更多科技前沿资讯 点亮在看,给BUG点好看 原文标题:重磅!微软开源Deep Speed Chat,人人拥有ChatGPT…… 文章出处:【微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。
    的头像 发表于 05-11 20:16 365次阅读
    重磅!微软<b class='flag-5'>开源</b>Deep Speed Chat,人人拥有<b class='flag-5'>ChatGPT</b>……