0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI新模型可将文本转换为生动的图像

如意 来源:站长之家 作者:站长之家 2021-01-07 16:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今人工智能越来越强大,比如可以实现生成音乐、改变图片艺术风格等等。最近,人工智能非营利组织OpenAI发布了一个名为DALL-E的神经网络,可以将文本转换成与内容相关的图像。

比如生成下面这些穿着芭蕾舞裙挥舞着光剑的熊猫宝宝:

OpenAI在一篇博文中表示,该系统是具有里程碑意义的GPT-3语言模型的120亿参数版本。

DALL-E模型具有多种功能,包括创建动物和物体的拟物化版本,以合理的方式展示相关的概念,渲染文本,以及对现有图像进行转换。

比如在该模型中选定“与猫有关的文本关键词”,同时选择给定的其中一种猫类型,最终系统会自动生成一系列与猫主题有关的图像,并且风格呈现多样化。

训练该模型的数据集主要基于互联网大量文本-图像。这使得它能够通过探索提示的结构来创造出全新的图片。比如生成一些令人印象深刻的地标、位置、杂交动物和不同年代设计的图像。但是OpenAI承认并不是所有的结果都是成功的。

不过,OpenAI承认并不是所有生成的结果都是成功的。该公司表示,DALL-E系统有时无法绘制出某些特定的项目,混淆了对象与其特定属性之间的关系。

通常,提示DALL-E写的字符串越长,成功率越低。测试中发现,重复部分文本内容,准确率有所提高。

当回答有关地理方面的问题时,比如旗帜、菜肴和当地野生动物,DALL-E也经常反映出肤浅的刻板印象。考虑到人们越来越关注人工智能算法偏见的问题,这个缺点尤为明显。

OpenAI表示,它计划分析DALL-E等模特的社会影响,但该公司认为,该系统表明“通过语言操纵视觉概念现在已经触手可及。”

感兴趣的小伙伴可以在OpenAI网站上查看更多DALL-E模型生成的图像。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像处理
    +关注

    关注

    29

    文章

    1344

    浏览量

    59691
  • AI
    AI
    +关注

    关注

    91

    文章

    40982

    浏览量

    302534
  • 模型
    +关注

    关注

    1

    文章

    3811

    浏览量

    52257
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型微调企业项目实战课

    自主可控大模型:企业微调实战课,筑牢未来 AI 底座 在人工智能席卷全球商业版图的今天,企业对大模型(LLM)的态度已经从“新奇观望”转变为“全面拥抱”。然而,随着应用层面的不断深入,一个严峻
    发表于 04-16 18:48

    将TensorFlowSavedModel转换为支持imx8mpNPU的tflite模型,没有成功是怎么回事?

    我想将TensorFlowSavedModel转换为支持imx8mpNPU的tflite模型。 我按照以下步骤作,但没有成功 Python 模型/研究/object_detection
    发表于 04-16 06:09

    【瑞萨AI挑战赛】手写数字识别模型在RA8P1 Titan Board上的部署

    利用其AI Navi Conversion Tool完成模型转换、量化与编译,该工具拥有可视化GUI界面,操作友好,且无需手动将模型转换为
    发表于 03-15 20:42

    一文了解语音AI的运作方式

    语音 AI 是对话式 AI 的一个子集,包括可将人类语音转换为文本的自动语音识别 (ASR) 和文本
    的头像 发表于 02-27 16:10 505次阅读
    一文了解语音<b class='flag-5'>AI</b>的运作方式

    模型 ai coding 比较

    序 我主要用途是 ai coding,从各种渠道获取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    发表于 02-19 13:43

    使用NORDIC AI的好处

    提升能效,适合音频、图像和高采样率传感器等更重的 AI 负载。[Axon NPU 技术页] 模型更小、更快、更省电 Neuton 模型相较 TensorFlow Lite:* 内存
    发表于 01-31 23:16

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    如何将图像文件转换为二进制文件?

    如何将图像文件转换为二进制文件
    发表于 09-05 08:28

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    能够有效捕捉AI生成图像与真实手绘扫描图像在纹理、笔触、光影、全局一致性等方面的细微差异。 边缘端部署:将模型量化、编译,最终高效运行在算力有限的MaixCAM-Pro开发板上。 实时
    发表于 08-21 13:59

    在K230中,如何使用AI Demo中的object_detect_yolov8n,YOLOV8多目标检测模型

    在K230的AI开发教程文档中,可以看到有源码的AI Demo,其中包括yolov8n模型,在仓库里可以看到源码 我想请问各位大佬,如何使用这个程序?如何更改程序,替换为我自己的
    发表于 08-07 06:48

    无法将Tensorflow Lite模型转换为OpenVINO™格式怎么处理?

    将 Tensorflow Lite 模型转换为 OpenVINO™ 格式。 遇到的错误: FrontEnd API failed with OpConversionFailure:No translator found for TFLite_Detection_PostP
    发表于 06-25 08:27

    将Whisper大型v3 fp32模型转换为较低精度后,推理时间增加,怎么解决?

    将 openai/whisper-large-v3 FP32 模型转换为 FP16、INT8 和 INT4。 推理所花费的时间比在 FP32 上花费的时间要多
    发表于 06-24 06:23

    2.0.0版本的ST Edge AI Core在linux平台上可以把量化后的onnx模型转换为.nb,但是运行报错,缺少文件,为什么?

    2.0.0版本的ST Edge AI Core工具在linux平台上应该是可以把量化后的onnx模型转换为.nb,但是运行报错,缺少文件。
    发表于 06-17 06:29

    AI技术助力全球野生动植物保护

    下面让我们进一步了解正在使用 NVIDIA AI 和加速计算保护野生动物和自然栖息地的领先非营利组织与初创企业。
    的头像 发表于 04-29 11:28 1098次阅读