0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI新模型可将文本转换为生动的图像

如意 来源:站长之家 作者:站长之家 2021-01-07 16:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今人工智能越来越强大,比如可以实现生成音乐、改变图片艺术风格等等。最近,人工智能非营利组织OpenAI发布了一个名为DALL-E的神经网络,可以将文本转换成与内容相关的图像。

比如生成下面这些穿着芭蕾舞裙挥舞着光剑的熊猫宝宝:

OpenAI在一篇博文中表示,该系统是具有里程碑意义的GPT-3语言模型的120亿参数版本。

DALL-E模型具有多种功能,包括创建动物和物体的拟物化版本,以合理的方式展示相关的概念,渲染文本,以及对现有图像进行转换。

比如在该模型中选定“与猫有关的文本关键词”,同时选择给定的其中一种猫类型,最终系统会自动生成一系列与猫主题有关的图像,并且风格呈现多样化。

训练该模型的数据集主要基于互联网大量文本-图像。这使得它能够通过探索提示的结构来创造出全新的图片。比如生成一些令人印象深刻的地标、位置、杂交动物和不同年代设计的图像。但是OpenAI承认并不是所有的结果都是成功的。

不过,OpenAI承认并不是所有生成的结果都是成功的。该公司表示,DALL-E系统有时无法绘制出某些特定的项目,混淆了对象与其特定属性之间的关系。

通常,提示DALL-E写的字符串越长,成功率越低。测试中发现,重复部分文本内容,准确率有所提高。

当回答有关地理方面的问题时,比如旗帜、菜肴和当地野生动物,DALL-E也经常反映出肤浅的刻板印象。考虑到人们越来越关注人工智能算法偏见的问题,这个缺点尤为明显。

OpenAI表示,它计划分析DALL-E等模特的社会影响,但该公司认为,该系统表明“通过语言操纵视觉概念现在已经触手可及。”

感兴趣的小伙伴可以在OpenAI网站上查看更多DALL-E模型生成的图像。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像处理
    +关注

    关注

    28

    文章

    1340

    浏览量

    59181
  • AI
    AI
    +关注

    关注

    89

    文章

    38163

    浏览量

    296858
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51719
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    无法将Tensorflow Lite模型转换为OpenVINO™格式怎么处理?

    将 Tensorflow Lite 模型转换为 OpenVINO™ 格式。 遇到的错误: FrontEnd API failed with OpConversionFailure:No translator found for TFLite_Detection_PostP
    发表于 06-25 08:27

    2.0.0版本的ST Edge AI Core在linux平台上可以把量化后的onnx模型转换为.nb,但是运行报错,缺少文件,为什么?

    2.0.0版本的ST Edge AI Core工具在linux平台上应该是可以把量化后的onnx模型转换为.nb,但是运行报错,缺少文件。
    发表于 06-17 06:29

    使用OpenVINO GenAI和LoRA适配器进行图像生成

    借助生成式 AI 模型(如 Stable Diffusion 和 FLUX.1),用户可以将平平无奇的文本提示词转换为令人惊艳的视觉效果。
    的头像 发表于 03-12 13:49 1552次阅读
    使用OpenVINO GenAI和LoRA适配器进行<b class='flag-5'>图像</b>生成

    将ONNX模型转换为中间表示 (IR) 格式,收到了错误的输出是怎么回事?

    将 ONNX* 模型转换为中间表示 (IR) 格式,并收到了错误的推断输出。自定义模型使用动态形状。
    发表于 03-07 08:20

    将YOLOv4模型转换为IR的说明,无法将模型转换为TensorFlow2格式怎么解决?

    遵照 将 YOLOv4 模型转换为 IR 的 说明,但无法将模型转换为 TensorFlow2* 格式。 将 YOLOv4 darknet 转换为
    发表于 03-07 07:14

    如何将Keras H5模型转换为中间表示 (IR) 格式?

    第 1 步: 将 Keras H5 模型转换为保存的型号格式 安装 依赖关系: cd deployment_toolsmodel_optimizerinstall_prerequisites
    发表于 03-07 06:11

    可以使用OpenVINO™工具包将中间表示 (IR) 模型转换为TensorFlow格式吗?

    无法将中间表示 (IR) 模型转换为 TensorFlow* 格式
    发表于 03-06 06:51

    ONNX模型无法转换为IR v10,为什么?

    使用以下命令将 ONNX* 模型转换为 IR:mo --input_model model.onnx 该模型无法转换为 IR v10,而是转换为
    发表于 03-06 06:32

    使用模型优化器命令将ONNX模型转换为OpenVINO™ IR格式时出现“ReplacementID”错误怎么解决?

    使用模型优化器命令将 ONNX 模型转换为 OpenVINO™ IR 格式: --input_model \"{onnx_path} --input_shape [1,512, 896
    发表于 03-05 09:41

    将ONNX模型转换为IR后报错,怎么解决?

    运行模型优化器,以将 ONNX 模型转换为 IR。 收到错误:[ ERROR ] The ExpandDims node Unsqueeze_333 has more than 1 input
    发表于 03-05 09:11

    使用myriad_compile将IR模型转换为blob后收到错误怎么解决?

    使用模型优化器将自定义 TensorFlow* 2 模型转换为中间表示 (IR)。 使用 myriad_compile 将 IR 模型转换为
    发表于 03-05 08:27

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    常见的 Hugging Face 格式模型转换为 RKLLM 模型转换后的模型能完美适配 Rockchip NPU 平台,充分释放 NP
    发表于 02-14 17:42

    一文详解视觉语言模型

    视觉语言模型(VLM)是一种多模态、生成式 AI 模型,能够理解和处理视频、图像文本
    的头像 发表于 02-12 11:13 3271次阅读
    一文详解视觉语言<b class='flag-5'>模型</b>

    【「基于大模型的RAG应用开发与优化」阅读体验】+Embedding技术解读

    今天学习大模型RAG 检索增强生成技术Embedding,即嵌入,是一种将离散数据(如文字、图像、音频等)转换为连续的密集向量表示的技术。这些向量能够反映原始数据之间的关系,使得计算机能够更好地处
    发表于 01-17 19:53