0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

不懂就问AI:AI大模型embeding是什么

Geant4模拟学习交流 来源:Geant4模拟学习交流 2024-11-09 10:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

背景和问题

osc推文看到一部分内容,关于AI的,虽然作者早期也做过AI的一部分工作,就是简单的训练和预测,也是用的GAN等类似的生成对抗网络,但是毕竟好多年没有用了,而且现在是大语言模型相关的概念还是没怎么了解过,这不OSC,也就是开源中国提到的这个图,里面有个embeddings引发了我的思考,借本文也分享一下这个概念。

ec5b2a62-9040-11ef-a511-92fbcf53809c.png

解答

人工智能领域,特别是在处理自然语言处理(NLP)和机器学习任务时,“embedding”一词通常指的是将高维的离散数据(如单词、句子或图像)转换成低维的连续向量表示的过程。这种转换使得机器能够更好地理解和处理这些数据,因为连续的向量空间可以进行数学运算,如加法和乘法,这有助于捕捉数据之间的复杂关系。

以下是一些关于embedding的关键点:

词嵌入(Word Embedding):这是最常见的embedding形式,它将词汇映射到向量空间,使得语义上相似的词在向量空间中彼此接近。

句子嵌入(Sentence Embedding):将整个句子或短语转换成单一的向量,以捕捉句子的整体含义。

文档嵌入(Document Embedding):类似于句子嵌入,但用于更长的文本,如文章或文档。

图像嵌入(Image Embedding):在计算机视觉中,将图像转换成向量形式,以便进行图像识别和分类。

上下文嵌入(Contextual Embedding):某些模型,如Transformer和BERT,生成的嵌入不仅考虑单个词的含义,还考虑它在句子中的上下文。

预训练嵌入(Pre-trained Embedding):使用大量数据预训练得到的嵌入,可以在特定任务上进行微调,提高模型性能。

定制嵌入(Custom Embedding):针对特定任务或数据集定制的嵌入,可能需要从头开始训练或根据预训练嵌入进行调整。

嵌入空间(Embedding Space):嵌入向量所在的多维空间,不同的数据点在这个空间中以向量形式表示。

嵌入维度(Embedding Dimension):嵌入向量的维数,决定了模型可以捕捉的数据复杂性。

嵌入技术(Embedding Techniques):生成嵌入的方法,包括Word2Vec、GloVe、BERT等。

在AI大模型中,embedding是模型理解和处理数据的基础,它们使得模型能够执行各种复杂的任务,如语言翻译、情感分析、图像识别等。

小结

经过查询,我大概理解了一些内容,也就是类似与编解码,只不过是维度级别的编解码。以前用做数字识别的例子里面有个one-hot编码,也大概这个含义吧。不过瘾,画个图。

ec7a5b6c-9040-11ef-a511-92fbcf53809c.png

这里其实不是百分百这样的。很多时候embeddings,其实是嵌入的意思,很多时候是维度升高的。

我斗胆说一个想法,编码是训练的的基础,编码其实是数据预处理的一种手段。欢迎思想碰撞。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38099

    浏览量

    296620
  • 人工智能
    +关注

    关注

    1813

    文章

    49735

    浏览量

    261532
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23191

原文标题:不懂就问AI:AI大模型embeding的意思

文章出处:【微信号:gh_361ab7628207,微信公众号:Geant4模拟学习交流】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、现阶段更智能、更接近AGI的6中算法与模型 1、MoE模型 MoE模型作为Transfomer模型的后继者,代表着AI技术的一项重大创新和
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    流体芯片 ⑤AI计算平台 ⑥基于AI的自主决策系统 ⑦基于AI的自主学习系统 2、面临的挑战 ①需要造就一个跨学科、全面性覆盖的知识库和科学基础模型 ②需要解决信息不准确和认知偏差问题
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升算力还是智力

    本章节作者分析了下AI的未来在哪里,就目前而言有来那个两种思想:①继续增加大模型②将大模型改为小模型,并将之优化使之与大模型性能不不相上下。
    发表于 09-14 14:04

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑在本质上就是一台湿润的软组织
    发表于 09-06 19:12

    关于NanoEdge AI用于n-Class的问题求解

    我想请教一下关于NanoEdge AI用于n-Class的问题。我使用NanoEdge AI的n-Class模式,训练好模型,设计了3个分类,使用PC端的模拟工具测试过,模型可以正常对
    发表于 08-11 06:44

    ai_cube训练模型最后部署失败是什么原因?

    ai_cube训练模型最后部署失败是什么原因?文件保存路径里也没有中文 查看AICube/AI_Cube.log,看看报什么错?
    发表于 07-30 08:15

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音
    发表于 07-04 11:14

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、管锴、张心雨。 大模型的普及是近三年来的一件大事,万物皆可大模型已成为趋势。作为大
    发表于 05-02 09:26

    海思SD3403边缘计算AI数据训练概述

    模型,将模型转化为嵌入式AI模型模型升级AI摄像机,进行
    发表于 04-28 11:11

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    AI的演进正在逼近“终端智能涌现”的拐点,从通用模型向场景落地迁移成为关键议题。联发科以“AI随芯,应用无界”为主题召开天玑开发者大会2025(MDDC 2025),不仅聚合了全球生态资源,还
    发表于 04-13 19:52

    训练好的ai模型导入cubemx不成功怎么处理?

    训练好的ai模型导入cubemx不成功咋办,试了好几个模型压缩了也不行,ram占用过大,有无解决方案?
    发表于 03-11 07:18

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    开发一个视频内容生成Agent。 访问语聚AI平台官网 ,进行注册或登录。 在平台首页,了解语聚AI的功能和应用场景,特别是其支持的视频生成相关的AI模型和工具。 在语聚
    发表于 03-05 19:52

    霍尔电流传感器的原边端如何接入AI模型

    霍尔电流传感器的原边端如何接入AI模型,以便AI分析问题解决问题?话题会不会太超前?现在正式AI风口啊,猪都要起飞了
    发表于 03-03 15:18

    AI模型托管原理

    AI模型托管的核心在于将训练好的AI模型部署在云端或边缘服务器上,由第三方平台提供模型运行、管理和优化等服务。下面,
    的头像 发表于 02-26 10:31 915次阅读