0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT的核心算法为何如此强大?

新思科技 来源:未知 2023-03-17 18:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ChatGPT近期成为了全球话题中心。短短两个月,ChatGPT注册用户数已经破亿,成为史上用户破亿速度最快的软件之一。它不但可以回答问题,还能写诗,写代码,提供旅游攻略…而ChatGPT的核心结构正是Transformer模型。

Transformer是一种能够同时处理所有输入数据的深度学习模型,最初是为翻译和自动问答等自然语言处理应用开发的。计算机视觉应用领域过去主要采用卷积神经网络(CNN),现在Transformer模型则更为流行,但它不会取代CNN,而是与之配合来提高视觉处理应用的准确度。

比如,当自动驾驶汽车在行驶过程中遇到障碍物,它是如何判断马路中间的是人,而不是电线杆呢?自动驾驶汽车的物体检测和防撞系统必须正确识别前方路况并给车辆发出相应的指令。在现代汽车的计算机视觉处理应用中,深度学习模型就发挥着重要作用。

除了汽车会采用AI驱动的计算机视觉技术外,摄像头如今已经在很多系统中都普及开了,手机和安防系统等大量基于摄像头的设备都已经在使用神经网络来提高图像质量和准确性了。

为何Transformer是嵌入式计算机视觉的理想选择呢?Transformer又将如何改变深度学习架构的发展方向?哪些技术可以优化这些模型来获得更出色的结果?本文将带着这些问题与大家共同探讨。

更专注的注意力机制

更好的情景感知

10多年来,CNN一直是视觉处理的首选深度学习模型。随着技术的不断发展,CNN现已能够准确地完成图像分类、物体检测、语义分割(对图像中的每个像素进行分组或标记)和全景分割(识别物体位置以及对每个物体中的每个像素进行分组和标记)。

但Transformer除了需要将语言块替换为图像块外,不需要任何其他修改就可以在准确性方面超越CNN。

2017年,Google Research将Transformer定义为一种基于自注意力机制的新型神经网络架构,特别适合用于语言理解。到2020年,Google Research的科学家们发表了一篇关于Vision Transformer(ViT)的文章,ViT是一个基于原始Transformer架构的模型。据该文章表示,当有足够的数据进行训练时,ViT表现出了优异的性能,超过了先进的CNN,而所需的计算资源却只有CNN的四分之一。这些Transformer虽然需要庞大的数据集进行训练,但确实非常擅于处理图像分类和物体检测等视觉任务。

Transformer之所以能够在视觉应用中游刃有余,其专有的注意力机制是关键,该机制让模型能够对特定情境有更深入的理解。Transformer和CNN一样都可以检测到前方道路上的物体是行人,而不是电线杆或者一棵树,但不同的是,Transformer并不会同等处理所有像素,它更多关注的是数据中微小但重要的部分,比如那个行人,而不太会去过多关注代表道路其余部分的那些不重要像素。

在处理每帧数据时,CNN通常并不会考虑该帧之前和之后的数据。而相比CNN,Transformer更擅于学习较为复杂的模式,因此所需的计算也就更多,所以在速度方面Transformer没有CNN快,但它也在努力的奋起直追了。

GPU目前可以支持这二种模型,但如果在实际应用中需要以更小的尺寸和更低的功耗来实现更高的性能,那么NPU或神经处理单元等专用AI加速器将会是更好的选择。

为了提高推理效率,视觉处理应用可同时使用CNN和Transformer。要想实现全方位视觉感知,仅靠纯视觉模型可能无法轻松获得所需的信息,而多模态学习可以提供更详尽的视觉信息。此外,Transformer等基于注意力机制的神经网络非常适合像汽车应用这种集成了多个传感器的应用。

利用NPUIP优化

Transformer和CNN的性能

Transformer包括以下几种运算:

  • 矩阵乘法

  • 逐元素加法

  • Softmax数学函数

  • L2归一化

  • 激活函数

目前大多数AI加速器都针对CNN进行了优化,但它们并非全都适合Transformer。Transformer需要庞大的计算能力来执行大量计算并支持其注意力机制。

新思科技的ARC NPX6 NPU IP就是一款能够同时处理CNN和Transformer的AI加速器。ARC NPX6 NPU IP的计算单元包括一个用于矩阵乘法(对这两种深度学习模型都非常重要)的卷积加速器,以及一个用于处理Transformer运算和激活函数的张量加速器。该IP提供高达3,500 TOPS的性能和高达30 TOPS/瓦的出色能效。

设计团队还可以使用新思科技的MetaWare MX开发工具包来加速其应用软件开发。该工具包提供了一个综合的软件编程环境,其中包括神经网络软件开发工具包和对各种虚拟模型的支持。

ChatGPT安全吗?

在ChatGPT爆火的背后,我们也要知道,ChatGPT或者其他AI软件所产出的内容或做出的决策并不是无懈可击的。这些工具提供的结果往往会和现实有所偏差,而只有人类才能基于现实去对结果进行检查和验证。

而且是否会有人利用ChatGPT编写恶意代码来进行网络攻击呢?自从人类开始编写代码以来,开发人员一直都在无意或者有意地编写出可被利用的代码。幸运的是,有很多安全测试工具可以帮助开发者们进行安全防护。无论编码者是谁,都应该使用安全工具扫描源代码发现漏洞。

总结

Transformer拥有强大的计算能力,且一直在自然语言处理应用中被广泛采用。现在,因Transformer模型基于其注意力机制的神经网络拥有更出色的情感感知能力,智能手机、安防系统、自动驾驶汽车等实时视觉处理应用也开始采用此模型。以后,各种基于摄像头的产品会越来越先进,提供的图像质量也越来越高。在深度学习中加入Transformer后,嵌入式视觉摄像头系统势必能够提供更清晰的图像和更准确的物体检测。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 新思科技
    +关注

    关注

    5

    文章

    983

    浏览量

    53002

原文标题:ChatGPT的核心算法为何如此强大?

文章出处:【微信号:Synopsys_CN,微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程携手上海AI实验室Day-0适配DeepSeek-V4核心算

    MTT S5000 上完成了核心算子的Day-0适配。目前算子通过率已超80%,真正实现了模型发布与国产算力适配的同步落地。这一成果不仅为开发者提供了无缝部署体验,更彰显了 KernelSwift 与 MUSA 软件栈在生态协同中的强大支撑作用。
    的头像 发表于 04-30 16:24 1315次阅读

    AI 算法核心知识清单(深度实战版2)

    三、机器学习核心算法(入门到实战)​1.监督学习算法(已知标签的模型训练)​线性模型​线性回归(回归任务):​核心原理:假设y=w₀+w₁x₁+w₂x₂+...+wₙxₙ+ε(ε为误差项),通过
    的头像 发表于 04-24 11:58 226次阅读
    AI <b class='flag-5'>算法</b><b class='flag-5'>核心</b>知识清单(深度实战版2)

    火灾防控新趋势:红外热成像火情监控为何如此重要?

    在火灾防控领域,传统技术正面临严峻挑战。浓烟遮挡视线、夜间能见度低、隐蔽火源难以发现等问题,导致火灾初期响应效率低下。而红外热成像技术的突破性应用,为火灾防控带来了革命性变革。这项基于物体热辐射原理的技术,通过红外探测器捕捉0.75-1000μm波段的红外能量,将不可见的热分布转化为可视化图像,使消防人员能在复杂环境中精准定位火源、监测火势蔓延,成为现代火灾
    的头像 发表于 04-08 16:40 258次阅读
    火灾防控新趋势:红外热成像火情监控<b class='flag-5'>为何如此</b>重要?

    端子电流循环寿命试验机核心算法解析:温升预测模型与寿命衰减曲线拟合

    端子电流循环寿命试验机的核心算法,是实现端子寿命精准预测、测试过程智能管控的关键,其中温升预测模型与寿命衰减曲线拟合两大核心算法,分别解决了测试过程中的温度动态调控与寿命趋势研判问题,共同构建起科学
    的头像 发表于 04-02 09:21 203次阅读
    端子电流循环寿命试验机<b class='flag-5'>核心算法</b>解析:温升预测模型与寿命衰减曲线拟合

    蓝牙信标、UWB等主流室内定位无线技术的参数对比、核心算法和选型指南详解(二)

    本文系统解析室内定位无线技术,涵盖蓝牙、Wi-Fi、UWB、RFID、超声波、可见光等主流技术的原理、参数对比与核心算法(RSSI、TDOA、AoA),并提供按精度、成本、场景匹配的选型指南,助力民用、工业、资产盘点及特殊环境下的最优技术选择。
    的头像 发表于 12-12 16:28 1983次阅读
    蓝牙信标、UWB等主流室内定位无线技术的参数对比、<b class='flag-5'>核心算法</b>和选型指南详解(二)

    政策多次提及,零碳园区为何如此重要?氢能源如何进入?

    11月10日,《国家发展改革委、国家能源局关于促进新能源消纳和调控的指导意见》发布。意见指出,推进零碳园区建设。 这是2025年国家层面第三次明文支持零碳园区建设,不难看出国家的支持力度,那么,零碳园区为何如此重要呢?从目前发展情况来看,氢能源又该如何与零碳园区融合发展?
    的头像 发表于 11-12 15:16 544次阅读
    政策多次提及,零碳园区<b class='flag-5'>为何如此</b>重要?氢能源如何进入?

    芯片专家精准赋能:超声切割技术迎来核心算法突破新契机

    在产学研深度融合的背景下,超声波技术领域正迎来新的发展机遇。近期,广东工业大学集成电路学院院长熊晓明教授团队与固特超声开展技术对接,针对超声波设备的核心控制瓶颈提出了创新性的芯片级解决方案。技术瓶颈
    的头像 发表于 11-11 18:18 963次阅读
    芯片专家精准赋能:超声切割技术迎来<b class='flag-5'>核心算法</b>突破新契机

    Camellia算法的实现二(基于开源蜂鸟E203协处理器)

    115200波特率向FPGA发送数据或密钥数据,UART_RX模块接收到数据后,进行串并转换,并将转换后的数据传给Camellia的核心算法模块进行处理。经过处理后的数据,并进行并串转换后,通过UART_TX
    发表于 10-30 06:35

    AI的核心操控:从算法到硬件的协同进化

           人工智能(AI)的核心操控涉及算法、算力和数据三大要素的深度融合,其技术本质是通过硬件与软件的协同优化实现对复杂任务的自主决策与执行。这一过程依赖多层技术栈的精密配合,从底层的芯片架构
    的头像 发表于 09-08 17:51 1197次阅读

    液态金属电阻率测试仪的核心算法与信号处理技术

    液态金属电阻率测试仪之所以能在科研与工业领域精准捕捉液态金属的电学特性,背后离不开核心算法与信号处理技术的协同支撑。这两大技术如同测试仪的“智慧大脑” 与 “敏锐感官”,前者负责将原始测量数据转化
    的头像 发表于 09-01 09:21 769次阅读
    液态金属电阻率测试仪的<b class='flag-5'>核心算法</b>与信号处理技术

    三相接触式调压器为何如此受欢迎

    三相接触式调压器通过调节输出电压来满足不同电气设备的电压需求,广泛应用与工业生产、科学试验及家用电器的测试领域中、电器产品负载老化、设备测试、调压、控温、调速、调光和功率控制等场景。三相接触式调压器为什么好用,具体体现在以下几个方面:
    的头像 发表于 08-13 15:56 904次阅读
    三相接触式调压器<b class='flag-5'>为何如此</b>受欢迎

    三坐标测量机路径规划与补偿技术:核心算法解析

    三坐标测量的微米级精度背后,是精密的路径规划算法与实时补偿技术在保驾护航。三坐标测量机的智能避撞算法保障了测量的安全与高效;温度补偿技术消除了环境的无形干扰;点云智能处理则让海量数据蜕变为精准的工程
    的头像 发表于 08-01 14:15 1837次阅读
    三坐标测量机路径规划与补偿技术:<b class='flag-5'>核心算法</b>解析

    shimetapi:开源RGB+EVS视觉融合相机事件相机工具链与算法

    的接口控制和算法处理。 一、shimetapi_Hybrid_vision_algo (算法层 SDK) 定位: 这是 SDK 的核心算法处理层,位于架构的中间层(黄色部分)。 核心
    的头像 发表于 06-26 13:52 873次阅读

    FLIR Si2x系列声学成像仪的五大优势

    在防爆行业,安全与效率是企业运营的重中之重,FLIR Si2x系列声学成像仪,凭借其卓越的性能和广泛的应用场景,成为了众多用户的佳选,那么它为何如此受欢迎呢?
    的头像 发表于 06-13 11:29 1176次阅读

    交流电机EMC整改:电磁兼容问题为何成为核心挑战

    深圳南柯电子|交流电机EMC整改:电磁兼容问题为何成为核心挑战
    的头像 发表于 05-28 11:19 1489次阅读
    交流电机EMC整改:电磁兼容问题<b class='flag-5'>为何</b>成为<b class='flag-5'>核心</b>挑战