0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何走过人工智能转型的转折点

姚小熊27 来源:企业网D1Net 作者:企业网D1Net 2020-11-04 09:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Milvus是一个开源项目,可以为开源人工智能生态系统提供数据服务功能。人们需要了解如何从中受益。

在谈到开源人工智能项目时,人们通常会想到Google TensorFlow、PyTorch等模型框架项目,由于模型框架是训练人工智能模型的关键组成部分,因此这些项目通常最受关注。但是人工智能并不是一种单一的技术,而是一个复杂的技术领域,涉及多个子领域和许多不同的组成部分。

向人工智能转型的转折点

一般而言,技术升级的转折点是其回报远远超出成本。当将其应用于人工智能转型时,它将涉及一些基本因素,其中包括模型(算法)、模型推断和数据服务。

在谈论模型时,人们需要了解利用人工智能技术的期望值。如果希望采用人工智能技术来击败和取代人类,例如采用人工智能驱动的对话机器人取代所有的客户支持专家,那么对人工智能模型的需求将相当高,并且在短期内无法实现。

如果企业想让客户支持专家从单调繁琐的日常工作中解脱出来,这意味着计划利用人工智能技术提高人类的生产力和能力,那么现在的模型在许多情况下都能实现。

这听起来令人鼓舞。但是关于模型的激烈争论是,尽管一些模型可供使用,但却没有一个最佳的模型。那些雇佣人工智能科学家拥有这些技术发展水平(SOTA)模型的公司。如果只使用公共模型,那么会失去竞争优势吗?人们对此感到困惑,因为他们认为效率更高的模型会带来更高的业务价值,但这种想法可能是错误的。在大多数情况下,模型有效性与商业价值之间的关系既不是线性的,也不是单调递增的。这一函数的图形如下所示。

这是一个分段函数。在第一阶段,在该模型在应用程序场景中实现实用之前,没有任何业务价值。在第二阶段,尽管理论上更好的模型应该具有更好的性能(响应时间和有效性等),但在实际场景中它可能并不那么明显。以下进行一下了解。

在医生确认患者是否患有肺部感染之前,需要对其肺部进行CT检查,将生成约300张CT图像。而经验丰富的医生将不得不花费5~15分钟来研究这些CT图像。在通常情况下,如果治疗的患者数量不多不会有什么问题。但是,在极端情况下(例如持续蔓延的冠状病毒疫情),患者数量激增将让医生不堪重负。

一个好消息是,数据科学家致力通过计算机视觉技术帮助医生。他们训练的模型可以在几秒钟内处理成百上千的CT图像并提供诊断建议。因此,医生只需花费1分钟的时间就可以查看模型生成的结果。因此,在采用机器学习技术之前,医生平均需要花费10分钟的时间才能查看一次CT扫描生成的结果,而现在大约需要1分钟。生产率提高了近90%。

如果有一个更快的模型,只需要3秒钟就可以生成结果,那会怎么样?如果有一个更有效的模型可以将准确度从80%提高到90%会怎么样?医生检查的结果会更少吗?其答案是否定的,这是因为该模型中,如果十分之一将会出错,但并不知道哪个是错误的,医生必须审查所有结果。因此不会节省更多的诊断时间。

此外,为了降低模型推理服务的成本,有时需要牺牲模型有效性。例如一个拥有5500万张商标图片的商业智能平台提供商,该公司希望提供一项服务,允许用户搜索这些商标的所有者。用户通过上传商标图像作为输入查询而不是给出关键字来执行搜索。

其背后的技术是计算机视觉,例如VGG模型。如果企业在后端服务器上运行模型推理,则必须分配和预留数据中心的硬件资源。另一个选择是部署一个规模更小的模型,这样企业就可以把模型推理放在边缘计算设备上(大多数情况下是智能手机)。它肯定会降低像GPU这样昂贵的模型推理硬件的成本。这是另一个例子,SOTA模型不可能在所有场景中都具有竞争力。

人们已经处在人工智能转型的转折点。接下来的问题是,如何走过这一转折点,并采用人工智能技术来增强业务能力。

可用模型是先决条件。但是,如果只具有模型,也无法轻松开发人工智能程序。像传统应用程序一样,数据服务始终是至关重要的部分。可以看到,它已成为当今采用人工智能的重要组成部分。这就是为什么启动开源项目Milvus来加速采用人工智能的原因。

采用人工智能的数据挑战

一些企业尝试通过人工智能技术处理的大多数数据都是非结构化的,因此期望Milvus项目为非结构化数据服务提供坚实的基础。

人们通常将数据分为结构化数据、半结构化数据、非结构化数据这三种。结构化数据包括数字、日期、字符串等。半结构化数据通常包括特定格式的文本信息,例如各种计算机系统日志。非结构化数据包括图片、视频、语音、自然语言和任何其他不能由计算机直接处理的数据。

据估计,非结构化数据至少占数字数据世界的80%。例如,人们可能每天与其家人、朋友或同事发送和接收数kB的短信。但即使只在移动设备上拍一张照片,例如采用具有1200万像素的摄像头iPhone 11,一张照片高达几兆字节。那么如果拍摄720p分辨率的视频呢?

一些企业开发了关系数据库、大数据等技术来高效地处理结构化数据。而半结构化数据可以通过基于文本的搜索引擎Lucene、Solr、Elastic search等进行处理,但是对于大量的非结构化数据,在以往并没有有效的分析方法。直到深度学习技术在近年来兴起,非结构化数据处理技术得到了快速的发展。

非结构化数据服务

嵌入是深度学习的一个术语,是指通过模型将非结构化数据转换为特征向量。由于特征向量是数字数组,因此很容易由计算机处理。因此,非结构化数据的分析可以转换为矢量计算。

一个最普遍的论点是特征向量似乎是非结构化数据处理的中间结果。那么是否有必要建立通用的矢量相似度搜索引擎?是否应将其包括在模型中?

专家认为,特征向量不仅仅是中间结果。它是深度学习场景中非结构化数据的知识表示。这也称为特征学习。

另一个论点是,由于特征向量还包含数值,为什么不对现有的数据处理平台(例如数据库)或计算框架(例如Spark)执行向量计算。

确切地说,向量由数字列表组成。这导致矢量计算和数值运算之间的两个重大区别。

首先,向量和数字最频繁的运算是不同的。对于数字来说,加减乘除是最常见的运算。但是对于向量,最常见的要求是计算相似度。人们会看到,在这里给出了计算欧几里德距离的公式,向量的计算比普通的数值计算要高得多。

其次,数据的索引组织不同。在两个数字之间,可以互相比较数值。这样就可以像B树那样根据算法来创建数字索引。但是在两个向量之间,无法进行比较。只能计算它们之间的相似性。因此矢量索引通常是基于近似最近邻神经网络算法。

由于这些显著的差异,传统的数据库和大数据技术很难满足矢量分析的要求。他们支持的算法和他们关注的场景都是不同的。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50357

    浏览量

    267013
  • 大数据
    +关注

    关注

    64

    文章

    9099

    浏览量

    144070
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    全国首批!拓维海云天通过人工智能企业评估认证

    近日,首批"人工智能企业评估认证"工作圆满结束。经严格评审,拓维海云天顺利通过认证,成为全国首批获得该权威资质的八家人工智能企业之一。本次认证由中国软件行业协会(全国发证机构
    的头像 发表于 04-20 18:09 183次阅读
    全国首批!拓维海云天通<b class='flag-5'>过人工智能</b>企业评估认证

    猫与商汤人工智能教育平台亮相联合国教科文组织

    在近日于法国巴黎联合国教科文组织(UNESCO)总部举行的“AI Day人工智能日”中,由商汤科技与青少年AI编程教育领军企业猫科技(编程猫)联合打造的“猫-商汤人工智能教育平台”
    的头像 发表于 04-10 13:55 368次阅读

    浅谈人工智能(2)

    接前文《浅谈人工智能(1)》。 (5)什么是弱人工智能、强人工智能以及超人工智能? 弱人工智能(Weak AI),也称限制领域
    的头像 发表于 02-22 08:24 352次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    Questa One 智能验证:释放人工智能在功能验证中的潜力

    品牌声誉受损。近期发布的 Wilson Research 数据显示,首次流片成功率降至 14%,创该研究开展 20 多年来的最低记录,且 75% 的 ASIC 项目进度滞后。为了应对这些挑战,行业正处在由人工智能 (AI) 驱动的革命性转折点上。
    的头像 发表于 02-12 14:56 686次阅读

    开发智能体配置-内容合规

    智能体上架前,需完成“人工智能生成合成内容标识”和“大模型备案信息”填写 ,以供平台审核;可在智能体【配置】-【内容合规】中填写。 人工智能生成合成内容标识 “
    发表于 02-07 11:44

    主线科技入选“人工智能+”创新应用实践案例

    正式收录于新华网联合中国软件评测中心编制的《实体经济和数字经济深度融合发展报告(2025)——“人工智能+”创新应用》,成为物流行业数智化转型的标志案例。
    的头像 发表于 01-12 09:23 527次阅读

    政策领航:“人工智能+”赋能,智慧能源平台开启能源转型新征程

     引言:政策引领下的能源智能转型新篇章 在全球能源转型人工智能技术深度融合的背景下,国家发展改革委、国家能源局于2025年9月发布《关于推进“
    的头像 发表于 10-20 15:57 909次阅读

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
    发表于 08-31 20:54

    人工智能+”,走老路难赚到新钱

    昨天的“人工智能+”刷屏了,这算是官方第一次对“人工智能+”这个名称定性吧?今年年初到现在,涌现出了一大批基于人工智能的创业者,这已经算是AI2.0时代的第三波创业潮了,第一波是基础大模型,第二波
    的头像 发表于 08-27 13:21 892次阅读
    “<b class='flag-5'>人工智能</b>+”,走老路难赚到新钱

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软硬件平台
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软硬件平台
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    维智科技为什么提出时空人工智能

    世界的关键转折点。为此,陶闯博士提出“时空人工智能”(Spatio-Temporal AI)概念,试图系统性地回答一个问题:如何让AI看得懂空间、学得会语义、做得了决策?
    的头像 发表于 06-12 14:30 1045次阅读