0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大量使用开源的中国 AI 应用,会是下一个被卡住的吗?

hl5C_deeptechch 来源:YXQ 2019-06-11 08:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近来美国基于出口管制条例(EAR)规范,要求多个不同领域的企业、组织不得与特定的中国企业往来,这其中除了已为外界所知的原料、芯片、零部件、软件以外,也包括不同形式的技术标准与产业联盟组织。这些企业或组织与中国企业之间的往来,多半还是基于封闭式条件环境下的往来关系,通过商业协议或是申请加入组织的条件。但相较于此,对于部分开源(Open source) 的资源,未来是不是也会受到美国出口管制条例的限制,这将是另一个值得关注的重点。

美国出口管制阴影笼罩,开源架构不等于自主可控

在所谓的开源资源中,以开源项目的主体来看,只要是注册在美国本土的开源基金会或开源项目提供者,就有可能受到美国法令的管制。以 Linux 基金会网站上的资料显示,其旗下的部分开发项目确实各自依其不同的规范提报申请出口审查、并取得许可。另外在 Apache 基金会的部分,则是原本就规范所有项目都必须遵守美国出口管制规定。

图丨 Linux 基金会网页上对于旗下开源项目受出口管制规定限制的申请状况(来源:Linux 基金会)

而除了开源基金会的项目外,在所谓的开源码托管平台上的项目,也同样会受到美国出口管制规定的限制,特别是由美国企业所拥有的平台,例如去年被微软收购的 GitHub。前不久,GitHub 就在其使用规范中调整凸显相关文字,强调 GitHub 上的使用与相关活动必须遵守美国出口管制规范。

另外,在其他的开源项目部分,也依循同样的思维模式,也就是若其所属主体,或者是拥有此一开源项目的企业受到美国出口管制的规范,则这些开源项目也同样受限,例如 Google 的 TensorFlow

以此就延伸出一个问题,这些过去被认为是“开源”的技术资源,其最大的优势与特性,就在于开放架构,但在如今美国动用了极端手段的情况下,原本开源项目最大的特性——“开放”被戳破了,原本合理使用就不存在侵权问题的开发项目或产品技术,突然暴露在可能侵权的风险中。这牵涉到的一个问题就在于,原本是以所谓的“自主可控”为出发点、选择采用开源架构所开发的技术与产品,但到最后居然还是逃不过被掐住脖子的陷阱吗?

以现在的发展状况来看,虽然表面上只有华为受到影响,但长期来看,在未来中国企业发展自有核心能力技术产品解决方案的道路上,原本基于全球技术开发共生体系所运行的开源合作项目,也可能随时因为美国或其他国家的一纸禁令,就让部分企业开发的产品陷入开发源码技术升级断炊,甚至可能遭控不当使用的侵权风险。

曾经在百度、华为负责 AI 自有架构技术开发项目的第四范式创始人、CEO 戴文渊在接受 DeepTech 专访时就认为,国内企业在使用开源系统开发产品时,应该关注到开源系统的背后是什么?必须要理解的是,并不是开源就是“自主可控”。

事实上,在 2017 年 Facebook 修改其 React 开源框架协议,就曾经在国内互联网业界造成很大的震动,因为,国内有许多互联网公司的产品都是使用 React 框架进行开发。戴文渊表示,在开源系统背后,也要看到底是一个民主的社区,还是背后其实是存在一个巨头的操控,如果是由巨头企业操控的开源社区,包括像 GitHub 类似的事件就是如此,这也会触动更多人进而去思考“开源”与“自主可控”之间的关系。

大量使用开源的中国 AI 应用,会是下一个被卡住的吗?

过去几年中国 AI 的快速发展受到全球瞩目,从 2018 年开始,就持续有不同单位的研究统计报告指出,从论文数、论文引用数、甚至是 AI 技术专利申请数量来看,中国即将、甚至是已经超越美国。但即使如此,在近来的科技封锁禁令风波中,还是凸显了一个值得深究的问题:中国 AI 研究与应用科技的发展已经脱离了被“卡脖子”的阶段了吗?而若以当前开源项目也可能随时受到出口禁令影响的状况来看,下一个被波及的会是中国的 AI 企业吗?

戴文渊在专访中特别提到:“中国在过去的十年时间里,在 AI 领域建立了一个领先优势,但最近我发现有一定的问题,这个问题来自于什么?其实是我们可能更偏实用主义一些,10 年前我们为了去做一个应用,因为那时候没有任何的基础设施,没有 TensorFlow、甚至连 Spark 都没有,而那时我们在百度,为了把百度的凤巢系统做出来,需要从底层一行一行地写代码,最后才把一个应用做出来。从这一点来看,其实中国的开发者是有能力从底层一层层往上写的。但是当我们有现成的东西可以直接拿来用的时候,比如 TensorFlow,出于实用主义大家可能就不太愿意去关注底层了,就直接拿过来,把应用做出来。”

但相较于当年,近几年有越来越多的开源工具可以快速导入开发应用,许多开发者很自然地会选择开源工具,加快应用开发的速度,这原本应该是科技发展进步的推动力,只是走到现在这个时点上,强调快速导入开发的“实用主义”似乎反而让中国开发者、甚至是中国的科技企业落入了另一个失去自主可控权的难题中。

对此,过去曾经参与过百度、华为重要自有底层技术项目开发的戴文渊表示担忧:“我看到最近这几年的趋势,当 TensorFlow 出来了以后,越来越少的企业去从底层开始考虑,越来越少的企业对自己的技术是自主可控的,这其实有很大的风险。”

事实上,近年中国企业有许多的应用是建构在美国大型企业所掌控的开源架构上,例如像是 TensorFlow、Caffe 等等,这些看似开放的开源架构,但在实际运作上却还是有许多规则的限制。戴文渊以他的实际经验提到:“比方说我们想去提交代码,虽然说它是一个社区,但是这个社区是有一个巨头所掌控,其他的人可以在这个社区里活动,但你想去改 TensorFlow 的核心代码,巨头一定是不会同意的。并且他想封锁,完全取决于他自己的策略。”

以目前国内 AI 企业的动作来看,不论是第四范式或者是商汤等其他企业,都曾对自有架构提出过明确的主张与想法,这些企业的最主要概念都在于,要提供一个不受外在变数影响、能够稳定提供应用服务的产品,而要做到这一点,就不只是单纯地求快、求方便,而是基于更长期的发展需求。

戴文渊回顾过去第四范式选择从底层自己一路开发的作法,他认为关键在于希望能够保持算法的灵活度,特别是有些算法如果要在 TensorFlow 上实现,是需要去改 TensorFlow 的底层,但这其实是不被容许的,但如果是自有的底层框架,自然是想改就能改。

除了灵活度外,还有另一个值得注意的关键在于对客户负责,特别是要对客户运营的安全性负责。戴文渊表示,第四范式的客户很多都是国计民生行业的头部企业,如金融、能源等,源代码如果暴露在外面,黑客就有机会针对一个防伪冒的系统,根据其获得的数据以及代码的计算逻辑,去探测出模型可能长什么样,然后进行攻击。基于对客户负责的角度来看,提供从底层开始自主可控的服务是经过多方面考虑的结果。

根据业界一个非正式的统计数字,在现有的中国开发者群体中使用 TensorFlow 的占比大概超过 70%,但戴文渊认为,实际上会受影响的应用产品比例可能低于这个数字,因为有些大型企业所提供的应用服务,其实都是更早之前就已经搭建完成的,特别是一些目前在市场上应用较为广泛、市场份额较大的应用,多半都不是使用 TensorFlow 之类的开源框架,因为这些应用开发的时间远早于这些开源项目推出的时间,但不可否认,有些应用在后来可能会开始用一些 TensorFlow 进行开发。

不可否认的是,TensorFlow 或其他开源框架的使用其实已经相当普遍,面对应用产品可能出现的问题,其实也已经有企业开始思考如何补漏,以第四范式为例,就已开始研究能让 TensorFlow 代码在第四范式自主开发的“先知平台”引擎上运行,但上层看起来仍然是 TensorFlow 的 Script。

对于很多 AI 解决方案供应商而言,目前已经导入企业客户运行的应用产品不能就此中断或完全替换,因此必须要能够提供另一条路径,未来若真出现被封锁的状况,还能够让客户把所有代码迁移到自主开发的系统里,但不可否认的是,这将会有非常大的工作量。

中国 AI 软件领先优势,将撬动中国 AI ASIC、服务器硬件全新机遇

对比中国与美国的 AI 框架的先进程度,戴文渊认为,中国国产框架技术和美国比是没有任何劣势的,即使是和 TensorFlow 比,主要的差别还是在于使用人数的多寡,TensorFlow 的使用者数量确实是比较大。

但相较于对中国国产 AI 框架技术能力抱持乐观看法,戴文渊认为影响中国 AI 或者是整体科技发展最大的风险还是在硬件上,因为中国与美国之间的差距确实比较明显,但这不代表中国就没有机会了,反而是在 AI 科技应用发展上,因为中国的 AI 框架软件技术等等都有一定的竞争力,所以,如果能够与硬件有更好的整合,特别是在像是 AI 服务器的发展上。

戴文渊认为:“中国要能够赶上美国,要做出像英特尔Intel)这样水平的 CPU,恐怕还是有一定难度的。虽说现在也有国产 CPU,但还是有一定的差距,甚至这个差距可能并不是一年两年能追得上的,但如果就 AI 计算来看,我们发现对 CPU 的依赖其实会越来越少,CPU 原来是一个通用的计算单元和一个中央处理器,中央处理器的价值依然还在,但通用计算单元的价值则变得越来越低,因为越来越多的计算可以放到 ASIC 上去算。”

观察国内 AI 企业在过去 1 年多来的发展路径,可以发现AI 算法应用与硬件的融合是非常明显的方向,不论是通过开发自有 ASIC,或者是开发自有的加速卡、服务器等等,都是许多 AI 企业看准的趋势。外界或许会将此解读为更容易商业化落地实现收入的作法,但就技术发展的层次来看,AI 的软硬整合确实有其既有技术发展的逻辑。

戴文渊就以第四范式自身的例子说明这个逻辑:“为什么我们能做加速卡,原因是我们能做软件,我们了解软件,所以可以把它硬件化,而且这是个未来趋势。因为 AI 系统是非常有套路的,不像编程语言,可以任意地去写,AI 是按照步骤的,有非常固定的计算模式。如果说今天让我们去真的做一个通用服务器,短期内仍有很大的差距,但这是我看到这个 AI 时代最大的机会,也是中国有可能赶上的最大机会,因为这样的 AI 服务器来自一个软件驱动的硬件设计,不是硬件系统的硬件设计,而中国在软件部分现在是领先的,所以在做软件驱动的硬件设计时,能够获得一定的领先优势。目前第四范式的软件与国内硬件厂商合作所取得的性能效果,并不亚于 TensorFlow+美国硬件,硬件的差距在靠软件和加速芯片追回。”

戴文渊就说:“到今天,我们走的这条路也是必经之路。因为,当我们开始去改造一些企业场景时,一旦牵涉到大量的场景被改造,马上就意味着算力不够用了,算力不够用,也意味着必须要去优化硬件,但这不是说去买一个更好的 CPU、GPU 就可以的,因为 CPU 和 GPU 并不知道你的软件长成什么样,我们见过的很多 GPU 服务器跑 AI 应用是没有性能提升的。因为,很多时候瓶颈并不在 GPU 算力的问题上,它可能在网络上、也可能在读写上,因此必须要有一个软硬件联合的优化,才能充分地将性能发挥出来,所以这条路是必须要走的。”

当我们站在当前的转折点上,面对技术开发道路的抉择,“自主可控”不是清谈议论的理想,而将是影响技术产品开发成功与否的长期关键因素。这一波美国出口管制禁令掀翻的滔天巨浪,不只冲刷出长期存在、只是隐而未现的缺口,从另一个角度来看,这也可能为中国科技产业的发展冲出一个新的机会,身处其中,中国 AI 企业将有机会迎来一波新的升级蜕变。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40941

    浏览量

    302524
  • 开源
    +关注

    关注

    3

    文章

    4325

    浏览量

    46428

原文标题:TensorFlow 等“开源陷阱",会掐住中国 AI 企业的命门吗?

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    下一个“TWS神话”?211%增长引爆赛道,AI眼镜竞争全面升级

    ,标志着该品类正式进入百万级出货俱乐部。 市场爆发:2025中国智能眼镜销量将暴涨211% 2025年,全球AI智能眼镜市场中,Meta枝独秀,霸榜全球第。但是国内市场,
    的头像 发表于 03-10 10:29 7521次阅读
    <b class='flag-5'>下一个</b>“TWS神话”?211%增长引爆赛道,<b class='flag-5'>AI</b>眼镜竞争全面升级

    十方融海小智AI的“开源样本”:生态扩张如何重构中国AI产业逻辑

    的——小智AI不仅没有"抄作业",反而吸引了数万开发者和数百家硬件厂商加入生态。这个数字还在持续增长,小智AI正在成为中国AI
    的头像 发表于 03-20 17:27 950次阅读
    十方融海小智<b class='flag-5'>AI</b>的“<b class='flag-5'>开源</b>样本”:生态扩张如何重构<b class='flag-5'>中国</b><b class='flag-5'>AI</b>产业逻辑

    AI+车,“吉速”中国

    张L3级自动驾驶汽车上路通行牌照发出。 这些突破点,全球媒体形容为一个个科技领域的“中国时刻”。我们也不免好奇,下一个有关智能化的中国时刻
    的头像 发表于 03-16 17:12 915次阅读
    <b class='flag-5'>AI</b>+车,“吉速”<b class='flag-5'>中国</b>

    嵌入式开发是否会成为下一个看好的领域?

    聊嵌入式开发会不会成为下一个风口,现在确实是挺热门的话题。各种论坛、投资报告都在讲物联网、智能硬件、AIoT的万亿市场,仿佛只要跟嵌入式沾边,就能乘着东风起飞。但如果套用我们刚才聊的那套逻辑,就会发现,这事儿还真“不好说”,得把那些热闹的表面词藻扒开,看看里面的筋骨。
    的头像 发表于 02-26 09:56 620次阅读
    嵌入式开发是否会成为<b class='flag-5'>下一个</b><b class='flag-5'>被</b>看好的领域?

    半导体测试,是“下一个前沿”

    ,但半导体测试是“下一个前沿”,它是设计与制造之间的桥梁,解决了传统分离领域之间模糊的界限。更具体地说,通过连接设计和制造,测试可以帮助产品和芯片公司更快地生产出
    的头像 发表于 12-26 10:02 704次阅读
    半导体测试,是“<b class='flag-5'>下一个</b>前沿”

    文读懂!AI搜索既是趋势也是未来,定不可错过的GEO机遇

    AI对搜索来说不是替代,而是进化,是搜索体验的下一个阶段。并已在众多你意想不到的场景中深入我们的生活,应用非常广泛,到处都有AI搜索的影子。
    的头像 发表于 12-12 17:38 2702次阅读

    下一个“电子茅台”,会是连接器吗?

    大特征:供给高度集中、产能扩张缓慢、需求出现结构性增长,从而带来价格趋势性、周期性上涨的动力。内存条(DRAM/HBM)因2023–2025年的价格飙升视为典型代表。而连接器——尤其是AI服务器、新能源汽车所用高端连接器产品——正在展
    的头像 发表于 11-18 10:56 641次阅读
    <b class='flag-5'>下一个</b>“电子茅台”,<b class='flag-5'>会是</b>连接器吗?

    开源鸿蒙技术大会2025丨以智能化为主旋律,擘画开源鸿蒙下一个五年发展技术蓝图

    ,与来自学术界和产业界的专家们共同回顾开源鸿蒙五年来走过的非凡历程,发布了开源鸿蒙6.0版本,并展望面向未来的智能终端操作系统关键技术创新方向,呼吁与会专家以智能化发展为主旋律,共同擘画开源鸿蒙
    的头像 发表于 11-10 18:13 1659次阅读
    <b class='flag-5'>开源</b>鸿蒙技术大会2025丨以智能化为主旋律,擘画<b class='flag-5'>开源</b>鸿蒙<b class='flag-5'>下一个</b>五年发展技术蓝图

    高通的AI新程,下一个激荡三十年

    中国共赴AI时代之约,高通已备好行囊
    的头像 发表于 10-02 11:00 3520次阅读
    高通的<b class='flag-5'>AI</b>新程,<b class='flag-5'>下一个</b>激荡三十年

    科技云报到:西湖大学、智元机器人都选它,存储成为AI下一个风口

    科技云报到:西湖大学、智元机器人都选它,存储成为AI下一个风口
    的头像 发表于 09-03 11:24 809次阅读

    【原创】TDMS设置下一个写入位置函数的摸索

    labview在20版本前,tdms都有高级函数,写入文件位置set file positon,但是在20版本后取消了。取而代之是‘tdms设置下一个写入位置函数’ 本意是想利用
    发表于 08-11 20:54

    88%中国法律人已用AI下一个改变工作方式的,会是你吗?

    技术革新已悄然走入日常——不仅改变了法律人的工作方式,也带来了全新的行业价值链重构。 全球先进的法律内容和技术提供商   LexisNexis律商联讯于6月30日正式推出律商+™平台 ,该平台致力于为中国法律从业者提供高效、精准的站式智能解决方案,涵盖权威法律检索、
    的头像 发表于 08-06 19:19 652次阅读
    88%<b class='flag-5'>中国</b>法律人已用<b class='flag-5'>AI</b>,<b class='flag-5'>下一个</b>改变工作方式的,<b class='flag-5'>会是</b>你吗?

    AI玩具或成为下一个万亿新赛道

    如果你将拥有家庭新成员,你首先会想到什么?是孩子还是宠物?如果我说你下一个家庭成员,或许是会“察言观色”的
    的头像 发表于 07-29 10:15 1240次阅读

    开源鸿蒙AI Agent TSG正式成立

    鸿蒙 AI Agent TSG(技术专家组)正式宣布成立,旨在联合产学研力量,共同洞察 Agent 在通信、协同、自演进等方面的技术趋势,并规划和探索下一代 Agent 技术框架。该组织的成立标志着开源鸿蒙在全场景智能终端操作系
    的头像 发表于 07-28 17:38 1045次阅读

    在传输DMA通道中的所有缓冲区后,DMA标志(就绪和部分)卡住了是怎么回事?

    )变为高电平,表示几乎已满,然后在最后次传输(水印设置为 5,使用 32 位总线)后,标志 A(DMA 就绪标志)变为高电平,4 时钟周期后完全符合预期。 现在,第二缓冲区
    发表于 05-16 07:18