0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI公司处理数据困难,引发版权及道德问题

微云疏影 来源:综合整理 作者:综合整理 2024-04-07 11:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本周,两家知名媒体——《华尔街日报》和《纽约时报》对AI公司在获取优质训练数据时遇到的困境进行了深入关注。值得注意的是,报道中提到了关于AI版权法模糊不清的灰色地带。

通过开发Whisper音频转录模型,OpenAI取得了一项突破性进展,成功转录了超过100万个小时的YouTube视频用于训练GPT-4大型语言模型。其实施的这一过程因涉及版权问题而存在严重法律风险,但OpenAI仍坚持为技术创新设定开拓者的姿态。

另一位受访者——《泰晤士报》,通过揭露OpenAI总裁Greg Brockman积极参与YouTube视频收集工作的事实,强调此类操作的合法性问题。然而,OpenAI宣布将严格遵守相关法规,谨慎对待每一次行动。为了持续发展,OpenAI正不断尝试从各种渠道获取有益的数据。

据OpenAI发言人Lindsay Held发表的声明显示,每个模型都在经过精心设计后配备了独特的数据集,目的在于让它们更准确地理解这个世界,能始终保持强大的研发能力。Notably, the company is exploring the possibilities of generating synthetic data to support their continuing growth and development.

相比之下,谷歌对此事持有不同看法。谷歌不认同未经授权就抓取和下载YouTube内容的行为,同时指出,谷歌的robots.txt文件和服务条款坚决禁止此类行为发生。近段时间,YouTube CEO尼尔·莫汉在接受采访时也警告潜在的侵入者,使用YouTube视频训练AI模型的行为违反了其服务条款。

面对日益激烈的竞争环境,Meta公司同样面临着数据可用性问题。公司AI部门为了提升自身竞争力,甚至开始考虑未经授权使用版权作品,尤其是在面临无法获得足够训练数据之际。维持可持续发展已经成为了当下AI科技行业的当务之急。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11265
  • GPT
    GPT
    +关注

    关注

    0

    文章

    368

    浏览量

    16728
  • OpenAI
    +关注

    关注

    9

    文章

    1238

    浏览量

    9829
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    2)渗透式AI的优势 5、大型多模态模型 多模态模型(LMM)可以被理解成大模型的更高级版本,不仅可以处理文本,还可以处理和理解多种类型的数据模态。 多模态模型的关键特性是:它通常能
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    灵感的过程中发挥关键作用。五、用AI实现诺贝尔奖级别的科学发现 这想法这能够大胆的。 1、AI科学家的构建 全自主科学实验室需要哪些部分: ①自动实验设备 ②流程管理系统 ③数据处理和分析系统 ④微
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    与边缘AI的不同特点: 边缘推理的优势:可以提供数据处理速度和响应速度,满足实时需求;可以缩短网络延迟,降低成本;可以提高安全性和隐私性,保护用户数据。 前面说的都是好处,那面临的困难
    发表于 09-12 16:07

    AI Cube如何导入数据集?

    我从在线平台标注完并且下载了数据集,也按照ai cube的要求修改了文件夹名称,但是导入提示 不知道是什么原因,我该怎么办? 以下是我修改后的文件夹目录
    发表于 08-11 08:12

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力,融合了自然语言处理
    发表于 07-16 15:29

    成都汇阳投资关于芯片+AI 眼镜核心公司

          芯片堪称 AI 眼镜的 “大脑”, 在这一领域发挥着核心作用。AI 眼镜需实时处理图像、 语音等大量数据, 芯片的算力决定了处理
    的头像 发表于 07-01 09:28 830次阅读

    海思SD3403边缘计算AI数据训练概述

    AI数据训练:基于用户特定应用场景,用户采集照片或视频,通过AI数据训练工程师**(用户公司****员工)** ,进行特征标定后,将标定好的
    发表于 04-28 11:11

    适用于数据中心和AI时代的800G网络

    随着人工智能(AI)技术的迅猛发展,数据中心面临着前所未有的计算和网络压力。从大语言模型(LLM)训练到生成式AI应用,海量数据处理需求推动了网络带宽的快速增长。在此背景下,800G网
    发表于 03-25 17:35

    泛林集团连续第三年被Ethisphere评为“全球最具商业道德企业”之一

    2025 年的表彰对公司道德、合规和治理方面的最佳表现给予认可 北京时间 2025 年 3 月 18 日—— 泛林集团近日宣布,公司已获得由定义和推进商业道德实践标准的全球领导者
    发表于 03-18 13:55 356次阅读
    泛林集团连续第三年被Ethisphere评为“全球最具商业<b class='flag-5'>道德</b>企业”之一

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    学习、自然语言处理(NLP)、计算机视觉(CV)等先进技术提供的强大的数据处理和分析能力。 在视频应用开发中,AI Agent可以用于视频内容分析、推荐、编辑等。 下面跟随作者的指导,使用语聚
    发表于 03-05 19:52

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    AI时代,FPGA(现场可编程门阵列)具有极其重要的地位,主要体现在以下几个方面: 1.硬件加速与高效能 • 并行处理能力:FPGA内部由大量可编程逻辑单元组成,能够实现高度并行的数据处理。这种
    发表于 02-19 13:55

    端侧 AI 音频处理器:集成音频处理AI 计算能力的创新芯片

    电子发烧友网综合报道:端侧 AI 音频处理器是专为智能物联网(AIoT)端侧设备设计,集成了人工智能(AI)加速器的系统级音频处理器。这类处理
    的头像 发表于 02-16 00:13 3129次阅读

    AI赋能边缘网关:开启智能时代的新蓝海

    。这一变革不仅带来了技术架构的革新,更为产业发展开辟了新的增长空间。 传统边缘网关受限于计算能力和算法支持,往往只能完成数据采集和简单处理,大量原始数据需要回传云端处理,导致响应延迟和
    发表于 02-15 11:41

    涂鸦智能集成Mistral AI大模型,加速欧洲AI硬件革新

    2025年2月,法国AI初创公司MistralAI凭借首次发布的AI大模型——LeChat,登顶法国免费App榜首,这一成绩不仅引发行业震动,也标志着欧洲本土技术在全球
    的头像 发表于 02-13 20:58 561次阅读
    涂鸦智能集成Mistral <b class='flag-5'>AI</b>大模型,加速欧洲<b class='flag-5'>AI</b>硬件革新

    SPEA创新实践:AI芯片混合信号测试仪

    芯片是人工智能(AI)应用的支柱,为从自动驾驶汽车到虚拟助手等各类应用提供着核心动力。AI芯片专门设计用于处理海量数据,并能实时做出决策,因此它们对于确保最终应用的成功发挥着至关重要的
    的头像 发表于 01-03 11:44 1131次阅读
    SPEA创新实践:<b class='flag-5'>AI</b>芯片混合信号测试仪