0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全球新闻网封锁OpenAI和谷歌AI爬虫

微云疏影 来源:综合整理 作者:综合整理 2024-02-27 15:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据2月27日路透社研究所报告显示,至2023年底,全球有十国近半(48%)主流新闻网站选择阻止OpenAI爬虫,另约四分之一(24%)如法炮制封锁了谷歌人工智能爬虫。

该研究团队从德国、印度、西班牙、英国及美国共计十五家综合性质网络新闻来源的robots.txt文件着手分析,涵盖包括《纽约时报》等传统印刷媒体、电视广播公司及数字原生媒体等多类形式。

分析结果显示,至2023年底,超半数(57%)的传统印刷媒体如《纽约时报》等已关闭OpenAI爬虫,反之电视广播以及数字原生媒体相应地分别为48%和31%。而对于谷歌人工智能爬虫,32%的印刷媒体采取相同措施,电视广播和数字原生媒体的比率分别为19%和17%。

近期康奈尔大学研究发现,部分新型人工智能模型仅仅依赖前代模型训练,非依靠人类输入数据,引发“模型崩溃”甚至退化,从而导致生成内容出现更多错误性和误导性的讯息。

网站爬虫具有多种用途,其中Google的Googlebot主要用于抓取发布商网站并纳入搜索查找,OpenAI的GPTBot则负责全网搜集训练数据以支持旗下的大规模语言模型ChatGPT等,此类AI工具产出的精准度与实时性受到很大保障,这也是新闻发布商频频发布此类内容的原因所在:大语言模型给予优质出版商内容的重视程度远高于其他来源。

研究进一步揭示,全球北方(以北美、欧洲为主,涵盖其他高收入地区)的新闻机构较全球南方(包含非洲、拉美,亚太地区以及发展中的亚洲国家)有较大偏向性地提出屏蔽人工智能爬虫要求。以美国为例,高达79%的热门在线新闻网站对OpenAI爬虫设限,而在墨西哥与波兰,这一比例仅为20%类似的情况出现在德国(有60%的新闻网站对谷歌爬虫采取限制)与波兰和西班牙仅占7%的对比之中。

令人瞩目的是,几乎所有封锁谷歌爬虫的网站同时也禁止了OpenAI(达到了夸张的97%)。尽管该研究并未给出具体的解释,唯一可信的推测可能在于OpenAI爬虫相较谷歌更早推出的缘故。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6258

    浏览量

    111956
  • 人工智能
    +关注

    关注

    1820

    文章

    50313

    浏览量

    266866
  • OpenAI
    +关注

    关注

    9

    文章

    1249

    浏览量

    10271
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌AI霸主归来!多线反击OpenAI,开启安卓Gemini时代

    电子发烧友网报道(文/莫婷婷)北京时间5月21日,谷歌2025 Google I/O开发者大会正式召开,从其发布的新品来看,这可以说是一场AI盛会。 在AI大模型方面,发布了Gemini 2.5
    的头像 发表于 05-22 09:01 6789次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>AI</b>霸主归来!多线反击<b class='flag-5'>OpenAI</b>,开启安卓Gemini时代

    深圳卫视 深圳新闻网聚焦创盈芯虾盒方案,与行业共探AI普惠生活

    想用AI,又怕成本高、数据泄露、设备卡? 这是OpenClaw火遍企业圈以来,企业的共同痛点。 近日,深圳卫视与深圳新闻网联合报道了创盈芯推出的全场景AI“OpenClaw虾盒”组合拳方案。该方案
    的头像 发表于 03-27 16:07 214次阅读

    昆仑万维天工AI大模型SkyReels V4登上Artificial Analysis榜单全球第一

    、Google Veo 3.1、Vidu Q3、OpenAI Sora 2等全球主流模型,成为全球AI视频生成能力最强的大模型,标志中国AI
    的头像 发表于 03-26 10:10 927次阅读

    巨头竞逐AI医疗健康:OpenAI推出ChatGPT Health,蚂蚁阿福国内领跑

    健康已成为AI技术的高频应用场景。OpenAI在其一篇博客文章中透露,通过分析匿名化的ChatGPT对话数据,发现全球每周有超过2.3亿人在ChatGPT上咨询健康相关问题,医疗健康的需求极为旺盛。
    的头像 发表于 01-10 11:17 2539次阅读

    AI业界新闻:OpenAI官宣自研首颗芯片 黄仁勋时隔9年再次给马斯克“送货”

    给大家带来一些AI业界新闻: OpenAI官宣自研首颗芯片 OpenAI宣布与博通合作自研AI芯片,首颗芯片预计9个月后量产;2026年起部署,2030年前完成10GW算力系统。该芯片
    的头像 发表于 10-14 18:42 2085次阅读

    看点:全球首颗!中国研发全新架构闪存芯片 OpenAI拉上巨头豪赌AI基建

    基混合架构芯片,攻克新型二维信息器件工程化关键难题。这也是全球首颗成功融合二维超快闪存与成熟硅基工艺的功能芯片。 芯片集成良率高达94.3%,支持8-bit指令操作和32-bit高速并行操作与随机寻址。 OpenAI拉上巨头豪赌AI
    的头像 发表于 10-10 18:20 2019次阅读

    NVIDIA携手OpenAI构建AI基础设施

    NVIDIA 首席执行官黄仁勋、OpenAI 首席执行官 Sam Altman 和 OpenAI 总裁 Greg Brockman 宣布了一项新的合作伙伴关系,旨在推动 OpenAI 的发展,并支持几乎所有行业和用户大规模使用
    的头像 发表于 09-23 14:38 1082次阅读

    华曦达亮相谷歌AI亚洲峰会,AI Home业务高增长引领发展新征程

    8月28日,谷歌AI亚洲峰会在新加坡圆满落幕。作为谷歌生态战略合作伙伴,华曦达受邀参与峰会主论坛及同期举办的“LeadersExchange”闭门会议,与全球顶尖科技企业共探
    的头像 发表于 09-10 10:22 658次阅读

    Nginx限流与防爬虫配置方案

    在互联网业务快速发展的今天,网站面临着各种流量冲击和恶意爬虫的威胁。作为运维工程师,我们需要在保证正常用户访问的同时,有效防范恶意流量和爬虫攻击。本文将深入探讨基于Nginx的限流与防爬虫解决方案,从原理到实践,为大家提供一套完
    的头像 发表于 09-09 15:52 1071次阅读

    OpenAI将与博通合作量产自研AI芯片 博通第四财季AI芯片收入展望超预期

    据外媒《金融时报》的报道称 OpenAI 将与博通公司开启大规模的合作,希望能够借住博通推动OpenAI 自研 AI 芯片的量产落地。 据称,OpenAI 的首款自研芯片主要是专注于
    的头像 发表于 09-05 11:06 2014次阅读

    OpenAI开源模型登陆IBM watsonx.ai开发平台

    OpenAI 已向公众发布了两款 AI 模型,允许开发者和企业可自由下载、运行并进行定制。其中一款模型现已部署在 IBM watsonx.ai 开发平台上。
    的头像 发表于 08-26 15:36 1139次阅读

    美泰与OpenAI联手,共探生成式AI智能玩具新领域

    电子发烧友网综合报道 近期,全球知名玩具制造商美泰(Mattel)宣布与人工智能公司OpenAI达成战略合作,计划共同开发基于生成式AI的智能玩具。这是OpenAI首次涉足玩具制造领域
    发表于 08-05 07:04 2031次阅读

    摆脱依赖英伟达!OpenAI首次转向使用谷歌芯片

    电子发烧友网报道(文/李弯弯)近日,据知情人士透露,OpenAI近期已开始租用谷歌的张量处理单元(TPU),为旗下ChatGPT等热门产品提供算力支持。这一举措不仅标志着OpenAI首次实质性
    的头像 发表于 07-02 00:59 8573次阅读

    “天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型

    电子发烧友网报道(文 / 吴子鹏)根据门萨智商(IQ)测试中的表现,OpenAI o3 在全球 “智商最高” 的人工智能模型 TOP 24 中位居榜首,在门萨测试中获得了 135 的高分,跻身
    的头像 发表于 06-15 01:56 6244次阅读
    “天才”!<b class='flag-5'>OpenAI</b> o3 成<b class='flag-5'>全球</b> IQ 最高的 <b class='flag-5'>AI</b> 大模型