据2月27日路透社研究所报告显示,至2023年底,全球有十国近半(48%)主流新闻网站选择阻止OpenAI爬虫,另约四分之一(24%)如法炮制封锁了谷歌人工智能爬虫。
该研究团队从德国、印度、西班牙、英国及美国共计十五家综合性质网络新闻来源的robots.txt文件着手分析,涵盖包括《纽约时报》等传统印刷媒体、电视广播公司及数字原生媒体等多类形式。
分析结果显示,至2023年底,超半数(57%)的传统印刷媒体如《纽约时报》等已关闭OpenAI爬虫,反之电视广播以及数字原生媒体相应地分别为48%和31%。而对于谷歌人工智能爬虫,32%的印刷媒体采取相同措施,电视广播和数字原生媒体的比率分别为19%和17%。
近期康奈尔大学研究发现,部分新型人工智能模型仅仅依赖前代模型训练,非依靠人类输入数据,引发“模型崩溃”甚至退化,从而导致生成内容出现更多错误性和误导性的讯息。
网站爬虫具有多种用途,其中Google的Googlebot主要用于抓取发布商网站并纳入搜索查找,OpenAI的GPTBot则负责全网搜集训练数据以支持旗下的大规模语言模型ChatGPT等,此类AI工具产出的精准度与实时性受到很大保障,这也是新闻发布商频频发布此类内容的原因所在:大语言模型给予优质出版商内容的重视程度远高于其他来源。
研究进一步揭示,全球北方(以北美、欧洲为主,涵盖其他高收入地区)的新闻机构较全球南方(包含非洲、拉美,亚太地区以及发展中的亚洲国家)有较大偏向性地提出屏蔽人工智能爬虫要求。以美国为例,高达79%的热门在线新闻网站对OpenAI爬虫设限,而在墨西哥与波兰,这一比例仅为20%类似的情况出现在德国(有60%的新闻网站对谷歌爬虫采取限制)与波兰和西班牙仅占7%的对比之中。
令人瞩目的是,几乎所有封锁谷歌爬虫的网站同时也禁止了OpenAI(达到了夸张的97%)。尽管该研究并未给出具体的解释,唯一可信的推测可能在于OpenAI爬虫相较谷歌更早推出的缘故。
-
谷歌
+关注
关注
27文章
6258浏览量
111956 -
人工智能
+关注
关注
1820文章
50313浏览量
266866 -
OpenAI
+关注
关注
9文章
1249浏览量
10271
发布评论请先 登录
谷歌AI霸主归来!多线反击OpenAI,开启安卓Gemini时代
深圳卫视 深圳新闻网聚焦创盈芯虾盒方案,与行业共探AI普惠生活
昆仑万维天工AI大模型SkyReels V4登上Artificial Analysis榜单全球第一
巨头竞逐AI医疗健康:OpenAI推出ChatGPT Health,蚂蚁阿福国内领跑
AI业界新闻:OpenAI官宣自研首颗芯片 黄仁勋时隔9年再次给马斯克“送货”
看点:全球首颗!中国研发全新架构闪存芯片 OpenAI拉上巨头豪赌AI基建
NVIDIA携手OpenAI构建AI基础设施
华曦达亮相谷歌云AI亚洲峰会,AI Home业务高增长引领发展新征程
Nginx限流与防爬虫配置方案
OpenAI将与博通合作量产自研AI芯片 博通第四财季AI芯片收入展望超预期
OpenAI开源模型登陆IBM watsonx.ai开发平台
美泰与OpenAI联手,共探生成式AI智能玩具新领域
摆脱依赖英伟达!OpenAI首次转向使用谷歌芯片
“天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型
全球新闻网封锁OpenAI和谷歌AI爬虫
评论