0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

信息社会产生的谣言,还是借用技术来解决

电子工程师 来源:lq 2019-05-16 18:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近期,HBO出品的台剧《我们与恶的距离》热播,在感慨剧情深度的同时,也引发了对于媒体行业生存现状的反思。

《我们与恶的距离》剧照

一方面,人们希望媒体能够坚持所谓“新闻理想”,另一方面,在信息爆炸讯息光速传递的今天,媒体人要坚守“客观真实”的报道,实属难得。

作为一位媒体从业者,文摘菌对于女主角新闻台副总监“宋乔安“印象深刻。

贾静雯饰演宋乔安,演技炸裂

影片一开始,我们就目睹了一起抢热点的假新闻事件。多家媒体同一时间播报了一条泰国发生爆炸的消息,令宋乔安和同事感到措手不及。这条消息没有得到前方记者的证实,也缺乏官方认证,用媒体术语来说,就是不具有权威信源。但是,该爆炸性新闻自带流量,若证实有中国游客身亡,更会让它成为一条名副其实的爆款新闻。

竞争对手们争相播报,宋乔安压力颇大,尽管没有拿到真的信源,依然硬着头皮播了这条新闻,但最终,它被证实是一条假消息。

机器学习假新闻判别

宋乔安的尴尬处境也恰恰是当代媒体真实写照。突发新热点多,真假难以被证实。或许,我们可以在算法的帮助下,打破这一困境。

《我们与恶的距离》剧照

AI谣言粉碎机

今年愚人节当天,阿里宣布了一项新技术被称为“AI谣言粉碎机”。这项技术的算法模型通过深度学习神经网络,设计了包括发布信息、社交画像、回复者立场、回复信息、传播路径在内的判断系统,将谣言识别和社交用户观点识别打通,最快1秒内判定结果。在特定场景中的准确率可达到81%。

阿里希望帮助社交平台和新闻网站在假新闻尚未造成大面积伤害时就快速识别出来,遏制其传播。在信息被证实为谣言后,AI还可通过虚假信息的传播路径,定向给阅读过此信息的用户进行辟谣。

SemEval语义测试大赛中,根据主办方提供的过去两年社交媒体Twitter和Reddit上的近500个真实言论和1万多条相关反馈数据,阿里巴巴的人工智能技术对假新闻识别的准确率创造了新的纪录。达摩院语言技术实验室首席科学家司罗表示,“AI谣言粉碎机”未来有望帮助社交媒体的审核机构承担60%的工作量。

Breaking Data

英国有一家体育媒体GiveMeSport,是一个主要基Faceboook发布体育相关的新闻,最后被人工智能公司Breaking Data 收购,目前在新闻频道的两个终端应用了AI技术,可以分析和反应片段及重大新闻报道。

Breaking Data运用自然语言处理技术扫描Twitter,通过相关推文筛选预定关键词,如运动队、球员姓名、球队名称、俱乐部、联赛或运动场。经过筛选和验证关键词,将其分为“重大事件”,“相关新闻”或“大幕新闻”等类别;并在BreakingSports Slack频道中作为警报发送给记者。GiveMeSport正在使用Breaking Data的技术将其他公开可用的数据源(如Facebook,Reddit和Wikipedia)整合在一起。

这个平台通过识别可靠的信息来源来判断推文是否可靠,例如,欧冠中当巴萨以3:0战胜利物浦时,人工智能平台可以跟踪Twitter上的内容何时首次出现,并将该帐户标记为可靠的权限。

用AI打假AI合成图片

除了假新闻,AI合成的视频和照片也越来越多,利用算法实现AI换脸技术已经很成熟。针对此种情况,成立于2017年的旧金山初创企业人工智能基金会(AI Foundation),他们正在开发的Reality Defender将帮助人们识别由人工智能算法生成的内容,以检测潜在的虚假媒体。

与病毒防护类似,他们的工具扫描每一幅图像、视频和其他媒体,寻找已知的假象,允许你报告可疑的假新闻,并使用各种人工智能驱动的分析技术,以检测变化或人为生成的迹象。

虚假、合成的照片和视频在网络的传播,也会造成品牌和个人造成不可挽回的名誉损毁。但试图监管全球媒体数据将是一项艰巨的任务,使用AI技术任何人都可以炮制出数百万张看起来逼真的假照片。鉴于虚假图像和视频的改善速度之快,或许验证“什么是真实的”的商业模式可能更有效,也许媒体和个人很快应该拥有自己的数字指纹,可AI合成的底线又在哪?

假新闻训练模型及数据集

在某种程度上假新闻的是一个微观领域问题,它和谣言分类、事实判断、标题党检测、垃圾内容挖掘等都比较类似,在宏观上说都属于内容质量的领域,所以很多方法其实是通用的框架。腾讯科技高级研究员孙子荀将假消息辨别模型分为两类:

基于内容的建模;

基于社交网络的模型。

后者可以通过对虚假新闻的传播游走轨迹跟踪,以及通过图模型和演化模型中针对特定假新闻的进一步调查;其次,识别虚假新闻的关键传播者,对于减轻社交媒体的传播范围至关重要。

在2017年,Kai Shu等人的论文中将假新闻的研究主要分为三个方向:

数据方面的研究:目前还没有标准的测评数据集,需要去建立的。可以通过传播特性提前检测假新闻。

模型特征方面的研究:通过使用用户的画像特征,内容特征(NLP、CV)结合深度学习,还有传播网络特征,比如用户和内容之间的关系构造出来的网络特征,网络本身的embedding表现。

模型方面的研究:这方面的工作可分为特征之间的组合、预测目标的变化、对内容源、内容反馈和文章风格的限制,组合这些模型,也可通过空间变换,把特征变换到另外的latent语义空间尝试解决。

鉴定假新闻是一件任重而道远的事,对假新闻机器学习模型感兴趣的同学也可以通过以下开放的数据集进行尝试。

1. FakeNewsNet

BuzzFeed和PolitiFact两个平台的数据集,包括新闻内容本身(作者,标题,正文,图片视频)和社交上下文内容(用户画像,收听,关注等)。

数据集获取方式:

https://github.com/KaiDMML/FakeNewsNet

2.LIAR

该数据集也是来自PolitiFact,包括内容本身和内容的基础属性数据,比如来源,正文等。

数据集获取方式:

http://www.cs.ucsb.edu/~william/data/liar_dataset.zip

3. Twitter and Weibo DataSet

一个比较全的数据集包括帖子ID,发帖用户ID,正文,回复等数据。

数据集获取方式:

http://alt.qcri.org/~wgao/data/rumdect.zip

4. Twitter15 Twitter16

来自 Twitter 15、16 年的帖子,包括了帖子之间的树状收听,关注关系和帖子正文等。

数据集获取方式:

https://www.dropbox.com/s/7ewzdrbelpmrnxu/rumdetect2017.zip?dl=0

5. Buzzfeed Election Dataset & Political News Dataset

Buzzfeed’s 2016 收集的选举假新闻,以及作者收集的 75个新闻故事。包括假新闻,真新闻和讽刺新闻。

数据集获取方式:

https://github.com/rpitrust/fakenewsdata1

相关链接:

http://www.sohu.com/a/311856780_99928473?sec=wd

https://zhuanlan.zhihu.com/p/57124028

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106781
  • 算法
    +关注

    关注

    23

    文章

    4760

    浏览量

    97136
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136227

原文标题:《我们与恶的距离》引发媒体反思:假新闻抢热点,机器学习能做些什么?

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    晶体振荡器的主要作用及其在现代社会中的应用

    晶体振荡器,也被称为钟表振荡器或者石英振荡器,是电子设备中的一个重要组件。它的功能在于产生一个精确且稳定的高频电信号,为各种电子设备提供参考时钟。本文将详细解析晶体振荡器的主要作用及其在现代社会
    的头像 发表于 12-04 16:16 187次阅读
    晶体振荡器的主要作用及其在现代<b class='flag-5'>社会</b>中的应用

    光纤——让光速穿越时空的信息“高速公路”

    在深海电缆、跨洲光缆和城市数据中心中,一根根头发丝般细小的玻璃或塑料丝,正以每秒30万公里的光速传输着海量数据。这些被称为“光纤”的神奇材料,彻底颠覆了传统通信的物理极限,成为现代信息社会的核心
    的头像 发表于 10-30 10:51 143次阅读

    全国产GNSS多模卫星定位导航技术解析与应用方案指南

    一、引言:国产GNSS技术的战略意义 全球导航卫星系统(GNSS)作为现代信息社会的空间基础设施,在国防安全、经济建设和社会发展中具有不可替代的重要作用。近年来,随着中美科技竞争的加剧,发展自主可控
    的头像 发表于 10-23 18:17 903次阅读

    通信机房局放监测系统

    文章由山东华科信息技术有限公司提供通信机房作为信息社会的核心基础设施,其供电可靠性直接关系到数字经济运行的稳定性。在高压、大电流工况下,配电设备易因局部放电引发绝缘劣化,而传统人工巡检模式难以实现
    的头像 发表于 08-13 09:43 336次阅读
    通信机房局放监测系统

    光缆的应用对信息社会的影响是什么

    光缆作为信息社会的“信息动脉”,通过其高带宽、低损耗、抗干扰等特性,深刻改变了社会运行模式,推动经济、生活、技术等多领域变革,具体影响如下
    的头像 发表于 07-31 09:51 471次阅读

    AI技术如何推动我们的商业和社会发展

    不断发展的AI技术能否给人类社会带来类似工业革命的跨越?它将如何推动我们的商业和社会发展?它与人类之间的关系又将如何演进?
    的头像 发表于 07-28 09:32 575次阅读

    帝奥微推出超低漏电高速开关DIO3749

    光通信是一种利用光波作为载波传输信息的通信方式。它主要通过在光纤中传输光信号实现,是当今信息社会高速通信网络的基石。随着AI世界的到来,数据通信的距离和速度都大幅提升。对于接收端微弱光信号的检测,需要极低漏电流的开关
    的头像 发表于 06-10 17:48 1064次阅读
    帝奥微推出超低漏电高速开关DIO3749

    智芯公司携手联通数科发布RedCap模组

    在5.17世界电信和信息社会日来临之际,北京智芯微电子科技有限公司与联通数字科技有限公司联合发布重磅推出RedCap模组,开启通信技术国产化新篇章,为千行百业数智化转型注入强劲动力。
    的头像 发表于 05-22 16:39 1059次阅读

    中兴通讯亮相2025年世界电信和信息社会日大会

    2025年世界电信和信息社会日的主题为“在数字化转型中实现性别平等”。值此通信人共同的节日来临之际,我谨代表中兴通讯,向致力于信息通信技术创新、推动数字包容发展的各位同仁及社会各界人士
    的头像 发表于 05-20 17:35 995次阅读

    广东移动携手华为开启AI生活新范式

    近日,世界电信和信息社会日前夕,广东移动举行移起AI——2025年三大服务计划发布会,并举行AI终端生态联盟启动仪式。华为等多家广东移动的战略合作伙伴倾力合作,以5G-A、AI 新技术双轮驱动,开启智慧生活全新篇章。
    的头像 发表于 05-19 12:35 791次阅读

    世界电信日 | 数智绽放平等之花:让技术温暖拥抱她和他

    2025年世界电信和信息社会日以“在数字化转型中实现性别平等”为主题。值此通信人共同节日来临之际,移远通信向所有投身通信技术创新、推动数字包容发展的同仁和各界人士,致以崇高敬意和诚挚祝贺!孩童手中
    的头像 发表于 05-17 09:05 269次阅读
    世界电信日 | 数智绽放平等之花:让<b class='flag-5'>技术</b>温暖拥抱她和他

    在SoC电源设计中如何选择PMIC,是选择PMIC还是以DC-DC设计?

    在SoC电源设计中如何选择PMIC,是选择PMIC还是以DC-DC设计?
    发表于 03-31 08:27

    名单公布!【书籍评测活动NO.57】芯片通识课:一本书读懂芯片技术

    基于半导体材料,通过复杂的电路设计和光刻技术,在硅片上构建出极其微小的晶体管和其他电子元件。这些晶体管以二进制的方式存储和处理信息,通过控制电路的通断实现数据的传输与运算。 一个电子元器件,为何会成
    发表于 02-17 15:43

    ths1230的时钟必须是矩形脉冲吗?必须由DSP本身产生吗?

    请问,ths1230的时钟必须是矩形脉冲吗?必须由DSP本身产生吗?因为我发现2812貌似产生不了这样的时钟信号啊。我想用10MHZ的时钟信号驱动AD芯片的。可以用其他的,比如
    发表于 02-11 08:00

    示波器在卫星通信测试中的应用

    卫星通信作为现代信息社会的重要组成部分,其可靠性和稳定性至关重要。而保证卫星通信系统正常运行的关键环节之一,便是严格而全面的测试。在这个过程中,示波器以其卓越的性能和丰富的功能,发挥着不可或缺的作用。本文将深入探讨示波器在卫星通信测试中的应用,以期为相关领域的技术人员提供
    的头像 发表于 02-02 14:02 891次阅读