0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

互联网自动化程序已经渗透到我们生活的方方面面

U9Hm_luomajqrxt 来源:陈年丽 2019-07-16 10:12 次阅读

互联网目前已经渗透到我们生活的方方面面,但它依然只是现实的物理世界在虚拟的网络空间上按比特信息编码后的投射。

所以只要定制相应的自动化程序便可以模仿人的行为,同时,因为机器速度更快且不知疲倦,它会被用于批量在论坛、网站、app 中发布营销信息。而且,在监管不足的情况下,利润更高的行业往往底线更低,自动机器人发布的垃圾信息经常也和赌博、诈骗、色情等灰色产业有关。一些自动化程序还会尝试以“撞库”的方式窃取用户帐号、密码,给网站带来巨大的安全隐患。

于是,验证码应运而生。作为同样的自动化程序,二维码存在目的是区分用户到底是机器人还是真实的人。

最常见的验证码便是自动生成的扭曲的文字和图案,虽然它可以有效地识别出很大一部分自动化程序,但它对真人用户的体验并不好。而且随着机器学习的发展,要破解它也越来越容易。

▲验证码风格的设计图案

Google的验证码团队有着各种创新试验,比如创造性地把验证码用于纸质典籍数字化。另外除了扭曲文字、图片的主流路线之后,Google的团队还尝试了新的思路,利用追踪用户的点击行为等来识别是否真人操作。用户只需要点击“我不是机器人”的复选框便可验证。

最新版本的Google验证码reCAPTCHA v3中,你甚至什么都不用做,系统就在悄悄核验当前的用户是不是机器人。技术正在让“验证码”越来越隐形,人类不必再为了自证身份去做“反向图灵测试”,然而这种进步也带来了不少新的问题。

初代验证码CAPTCHA:歪歪扭扭的文字

2000年,从杜克大学数学系毕业,来到卡内基梅隆大学读计算机科学博士的路易斯·冯·安(Luis von Ahn)和导师一起提出了验证码的概念,全称是全自动区分计算机和人类的公开图灵测试(英语:Completely Automated Public Turing test to tell Computers and Humans Apart,简称 CAPTCHA)。

图灵测试由计算机先驱人物,“人工智能之父”阿兰·图灵提出,以一台计算机能和人类对话而不被识别出是机器人为通过图灵测试基准。验证码也是图灵测试的一种,但它的目的不是为了创造AI,而只是为了识别真实的人类用户。

一种最常见的验证码是由算法生成的扭曲的文字,这么做是为了防止被光学字符识别程序(OCR)自动识别出来。

有一些方法是在字母上加一条曲线或将不同的字母叠在一起,也有添加复杂背景的方式。

也有图片验证码,要求用户识别图片的物体,以及把缺失的部分拖到正确的位置和拼图等。

但不管形式如何,这些验证码有一个共同的原则:就是要让人类很容易识别,却对计算机来说非常困难。一些研究者认为,为避免 CAPTCHA过难而使网站损失用户,通常要求人类用户通过测试的时间小于30秒,用户通过率大于90%。

还有一个不被普通人知道的点,验证码被称为一种“图灵测试”,所以它在设计之初就有促进人工智能发展的初衷。

根据定义,验证码的算法必须公开,这样做的目的是为了让破解验证码的过程是在解决对应的人工智能问题,例如图像识别、准确度更高的OCR等,破解者不必花费心思通过逆向工程推演算法。

利用验证码将纸质典籍数字化

目前验证码已经被广泛用于各大网站、app中,有数据显示,这项技术在推出后的短短五年内,每天就有2亿个验证码在被使用。

很快,验证码发明者提出一个新的项目reCAPTCHA,主要用于把互联网出现前的纸质典籍数字化。思路是这样的:验证码系统会向用户出示两个单词,第一个是正常的自动生成扭曲文字,另外一个则来自纸质典籍的扫描版,来自扫描版的文字通常因为年代久远、或是纸上有污点等原因而难以被OCR程序识别。

因此,当用户输入验证码时,只要第一个单词输入正确就可以被判别为人类,输入的第二个单词只是“义务劳动”。这是因为系统会默认第二个单词输入是正确的,输入结果只是会与其他用户的输入结果进行对比,如果多名用户的答案一致,这个词的数字化就完成了。

也许你会认为这样一个一个词的识别与庞大的待数字化的典籍相比,根本起不了多大作用,然而在推出之初,reCAPTCHA便能录入3000万个字符。2011年,它已经完成了全部的《纽约时报》数字化的工作,这份从1851年开始出版的老报纸有大量纯纸质版的内容。

2009 年,Google看上了这个项目的价值,并出手收购了reCAPTCHA,同时也被Facebook、Twitter、CNBC等使用。在帮助这些流量最大的网站抵御自动化程序骚扰的同时,Google图书中难以被自动识别的扫描版的古老典籍同样借助reCAPTCHA得以数字化。

另外,reCAPTCHA还被用于帮助机器学习系统提高图像识别率,运作原理和典籍数字化的方法是一样,用机器难以辨别的门牌号、猫狗照片拿来当做验证码供人类识别。

与此同时,用户实际上还在帮机器学习系统标注训练集,所以,强大的AlphaGo背后的人工智能技术,可能早就有你的功劳。

NoCAPTCHA:不用输入字符的验证方式

Google在收购reCAPTCHA后,对它进行了以Google的方式改进。

在2014年,Google推出了新的验证码系统——NoCAPTCHA reCAPTCHA,虽然名字有点拗口,但依然是个验证系统,其核心是不需要输入验证码,用户只需要点击一个“我不是机器人”的复选框,Google就能判别你是不是真正的人类。

reCAPTCHA的口号也从“别发垃圾信息了,读点书吧”(Stop Spam. Read Books),变成了验证码最初的目的“对人类简单,对机器人困难”(Easy on Humans, Hard on Bots)。

NoCAPTCHA跟踪用户点击验证框之前、当时和之后的行为,比如在网页上花费的时间,从而来判断是否是人为操作。

假如你被误判为机器人,还有一个“申诉”的机会,和图片验证一样,从一堆图片中选出正确的目标。

使用reCAPTCHA v3的网站会在网站的每个页面放入reCAPTCHA v3代码,而不只是在登录页面。reCAPTCHA系统会跟踪用户的所有浏览行为进行分析。

就这样,Google 可以获得几乎用户的所有行为。Google也确认,用户使用的硬件信息即设备上的软件会被发送回 Google服务器,但它表示,获得的结果“只用于分析用户行为,不用于个性化广告推荐”。不过,隐私都被掌握了的事实就摆在这里,你想更快捷被验证还是以隐私换取快捷呢?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    26974

    浏览量

    201308
  • 互联网
    +关注

    关注

    54

    文章

    10892

    浏览量

    100694

原文标题:验证方式的进化,除了要当上义务标注员,还要付出什么代价呢?

文章出处:【微信号:luomajqrxt,微信公众号:机器人学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    金航标kinghelm

    金航标kinghelm(www.kinghelm.net)宋仕强说,物联网改变了企业营运和城市生活,还有工业和农业的方方面面我们已经看到
    发表于 03-15 11:56

    安富利荣登“2023年度中国物联网企业100强”

    随着物联网行业的蓬勃发展,智慧生活正日益渗透到我们生活方方面面。在这一背景下,技术的创新融合显得尤为重要,它将为
    的头像 发表于 03-07 09:20 342次阅读

    RFID标签技术革新——原来RFID标签已渗透到生活方方面面

    RFID标签技术,颠覆传统标签的“黑科技”,以其远距离识别、大数据容量和高可靠性在众多领域获得广泛应用。随着RFID技术不断成熟,其应用场景已经深入到生活中的方方面面。那么,RFID电子标签市场隐藏
    的头像 发表于 12-29 11:40 168次阅读
    RFID标签技术革新——原来RFID标签已<b class='flag-5'>渗透到</b><b class='flag-5'>生活</b>的<b class='flag-5'>方方面面</b>

    联网的应用行业

    我们经常提到互联网+,在过去的20年里,中国的互联网发生了翻天覆地的变化。它在改变人们的生活,无论从衣着、饮食、生活、出行等
    的头像 发表于 12-27 18:22 888次阅读
    物<b class='flag-5'>联网</b>的应用行业

    探索集成电路芯片封装的未来之路:智能化、自动化与可持续发展

    集成电路芯片,作为现代电子工业的核心,已经深入到我们生活方方面面。随着科技的飞速发展,集成电路芯片封装技术也在不断创新。本文将重点探讨集成电路芯片封装的未来发展趋势,特别是数字化、智
    的头像 发表于 12-15 11:06 485次阅读
    探索集成电路芯片封装的未来之路:智能化、<b class='flag-5'>自动化</b>与可持续发展

    信驰达蓝牙模块的天线输出方式介绍

    随着互联网技术的飞速发展,物联网(IoT)已经渗透到我们生活
    的头像 发表于 12-14 16:34 265次阅读
    信驰达蓝牙模块的天线输出方式介绍

    电梯AI智能摄像头:保障乘坐安全

    随着科技的不断发展,AI智能技术已经深入到我们生活方方面面,现如今,它们甚至引入到了我们每日乘坐的电梯中,成为了
    的头像 发表于 12-14 10:19 334次阅读
    电梯AI智能摄像头:保障乘坐安全

    电梯物联网:智能化改变电梯使用和维保!

    随着科技的快速发展,物联网已经渗透到我们生活方方面面。在电梯领域,电梯物联网
    的头像 发表于 12-12 10:35 541次阅读
    电梯物<b class='flag-5'>联网</b>:智能化改变电梯使用和维保!

    重新认识电声器件!

    电声器件:实现电声转换的重要工具 在科技快速发展的今天,电声器件已经深入到我们生活方方面面。无论是音乐、语音通信、电影等娱
    的头像 发表于 11-29 09:08 283次阅读
    重新认识电声器件!

    《天猫精灵诞生记——如何在互联网公司做硬件》+ 理论结合实践-难得的介绍硬件产品开发的好书(五星推荐)

    的立足于具体项目案例的技术分享书。和普通讲技术的书不一样,不是罗列堆砌技术内容,知识点,本书立足于具体的项目分享打造一个现象级硬件产品的诞生过程涉及到的方方面面:项目管理,技术,创新思想等等,可以说内容
    发表于 10-11 22:26

    电子系统中的噪声抑制与衰减技术

    内容简介随着电路在通信、计算机、自动化以及其他方面的广泛应用,电磁干扰已经成为电路设计师所要面对的一个重要问题。包括电路中噪声抑制技术实践应用的方方面面。涵盖了两种基本的噪声控制方法:
    发表于 09-25 08:13

    金在半导体领域的应用

    随着科技的快速发展,半导体技术已经渗透到我们生活方方面面,从手机、电脑到各种高精尖的工业设备中。而在这些技术背后,金作为一种贵金属,以其独特的物理和化学性质在半导体领域中扮演着不可替
    的头像 发表于 08-19 11:42 752次阅读

    人工智能在日常生活中的十大应用

    “人工智能技术渗透到我们生活方方面面,这几乎是潜移默化的,”IEEE高级会员Guangjie Han说,“它为我们的设备提供动力,同时通
    的头像 发表于 07-10 16:31 3543次阅读

    网络安全包括哪5个方面 网络安全的重要性

    网络安全的重要性无法被低估。随着互联网的普及和数字化技术的迅猛发展,网络已经渗透到我们生活、工作和社会的方方面面
    发表于 06-19 17:27 5294次阅读

    Android自动连接但未检测到互联网是怎么回事?

    : - 安装 AdAway 以阻止对互联网存在检查的请求 - 第三方应用程序,例如自动化;可以工作,但会是一个巨大的能源消耗者 ——在 ESP 上找到一种方法来“模拟”一个工作的互联网
    发表于 06-07 08:17