0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

互联网自动化程序已经渗透到我们生活的方方面面

U9Hm_luomajqrxt 来源:陈年丽 2019-07-16 10:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

互联网目前已经渗透到我们生活的方方面面,但它依然只是现实的物理世界在虚拟的网络空间上按比特信息编码后的投射。

所以只要定制相应的自动化程序便可以模仿人的行为,同时,因为机器速度更快且不知疲倦,它会被用于批量在论坛、网站、app 中发布营销信息。而且,在监管不足的情况下,利润更高的行业往往底线更低,自动机器人发布的垃圾信息经常也和赌博、诈骗、色情等灰色产业有关。一些自动化程序还会尝试以“撞库”的方式窃取用户帐号、密码,给网站带来巨大的安全隐患。

于是,验证码应运而生。作为同样的自动化程序,二维码存在目的是区分用户到底是机器人还是真实的人。

最常见的验证码便是自动生成的扭曲的文字和图案,虽然它可以有效地识别出很大一部分自动化程序,但它对真人用户的体验并不好。而且随着机器学习的发展,要破解它也越来越容易。

▲验证码风格的设计图案

Google的验证码团队有着各种创新试验,比如创造性地把验证码用于纸质典籍数字化。另外除了扭曲文字、图片的主流路线之后,Google的团队还尝试了新的思路,利用追踪用户的点击行为等来识别是否真人操作。用户只需要点击“我不是机器人”的复选框便可验证。

在最新版本的Google验证码reCAPTCHA v3中,你甚至什么都不用做,系统就在悄悄核验当前的用户是不是机器人。技术正在让“验证码”越来越隐形,人类不必再为了自证身份去做“反向图灵测试”,然而这种进步也带来了不少新的问题。

初代验证码CAPTCHA:歪歪扭扭的文字

2000年,从杜克大学数学系毕业,来到卡内基梅隆大学读计算机科学博士的路易斯·冯·安(Luis von Ahn)和导师一起提出了验证码的概念,全称是全自动区分计算机和人类的公开图灵测试(英语:Completely Automated Public Turing test to tell Computers and Humans Apart,简称 CAPTCHA)。

图灵测试由计算机先驱人物,“人工智能之父”阿兰·图灵提出,以一台计算机能和人类对话而不被识别出是机器人为通过图灵测试基准。验证码也是图灵测试的一种,但它的目的不是为了创造AI,而只是为了识别真实的人类用户。

一种最常见的验证码是由算法生成的扭曲的文字,这么做是为了防止被光学字符识别程序(OCR)自动识别出来。

有一些方法是在字母上加一条曲线或将不同的字母叠在一起,也有添加复杂背景的方式。

也有图片验证码,要求用户识别图片的物体,以及把缺失的部分拖到正确的位置和拼图等。

但不管形式如何,这些验证码有一个共同的原则:就是要让人类很容易识别,却对计算机来说非常困难。一些研究者认为,为避免 CAPTCHA过难而使网站损失用户,通常要求人类用户通过测试的时间小于30秒,用户通过率大于90%。

还有一个不被普通人知道的点,验证码被称为一种“图灵测试”,所以它在设计之初就有促进人工智能发展的初衷。

根据定义,验证码的算法必须公开,这样做的目的是为了让破解验证码的过程是在解决对应的人工智能问题,例如图像识别、准确度更高的OCR等,破解者不必花费心思通过逆向工程推演算法。

利用验证码将纸质典籍数字化

目前验证码已经被广泛用于各大网站、app中,有数据显示,这项技术在推出后的短短五年内,每天就有2亿个验证码在被使用。

很快,验证码发明者提出一个新的项目reCAPTCHA,主要用于把互联网出现前的纸质典籍数字化。思路是这样的:验证码系统会向用户出示两个单词,第一个是正常的自动生成扭曲文字,另外一个则来自纸质典籍的扫描版,来自扫描版的文字通常因为年代久远、或是纸上有污点等原因而难以被OCR程序识别。

因此,当用户输入验证码时,只要第一个单词输入正确就可以被判别为人类,输入的第二个单词只是“义务劳动”。这是因为系统会默认第二个单词输入是正确的,输入结果只是会与其他用户的输入结果进行对比,如果多名用户的答案一致,这个词的数字化就完成了。

也许你会认为这样一个一个词的识别与庞大的待数字化的典籍相比,根本起不了多大作用,然而在推出之初,reCAPTCHA便能录入3000万个字符。2011年,它已经完成了全部的《纽约时报》数字化的工作,这份从1851年开始出版的老报纸有大量纯纸质版的内容。

2009 年,Google看上了这个项目的价值,并出手收购了reCAPTCHA,同时也被Facebook、Twitter、CNBC等使用。在帮助这些流量最大的网站抵御自动化程序骚扰的同时,Google图书中难以被自动识别的扫描版的古老典籍同样借助reCAPTCHA得以数字化。

另外,reCAPTCHA还被用于帮助机器学习系统提高图像识别率,运作原理和典籍数字化的方法是一样,用机器难以辨别的门牌号、猫狗照片拿来当做验证码供人类识别。

与此同时,用户实际上还在帮机器学习系统标注训练集,所以,强大的AlphaGo背后的人工智能技术,可能早就有你的功劳。

NoCAPTCHA:不用输入字符的验证方式

Google在收购reCAPTCHA后,对它进行了以Google的方式改进。

在2014年,Google推出了新的验证码系统——NoCAPTCHA reCAPTCHA,虽然名字有点拗口,但依然是个验证系统,其核心是不需要输入验证码,用户只需要点击一个“我不是机器人”的复选框,Google就能判别你是不是真正的人类。

reCAPTCHA的口号也从“别发垃圾信息了,读点书吧”(Stop Spam. Read Books),变成了验证码最初的目的“对人类简单,对机器人困难”(Easy on Humans, Hard on Bots)。

NoCAPTCHA跟踪用户点击验证框之前、当时和之后的行为,比如在网页上花费的时间,从而来判断是否是人为操作。

假如你被误判为机器人,还有一个“申诉”的机会,和图片验证一样,从一堆图片中选出正确的目标。

使用reCAPTCHA v3的网站会在网站的每个页面放入reCAPTCHA v3代码,而不只是在登录页面。reCAPTCHA系统会跟踪用户的所有浏览行为进行分析。

就这样,Google 可以获得几乎用户的所有行为。Google也确认,用户使用的硬件信息即设备上的软件会被发送回 Google服务器,但它表示,获得的结果“只用于分析用户行为,不用于个性化广告推荐”。不过,隐私都被掌握了的事实就摆在这里,你想更快捷被验证还是以隐私换取快捷呢?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31432

    浏览量

    223604
  • 互联网
    +关注

    关注

    55

    文章

    11350

    浏览量

    110445

原文标题:验证方式的进化,除了要当上义务标注员,还要付出什么代价呢?

文章出处:【微信号:luomajqrxt,微信公众号:机器人学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    黑M-狂野大数据5期|网盘无密Mp4+大数据直播课-狂野大数据

    科技重构数据生产力:狂野大数据直播实战全解析 随着数字化时代的快速发展,大数据已经渗透到我们生活方方面面。无论是商业、教育,还是医疗、政府服务,大数据的应用都在不断创造新的价值。而在
    的头像 发表于 04-06 11:13 192次阅读

    德州仪器半导体赋能将音频技术引入意想不到的场景

    无论您是否察觉,由半导体赋能的音频技术都已渗透到生活方方面面,其产生的影响早已超越单纯的聆听本身。
    的头像 发表于 03-11 15:00 836次阅读

    探讨我们的社会如何应对持续停电危机

    现代生活方方面面几乎都依赖电力,其中既有显而易见的用途,比如家用照明,也有我们或许习以为常却未曾意识到的用途,比如自来水净化。
    的头像 发表于 03-06 09:41 630次阅读

    安森美创新方案助力AI数据中心提升能效

    人工智能 (AI) 正在迅速发展,并渗透到我们日常生活方方面面,从内容生成到客服聊天机器人皆是如此。与此同时,数据处理量大幅激增,而数据处理很大程度上依赖于强大的计算基础设施。此外,AI 模型在投入使用前,需要在先进的数据中心
    的头像 发表于 12-26 10:23 769次阅读
    安森美创新方案助力AI数据中心提升能效

    RFID电子标签:让生活和工作开挂的神奇科技

    出门过ETC不用停车、超市结账不用挨个扫码、酒店开门不用插钥匙 —— 你有没有发现,这些让生活变便捷的场景里,都藏着同一个 “幕后功臣”:RFID电子标签。这个看似不起眼的小技术,早已悄悄渗透到我们
    的头像 发表于 11-13 10:06 863次阅读

    蓝牙6.0信道探测的创新功能

    预计将以8%的复合年增长率持续攀升,到2029年达到近80亿台。毋庸质疑,蓝牙技术已经成为物联网时代应用极为广泛的无线互连基础设施,渗透到我们生活
    的头像 发表于 09-10 16:25 3414次阅读
    蓝牙6.0信道探测的创新功能

    Microchip助力智能设备高效进化

    随着人工智能(AI)技术的飞速发展,边缘AI正逐步渗透到我们生活方方面面——从车间的智能监控到手术室的实时分析,AI的身影无处不在。你是否曾想过,如何让AI在功耗极低、资源有限的小型设备上高效运行?
    的头像 发表于 08-19 16:43 1291次阅读

    融大视觉:投影融合处理器的应用场景

    如今,投影融合处理器已经渗透到我们生活方方面面,在众多场景中发挥着至关重要的作用。接下来,就为大家揭开它在不同领域应用的神秘面纱。
    的头像 发表于 07-29 18:20 535次阅读

    WT2605A蓝牙录音芯片带来0光害、真省电的智能监护方案​,解决婴儿哭声监护产品操作繁琐,误报率高等难题

    小伙伴们,2025年智能育儿硬件市场正迎来前所未有的爆发式增长!在这个科技日新月异的时代,蓝牙录音技术已经悄然渗透到我们生活方方面面,尤其是在婴儿产品领域,如婴儿看护器市场展现出了令
    的头像 发表于 07-24 17:53 761次阅读
    WT2605A蓝牙录音芯片带来0光害、真省电的智能监护方案​,解决婴儿哭声监护产品操作繁琐,误报率高等难题

    广州邮科逆变器直流12V输入:助力现代生活的电力变革

    现代社会,电力已经渗透到我们生活方方面面,从手机、家电到各类设备,电力的稳定性与质量直接影响着我们的工作与
    的头像 发表于 07-24 09:47 1137次阅读
    广州邮科逆变器直流12V输入:助力现代<b class='flag-5'>生活</b>的电力变革

    云台电机驱动:开启智能化时代的新篇章

    在科技飞速发展的今天,智能已经渗透到我们生活方方面面。而在众多科技领域中,云台电机驱动技术正以其独特的魅力,开启着智能化时代的新篇章。
    的头像 发表于 07-23 18:16 1130次阅读

    上海海思推出Hi2131 Cat.1芯片

    在万物互联的时代,物联网应用已经渗透到了人们生活方方面面
    的头像 发表于 07-14 16:58 1410次阅读

    低速自动驾驶与乘用车自动驾驶在技术要求上有何不同?

    到我们生活方方面面。与面向开放道路、高速巡航的乘用车自动驾驶系统相比,低速小车在技术实现、系统架构、硬件配置、软件算法及安全冗余等方面都存
    的头像 发表于 07-14 09:10 1246次阅读
    低速<b class='flag-5'>自动</b>驾驶与乘用车<b class='flag-5'>自动</b>驾驶在技术要求上有何不同?

    联网未来发展趋势如何?

    技术将为人们带来更加安全、便捷和舒适的居住环境。 工业互联网:工业互联网是物联网行业中的热门领域。通过将传感器、设备和计算机系统相连接,实现工业生产的智能
    发表于 06-09 15:25

    游泳馆智能照明系统:动态光谱调节,重塑游泳体验

    随着科技的不断进步,智能设备已经渗透到我们生活方方面面,游泳馆作为公共场所,其照明系统的智能
    的头像 发表于 05-07 15:09 803次阅读