任何一个经常上网的人都对CAPTCHA很熟悉——你必须输入形状奇怪的字母,才能进入某些网页。CAPTCHA代表完全自动化公共图灵测试来告诉计算机这是一种非常有效的安全措施,意味着计算机系统可以分辨出你是一个真正的人,还是一个垃圾邮件机器人。

验证码图像现在,匹兹堡卡耐基梅隆大学的研究人员利用这项技术实现了一个相当不同寻常的目的——将印刷材料中的旧文本转录成数字形式。利用验证码系统,研究人员一直在要求计算机用户破译当前字符识别计算机程序无法识别的书籍扫描单词。研究小组发现,这种方法的准确率超过99%,与专业的人类文本转录者一样好。目前,该系统已在4万多个网站中使用,并已用于转录超过4.4亿个单词。

评论

添加注释