他婉拒了比尔盖兹将两个产品卖了给谷歌!这位教授用免费来赚钱
大家在网上申请各种账号的时候,常被要求填写「验证码」;例如将一张图片上扭曲的字打出来,或是从多张图片中选出有「红绿灯」的。这个技术主要是用来判断申请者是不是人类,而它是由Luis von Ahn 所发明的。而他都免费的将这个服务提供给网络平台商。那他的公司如何赚钱?
创新点:透过每次5 ~ 10 秒钟,让全世界一起为人类文明出一份力。
本文4 大重点:1. 暑假娱乐是数学解题,到糖果工厂却只爱拆机器。2. 用系统分辨电脑后面是不是人类,解决让雅虎头痛的问题。3. 随机结合两个人玩游戏,顺便为网路照片贴标签。4. 想要免费使用服务,就要「义务」协助电子化内容。
1. 暑假娱乐是数学解题,到糖果工厂却只爱拆机器
大家暑假时都会如何打发时间?每天睡到自然醒、24小时不断玩电脑、和朋友整天腻在一起、还是出门旅行?
出生并成长于80 年代瓜地马拉(Guatemala) 的Luis von Ahn没有网路、手机,所以他暑假的娱乐就是找来下学年的数学课本,然后一题一题的解。在解题的过程中,von Ahn 爱上了数学,以及解决难题。
除了解题,von Ahn也爱玩电动。8岁那年,von Ahn要求母亲买一台任天堂的游戏机给他。但母亲却买了一台Commodore 64家用电脑。虽然8岁的von Ahn完全不懂得使用电脑,但想要玩电动,而且又热爱解决问题的他,很快的就靠着阅读使用者手册,搞懂了如何操作这台机器。
同时,von Ahn 还发现他只要将向朋友借来的电脑游戏,复制到自己的磁碟片中,就可以拥有这个游戏。于是,他开始用手上的游戏和附近的年轻人们交换,很快的他家里成为了小小的电玩收藏室。
到了周末,von Ahn 会在他母亲家开的糖果工厂中度过。和他同辈的亲戚们都爱到工厂吃免费糖果,但von Ahn 对工厂里的机器更有兴趣。他每次都找机会将不同的机器拆开然后重组。虽然常因为有零件漏了没有组回去而被骂,但他依然乐此不疲。
虽然von Ahn 的成长的过程看来非常多姿多彩,但那个时候的瓜地马拉其实正处于内战中,局势非常混乱,治安非常糟糕。15 岁那年,von Ahn 一位亲人被绑架。这让von Ahn 决定要离开家乡,到美国生活。
2. 用系统分辨电脑后面是不是人类,解决让雅虎头痛的问题
Von Ahn在18岁时,被美国北卡州最顶尖的杜克大学(Duke University)录取,就读他最强的数学系。2000年大学毕业后,他进入了卡内基梅隆大学(Carnegie Mellon University)就读资讯工程系的博士班。
原本,von Ahn 想要继续就读数学系,但在一次和数学系教授的聊天中,发现教授正在研究一个300 年来都没有人能够解开的难题。Von Ahn 马上就在想,300 年都没有人能够解决的问题,他怎么可能解开?
但他在拜访资工系时,看到的结果就完全不一样了。因为资工是比较新的科系,所以每一位教授都可以说出最近几个月来他们解决了什么问题。这让喜欢解题的von Ahn 觉得更有成就感,因此决定要转换跑道。
一天von Ahn 和指导教授一起去参与了由雅虎主办的座谈会。当天雅虎的工程师介绍了10 个雅虎没有办法解决的问题。这让爱解决难题的von Ahn 精神一振。他在座谈会结束后,马上就开始和指导教授一起讨论这些问题。
雅虎在2000 年时,是一家顶尖的科技公司。因此,连雅虎都无法解决的问题当然都是非常复杂的。在思考了好几个月之后,von Ahn 总算为其中一个问题找到可能的解决方法。
雅虎其中一个重要的服务是提供免费的电邮地址,但每个地址一天只能寄出500 封信。于是,很多骇客就写程式,不断的申请新的账号,然后用这些账号发出大量的垃圾邮件。而这个现象让雅虎非常头痛。
Von Ahn 觉得,人类是无法24 小时坐在电脑前申请新账号,所以,要解决这个问题只要能够分辨出操作电脑的是人类还是程式就好了。
那有什么东西是人类可以轻易做到,而程式不行的?Von Ahn 认为「看图说故事」是连小孩都可以轻易做到,但对电脑来说却是非常困难的事。
因此,他设计了一个系统,将扭曲的文章与数字放在图片中,然后请要申请电邮地址的人,输入图片中的字。成功输入对的人,才被允许申请新的电邮地址。这就是第一版的「验证码」(CAPTCHA)了。
Von Ahn 将这个系统简称为CAPTCHA,因为CAPTCHA 听起来像是英文的「抓到你了」,代表他们成功抓出用程式申请电邮地址的人。而CAPTCHA 的全名是:「全自动区分电脑和人类的公开图灵测试」(Completely Automated Public Turing test to tell Computers and Humans Apart) 。
在确保CAPTCHA 是可行的之后,von Ahn 写了一封电邮给雅虎,并附上了他的程式与简单的说明。大约一周后,雅虎就在他们电邮地址申请的页面上,加入了这个验证功能,可见它们真的很想要处理这个问题。
21 岁的von Ahn 虽然解决了雅虎的问题,但并没有因为这样而致富。因为,他并没有向雅虎收取任何费用,所以CAPTCHA 是免费提供给雅虎的。
网上其他的厂商看到雅虎的验证码,也开始推出类似的程式。不久后CAPTCHA 就成为了网路上最常见的验证方法。
3. 随机结合两个人玩游戏,顺便为网路照片贴标签
在解决了雅虎的问题后,von Ahn 继续回到他的博士论文:找出人类可以做到,但电脑无法完成的事,并设法让人类来辅助电脑。
在有了CAPTCHA 的经验后,von Ahn 决定继续的朝着「看图说故事」的方向前进。他设计了一个网路游戏,将参与者随机配对成两人一组,然后给他们一张图片,并请他们猜对方看到图片时会想到什么。
例如,参与者看到一张101大楼的照片,就可能会写下:「101」、「建筑」、「高楼」、「台湾」等不同的词。而游戏就是要看那一对能够写出最多相同的词。
这个游戏延续von Ahn 优良的怪咖命名传统,被称为「ESP 游戏」(Extrasensory perception,第六感)。
这边表面上看来是「心灵感应」的游戏,其实后面在解决的,是「电脑无法分辨照片」的问题。透过这个游戏,von Ahn 就能为网路上照片贴上标签,让电脑以后也可以透过使用者的输入,找到正确的照片。
今天,大家一定觉得这个技术没什么了不起,因为我们在Google 输入「101」,就能够找到各式各样101 相关的照片。而这正是运用了von Ahn 研究的成果。
ESP 游戏在2005 年正式上线,在4 个月内,它成功吸引了13,000 人使用,并为约300,000 张照片加上了超过130 万笔标签。
2006 年,Google 发现了这个研究,就向von Ahn 购买了使用权,并设计了类似的产品。这个名为Google Image Labeler 的工具就能够让使用者标注上传到Google 的照片。
4. 想要免费使用服务,就要「义务」协助电子化资本内容
博班毕业后,von Ahn 打算继续留在卡内基梅隆大学做研究。但这时,他接到了来自比尔盖兹的电话。由于von Ahn 之前曾在微软实习,所以里面的主管都很想招揽他加入微软研究团队。但von Ahn 一直坚持要做自己的研究而婉拒。微软因此决定要出绝招,找来了创办人比尔盖兹亲自打电话给von Ahn。他们在电话中聊了约半小时,但von Ahn 最后还是没有加盟微软。
回到卡内基梅隆大学当讲师的von Ahn 还是继续思考「人类」和「电脑」如何搭配。这时,他忽然想起使用CAPTCHA 人每次都要花5 ~ 10 秒的时间,输入验证码。但由于使用者很多,所以这些时间累积起来也非常可观。于是,他开始思考如何更好的利用这些时间。
在这个时,随着电子储存技术的进步,很多公司都开始研究如何将过去数以万计的纸本书籍数位化。而可行的方法只有两种,第一是手动输入,但这个方法耗时耗力,而且容易出现输入错误。
另一种方法,就是将纸本扫描后,利用光学文字辨识技术(OCR) 去辨别这些文字。但是,辨识技术一般来说大概有20% 的字是无法辨识的。而那些年代久远导致文字不清晰的书,就更难被辨识了。
于是,von Ahn 再次想起了人类「看图说故事」的能力。于是,他改良了CAPTCHA 的做法,并将它命名为「reCAPTCHA」,然后又免费的提供给有需要的网站。唯一不同的是,使用这个服务的网站需要将使用者输入的字回传给von Ahn。
reCAPTCHA 和CAPTCHA 最大的分别,是在于它不是提供使用者一组扭曲了的文字,而是两组。其中一组是系统已经知道答案的文字,另一组则是从扫描纸本得来的。只要使用者能够正确的回答前一组,那系统就会认为后一组的解答也是正确的。
系统同时还会将同一张扫描内容发送给多个使用者交叉验证,以确保不会有人答对了前一组,却不小心打错了后一组的状况。所以,使用者在输入验证码时,同时也在为纸本的电子化尽一份力。
系统上线后,von Ahn 找了一些小网站合作,但在2006 年,有一家新兴的网站主动联络他,想要使用这个服务。这个网站就是后来著名的脸书,而这也让reCAPTCHA 的使用量暴增。
之后一场演讲中,von Ahn 分享了reCAPTCHA 如何能够协助电子化既有的纸本资讯,而纽约时报技术长正好在场。会后,这位技术长就告诉von Ahn,纽约时报在全面电子化之前,有约130 年的纸本内容。他想要von Ahn 报个价,看看要将全部内容电子化大概需要多少钱。
一开始,von Ahn 并没有想到reCAPTCHA 能够如何赚钱,甚至也没有想要用它来赚钱(就如CAPTCHA 和ESP 游戏一样,只是他的研究)。因此,他只好急忙的想办法估算需要的费用。最后,他不知从如何算出电子化一年的内容,要收42,000 美元这个数字。但纽约时报没有讨价还价,只是要求他每完成转换一年的内容,就请款一年的费用。
托脸书的福,reCAPTCHA 那时候已经有非常多的用户,所以只要一周就大约能将纽约时报一年的资本电子化。更好的是,von Ahn 其实并没有需要做些什么,只要确保reCAPTCHA 的系统有正常运作,就可以每周收到42,000 美元。
Von Ahn 的老客户Google 在这个时候,正好启动了自己的电子书计划。它们看到了reCAPTCHA 后,就决定再次向von Ahn 购买这个系统。就这样,von Ahn 再次将他的研究卖给Google。
在收购了reCAPTCHA 后,von Ahn 因为合约的关系,短暂的进入了Google 工作。而在2012 年,reCAPTCHA 每天大概能够协助辨识1.5 一个需要被电子化的字。
但von Ahn 的研究并没有停止。很快的,他又在为「看图说故事」找到新的应用,而且还设计出一个线上语言学习App。不过,这又是另一个故事了!
▽▽▽▽▽▽