最先想要解決這一問(wèn)題的是雅虎——作為互聯(lián)網(wǎng)時(shí)代早期最重要的免費(fèi)郵件提供商,他們一方面要解決用戶(hù)們每天遇到的數(shù)以百計(jì)的垃圾郵件轟炸,另一方面,他們自己的免費(fèi)郵箱,恰恰又是垃圾郵件的最?lèi)?ài)——耗費(fèi)無(wú)數(shù)資源所阻止的垃圾郵件,都來(lái)自于自己的服務(wù)器。這讓雅虎開(kāi)始認(rèn)真考慮如何解決人機(jī)辨識(shí)問(wèn)題。

互聯(lián)網(wǎng)最早出現(xiàn)的capthca
他們找到一位當(dāng)時(shí)剛剛21歲的天才——Luis von Ahn。 而Luis Von Ahn給出的方案,就是這個(gè)讓人民群眾微微皺眉,但是讓計(jì)算機(jī)聳肩撓頭的驗(yàn)證碼 Capcha。計(jì)算機(jī)辨識(shí)技術(shù)還很落后,對(duì)于經(jīng)過(guò)扭曲、污染的文字,無(wú)法辨識(shí)。而人類(lèi)卻可以輕松認(rèn)出這些文字。這是一個(gè)簡(jiǎn)單而巧妙的設(shè)計(jì),計(jì)算機(jī)先是產(chǎn)生一個(gè)隨機(jī)的字符串,然后用程序把這個(gè)字符串的圖像進(jìn)行隨機(jī)的污染,扭曲,再顯示給顯示器前的人或者機(jī)器。凡是能夠辨識(shí)這些字符的,即為人類(lèi)。
故事還沒(méi)完,Luis Von Ahn是那種追求完美的科學(xué)家。當(dāng)全世界數(shù)以十億計(jì)的人每天都會(huì)浪費(fèi)幾秒鐘的時(shí)間參與辨認(rèn)文字這一簡(jiǎn)單活動(dòng)的時(shí)候,他開(kāi)始思考,其中浪費(fèi)的人腦智力是否能得到更好的應(yīng)用呢?
Luis Von Ahn的最終設(shè)計(jì)是,讓人們用這些腦力解決一些計(jì)算機(jī)無(wú)法解決的圖書(shū)數(shù)字化。
在計(jì)算機(jī)時(shí)代以前,印刷術(shù)已經(jīng)存在了數(shù)百年,但這些印刷術(shù)所產(chǎn)生的書(shū)本和報(bào)紙等等,對(duì)于計(jì)算機(jī)來(lái)說(shuō)都是模擬信號(hào),僅以圖像的形式存在,而非以數(shù)字化的形式存在。但是,早期的印刷術(shù)并不精確,文字大小不一,形象有差別。而且因?yàn)橛∷⑵纺甏眠h(yuǎn),擁有各種細(xì)微的缺損和污染。這對(duì)人眼來(lái)說(shuō)不是什么大問(wèn)題,但對(duì)計(jì)算機(jī)來(lái)說(shuō)就麻煩了。


目前在google、yahoo、youtube等各個(gè)網(wǎng)站都能看到的雙capcha,一個(gè)是需要辨認(rèn)的文檔圖像,一個(gè)是計(jì)算機(jī)生成的capcha
因此,2002年,luis Von Ahn開(kāi)始讓capcha引用各種無(wú)法被計(jì)算機(jī)辨識(shí)的文字圖像,目前,已經(jīng)有上萬(wàn)網(wǎng)站采用他的新一代capcha。每天幫助辨識(shí)數(shù)以百萬(wàn)計(jì)的古老文檔。
問(wèn)題在于,對(duì)于最初的capcha來(lái)說(shuō),計(jì)算機(jī)實(shí)際上是知道答案的。而Luis希望人們辨識(shí)的文字,計(jì)算機(jī)實(shí)際上是不知道答案的,那如何能驗(yàn)證返回的答案到底是不是真的呢?
解決這個(gè)問(wèn)題的方法依然體現(xiàn)了Luis一貫的簡(jiǎn)潔和優(yōu)美,他讓人們每次辨識(shí)兩個(gè),而非一個(gè)capcha,其中一個(gè)來(lái)自于計(jì)算機(jī)隨機(jī)生成的字符串,而另一個(gè)則是從文檔中選取的計(jì)算機(jī)不認(rèn)識(shí)的字符圖像。只要人們對(duì)前一個(gè)字符串給出的答案是正確的,那么就判定,人們對(duì)后一個(gè)capcha的辨識(shí)是正確的。
用這一方法,luis的capcha2.0 已經(jīng)幫助完成了整個(gè)紐約時(shí)報(bào)130年的報(bào)紙存檔數(shù)字化——這一本可能花費(fèi)無(wú)數(shù)時(shí)間和資源的工程,在幾個(gè)月之內(nèi)就由各位網(wǎng)友們完成了。
當(dāng)然,這是美國(guó)人在capcha中找到的人肉商機(jī)。而相對(duì)的,知道中國(guó)人和印度人怎么從capcha中尋找人肉商機(jī)嗎?
簡(jiǎn)單來(lái)說(shuō),通過(guò)一系列程序轉(zhuǎn)換,亞洲勞動(dòng)密集型產(chǎn)業(yè)把各種垃圾郵件注冊(cè)、電子游戲金幣農(nóng)民所需要解決的capcha辨認(rèn)問(wèn)題,集中給幾個(gè)專(zhuān)門(mén)負(fù)責(zé)辨認(rèn)capcha的人手里,這些人的工作就是,替垃圾郵件注冊(cè)軟件辨認(rèn)capcha,一遍他們能冒充人類(lèi),每辨認(rèn)一個(gè)獲得半個(gè)盧比,每天需要辨認(rèn)成千上萬(wàn)個(gè)capcha。
勞動(dòng)密集型經(jīng)濟(jì)體和資本密集型經(jīng)濟(jì)體對(duì)人類(lèi)腦力就是如此區(qū)別定價(jià)的。