Bizonyára ön is találkozott már azzal, hogy egy új regisztráció során, egy online jegyvásárláskor vagy egy e-mail-fiók megnyitásakor ellenőrzi a távoli szerver, hogy véletlenül nem egy másik komputer próbál-e ezer és ezer automata folyamatot futtatni. „Bizonyítsd be, hogy ember vagy és nem gép” – erről szól ez a megközelítés. Hosszú évekig dülöngélő, rosszul látható betűk megfejtésével kellett bizonyítanunk, hogy emberek vagyunk, s ez sokszor még ma is így van. E szolgáltatás reCAPTCHA néven futott. A Wikipédia szerint éppen egy tucat ilyen (nagyobb, jelentősebb) alkalmazás érhető el, a reCAPTCHA csak az egyik közülük.
A technológiát a Google vásárolta fel. Hogy miért? Azért, mert a keresőóriás alapítói a fejükbe vették, hogy a beszkennelt képeket (könyvoldalakat) szöveggé alakítani képes szoftverekkel a világ összes könyvét digitálissá alakítják. Csakhogy a megfakult, sok helyütt gyűrött vagy rosszul nyomott oldalak hiányos, csonka, girbegurba betűit a legokosabb gép sem tudja „kihámozni”. Erre csak az emberek képesek. De honnan lehet önkénteseket toborozni, akik az évi kétmillió kötet összes hibáját kiszűrik?
És igen, itt jön Luis von Ahn, a CAPTCHA cég alapítójának zseniális ötlete. A fenti folyamat segít az emberek távoli azonosításában, ők pedig „felokosítják” az öntanuló mesterséges intelligenciákat arra, hogy melyik kivehetetlen, hiányos és rosszul nyomott betű, szó mit is jelenthet. Persze mondjuk egy kis magyar vállalatnak így esélye sincs a Google-lal szemben, hiszen akárhány diákot és nyugdíjast venne rá egy ilyen munkára, a keresőóriásnál csak a Gmail levelezőt 1,2 milliárdan használják, és naponta 3,5 milliárd keresőszót gépelnek be. Azaz a világ legpontosabb, legprofibb szövegfelismerője ki másé lenne, mint a Google-é?
Ha pedig egy recept beválik, minek annyit változtatni rajta? Egy időben házszámokat és más táblákat kellett az embereknek a CAPTCHA révén feloldaniuk. Miért? Talán azért, mert a Google Street View autóinak képek millióiról kellett digitálisan „kiradírozni” a név- és számtáblákat.
De a legmeredekebb a legújabb Google reCAPTCHA. Itt egy képet négyszer négy kockára vágnak, és be kell jelölnünk azokat a kockákat, amelyeken járművek és közlekedési táblák láthatók. A fentiek ismeretében pedig már nem is nehéz kitalálnunk, mire megy ki a „játék”. A Google önvezető autót fejleszt, és annak a szoftverét kell tökéletesítenünk. De gondoljuk csak el, mekkora az előnye akár a Daimlerhez, akár a Toyotához, akár a BMW-hez képest az amerikai keresőóriásnak? Bizony, ekkora hatalom és mérhetetlen profit az információs korszakban az adatok okos gyűjtése és felhasználása, méghozzá a napi gyakorlatban.
MI IS AZ A CAPTCHA?
A kifejezés a számítástechnikában olyan automatikus tesztet jelent, amely képes megkülönböztetni az emberi felhasználót a számítógéptől. A szó az angol Completely Automated Public Turing test to tell Computers and Humans Apart rövidítése, azaz hozzávetőleg: teljesen automatizált nyilvános Turing-teszt a számítógép és az ember megkülönböztetésére.