воскресенье, 2 сентября 2007 г.

reCAPTCHA

reCAPTCHA - это прекрасно! Бесплатный сервис, который генерит т.н. capchas - картинки, защищающие от регистрации на твоем сайте нечеловеческих роботов. Но самое замечательное - что эти картинки берутся из оцифрованных книг. То есть люди, регистрируясь на сайтах, тем самым помогают оцифровывать книги.

Приятно видеть, что сервис не только лично, но еще и общественно полезный.

Очень интересно сделан алгоритм распознования. Ведь компьютер не может проверить, правильно ли проходящий captcha-тест человек "оцифровал" то, что ему показано. Поэтому человеку даются на распознование два слова - одно, которое уже было распознанно, и другое, которое еще не распознано. Если человек одно из слов распознает верно, то второе автоматом тоже считается правильно распознанным.

Думаю, там должен быть еще какой-то алгоритм кросс-проверки. То есть одно и то же слово должно быть передано нескольким людям, а их результаты надо сравнить, перед тем, как считать слово надежно распознанным.

UPD: А у Амазон, гад такой, получил патент на Human Computing: http://soft.compulenta.ru/313616/ (c подсказки Макса Космыча)

1 комментарий:

Анонимный комментирует...

Ага
Был еще интересный докладец на тему Human Computing - надо найти и тебе сюда выложить