Платим блогерам
Редакция
Новости Software jMeirou

реклама

На конференции, посвящённой безопасности компьютеров и коммуникаций и проходящей в Чикаго, исследователи из Стэнфордского университета, Эли Бурштейн, Мэттью Мартин и Джон Митчел, представили результаты своего полуторагодичного проекта, посвящённого разработке программного инструмента для автоматического распознавания текстовой капчи.

CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart - полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей) представляет собой тесты, пройти которые должны быть способны только люди. Веб-сайты используют подобные тесты для блокирования спам-ботов, способных автоматически регистрироваться на сайтах и оставлять комментарии.

реклама

Существуют различные виды капчи: одни используют генерируемые аудиофайлы, другие предлагают решать математические задачи, но наиболее распространённой является текстовая капча, требующая распознавания искажённого текста.

Команда из Стэнфорда разработала различные методы очистки искажённой картинки капчи от шумов и способы разбития изображения текстовой строки на отдельные буквы для более простого распознавания. Идеей для некоторых разработанных алгоритмов послужил метод, используемый некоторыми роботами для ориентирования в пространстве. Разработанный инструмент был назван Decaptcha и протестирован на 15 популярных сайтах.

На сайте компании Visa Authorize.net программа смогла правильно разгадать капчу в 66% случаев, ввод капчи на портале игры World of Warcraft оказался успешным в 70% случаев. На сайте eBay капча была введена успешно в 57% случаев.

Единственными сайтами, на которых капчу не удалось пробить ни разу, оказались сайты Google и сервис reCAPTCHA. Последний использует капчу, разработанную в университете Карнеги-Меллон и купленную в дальнейшем Google. После проведения этих тестов Authorize.net и ещё несколько сайтов сразу же перешли на использование reCAPTCHA.

Бурштейн и его команда ранее уже отличились другими достижениями в области обхода капчи. В мае они представили техники, позволяющие успешно распознавать аудио-капчу на таких сайтах, как eBay, Yahoo и Digg. В будущем команда планирует совершенствовать свою программу.

Показать комментарии (13)

Сейчас обсуждают