Привет всем.
Сколько раз Вам приходилось заполнять какую-нибудь веб-форму, где требовалось прочитать искаженный ряд символов (captcha)? Очень многих он раздражает. Ка́пча (от CAPTCHA — англ. Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей) — компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. Термин появился в 2000 году. В Рунете устоялось название капча — фонетическая калька с термина.
Сейчас reCAPTCHA - механизм, который помогает усилиями огромного количества пользователей интернета оцифровывать книги.
капча
Тот, кто придумал этот "чудесный" механизм, сейчас разрабатывает новый грандиозный проект - Duolingo, который поможет миллионам людей бесплатно изучать иностранные языки.
Этот проект начался со следующего озарения. Оказывается, примерно 200 миллионов капчей вводится каждый день людьми в мире. Каждый раз при вводе капчи, вы теряете 10 секунд вашего времени. Если умножить это на 200 миллионов, оказывается, человечество теряет 500 000 часов каждый день, вводя надоедливые капчи.
Вы можете не знать, но сегодня при вводе капчи, вы не только подтверждаете, что вы человек, но вдобавок вы помогаете оцифровывать книги.
Как это работает.
Есть много проектов по оцифровке книг. В Google, у The Internet Archive. Amazon, теперь с Kindle, пытается оцифровывать книги. Это выглядит примерно так:
Сканирование книги, это как фотографирование каждой страницы.Это изображение с текстом каждой страницы книги. Следующий шаг в этом процессе — компьютеру нужно расшифровать все слова в этом изображении. При этом используется технология OCR, оптическое распознавание символов, которая берёт изображение текста и пытается понять, что там за текст. Проблема в том, что OCR не идеальна. Особенно в старых книгах, где чернила выцвели и страницы пожелтели, OCR не может распознать многие слова. Например, в книгах, написанных более 50 лет назад, компьютер не может распознать примерно 30% слов. Поэтому выбирают все нераспознанные слова, и дают их на чтение людям, когда они вводят капчу в интернете.
При следующем вводе капчи, знайте, что вы вводите слова, взятые из оцифровываемых книг, которые компьютер не смог распознать.
это явно не изображения из старинных книг. впрочем, я никогда не видел капчи, которая хотя бы отдалённо напоминала бы мне скан слова из старинной книги.
так что как по мне, про капчи с частями из старинных книг, это полная чушь
Хм, версия интересная, как же тогда выясняется правильно ли распознал человек картинку?
Использют два слова вместо одного, потому что одно из слов система взяла из книги, второе неизвестно и показывается вам. Однако поскольку ответ неизвестен, то оценить точность невозможно. Поэтому дают другое слово, ответ для которого известен. Какое из них какое не говорят, и просят ввести оба. При вводе правильного слова, того, для которого ответ известен, система считает вас человеком, а также получает уверенность в правильности ввода другого слова. Повторив это с 10-ю разными людьми, все из которых согласны с вводом нового слова, получают ещё одно точно оцифрованное слово.
Добавлено спустя 01 минуту 32 секунды
это явно не изображения из старинных книг. впрочем, я никогда не видел капчи, которая хотя бы отдалённо напоминала бы мне скан слова из старинной книги.
так что как по мне, про капчи с частями из старинных книг, это полная чушь
Так и не дают прямой скан из книги, дают только непонятное системе слово
фига ... да это фантастика) а капча просто бессмысленное действие, как и 99% всех действий человеков
как говаривал старина бендер, не грустите, мешки с костями :)