You are hereOCR

OCR

By metelica - Posted on 01 марта 2011

Картинка:

Оптическое распознавание символов (OCR) или оптическое распознавание символов - технология для преобразования изображения текстовых документов в машиночитаемый текст. В то время как был достигнут высокий уровень точности признания печатного или машинописного текста, точность в случае с текстом, написанным от руки, остаётся несовершенной. Всё ещё остаётся необходимость в некоторой корректировке полученного текста.

Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учета в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слова или фразы, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тесту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.

Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.

Теги

OCR

Белинтер.нет

Русинтер.нет

Интер.нет

Навигация

Сейчас на сайте

Последние комментарии

OCR