Распознавание и вычитка
Добавлено: 09 ноя 2006, 14:32
Для тех, кто желает помочь с распознаванием и вычиткой.
Внимание! Для тех, кто решил помочь с распознаванием и вычиткой, хорошее владение русским языком обязательно. Если вы не уверены в своих знаниях русского языка, то можно ограничиться простым распознаванием.
Распознавание включает в себя первичный просмотр распознанного текста и устранение ошибок распознавания (правка неуверенно распознанных символов, в случае необходимости добор нераспознанного текста с центра разворотов). Убедительная просьба к тем, кто считает, что распознавание состоит только из обработки файлов программой без личного участия, не беспокоиться.
Скан одной книги весит порядка 5-6 Мб. Все сканы имеют формат djvu. Для конвертации файлов необходимо установить программу IrfanView и воспользоваться следующей инструкцией. Внимание! Если конвертация осуществляется в файлы формата tiff (рекомендуется), то на диске винчестера должно быть минимум 1.5 Гб свободного места. При конвертации в jpg места требуется намного меньше, но качество файлов тоже несколько хуже. В некоторых случая это не принципиально. Рекомендуем ориентироваться на располагаемые ресурсы. Также имеет смысл попробовать сохранять tiff как CCITT Fax 4.
Для распознавания файлов рекомендуем использовать программу Abby FineReader 8.0. Возможно также использование более ранних версий этой программы, но следует учитывать, что в таких случаях время, потраченное на вычитку текста, может увеличиться.
Рекомендации по распознаванию можно посмотреть здесь. Рекомендации по вычитке и оформлению здесь.
В связи с определенной трудоемкостью процесса просьба реально оценивать свои возможности для распознавания и вычитки. Максимальное время на одну книгу - одна неделя.
Все заявки присылайте на ящик fenzin@mail.ru
Внимание! Для тех, кто решил помочь с распознаванием и вычиткой, хорошее владение русским языком обязательно. Если вы не уверены в своих знаниях русского языка, то можно ограничиться простым распознаванием.
Распознавание включает в себя первичный просмотр распознанного текста и устранение ошибок распознавания (правка неуверенно распознанных символов, в случае необходимости добор нераспознанного текста с центра разворотов). Убедительная просьба к тем, кто считает, что распознавание состоит только из обработки файлов программой без личного участия, не беспокоиться.
Скан одной книги весит порядка 5-6 Мб. Все сканы имеют формат djvu. Для конвертации файлов необходимо установить программу IrfanView и воспользоваться следующей инструкцией. Внимание! Если конвертация осуществляется в файлы формата tiff (рекомендуется), то на диске винчестера должно быть минимум 1.5 Гб свободного места. При конвертации в jpg места требуется намного меньше, но качество файлов тоже несколько хуже. В некоторых случая это не принципиально. Рекомендуем ориентироваться на располагаемые ресурсы. Также имеет смысл попробовать сохранять tiff как CCITT Fax 4.
Для распознавания файлов рекомендуем использовать программу Abby FineReader 8.0. Возможно также использование более ранних версий этой программы, но следует учитывать, что в таких случаях время, потраченное на вычитку текста, может увеличиться.
Рекомендации по распознаванию можно посмотреть здесь. Рекомендации по вычитке и оформлению здесь.
В связи с определенной трудоемкостью процесса просьба реально оценивать свои возможности для распознавания и вычитки. Максимальное время на одну книгу - одна неделя.
Все заявки присылайте на ящик fenzin@mail.ru