Моё новое увлечение, ага. Посему себе в склерозник сразу инструкцию, чтоб через полгодика вспомнить...Порядок действий при создании е-книги в fb2 в docНе удалось освоить фб2, сколько программ ни перепробовала. Не проходят файлы валидность, а про какие ошибки на инглише пишет - непонятно... ну и шут с ними. Буду делать в привычном доке!1. Итак, сошлись вместе сканер и книжка.
читать дальшеЭтого вполне может быть достаточно для сканирования, но удобнее показалось и спецпрограмму сразу прикрутить - ABBYY FineReader, допустим, версии 11. Па-бам, включается сканер, в FR выбираются настройки сканирования: 1) стандарт для научки и худлита мелкого шрифта - 600 дпс, серый, определять ориентацию страницы, делить разворот книги; 2) для красочной детской литературы крупного шрифта - 300 дпс, цветной, остальное то же.
2. Положить книгу нужными страницами на сканер, подровнять, плотно прижать, нажать в FR "Сканировать" - и повторить эту операцию до получения нужного количества страниц или пока руки не устанут. На случай вылета стоит иногда сохранять создаваемый "Документ FR". А на случай смявшейся или слабо отсканированной по корешку страницы - проверять качество получаемых сканов, чтоб при необходимости сразу и переделать.
3. Обложку книги отсканировать в цвете. Важные цветные иллюстрации и карты тоже в цвете. Передвинуть в создаваемом документе эти страницы на положенные им места.
4. Подключить в FR языки, которые есть в книге (меню Сервис - Редактор языков). Запустить распознавание документа. Теперь сохранить распознанный документ FR отдельно и далее работать с этой копией, а оригинал оставить на всякий пожарный.
5. Сначала следует разобраться с распознанными областями - текстовыми блоками, изображениями, колонтитулами, померещившимися файнридеру буквами на пустом месте... Области-изображения и колонтитулы по-максимуму удалить: иллюстрации таки лучше вставить в документ отдельно, после обработки. Текст, если он оказался разделен на несколько областей на одной странице, свести к минимуму областей (обычно - одна на странице; текст в две колонки - две области, а три - когда там еще и внезапная текстовая врезка). И не забывать распознавать эти объединенные в одну области заново - чтоб текст не потерялся.
6. Вычитка текста. Первоначальную удобнее делать в FB (пункт Проверка): сразу показывается и спорное место получаемого текста, и окно правки, и окно исходного скана - и всё на нужном слове (или недораспознанных кракозяблах...). Первичное форматирование текста тоже удобнее делать в FB, настроив несколько основных стилей (заголовок и подзаголовки, основной, сноски) - автоматически или по воле создателя, но стили будут, впиваются в текст они крепко, сохраняясь при конвертациях, лучше уж сразу эти стили проконтролировать...
7. После вычитки - сохранить документ в док-файл Микрософт Офиса и теперь вторично вычитывать в нём, возможностей редактирования в нем больше. Полной автозамены в большинстве случаев стоит избегать (ну разве что массово "найти и удалить" ненужное - мягкие переносы, разрывы страниц), заменить двойные и более пробелы на одинарные. Индивидуально проверить путем "найти-заменить" дефисы (часто они рвут слова с того этапа, когда были в них переносами). Пройтись функцией "найти-заменить" по характерным для этой книги возможным ошибкам (кавычки, двоеточия, цифры, непечатаемые знаки, сокращения слов...) Ну и, наконец, сплошняком проверить текст на слова и ошибки, на сбившиеся стили, сноски, эпиграфы, стихи - форматировать и редактировать текст, как полагается, чтоб было приятно читать. А стилей на случай конвертации когда-нибудь в FB2 использовать поменьше. 
8. Иллюстрации. Их минимум одна - обложка. Отдельно картинку из скана вроде как не выдрать, поэтому надо сохранить изображение выбранной страницы (в jpeg - понимается чаще, весит меньше). Потом открыть страницу в редакторе изображений (или просто в FastStone Image Viewer - он и просмотрщик, и редактор) - и довести до ума: отрезать всё лишнее, улучшить контрастность и гамму, уменьшить изображение до приемлемых размеров (минимум 240 на 320, максимум советуют 800 на 600... чтоб в читалку влезло :gigi
Готовые картинки вставить на соответствующие места в файле doc.
Объем файла готовой электронной книги (крайне желателен) - до 10 мб.
@темы:
полезная инфа,
хард и софт