Делюсь собственным опытом по преобразованию вордовских документов (книг или структурированных определенным образом каких-либо работ) в форматы читалок fb2 и epub. Скажу сразу, что напрямую конвертирование doc в epub ни одной из нескольких десятков перепробованных программ к желаемому результату не приводит: то сносок нет, то содержание дублируется, то еще что-нибудь обязательно выползает. И даже такой гигант как «calibre» с этим грамотно не справляется.
Выход очень простой и одновременно полезный – нужно конвертировать документ Word в формат fb2. Полезность заключается в том, что вместо одного популярного формата для различных ридеров, вы получаете сразу два, ну и плюс ко всему редактировать его гораздо проще, чем формат epub.
Правильное оформление исходного документа в doc
Итак, начнем подробнейшим образом разбираться с самим процессом преобразования. Для начала необходимо убедиться, что исходный текстовый документ у вас оформлен и отформатирован надлежащим образом. Мало кто знает и использует такие полезные вещи в Ворде, как заголовки, разрывы страниц, сноски и многое другое. Привожу в качестве примера небольшой документ, предполагаемую книгу, которая специально оформлена неправильно. Скачать ее можно, кликнув на скриншот.
Сразу бросается в глаза безобразное оформление: заголовки выделены только с помощью жирности, сноски просто помечены курсивом, а каждая последующая глава идет без какого-либо малейшего разрыва от предыдущей. Что ж, придется отформатировать текст должным образом. Для начала избавимся от лишних абзацев и сделаем название каждой главы на новой странице, причем отформатируем его именно как Заголовок. Включаем отображение непечатаемых знаков.
Перед каждой главой ставим курсор и нажимаем Ctrl+Enter. Указанное сочетание клавиш создаст разрыв страницы и перенесет нашу главу на новый лист. Удаляем лишний перенос строки перед названием главы. Выделяем само название и идем в «Стили». Здесь нужно выбрать «Заголовок 1», после чего можно продолжить форматировать название: выравнивать по центру, менять размер и сам шрифт.
Проделываем эту процедуру с каждой главой. Для чего это нужно? Во-первых, это правильное оформление текста, ну а во-вторых, подобная разметка сильно поможет впоследствии в автоматическом формировании активного (кликабельного) оглавления на читалках.
Двигаемся дальше. Всякая уважающая себя книга имеет обложку, поэтому мы не будем отставать от традиций и вставим изображение (обложку) в самое начало документа.
Осталось разобраться со сносками и наша будущая книга почти готова. Напоминаю, что сейчас сноски оформлены неправильно, точнее вовсе никак не оформлены, а идут сплошным текстом.
Но это как раз легко исправить. Ставим курсор непосредственно в конце текста, после которого должна идти сноска и нажимаем комбинацию клавиш Alt+Ctrl+F. Рядом с текстом появится маленькая цифра, номер сноски, а в конце страницы (курсор сам переместится в нужное место) можно вставить сам текст сноски.
Оформляем подобным образом все сноски в тексте и на этом работа с исходным документом окончена. На всякий случай еще раз оговорюсь, что мы не ставим перед собой целью оформление документа абсолютно правильно, по ГОСТу и так далее. Мы его отформатировали только для того, чтобы на следующих этапах получались правильные книги в формате fb2 и epub.
Конвертирование doc в fb2
На мой взгляд, самой лучшей, удобной и наиболее правильной конвертирующей документ в fb2 программой является «FictionBook Tools». Она единственная в своем роде, которая правильно определяет и форматирует сноски в fb2. Да и скорость работы у нее шикарнейшая. Итак, скачиваем программу, устанавливаем (либо можно воспользоваться архивом в конце статьи и распаковать в любое место на диск). Кладем в папку с этой программой наш отформатированный doc-файл «Correct.doc» и запускаем приложение «doc2fb.hta».
Заходим в настройки и ставим галочку «Определять сноски как». Это если у вас в исходном документе сноски присутствуют. Если же их нет, то в настройках нам делать нечего вовсе, там все и так правильно выставлено по умолчанию.
Нажимаем кнопку «Преобразовать» и ждем, когда чуть ниже нее в «Журнале» появится новый пункт «Преобразованные файлы».
Таким образом программа нам дает знать, что процесс конвертации закончен. Смотрим папку с программой и обнаруживаем там появление нашей книги уже в формате fb2.
Редактирование fb2
В принципе, книгу уже можно открывать на электронных читалках и в таком виде, но я предлагаю все-таки ее немножко отредактировать и сделать более корректной. Для этого можно воспользоваться замечательной программой «FictionBook Editor», а если же вы уже съели не одну собаку на этом деле, то вам вполне может быть достаточно и любого текстового редактора. Я же буду рассматривать процесс редактирования именно через указанную выше программу.
Итак, запускаем ее (естественно, после скачивания и установки) и открываем в ней нашу книгу. Мы видим, что книга вполне себе читается, и даже отображаются обложка и сноски. Но явно не хватает автора и названия книги, да и эпиграф почему выглядит обычным текстом. Поэтому сразу идем в режим редактирования кода.
Первое, что надо сделать, это указать жанр, к которому относится наша книга. Проще всего это сделать войдя в режим «Описание документа» и выбрав соответствующий жанр из выпадающего списка.
Там же можно указать ФИО автора книги, название книги, ее язык и прочие атрибуты. После этого возвращаемся в режим редактирования кода. Сразу же переходим к разделу Body и его первой секции.
Так как у нас уже есть обложка, то строку
«<subtitle><image l:href="#doc2fb_image_03000001.png"/></subtitle>»
смело удаляем. А вот этот кусок текста:
<section>
<empty-line/>
<subtitle><strong>Заголовок книги</strong></subtitle>
<subtitle><strong>Автор книги</strong></subtitle>
<empty-line/>
<p><emphasis>Текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа Автор эпиграфа</emphasis></p>
</section>
<section>
<title>
<p>Название 1 главы</p>
</title>
Заменяем на:
<title>
<p>Заголовок книги</p>
<p>Автор книги</p>
</title>
<epigraph>
<p>Текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа текст эпиграфа</p>
<text-author>Автор эпиграфа</text-author>
</epigraph>
<section>
<title>
<p>Название 1 главы</p>
</title>
В итоге, код у нас должен теперь выглядеть вот таким образом:
Дальше переходим к разделу « <body name=»notes»>» и добавляем сразу после указанной строки название раздела:
<title>
<p>Примечания</p>
</title>
Все, на этом мелкие правки книги в формате fb2 можно считать оконченными. Она уже вполне корректно будет открываться на любых читалках. Но для того, чтобы быть оформлять грамотно и красиво книги в формате fb2 я бы рекомендовал хорошенько изучить спецификации данного формата. Например, можно воспользоваться неплохим описанием по этой ссылке.
Конвертирование fb2, который был получен из doc в epub
Этот процесс, наверное, самый простой из всего, что мы уже сделали. Для его успешного завершения нам понадобится программа «calibre». После скачивания и установки, запускаем ее и добавляем в нее нашу отредактированную книгу в формате fb2 (можно просто перетянуть в окно программы). Справа отобразится наша обложка и немного информации о книге. Для того чтобы получить книгу в формате epub нажимаем соответствующую кнопку вверху.
Перед нами откроется большое окно с многочисленными настройками будущей книги и процесса конвертации. Не буду все их описывать, укажу только те, которые требуются для нашей задачи.
В разделе «Метаданные» проверяем все атрибуты книги: название, автор, жанр (пометки) и прочие.
В разделе «Вид и функции» в пункте «Вставить семейство шрифтов» выбираем именно тот шрифт, в котором по нашей задумке будет книга.
В разделе «Содержание» ставим галочку «Вручную исправить оглавление после завершения преобразования».
В разделе «Импорт FB2» ставим галочку «Не вставлять Оглавление в начало книги».
В разделе «EPUB выход» ставим галочку «Сохранять соотношение сторон обложки».
После установок указанных настроек можно нажимать «ОК» и процесс конвертации запустится. Когда дойдет очередь до формирования содержания, то программа покажет окно, в котором вручную можно добавлять или удалять разделы, которые будут находиться в содержании книги. У нас в примере в содержание попали сноски и заголовок книги, значит, нужно их удалить, выделив и нажав соответствующую кнопку.
После чистки и правки будущего содержания список стал выглядеть следующим образом:
Нажимаем «ОК» и завершаем процесс преобразования. Получившаяся книга по умолчанию сохраняется в папке «C:\Users\Имя_Пользователя\Documents\Библиотека Calibre\» во вложенной подпапке с именем автора.
Заключение
Данная статья не претендует на оригинальность и какой-то единственный возможный вариант решения поставленной задачи. Здесь также не рассмотрены все доступные корректировки выходных форматов книг. Тем не менее, в рамках минимального ознакомления с правильной конвертацией вордовских документов в наиболее популярные электронные книжные форматы данной статьи вам будет вполне достаточно. При наличии желания и свободного времени вы всегда сможете сделать что-то лучше.
В конце прилагаю архив с программой doc2fb и исходных/конечных файлов, с которыми мы работали в этой статье. Остальные программы вы можете скачать с официальных страниц разработчиков: