Читать онлайн "Книга 3.0 Слушайте! [calibre 3.13.0]" - Болгарчук Роман - RuLit

Еще кратенько по форматам и программам.

Формат это, образно говоря, способ сохранения текста или картинки в виде какого-либо файла. Способов сохранить есть масса, посему форматов и программ, которые работают с данными файлами так же много.

Для сохранения, в одном файле, текста и картинки используют в основном два формата djvu и pdf. Они самые распространенные.

Многим полюбился формат djvu. Но я его крайне не рекомендую использовать для сохранения книг. Да, конечно заманчивым преимуществом есть то, что фото (каковым зачастую, является djvu) имеет маленький размер. Многие попавшиеся мне в руки книги, в данном формате, просто испорченное время и бессмысленно потраченный труд. Т.к. в основном, изображения в этом формате навсегда утрачивает свое качество и буквы иногда не видно и иногда их невозможно распознать. Конечно, данный формат бурно развивается и уже допускает возможность добавления и ссылок и распознанного текста. А многие пользователи уже научились делать отличные книги в таком формате. Книги, в которых в хорошем качестве сохранено изображение, так же сохранен распознанный текст и даже могут иметься гиперссылки. Все-таки пока не встречал программы для данного формата, которая могла бы с легкостью добавлять примечания, пометки и многое другое. Как, например, PDF-XChange Viewer или FoxitReader для аналогичного формата - pdf. Поэтому, сохранять книги в формат djvu, все же, не рекомендую т.к. возможности таких файлов на данный момент все еще на очень низком уровне и работать с ним сложнее. Хотя места книги в формате djvu занимают немножко меньше чем pdf.

Помимо djvu и pdf книги, не имеющие больше количества картинок и с хорошо распознанным текстом лучше просто сохранять в формате вордовских документов (как обычный текст в ворде). Это наиболее удобный формат для редактирования и прослушивания текста. При экспорте с файнридера часто удается автоматический установить гиперссылки, из содержания в текст. Т.е. программа сама расставляет ссылки, и нажав на оглавление можно перейти на соответствующий раздел в тексте.

Зачастую распознанные книги мне приходиться сохранять даже в трех различных документах. 1 - pdf – Акробат ридер. 2 - docx – водр 3 - txt – обычный текстовый документ открывается блокнотом. Третий формат занимает пустяковый размер и очень удобен для прослушивания книг на смартфоне. Хотя его недостатком является полное отсутствие картинок и какого-либо форматирования.

П. с.

Помимо этих появляются много других перспективных форматов и программ. Например, .fb2, .mobi, .epub и др. Но мне не приходилось ими пользоваться. Максимум перекодировал с них книги в привычный мне docx или txt. Хотя, по-хорошему, это уже будет считаться не формат книги, а формат документа. Но это уже тонкости и формальности…

Выводы и советы.

Надеюсь, данная информация пойдет на пользу обществу. И книг в плохом пережатом качестве с перекошенными не распознанными страницами, засунутыми вместе с разворотом в djvu будет встречаться все меньше. В интернете есть масса статей, как правильно распознать и сохранить книгу файнридером или ClearScan в формат pdf – (текст под изображением с добавлением гиперссылок в содержании) или в ворд. Поэтому на данных моментах останавливаться пока не буду. Хотя стоит отметить, что даже самая лучшая на сегодняшний день программа распознавания текстов не всегда справляется к примеру, с сложными химическими формулами и громоздкими таблицами. Из-за чего и приходиться сохранять поверх текстов изначально сканированные картинки. Однако, данная программа отлично распознает простые тексты, которые можно сохранить в ворд. Сэкономив в дальнейшем и время, и место на диске. В общем, работать еще есть над чем. Книги, в любом случае, для полноценной работы нужно распознавать, даже если они плохо распознаются, и распознанный текст имеет много ошибок. Так что очень надеюсь на дальнейшие разработки в данном направлении.

ссылки¹¹ опубликовал¹²

П.с.

Вот еще не плохая статейка по теме: «Зачем нужны программы распознавания текста?»

Некоторые