блог об информационных технологиях: софт, железо, интернет, услуги, советы

От простого к сложному: обзор форматов электронных книг

Откройте описание к любой современной электронной читалке и вы найдете там целый список поддерживаемых форматов: TXT, HTML, RTF, FB2, FB3, MOBI, CHM, PDB, DOC, DOCX, PRC, EPUB. Чем они отличаются и какой формат предпочесть?

В нашей заметке мы в первую очередь ориентируемся на форматы, которые понимают электронные книги. Если вы собираетесь читать в телефоне, например, iPhone, вам нужно сначала установить специальное приложение для чтения (небольшой обзор таких программ для iOS можно найти тут: https://myapples.ru/top-podborki/prilojeniya-dlya-chtenia-knig).

TXT — прадедушка всех текстовых форматов. Появился настолько давно, что его ровесники уже сами стали дедушками и бабушками. Главные плюсы — малый размер файла и кроссплатформенность (TXT понимают все устройства). Минусы тоже есть — этот формат не поддерживает ни форматирование, ни выравнивание, ни разметку — ничего такого. Голый текст и все.

RTF (Rich Text Format) — улучшенная версия формата TXT с форматированием, таблицами, картинками и прочими радостями жизни. В настоящее время не очень распространен — устарел.

DOC/DOCX/ODT — текстовые форматы, которые используются в Microsoft Office, LibreOffice и других серьезных офисных пакетах. В документы можно внедрить таблицы, графики, иллюстрации, фотографии и т.п. Для использования в электронных книгах DOC и DOCX подходят плохо — занимают много места, тяжело обрабатываются в «читалках», а ODT и вовсе не будет открыт.

По хорошему TXT/RTF/DOC/DOCX лучше переконвертировать в FB2, прежде чем вы закинете их в память букридера.

HTM/HTML — форматы для представления информации в интернете (по сути из html-файлов большая часть сайтов и состоит). В электронной книге их тоже лучше не использовать из-за сложности отображения веб-контента (текст, фото, видео, музыка, ссылки и т.п.).

CHM — запакованный HTM-формат (обычно содержит в себе множество таких html-файлов). Изначально был создан для замены справки в Windows. Также редко используется в электронных книгах.

FB2 (FictionBook) — самый распространенный в России формат текстовых файлов для электронных книг. В отличие от ранее описанных чисто текстовых форматов, FB2 — структурированный формат, позволяющий делать деление на главы и разделы, использовать содержание, сноски, иллюстрации. Еще он компактен и понимается подавляющим большинством электронных книг, продаваемых в нашей стране.
К сожалению, ряд мировых производителей его не поддерживают (FB2 создан в России). FB3 — усовершенствованный формат FB2 и пока не получил широкого распространения.

ePUB (Electronic PUBlication) — самый популярный в мире формат книг для «читалок», поддерживается международной организацией IDPF (International Digital Publishing Forum) и рядом известных производителей электронных книг. Данный стандарт используется по умолчанию в iPhone и iPad.

MOBI — специализированный формат электронных книг для ридеров Amazon Kindle. Недавно Amazon представил новый формат — Kindle Format 8 или KF8.

PDF (Portable Document Format) — специальный формат, созданный для того, чтобы совместить в единое целое текст, графику, изображения и другой контент. PDF обладает кроссплатформенностью и на всех устройствах показывается одинаково. Неудобен для использования на девайсах с маленьким экраном (например, 6-дюймовых «читалках»), так как PDF-документы обычно делаются под формат A4.

DJVU — в некотором роде конкурент PDF, хотя имеет ряд отличий. Этот формат был специально создан для хранения сканированных документов. Обладает тем же недостатком — формат A4 неудобно читать на небольших дисплеях. Зато отлично подходит для сканирования технической литературы с большим числом таблиц и изображений.

Вывод: если вы собираетесь читать книги, где иллюстрации не особо важны, используйте форматы FB2 и ePUB. В противном случае ориентируйтесь на PDF и DJVU. Также в электронных книгах можно использовать форматы RTF и DOC/DOCX, но они менее удобные.


Добавить комментарий

Защитный код
Обновить

Комментарии