Что такое DJVU?
Графический формат DJVU разработан фирмой AT&T в первую очередь для размещения в Интернет отсканированных изображений. Это могут быть принципиальные схемы различной бытовой электроники, книги, рукописи, географические карты, художественно оформленные меню ресторанов и многое многое другое.
Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц, пригодных для распечатывания на лазерном принтере.
Кроме того, этот формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать еще до завершения скачивания. Таким образом DJVU является уникальным инструментом для открытия Интернет-доступа к фондам обычных, бумажных библиотек.
Несмотря на растущую важность Интернета, большая часть знаний в виде культурного и образовательного материала уже существующего сегодня, всё ещё доступна лишь в бумажной форме. Внедрение данного информационного богатства в цифровую область, в схожем с оригиналом виде, с лёгким доступом и поиском, является основным шагом к созданию Всемирной Интернет Библиотеки.
DjVu (произносится как «дэжа вю») это технология сжатия, файловый формат и универсальная платформа специально спроектированная для создания цифровых библиотек на основе печатного, сканированного или цифрового материала. Так, например, для сканированного документа, размер DjVu файла обычно в 3...10 раз меньше чем чёрно-белый TIFF или PDF и в 5...10 чем цветной JPEG.
Обычная страница из книги, журнала или древней рукописи отсканированная в цвете и 300dpi содержит порядка 8 миллионов пикселей и занимает 24 MB в несжатом виде. Традиционные технологии сжатия такие как JPEG обладают следующими минусами:
- типичные размеры JPEG файла на страницу находятся в рамках между 400 KB и 2 MB в лучшем качестве, что является абсолютно непригодным для удалённого доступа;
- острые грани (в символьных структурах) - причина многочисленных потраченных впустую бит и/или неприятных артефактов;
- большие изображения очень медленно рендрятся, требуя объёмный буфер памяти для распаковки в клиенте, а ещё, их проблематично увеличить или распечатать в существующих браузерах;
- текст обычно не отделяется от изображения и по этой причине не может быть подвергнут OCR, индексированию и поиску;
- ничего не сделано для многостраничных документов, потому приходиться формировать изображения в контейнерный формат типа PDF, ещё больше теряя в эффективности.
DjVu избавляет от этих проблем обрабатывая двутональные документы, низкоцветовые (индексированные) изображения, изображения с непрерывным спектром тонов (фотографии, и т.п), сканированные цветные и чёрно-белые документы, цифровые документы (например в Postscript или формате PDF).
DjVu документы могут быть отображены через вэб браузер с помощью очень маленького plug-in'а (доступного для всех основных платформ).
Всё в дизайне DjVu было оптимизировано, чтобы уменьшить задержку между решением пользователя рассмотреть страницу и её отображением на экране:
- многопоточная программная архитектура с умным кэшированием позволяет индивидуальным компонентам документа быть загруженными и преддекодированными по требованию;
- страницы загруженные по требованию, дают произвольный доступ без предшествующей загрузки полного документа;
- компоненты страницы (передний план, фоновые куски) загружаются последовательно и рендрятся отдельным потоком как только загрузка считается завершённой. Всё это даёт прогрессивный рендеринг и улучшает качество изображения;
- страница, которая следует за страницей, в настоящее время отображаемой, предзагружена, преддекодирована и кэширована, посредством чего автоматически уменьшается задержка между перелистыванием страниц;
- просмотрщик DjVu файлов обладает своим «независимым» графическим интерфейсом пользователя, который позволяет быстро изменять масштаб изображения, панорамирование и зеркальное отражение страницы одним кликом мыши или нажатием клавиши на клавиатуре.
В настоящее время DjVu становится фактическим стандартом для электронных библиотек технической и научной литературы. Файлы с расширением DjVu скоро перестанут быть экзотикой на просторах сети.