Как скопировать текст из DjVu в Word

Из этой инструкции вы узнаете, как скопировать текст из файла в формате .djvu в документ word двумя способами.

Способ 1. С помощью программы DjVu Reader

Откройте djvu-файл в программе DjVu Reader. В панели инструментов программы нажмите «Выбор», а затем выделите нужный фрагмент текста.

выделите нужный фрагмент текста

Далее нажмите кнопку «TXT» или клавиши Ctrl+Т.

Как скопировать текст из DjVu в Word

Примечание: если вы нажмете кнопку «TXT» или клавиши Ctrl+T, не выделив ничего в документе, скопируется содержимое всей страницы.

Теперь вы можете открыть документ Word и скопировать в него выделенный фрагмент.

Важно: если кнопка «TXT» в DjVu Reader неактивна (серого цвета), значит скопировать текст из этого документа не получится, так как в нем нет специального слоя с распознанным текстом, или программа не может определить, что такой слой присутствует.

кнопка «TXT» в DjVu Reader неактивна

Чтобы извлечь необходимые данные из такого документа, вам нужно воспользоваться программой для распознавания текста. Перед этим придется конвертировать файл в тот формат, с которым работает выбранная вами программа. Также вы можете попробовать извлечь текст вторым способом (см. ниже).

Что делать, если вставленный текст невозможно прочитать из-за проблем с кодировкой?

Примечание: здесь приведена инструкция для Word 2016. В других версиях MS Office данная операция производится аналогично.

Нажмите кнопку «Файл», затем «Сохранить как».

Сохранить

Далее выберите место сохранения файла, например, «Рабочий стол». В появившемся окне кликните по полю «Тип файла» и выберите «Обычный текст».

Тип файла

Нажмите «Сохранить» и появится окно преобразования файла. Здесь вам нужно отметить «Другая», а в меню справа выбрать кодировку. Чаще всего это «Западноевропейская (Windows)» или «Кириллица (Windows)». Затем нажмите «ОК»

Выбор кодировки

Примечание: текст в окне предварительного просмотра может остаться нечитабельным. О том, что вы выбрали правильную кодировку, говорит отсутствие красных символов и значка-предупреждения.

Значок-предупреждение

Если и западноевропейская кодировка, и кириллица окажутся неправильными вариантами, попробуйте другие. Найдите ту кодировку, при которой исчезнет значок-предупреждение, а все символы станут черными.

После того, как вы нажмете «ОК» окно закроется и в той папке, которую вы указали при сохранении, появится новый файл. Откройте его и перенесите текст в ваш документ Word, заменив нечитабельные символы.

Способ 2. С помощью онлайн-сервисов.

Существует много онлайн-сервисов, позволяющих конвертировать формат djvu в docx. Все они работают примерно по одному принципу. Рассмотрим порядок действий на примере сервиса Convertio.

Открыв страницу сервиса, выберите иконку «С компьютера».

Convertio

Далее выберите файл в формате djvu, из которого вы хотите скопировать текст и нажмите «Открыть», либо дважды кликните по файлу.

выберите файл, из которого хотите скопировать текст

Теперь выберите формат файла, в который нужно преобразовать ваш документ. Для этого кликните по стрелке.

кликните по стрелке

В появившемся меню выберите «Документ» и DOCX.

выберите «Документ» и DOCX

Теперь нажмите «Преобразовать» и ждите пока конвертирование не завершится. Когда файл будет переконвертирован, вы сможете скачать его, нажав на соответствующую кнопку.

нажмите «Преобразовать»

Скачав файл, вы сможете открыть его в программе Word.

Примечание: если в получившемся документе после скачивания вы видите картинки с абзацами и страницами из исходного документа, и скопировать буквы и слова не получается, значит ваш файл в формате djvu не содержал слой оцифрованного текста. В этом случае вам придется воспользоваться программой для распознавания текста.