Как перенести текст из PDF в TXT без иероглифов (кракозябров)
Рубрика: Обработка документов

На днях пришлось перенести некоторые отрывки текста из PDF-документа, а если точнее книги в обычный текстовый файл. Раньше для этих целей я использовал либо Adobe Reader либо Foxit Reader. Для этого в обеих программах есть функция экспорта текста. Делается это так: при открытом документе в Foxit Reader'е выбираем в меню «File» — «Save as...» в открывшемся окне задаем имя и выбираем тип файла «TXT files».
Но в последний раз появилась проблема. Текст с первых нескольки страниц книги PDF скопировался нормально, а дальше остальные страницы шли в виде каких-то иероглифов, так называемых кракозябров. Как я понял дело было в кодировках текста. Пытался поменять кодировки в «Notepad2», не помогло.
После непродолжительных поисков решения в интернете наткнулся на программу «Cool PDF Reader» скачал и попробовал. Программа бесплатна и сразу скажу не так удобна как две ранее упомянутые, но она вывела текст из моего проблемного PDF'а в нормальном виде. Никаких кракозябров, чистый текст. Но есть у нее один недостаток — «Cool PDF Reader» экспортирует текст по одной странице.
Для этого открываем в ней PDF-файл, переходим на нужную страницу с помощью кнопок сверху окна, и нажимаем кнопочку в виде дискеты, задаем имя будущего текстового файла и жмем «Сохранить».
Если вам нужно получить из PDF-книг весь текст вы замучитесь, но если нужен отрывок, то пользоваться можно.
Данную программу можно скачать с нашего сайта.
Если вы знаете аналогичную программу, нормально экспортирующую текст из PDF-документов пишите в комментариях, допишу в статью.

Warning: Use of undefined constant rand - assumed 'rand' (this will throw an Error in a future version of PHP) in /home/p381079/www/compusers.ru/wp-content/themes/computers/single.php on line 132
У меня два документа сохранились пустыми-сношу прогу бесполезную
С фотокопий текста какой программой можно переносить текст в более приемлемые форматы как txt, doc?
Для этого есть очень мощная программа ABBYY Finereader
Изредка сталкивалась с кракозябрами — но сразу прекращала работать с этим документом, так как не знала, что делать. Оказывается, всегда можно найти выход из положения.
Не все тексты в pdf копируются, в некоторых поставлена защита от копирования. Пробовал сервисы, но там ограничение на размер книги, а у меня как раз была большая.
Буквально месяц назад пользовалась такой программой, когда текст был нечитаемый. Удобно пользоваться — все получилось.
А есть программы для переноса из формата djvu в текст?
Есть способы и для этого
Приветствую дорогой автор. спасибо за статью. ну жалко конечно что не удобно книгу перевести. мне пару книг нужно было перевести,если узнаю лучше программу ,обязательно сообщу!!!
нужная статья,бывало скопируешь, а оно и не открывается. Многие и сейчас в недоумении,как поступать)
Все на столько просто?? Я раньше над этим вопросом так голову ломал, что сказать трудно как... Спасибо, теперь будем знать и применять!!
Просто, когда ПДФ-файл не запаролен и когда внутри него не картинки, а именно распознанный текст. Но активные формы, например декларация для налоговой, такому простому конвертированию не поддается...