CompUsers.ru Блог Хайбулаева Мухаммеда

Помогаю начинающим пользователям подружиться с компьютером. Пишу о компьютерах для чайников.

Как перенести текст из PDF в TXT без иероглифов (кракозябров)

Рубрика:

На днях пришлось перенести некоторые отрывки текста из PDF-документа, а если точнее книги в обычный текстовый файл. Раньше для этих целей я использовал либо Adobe Reader либо Foxit Reader. Для этого в обеих программах есть функция экспорта текста. Делается это так: при открытом документе в Foxit Reader'е выбираем в меню «File» — «Save as...» в открывшемся окне задаем имя и выбираем тип файла «TXT files».

Но в последний раз появилась проблема. Текст с первых нескольки страниц книги PDF скопировался нормально, а дальше остальные страницы шли в виде каких-то иероглифов, так называемых кракозябров. Как я понял дело было в кодировках текста. Пытался поменять кодировки в «Notepad2», не помогло.

После непродолжительных поисков решения в интернете наткнулся на программу «Cool PDF Reader» скачал и попробовал. Программа бесплатна и сразу скажу не так удобна как две ранее упомянутые, но она вывела текст из моего проблемного PDF'а в нормальном виде. Никаких кракозябров, чистый текст. Но есть у нее один недостаток — «Cool PDF Reader» экспортирует текст по одной странице.

Окно программы "coolpdfreader" и самые важные для нас кнопки

Для этого открываем в ней PDF-файл, переходим на нужную страницу с помощью кнопок сверху окна, и нажимаем кнопочку в виде дискеты, задаем имя будущего текстового файла и жмем «Сохранить».

Каждую страницу вашего pdf документа нужно сохранять в отдельный текстовый файл

Если вам нужно получить из PDF-книг весь текст вы замучитесь, но если нужен отрывок, то пользоваться можно.

Данную программу можно скачать с нашего сайта.

Если вы знаете аналогичную программу, нормально экспортирующую текст из PDF-документов пишите в комментариях, допишу в статью.

Похожие статьи
Комментариев к статье: 2
  • Андрей

    Все на столько просто?? Я раньше над этим вопросом так голову ломал, что сказать трудно как... Спасибо, теперь будем знать и применять!!

    • Маргарита

      Просто, когда ПДФ-файл не запаролен и когда внутри него не картинки, а именно распознанный текст. Но активные формы, например декларация для налоговой, такому простому конвертированию не поддается...

Добавить комментарий

  • ;-)
  • :|
  • :x
  • :twisted:
  • :smile:
  • :shock:
  • :sad:
  • :roll:
  • :razz:
  • :oops:
  • :o
  • :mrgreen:
  • :lol:
  • :idea:
  • :grin:
  • :evil:
  • :cry:
  • :cool:
  • :arrow:
  • :???:
  • :?:
  • :!: