Почему не конвертируется pdf в word. Преобразование PDF в Word

Задачей этой небольшой статьи-руководства является ответ на поставленный ее заглавием вопрос.
Сразу поблагодарим компанию «Adobe» за этот замечательный формат - PDF . Еще большие благодарности тем, кто заталкивает в этот формат все, что только попадется под руку: и текст, и графику, а также считает дурным тоном прислать вам обычное письмо не конвертировав его в PDF …
Но, спокойно, без нервов! Что нужно переводчику от PDF? Верно - ТЕКСТ. Лучше даже неформатированный (Plain Text). Ну, а на картинки можно посмотреть и в «Adobe Reader» (ранее Acrobat Reader).
Итак, начнем.

ЗАПОМНИТЕ! Если заказчик хочет получить на выходе PDF да еще и с рисунками в растре, и чтобы форматирование сохранилось, смело шлите его к верстальщику с Adobe inDesign! Или осваивайте его сами и требуйте надбавку за верстку!

Сначала попробуйте получить у заказчика исходник PDF - может его как раз из вашего любимого Microsoft Word конвертером PDF и сделали… Если его нет, тогда разберемся, какого вида бывают файлы PDF и как из него выудить текст.

1. PDF содержит настоящий текст (ура!). Его можно извлечь простым выделением и копированием или в обычном «Adobe Reader» (бесплатная программа для чтения PDF) в меню «Файл» выбрать «Сохранить как текст» (или иногда даже «Сохранить как текст с форматированием», если это возможно и нужно). Есть и более сложные и небесплатные варианты, о которых мы подробнее поговорим чуть позже.

1.1. PDF содержит настоящий текст (рановато радуетесь!), но неведомые силы не позволяют нам его копировать - файл защищен паролем и копирование текста запрещено. Что же делать? Либо взять пароль у заказчика, либо воспользоваться утилитой PDF Password Remover.

1.2. PDF содержит настоящий текст (рано радуетесь!). Его можно вытащить простым копированием, но… кодировка какая-то у него не та. И кроме крокозябров и цифр ничего вытащить не удается. Без паники - читаем следующий пункт.

2. PDF собран из картинок или шрифты в нем в кривых или «кривой» кодировке. Вот это уже «тяжелый случай». Тут не обойтись без обожаемого «FineReader» (ABBYY PDF Transformer не дает таких же хороших результатов как конвертер PDF, поскольку не в состоянии правильно определить все блоки автоматически. Скажем так: PDF Transformer - это урезанная автоматическая версия FineReader). За преобразование в текст тоже неплохо бы получить дополнительное вознаграждение, ведь вы расходуете ваше драгоценное время на процесс распознавания, который проходит не всегда так гладко, как хотелось бы. Но ведь заказчику-то все равно, пользуетесь вы электрословарями и средствами автоматизации или нет. Так что это ваши проблемы. :(

3. PDF собран из картинок с неподдающимся распознаванию тексту. Сочувствую. Распечатываем, забываем о всяких «продвинутых прогах», вешаем бумажку на планшет и переводим, совершенствуя свои навыки чмакания по клавиатуре.

Теперь, как и обещал, поподробнее по первому пункту. Для примера возьмем довольно сложный файл нестандартного формата бумаги с руководством к велонавеске с сайта компании Shimano: SI-41R0F-PD-M970_540_520-EN.pdf (182 Кбайт) . В нем есть все: и таблицы, и рисунки в растре, и текст в разных шрифтах и размерах. Попробуем преобразовать его по очереди разными способами.

1. В файле разрешено копирование - PDF Password Remover не требуется.
2. Текст «живой». Пробуем бесплатный способ:

Adobe Reader 7.0 или 8.0

Теперь опробуем специализированные программы-конвертеры PDF (а не конверторы!). :

Adobe Acrobat 7.0 или 8.0

Adobe Acrobat 7.0 или 8.0 Файл - Сохранить как… - *.doc, *.rtf
Лучше их и не смотреть: это ужас какой-то. И это «родной инструмент» для работы с PDF?! Текстовый формат - то же, что и в Adobe Reader.
Посмотреть сконвертированный файл:
Save as *.txt ,
Save as *.doc ,
Save as *.rtf

Solid PDF Converter 80 USD; 15,6 Mb

PDF to Word 40 USD; 4 Mb

Был выбран автоматический режим обработки. Результат, надо заметить, не плох, но для перевода мало пригоден - те же лишние знаки абзаца, неудобный текст. Здесь также представлен файл, сохраненный в Word «Как простой текст»

BCL Jade 130 USD; 2 Mb

Штука, конечно, хорошая. Только для работы BCL Jade нужен еще и сам Adobe Acrobat (не Reader). Он в него встраивается как плагин. И привыкнуть к нему придётся - «зонировать» всё придется вручную. Зато он часто справляется с такими вещами, которые другим не под силу (правда, только при условии «живого» PDF). Обычно используется для «довытаскивания» того, что не вытащил или не так вытащил Solid.

BCL easyConverter

Прямо-таки верх аскетизма! Ничего лишнего. То есть, вообще ничего: «Failed to convert» - это единственное, что удалось добиться от BCL easyConverter:(

ScanSoft PDF Converter Professional 100 USD; 434 Mb

Качаем, качаем, качаем… Что ж... скачал! И хотел бы подивиться на распрекрасный файл формата *.doc . Но вот надежды обмануты: несмотря на всю внушительность, программа выдала файл с ОТСУТСТВУЮЩИМИ фрагментами текста! Забыть как страшный сон.

Infix PDF Editor 100 USD; 10 Mb

Уже почти отчаявшись, запускаю некий Infix PDF Editor. Открываю PDF-ку, выбираю сохранить «Как простой текст»… Смотрим… И, о чудо (!) : мы получили удобоваримый в переводческой кухне текст, лишние знаки абзаца отсутствуют как класс - класс, в общем и целом, и «одобрямс» (даже RTF у них приятен глазу - размер и цвет шрифта сохранен).

И на последок бесплатные он-лайн PDF конвертеры: ZamZar и Freepdfconvert. http://www.freepdfconvert.com Встречайте! Но не забудьте: файлы с секретными данными там конвертить не стоит;)

Online PDF конвертер ZamZar.com

Этот он-лайн сервсис предназначен для конвертации всего во все и скачивания фильмов в YouTube и подобных сервисов, но в том числе умеет и конвертировать файлы PDF в форматы DOC, RTF, ODT, TXT

Текстовый файл, вылезший из недр Замзара, ужасен, а вот *.doc приятно удивил - это ПЕРВЫЙ приличный макет документа. Картинки изуродованы изрядно, но текст везде на месте. Даже со спецсимволами. Однако он совсем непригоден для перевода: чересполосица какая-то да и только плюс знаки абзаца в конце КАЖДОЙ строки.

Online PDF конвертер FreePDFConvert

А вот этот преобразователь поработал на славу: все выглядит очень прилично! И картинки нормального качества и текст. Лишние знаки абзаца (которые можно убрать макросом) стоят там, где и в самом PDF. Если работать только в виде "Разметка страницы", то "твердое четыре".

Результат перевода сервисом Freepdfconvert.com тестового PDF файла в формат Microsoft Word -

Есть он-лайн сервис и от самих создателей PDF:

Вывод: Стоит начать с самых надежных и простых программ. Если же результат неудовлетворительный, остается пробовать остальные.

Уф. Так вот он какой, этот «пе-де-эф». Надеюсь, я вам хоть немного помог. Успехов!

Всем привет. Решил написать полезную статью на тему, как конвертировать pdf в word, чтобы можно было редактировать текст бесплатно. Смотрим все способы.
PDF формат – формат документов, который помогает сохранять презентабельный и компактный внешний вид на любых гаджетах: компьютерах, планшетах, телефонах. Именно поэтому в настоящее время такой формат используется для электронных книг и журналов, так как он сохраняет все настройки текста.


  • Как перевести PDF в Word в FineReader

  • Как конвертировать PDF в документ Word без программ
  • Пользователи считают, что PDF файлы очень удобны в использовании, только есть одно «но» — редактирование текста. В таком формате невозможно как-то изменять текст, более того, не все PDF форматы «разрешают» копировать информацию. Именно поэтому пользователи ищут способы, как можно перевести PDF формат в Word, редактор, где можно полноценно работать с текстом. Рассмотрим несколько способов.

    Как конвертировать PDF в Word

    Конвертирование файлов – преобразование определенного рода файлов в какую-то другую форму. Поэтому когда мы преобразовываем PDF файл, например, в Word, это будет называться конвертирование.

    • самый простой и быстрый метод перевода в формат Word – копирование текста из PDF файла и вставка его в нужный формат, с помощью сочетания клавиш Ctrl+C, Ctrl + V. Для копирования файла целиком – Ctrl +A. Но, как уже говорилось, не во всех форматах PDF есть функции редактирования текста;
    • следующий способ конвертирования файла PDF в Word – онлайн редактирование. Для этого потребуется:
  • В Google диск загрузить свой файл PDF.
  • Когда файл загрузится, кликните по нему правой кнопкой мыши и в появившемся меню выберите «Открыть с помощью» → «Google документы».
  • В новой вкладке браузера откроется ваш файл. Нажмите «Файл» → Скачать как → Microsoft Word (doc. или docx.).
  • После того, как файл загрузится на ваше устройство, проверьте, правильно ли прошла конвертация.
  • Если данные способы Вас не устраивают, существует еще несколько онлайн-приложений, которые смогут помочь конвертировать файлы PDF в Word.

  • Временная программа «Nitro Pro». Срок действия данного приложения – 14 дней. После чего придется или приобрести лицензионную версию, либо еще раз скачать программу. Для работы с данной программой для начала откройте ее в своем браузере. После чего выберите нужный вам файл в PDF формате и откройте его в «Nitro Pro». На панели инструментов ищем кнопку «To Word» и кликаем на нее. После чего должно появиться окошко, где мы видим наш PDF документ. Далее нажимаем на кнопку «Folder» и «Convert», после чего автоматически создается и открывается документ Word, который можно редактировать. У программы есть один недостаток – она англоязычная, поэтому тем, кто не знает языка, будет немного сложновато.
  • Программа First PDF – тоже временная программа, где можно совершить до 100 преобразований. Открываем программу First PDF у себя в браузере и жмем на клавишу «Добавить из файла», где вы выбираете свой PDF файл. После того, как данный файл появится на рабочем столе программы, в правом столбике выбираем формат – Word. Далее указываем адрес на своем компьютере, где сохранится данный файл, ставим галочку на функции «Открыть результат» и жмем кнопку «Конвертировать». После завершения работы файл откроется автоматически.
  • Программа SmallPDF. Открывая сайт данной программы можно увидеть, что она не только конвертирует документы из одного типа файлов в другой, но и выполняет целый ряд различных функций: поворачивает, сжимает, совмещает PDF файлы и т.д. Но нам нужно преобразовать файл PDF в Word. Поэтому нажимаем на значок «PDF в Word» и выбираем нужный нам файл на компьютере с помощью обзора. Перетаскиваем выбранный файл в программу SmallPDF. Конвертирование происходит самостоятельно. После завершения работы вы увидите сообщение об успешно выполненной задаче и теперь сможете скачать файл, нажав на «Скачать файл». Минус программы – всего лишь 2 возможности преобразования документа за час. После этого конвертирование платное.
  • Программа Adobe Acrobat DC. Есть русскоязычная версия. Но, к сожалению, дается лишь 7 бесплатных дней пользования. В онлайн-версии программы Adobe Acrobat DC открываете ваш PDF файл. На правой боковой панели найдите кнопку «Экспорт PDF» и нажмите на нее. Откроется окно, где необходимо выбрать формат Microsoft Word и нужное вам расширение файла. После нажатия клавиши «Экспорт» откроется окно, где нужно выбрать место, куда сохранить новый документ. Выберите папку и нажмите «Сохранить». После преобразования можете изменять файл Word. Кроме того, в программе Adobe Acrobat DC можно преобразовать не весь файл PDF, а некоторые его части. Нужно всего лишь отметить необходимую часть текста в PDF документе и скопировать его в буфер обмена с помощью комбинации клавиш «Ctrl+C». После чего с помощью сочетания клавиш Ctrl + V вставьте скопированную вами часть в документ Word.
  • Пришло время рассказать, как произвести обратное действие.

    Рассмотрим, как вытащить из PDF-документа текст, так чтобы можно было потом его редактировать в Word и подобных ему текстовых редакторах. То есть, попросту говоря, будем конвертировать PDF-файлы в Word.

    Adobe Reader и аналоги

    Самый простой, быстрый и бесплатный вариант:
    Открываем нужный PDF-документ в Adobe Reader. Заходим в меню Редактировать, потом выбираем команду “Копировать файл в буфер обмена”



    Все, можно спокойно редактировать полученный текст.

    Обратите внимание, при использовании данного метода не сохраняется форматирование текста и нет возможности вытащить изображения!!!

    Если вам, все таки, во что бы то ни стало нужно извлечь изображение из PDF-документа,чтобы не использовать какие-нибудь программы, сделайте скриншот с экрана на котором открыт PDF-файл, из которого вы скопировали текст, но не получилось скопировать картинку.


    И полученное изображение вставьте в Word. Должно получиться вот так:


    Понятно, что качество изображения будет оставлять желать лучшего, но как запасной вариант вполне подойдет.

    В других просмотрщиках нужно будет сделать несколько иное действие.

    Вот так в Foxit Reader (меню инструменты –> команда Выделить текст):


    А вот так в PDF-XChange Viewer (меню Инструменты –> Основные –> Выделение):


    Затем выделяем нужный текст и производим стандартные действия с буфером обмена, для тех кто не догадался: Копировать (Ctrl+C) и в Word — Вставить (Ctrl+V).

    Система оптического распознавания текста (OCR)

    При всей прелести этой методики у нее есть недостаток. Конвертировать PDF в Word не получиться, если PDF-документ создан сканированием с бумажного носителя или защищен от редактирования.

    Поэтому будем использовать другой метод. А имено, с помощью специальной программы оптического распознавания текста.

    Программа называется ABBYY FineReader и, к сожалению, является платной. Но зато функционал этой программы позволит перекрыть любые требования по созданию и конвертированию PDF-файлов.

    Вот, например, имеем отсканированный текст в PDF формате


    Запускаем ABBYY FineReader и в стартовом окне выбираем Файл в Microsoft Word


    И все! Система сама распознает текст и отправляет его в Word



    И опять же, ни один из онлайн-сервисов не работает с изображениями, и если текст у вас отсканирован и сохранен в формате PDF, то ничего не получится. Необходимо будет рассматривать вариант OCR.

    Резюмируем

    Как обычно, самым удобным оказался платный вариант, но остальные имеют право на существование, потому что не каждый день требуется преобразовывать файлы PDF. А на один раз можно или скачать демо-версию или воспользоваться онлайн-сервисом.

    Если нельзя, но сильно надо, то способ всегда найдется.

    Да, и еще, если Вы знаете еще какой-нибудь способ преобразования PDF-файлов, напишите мне в комментариях.

    Спасибо за внимание!

    P.S. Лирическое отступление :

    Довольно часто пользователи сталкиваются с необходимостью преобразования (конвертирования) файла в формате PDF в Word (ПДФ в Ворд). Два популярных формата текстовых документов имеют разные области применения.

    PDF (Portable Document Format) - переносной формат документов применяется для хранения документов, форм отчетности, бланков, технической документации, электронных книг и т. п. Файл в формате PDF имеет расширение «*.pdf», редактирование файлов данного формата затруднено. Документ ПДФ одинаково выглядит на любых компьютерах и мобильных устройствах.

    Microsoft Word - самый популярный тестовый процессор, входящий в состав программы Microsoft Office, имеющий свой формат документа Word с расширениями «*.docx» (Документ Word) и «*.doc» (Документ Word 97-2003). Программа Word используется в качестве текстового редактора в широких целях, документы в форматах Ворд легко редактируются.

    Поэтому возникает необходимость конвертировать файл в формате PDF в фал формата Word, чтобы перевести документ в редактируемый формат, в который можно будет внести изменения.

    Преобразовать PDF в Word можно с помощью программ - конвертеров и специализированных онлайн сервисов (конвертеры PDF в Word онлайн), которые имеют ограничения из-за своей специфики, о них я расскажу в другой статье.

    В данной статье мы рассмотрим несколько мощных программ, с помощью которых можно перевести PDF файл в редактируемый формат Word. В этом обзоре присутствуют платные программы из-за того, что многие бесплатные приложения имею некоторые ограничения, установленные разработчиками, или справляются только с довольно простыми документами.

    Программы из обзора (ABBYY PDF Transformer+, Adobe Acrobat Pro, Readiris, Solid PDF Tools, Icecream PDF Converter Pro) поддерживают технологию OCR (оптическое распознавание символов), которая помогает извлекать текст из изображений.

    Обратите внимание:

    • После преобразования из PDF в формат «DOCX» или «DOC», текст сохраненного документа необходимо проверить на ошибки. В простом тексте ошибок, возможно, не будет. При сложном форматировании или низком качестве исходного документа, после конвертирования, скорее всего, появятся ошибки в тексте: не правильно распознанные буквы, знаки препинания, съехавший текст и т. д. Поэтому желательно сверить содержание исходного и итогового документа для исправления недочетов.

    Для примера, я буду использовать отсканированные электронные книги с картинками и более сложным форматированием. Это более серьезный вариант проверки при настройках программ по умолчанию. В результате, даже протестированные мощные программы справились со своей работой не идеально, но выходные файлы можно отредактировать, исправить ошибки.

    Конвертируем PDF в Word в ABBYY PDF Transformer

    Программа ABBYY PDF Transformer+ предназначена для работы с PDF файлами. В приложении имеются различные инструменты для работы с ПДФ документами. Основное направление использования ABBYY PDF Transformer+: преобразование PDF в другие форматы, извлечение текста из файла PDF.

    Программа создана российской компанией ABBYY - ведущим разработчиком приложений, использующих технологию OCR. Все возможности ABBYY PDF Transformer присутствуют в программе ABBYY FineReader, которая обладает более широким функционалом.

    Конвертирование PDF в программе ABBYY PDF Transformer (1 вариант):

    1. Войдите в программу ABBYY PDF Transformer+.
    2. В разделе «Конвертировать PDF в» нажмите на кнопку «W» (Word).

    1. В окне «Открыть PDF» выберите файл в формате ПДФ.
    2. Далее происходит конвертирование в формат «docx».
    3. После завершения обработки, файл откроется в программе Microsoft Word. Не забудьте сохранить файл на компьютере.

    Преобразование PDF в ABBYY PDF Transformer (2 вариант):

    1. В главном окне ABBYY PDF Transformer+ нажмите на кнопку «Открыть», выберите нужный файл.
    2. После открытия файла в окне ABBYY PDF Transformer, нажмите на кнопку «Конвертировать в», а затем выберите «Документ Microsoft Word».

    После завершения процесса конвертирования PDF, преобразованный файл откроется в программе Word.

    Конвертация PDF в Word в Adobe Acrobat Pro

    Программа Adobe Acrobat Pro (не путайте с бесплатным просмотрщиком Adobe Acrobat Reader) - мощное приложение для работы с PDF файлам, от создателя формата PDF. Приложение имеет все необходимые инструменты для работы с PDF файлами, поддерживает русский язык.

    Программа Adobe Acrobat Pro имеет поддержку сохранения файлов PDF в формат документов Word.

    В программе Adobe Acrobat Pro выполните следующие действия:

    1. Откройте в программе файл в формате PDF.
    2. Войдите в меню «Файл», перейдите в контекстном меню «Сохранить как другой…» → «Microsoft Word» → выберите «Документ Word» или «Документ Word 97-2003».

    1. В окне «Сохранить как» нажмите на кнопку «Настройки…».
    2. В окне «Настройка сохранения DOCX» («Настройка сохранения DOC»), в опции «Параметры модуля OCR» нажмите на кнопку «Выбрать язык».

    1. В окне «Общие параметры распознавания символов», выберите язык распознавания текста: «Русский», а затем нажмите на кнопку «ОК».

    1. В окне «Сохранить как» выберите место для сохранения, укажите имя файла, нажмите на кнопку «Сохранить».

    Откройте файл Word для проверки.

    Преобразование PDF в Word в Readiris

    Readiris - мощная программа для преобразования изображений, PDF файлов, отсканированных документов в редактируемые текстовые форматы, поддерживающая технологию распознавания OCR. В программе поддерживается распознавание на 110 языках, сохранение файлов в большом количестве форматов, извлечение текста из любых отсканированных документов.

    Приложение имеет понятный интерфейс, имеется поддержка русского языка.

    Для распознавания документа PDF в Word пройдите последовательные шаги:

    1. Нажмите на кнопку «Из файла», выберите «PDF».
    2. Далее программа распознает файл в формате PDF.
    3. Выберите язык документа: «Русский». На панели инструментов, в области «Выходной файл», нажмите на стрелку под кнопкой «docx». В окне «Выход» выберите настройки, здесь можно выбрать подходящий формат («.docx» или «.doc»).
    4. Нажмите на кнопку «docx».
    5. В окне «Выходной файл» выберите место, имя, нажмите на кнопку «Сохранить».

    1. Происходит распознавание PDF в Word.

    После завершения процесса, откройте преобразованный файл в формате «DOCX».

    Конвертирование PDF в Word в Solid PDF Tools

    Solid PDF Tools - программа для работы с PDF файлами, мощный конвертер PDF в редактируемые форматы. Поддерживается создание, редактирование, архивирование и преобразование документов (всего документа или выбранного фрагмента).

    Программа работает в Windows на русском языке.

    Выполните преобразование документа в Solid PDF Tools:

    1. В главном окне Solid PDF Tools нажмите на кнопку «Преобразовать в PDF», выберите файл.

    1. Во вкладке «Главная», на панели инструментов вместо «<Автоматически> OCR», выберите «русский OCR».
    2. Нажмите на кнопку «PDF в Word»
    3. В окне «Сохранение» имя место, нажмите на кнопку «Сохранить».

    В завершении можете посмотреть на результат работы программы.

    Сохранение из PDF в Word в Icecream PDF Converter Pro

    Программа Icecream PDF Converter Pro предназначена для конвертирования файлов PDF. Приложение поддерживает преобразование PDF в другие форматы, и конвертирование файлов других поддерживаемых форматов в формат PDF. Программа имеет простой и понятный интерфейс на русском языке.

    Пройдите следующие шаги:

    1. В главном окне Icecream PDF Converter Pro нажмите на кнопку «Из PDF».
    2. Добавьте в программу файл PDF. В окне приложения отображается: название (файл можно открыть для просмотра во встроенной PDF читалке), количество страниц (можно выбрать какие страницы необходимо конвертировать), формат для конвертирования (можно выбрать «doc» или «docx»), есть возможность разбить документ на отдельные части.
    3. Нажмите на кнопку «Настройка» для того, чтобы выбрать качество (по умолчанию выбрано среднее качество).
    4. В поле «Сохранить в:» выберите место для сохранения, а затем нажмите на кнопку «Конверт.» для запуска процесса конвертирования.

    Войдите в папку с файлом, откройте сохраненный документ MS Word.

    Мой пример использования конвертирования PDF в редактируемый формат

    В свое время, я столкнулся с необходимостью преобразования файлов из одного формата в другой редактируемый формат. Моя дочь училась в младших классах, очень много времени занимало выполнение домашних заданий.

    Мне поручили выполнять переводы с английского языка. Знакомая многим ситуация, но был один нюанс: в свое время я учил испанский язык, а жена - французский. Помочь с переводами текстов мы не могли.

    Вручную набрать пару страниц текста для вставки в онлайн переводчик было нереально (огромные затраты времени). Поэтому, я придумал, как выйти из этого положения. План был такой: я сканирую листы учебника на принтере МФУ (имеющем встроенный сканер), сохраняю их в формате PDF, а потом с помощью программы ABBYY PDF Transformer конвертирую в редактируемый формат Word. После проверки на ошибки, текст готов для работы с переводчиком.

    Подобным образом я пару лет выполнял домашние задания по английскому языку, потом дочка стала успевать делать уроки. Программа ABBYY PDF Transformer меня здорово выручила.

    Заключение

    Для преобразования файла в формате PDF в файл формата Word можно использовать программы: ABBYY PDF Transformer+, Adobe Acrobat Pro, Readiris, Solid PDF Tools, Icecream PDF Converter Pro. В результате конвертирования, на компьютере сохраняется выходной файл - документ Word.