Sitemap

Вот распространенная проблема.Кто-то отправляет вам PDF-файл, и вам нужно внести в него крупномасштабные изменения, такое массовое редактирование, которое невозможно сделать в приложениях PDF-редактора, таких как те, которые вы можете использовать для легкого редактирования PDF.Как преобразовать PDF в документ, который можно редактировать, добавляя или удаляя абзацы, перемещая текст из одной части документа в другую и т. д.?

Вот еще одна проблема: вам нужно преобразовать PDF в файл изображения для отображения в Интернете, вставить в документ или загрузить его на сайт, который принимает только JPG.Эту задачу решить намного проще, чем первую — ответ в конце этой истории.

Единственный способ внести массовые изменения в PDF-файл — преобразовать его в текстовый документ, чтобы вы могли редактировать его в Word, Google Docs или любом другом текстовом редакторе.Сложность заключается в том, что стандарт PDF (Portable Document Format), открытый стандарт, созданный Adobe в 1990-х годах, полностью несовместим с форматом обработки текстов DOCX, который сейчас является стандартом в Microsoft Word и почти во всем остальном.Не верьте ни одному поставщику, который утверждает, что делает редактирование PDF таким же простым, как в Word.Такое редактирование просто невозможно в файле PDF.Сначала вы должны преобразовать PDF в документ другого типа.

Идеального решения этой проблемы не существует, но есть множество достаточно хороших решений.Какое решение вы должны использовать, зависит от типа PDF, который вам нужно отредактировать.Если PDF-файл был создан из приложения Windows, Mac или Linux путем экспорта из приложения в PDF-файл, решение относительно простое, поскольку текст PDF-файла встроен в PDF-файл и может быть извлечен.Однако, если PDF-файл был создан путем сканирования или фотографирования печатного текста, то проблема намного сложнее, потому что вам нужно использовать OCR (оптическое распознавание символов) на отсканированном изображении для извлечения текста, и этот процесс всегда может привести к ошибкам.


Как узнать, создан ли PDF-файл в приложении или отсканирован?

Если вы не знаете, был ли PDF-файл создан приложением, камерой или сканером, вот как это узнать.

Откройте PDF-файл в приложении PDF по умолчанию, например Edge в Windows 11, Preview в macOS или Adobe Acrobat Reader (открывается в новом окне).Попробуйте выделить какой-нибудь текст, перетащив его мышью.Если вы можете выделить текст, то PDF-файл был экспортирован из приложения или к нему уже было применено распознавание символов, что не менее хорошо.Если вы не можете выделить текст, PDF-файл сканируется, и перед преобразованием его в документ Word необходимо применить распознавание символов.


Как конвертировать PDF-файлы со встроенным текстом с помощью Word

Начнем с PDF-файлов, которым не требуется OCR, другими словами, PDF-файлов со встроенным текстом.Самый простой способ преобразовать PDF-файл — открыть его в Microsoft Word и позволить Word преобразовать содержимое.

Откройте его, как и любой другой файл в Word.Запустите Word, выберите «Файл» > «Открыть» и выберите свой PDF-файл.Или щелкните файл правой кнопкой мыши и выберите «Открыть с помощью» > «Microsoft Word».Файл, вероятно, займет некоторое время для обработки, а затем откроется как редактируемый документ Word.

Это решение работает достаточно хорошо, но содержимое, вероятно, будет выглядеть не совсем правильно.Содержимое в PDF-файлах «зафиксировано» в одном месте на странице, и PDF-файл не позволяет вам вставлять или удалять абзацы, сохраняя при этом поток документа, как вы можете в текстовом процессоре.

Вот список от Microsoft того, что может не конвертироваться правильно:

  • таблицы с интервалом между ячейками

  • цвета страницы и границы страницы

  • отслеживаемые изменения

  • кадры

  • сноски, занимающие более одной страницы

  • концевые сноски

  • аудио, видео и активные элементы PDF

  • PDF-закладки

  • Теги PDF

  • PDF-комментарии

  • эффекты шрифта, такие как Glow или Shadow (в файле Word эффекты представлены графикой)

Когда вы открываете PDF-файл в Word, вы можете увидеть предупреждение:

«Теперь Word преобразует ваш PDF в редактируемый документ Word», — говорится в сообщении. «Это может занять некоторое время. Результирующий документ Word будет оптимизирован, чтобы вы могли редактировать текст, поэтому он может не выглядеть точно так же, как исходный PDF-файл, особенно если исходный файл содержит много графики».

Тем не менее, графика будет подтянута, но она может быть не совсем такой, какой вы хотите.И ваш текст может оказаться в текстовых полях, а не свободно перемещаться по странице.Но, по крайней мере, у вас будет документ, с которым вы сможете работать.

Если вы хотите экспортировать его в формате PDF, когда закончите редактирование, просто используйте меню Word «Экспорт» или «Сохранить как» и экспортируйте документ в формат PDF.

Кстати, это преобразование работает не только в настольном приложении Word, но и в бесплатной версии Word для веб-приложения (находится на office.com). Вы открываете PDF-файл в Word Online, и он доступен для просмотра, но вы нажимаете ссылку «Редактировать в Word», и вы можете увидеть предупреждение о преобразовании файла:

Далее следует еще одно предупреждение об изменении макета и т. д.Но контент будет там и его можно будет редактировать, даже если внешний вид будет шатким.Попробуйте.


Acrobat, Adobe PDF Converter и методы Google Docs

Открытие PDF-файла в Word — это только один из способов конвертировать PDF-файлы в формат DOCX.Вы можете получить лучшие результаты, используя приложения для редактирования PDF, такие как Adobe Acrobat DC.По моему опыту, Acrobat лучше всего справляется с экспортом PDF-файлов в формат Word.

Откройте PDF-файл в Acrobat, выберите в меню «Файл/Экспорт в…» и экспортируйте в формат Word.Acrobat гораздо лучше Word справляется с форматированием страниц, таким как верхние и нижние колонтитулы.Word иногда смешивает текст в заголовке с текстом документа, но Acrobat почти всегда делает это правильно.

Проблема с Acrobat в том, что он стоит денег, но Adobe предлагает бесплатный онлайн-конвертер PDF(открывается в новом окне), который вы можете использовать для получения тех же результатов, что и в Acrobat.

Вы можете найти более дешевое программное обеспечение для PDF, которое конвертирует PDF-файлы, созданные приложением, в формат DOCX, но я не нашел ничего, что делало бы это так же хорошо, как Acrobat.

Десятки других бесплатных онлайн-конвертеров PDF обещают выдавать редактируемый текст, но я не рекомендую ни один из них как место, где можно доверять загрузку ваших данных.Adobe, однако, достаточно хорошо зарекомендовала себя, чтобы я мог доверять ей обычные документы, хотя я не буду загружать ничего, что мне серьезно нужно держать в секрете.

Рекомендовано нашими редакторами

Еще одно бесплатное приложение, которое мне иногда рекомендуют для преобразования PDF в Word, — это Google Docs.Инструкции аналогичны использованию Acrobat: откройте файл для редактирования, а затем загрузите его в формате Word.Однако каждый раз, когда я пробовал это, результаты были ужасными.Ваша удача может быть лучше.


Как преобразовать отсканированный документ в формат Word

Все, что я написал до сих пор, сосредоточено на PDF-файлах, которые были экспортированы из приложения, чтобы текст был встроен в PDF-файл.Что вы можете сделать с преобразованием PDF-файлов, сделанных со сканера или камеры?

В зависимости от качества отсканированного изображения вы можете открыть его в Word, а встроенное в Word средство распознавания текста может создать редактируемый текст.Мне удавалось работать с четкими одностраничными изображениями, но Word просто не может справиться с чем-то сложным, например, со сканированием книги, и имеет тенденцию создавать бесполезную смесь текста и изображений.

При преобразовании отсканированных изображений в редактируемый текст Acrobat неплохо справляется с созданием PDF-файлов, но ничто не сравнится с мощью нашего победителя «Выбор редакции» для инструментов OCR, ABBYY FineReader PDF 15 (199 долларов США). Механизм OCR FineReader является более точным, чем что-либо еще, что я пробовал, и он поставляется с уникальной функцией проверки ошибок, которая работает как проверка орфографии в текстовом процессоре, поэтому вы можете исправить ошибки OCR перед экспортом результата.FineReader экспортирует результаты в Word, PDF и другие форматы, и полученные файлы намного удобнее в использовании, чем все, что я нашел.

Если у вас все еще есть исходный документ, который был отсканирован или преобразован в файл изображения, вы можете использовать мобильное приложение для сканирования с OCR для захвата и извлечения текста.


Как экспортировать PDF в JPG или другой формат изображения

Если вам нужно преобразовать PDF в файл изображения, на Mac это сделать намного проще, чем на ПК.

На Mac просто откройте PDF-файл в режиме предварительного просмотра.Используйте меню «Файл»> «Экспорт» и выберите нужный формат изображения и параметры, которые вы предпочитаете, и у вас есть файл изображения.

В Windows лучший бесплатный способ — создать бесплатную учетную запись Adobe(откроется в новом окне) в Adobe, а затем перейти на страницу cloud.acrobat.com/exportpdf(откроется в новом окне).Перетащите PDF-файл в окно.Выберите «Преобразовать в» > «Изображение» > «Формат изображения» (JPEG, PNG или TIFF) и с помощью ползунка выберите качество изображения.Многостраничные PDF-файлы преобразуются в отдельные файлы изображений.Затем вы можете загрузить ZIP-файл с файлами изображений.

Если вас беспокоят проблемы конфиденциальности и вы не хотите делиться своими данными с Adobe, вы можете использовать множество графических редакторов для экспорта PDF в файлы изображений.Мой любимый — XnViewMP (открывается в новом окне), который бесплатен для личного и образовательного использования.Когда вы открываете PDF-файл в XnViewMP, вам, вероятно, потребуется следовать инструкциям по установке приложения GhostScript с открытым исходным кодом для работы с файлами PDF и PostScript, но затем вы можете использовать XnViewMP для экспорта PDF-файла в любой стандартный формат изображения.Имейте в виду, что все шрифты будут преобразованы из масштабируемого формата TrueType в растровый, а мелкий текст будет выглядеть блочным.

Если вам нужны более точные параметры экспорта, любой коммерческий редактор PDF может экспортировать в файлы изображений.FineReader, Acrobat и PDF-Xchange Editor (открывается в новом окне) работают с превосходными результатами и включают в себя опции для создания небольших файлов, подходящих для отображения в Интернете, вставки в документы или использования где-либо еще, где PDF-файлы не поддерживаются или удобный.

Все категории: Сообщение об ошибке