Sitemap

Đây là một vấn đề phổ biến.Ai đó gửi cho bạn tệp PDF và bạn cần thực hiện các thay đổi quy mô lớn trong đó, kiểu chỉnh sửa bán buôn không thể thực hiện trong các ứng dụng trình chỉnh sửa PDF như những ứng dụng bạn có thể sử dụng để chỉnh sửa nhẹ đối với PDF.Làm cách nào để bạn chuyển đổi PDF thành một tài liệu mà bạn có thể chỉnh sửa để thêm hoặc xóa các đoạn văn, di chuyển văn bản từ phần này sang phần khác của tài liệu, v.v.?

Đây là một vấn đề khác: Bạn cần chuyển đổi PDF thành tệp hình ảnh để hiển thị trên web, chèn vào tài liệu hoặc tải tệp đó lên trang web chỉ chấp nhận JPG.Vấn đề này dễ giải hơn rất nhiều so với vấn đề đầu tiên — câu trả lời nằm ở phần cuối của câu chuyện này.

Cách duy nhất để thực hiện các chỉnh sửa bán buôn trong tệp PDF là chuyển đổi tệp đó thành tài liệu xử lý văn bản để bạn có thể chỉnh sửa trong Word, Google Tài liệu hoặc bất kỳ ứng dụng xử lý văn bản nào khác.Điều gây khó khăn là tiêu chuẩn PDF (Định dạng Tài liệu Di động), một tiêu chuẩn mở do Adobe tạo ra vào những năm 1990, hoàn toàn không tương thích với định dạng xử lý văn bản DOCX hiện là tiêu chuẩn trong Microsoft Word và hầu hết mọi thứ khác.Đừng tin bất kỳ nhà cung cấp nào tuyên bố chỉnh sửa PDF dễ dàng như trong Word.Loại chỉnh sửa đó đơn giản là không thể trong tệp PDF.Trước tiên, bạn phải chuyển đổi PDF sang một loại tài liệu khác.

Không có giải pháp hoàn hảo nào cho vấn đề này, nhưng có rất nhiều giải pháp đủ tốt.Giải pháp nào bạn nên sử dụng tùy thuộc vào loại PDF mà bạn cần chỉnh sửa.Nếu tệp PDF được tạo từ ứng dụng Windows, Mac hoặc Linux bằng cách xuất từ ​​ứng dụng đó sang PDF thì giải pháp tương đối dễ dàng vì văn bản của PDF được nhúng trong tệp PDF và có thể được trích xuất.Tuy nhiên, nếu tệp PDF được tạo bằng cách quét hoặc chụp ảnh văn bản in, thì vấn đề khó hơn rất nhiều, vì bạn cần sử dụng OCR (nhận dạng ký tự quang học) trên hình ảnh được quét để trích xuất văn bản và quá trình đó luôn có nguy cơ tạo ra lỗi.


Làm thế nào để biết một tệp PDF được tạo ra hoặc được quét bởi ứng dụng?

Nếu bạn không biết liệu một tệp PDF được tạo bởi một ứng dụng hay bởi một máy ảnh hoặc máy quét, thì đây là cách tìm hiểu.

Mở PDF trong ứng dụng PDF mặc định của bạn, chẳng hạn như Edge trong Windows 11, Preview trong macOS hoặc Adobe Acrobat Reader (Mở trong cửa sổ mới).Cố gắng chọn một số văn bản bằng cách kéo bằng chuột.Nếu bạn có thể chọn văn bản, thì PDF đã được xuất từ ​​một ứng dụng — hoặc nó đã được áp dụng OCR cho nó, điều này cũng tốt.Nếu bạn không thể chọn văn bản, thì PDF sẽ được quét và cần áp dụng OCR trước khi bạn có thể chuyển nó thành tài liệu Word.


Cách chuyển đổi PDF bằng văn bản nhúng bằng Word

Hãy bắt đầu với các tệp PDF không cần OCR, hay nói cách khác là các tệp PDF có văn bản được nhúng.Cách đơn giản nhất để chuyển đổi PDF của bạn là mở nó trong Microsoft Word và để Word chuyển đổi nội dung.

Mở nó như bạn làm với bất kỳ tệp nào khác trong Word.Khởi chạy Word và đi tới Tệp> Mở và chọn tệp PDF của bạn.Hoặc nhấp chuột phải vào tệp và chọn Mở Bằng> Microsoft Word.Tệp có thể sẽ mất một chút thời gian để xử lý và sau đó mở ra dưới dạng tài liệu Word có thể chỉnh sửa.

Giải pháp này hoạt động hợp lý, nhưng nội dung có thể sẽ không chính xác.Nội dung trong tệp PDF được "cố định" ở một vị trí trên trang và PDF không cho phép bạn chèn hoặc xóa các đoạn văn trong khi vẫn giữ nguyên dòng tài liệu như bạn có thể làm trong trình xử lý văn bản.

Dưới đây là danh sách từ Microsoft về những thứ có thể không chuyển đổi vừa phải:

  • bảng có khoảng cách giữa các ô

  • màu trang và đường viền trang

  • những thay đổi được theo dõi

  • khung

  • chú thích kéo dài nhiều hơn một trang

  • chú thích

  • các phần tử hoạt động âm thanh, video và PDF

  • Dấu trang PDF

  • Thẻ PDF

  • Nhận xét PDF

  • hiệu ứng phông chữ, như Phát sáng hoặc Bóng tối (trong tệp Word, các hiệu ứng được thể hiện bằng đồ họa)

Khi mở PDF trong Word, bạn có thể thấy cảnh báo:

"Word sẽ chuyển đổi PDF của bạn thành một tài liệu Word có thể chỉnh sửa", nó nói. "Quá trình này có thể mất một chút thời gian. Tài liệu Word kết quả sẽ được tối ưu hóa để cho phép bạn chỉnh sửa văn bản, vì vậy nó có thể không giống hệt như PDF gốc, đặc biệt nếu tệp gốc chứa nhiều đồ họa."

Điều đó nói rằng, đồ họa sẽ được kéo vào, nhưng chúng có thể không chính xác ở nơi bạn muốn.Và văn bản của bạn có thể kết thúc trong các hộp văn bản thay vì tự do chảy qua trang.Nhưng ít nhất bạn sẽ có một tài liệu mà bạn có thể làm việc.

Nếu bạn muốn xuất nó dưới dạng PDF khi chỉnh sửa xong, chỉ cần sử dụng menu Xuất hoặc Lưu dưới dạng của Word và xuất tài liệu của bạn sang định dạng PDF.

Nhân tiện, chuyển đổi này không chỉ hoạt động trong ứng dụng Word trên máy tính mà còn trong phiên bản ứng dụng web miễn phí của Word (tìm thấy tại office.com). Bạn mở một tệp PDF trong Word Online và nó có thể xem được, nhưng hãy nhấp vào liên kết "Chỉnh sửa trong Word" và bạn có thể thấy cảnh báo chuyển đổi tệp:

Tiếp theo là một cảnh báo khác về những thay đổi đối với bố cục, v.v.Nhưng nội dung sẽ ở đó và có thể chỉnh sửa, ngay cả khi giao diện có vẻ khó hiểu.Hãy thử một lần.


Phương pháp Acrobat, Trình chuyển đổi PDF của Adobe và Google Tài liệu

Mở PDF trong Word chỉ là một cách để chuyển đổi tệp PDF sang định dạng DOCX.Bạn có thể nhận được kết quả tốt hơn bằng cách sử dụng các ứng dụng chỉnh sửa PDF như Adobe Acrobat DC.Theo kinh nghiệm của tôi, Acrobat làm tốt hơn bất kỳ công việc nào khác là xuất PDF sang định dạng Word.

Mở PDF trong Acrobat, chọn File / Export To… từ menu và xuất sang định dạng Word.Acrobat thực hiện công việc tốt hơn nhiều so với Word trong việc phân loại định dạng trang như đầu trang và chân trang.Word đôi khi trộn văn bản trong tiêu đề với văn bản của tài liệu, nhưng Acrobat hầu như luôn làm đúng.

Vấn đề với Acrobat là nó tốn tiền — nhưng Adobe cung cấp một trình chuyển đổi PDF trực tuyến miễn phí (Mở trong cửa sổ mới) mà bạn có thể sử dụng để có được kết quả tương tự như bạn nhận được từ Acrobat.

Bạn có thể tìm thấy phần mềm PDF rẻ hơn có thể chuyển đổi các tệp PDF do ứng dụng tạo sang định dạng DOCX, nhưng tôi không tìm thấy phần mềm nào làm được điều đó tốt như Acrobat.

Hàng chục trang web chuyển đổi PDF trực tuyến miễn phí khác hứa hẹn cung cấp văn bản có thể chỉnh sửa, nhưng tôi không khuyến khích bất kỳ trang web nào trong số đó làm nơi đáng tin cậy để tải lên dữ liệu của bạn.Tuy nhiên, Adobe đủ vững chắc để tôi tin tưởng vào nó với các tài liệu thông thường, mặc dù tôi sẽ không tải lên bất kỳ thứ gì mà tôi thực sự cần giữ bí mật.

Được giới thiệu bởi các biên tập viên của chúng tôi

Một ứng dụng miễn phí khác mà đôi khi tôi nghe được đề xuất để chuyển đổi PDF sang Word là Google Documents.Hướng dẫn tương tự như sử dụng Acrobat: Mở tệp để chỉnh sửa, sau đó tải xuống ở định dạng Word.Tuy nhiên, mỗi khi tôi đã thử nó, kết quả thật tồi tệ.May mắn của bạn có thể tốt hơn.


Cách chuyển đổi tài liệu đã quét sang định dạng Word

Mọi thứ tôi đã viết cho đến nay đều tập trung vào các tệp PDF được xuất từ ​​một ứng dụng để văn bản được nhúng vào tệp PDF.Bạn có thể làm gì khi chuyển đổi tệp PDF được tạo từ máy quét hoặc máy ảnh?

Tùy thuộc vào chất lượng của hình ảnh được quét, bạn có thể mở nó trong Word và OCR tích hợp của Word có thể tạo văn bản có thể chỉnh sửa.Tôi đã thành công với những hình ảnh rõ ràng trên một trang, nhưng Word đơn giản là không thể xử lý bất cứ thứ gì phức tạp, chẳng hạn như quét sách và có xu hướng tạo ra một hỗn hợp văn bản và hình ảnh không thể sử dụng được.

Trong việc chuyển đổi hình ảnh được quét thành văn bản có thể chỉnh sửa, Acrobat thực hiện tốt công việc tạo PDF, nhưng không có gì gần với sức mạnh của người chiến thắng Sự lựa chọn của ban biên tập cho các công cụ OCR, ABBYY FineReader PDF 15 ($ 199). Công cụ OCR của FineReader chính xác hơn bất kỳ thứ gì khác mà tôi đã thử và nó đi kèm với tính năng kiểm tra lỗi độc đáo hoạt động giống như trình kiểm tra chính tả trong trình xử lý văn bản, vì vậy bạn có thể sửa lỗi OCR trước khi xuất kết quả.FineReader xuất kết quả dưới dạng Word, PDF và các định dạng khác và các tệp kết quả có thể sử dụng được nhiều hơn bất kỳ thứ gì khác mà tôi đã tìm thấy.

Nếu bạn vẫn còn tài liệu gốc đã được quét hoặc chuyển thành tệp hình ảnh, bạn có thể sử dụng ứng dụng quét trên thiết bị di động với OCR để chụp và trích xuất văn bản.


Cách xuất PDF sang JPG hoặc định dạng hình ảnh khác

Nếu bạn cần chuyển đổi một tệp PDF thành tệp hình ảnh, nó hoàn toàn dễ dàng hơn trên máy Mac so với PC.

Trên máy Mac, chỉ cần mở PDF ở chế độ Xem trước.Sử dụng menu Tệp> Xuất và chọn định dạng hình ảnh bạn muốn và các tùy chọn bạn thích, và bạn có tệp hình ảnh của mình.

Trên Windows, phương pháp miễn phí tốt nhất là tạo tài khoản Adobe miễn phí (Mở trong cửa sổ mới) với Adobe và sau đó truy cập cloud.acrobat.com/exportpdf (Mở trong cửa sổ mới).Kéo một tệp PDF vào cửa sổ.Đi tới Chuyển đổi thành> Hình ảnh> Định dạng hình ảnh (JPEG, PNG hoặc TIFF) và sử dụng thanh trượt để chọn chất lượng hình ảnh.Các tệp PDF nhiều trang được chuyển đổi thành các tệp hình ảnh riêng biệt.Sau đó, bạn có thể tải xuống tệp ZIP với các tệp hình ảnh.

Nếu bạn bị làm phiền bởi những lo ngại về quyền riêng tư và không muốn chia sẻ dữ liệu của mình với Adobe, thì bạn có thể sử dụng nhiều trình chỉnh sửa hình ảnh để xuất PDF thành tệp hình ảnh.Yêu thích của tôi là XnViewMP (Mở trong cửa sổ mới), miễn phí cho mục đích cá nhân và giáo dục.Khi bạn mở PDF trong XnViewMP, có thể bạn sẽ cần làm theo lời nhắc để cài đặt ứng dụng GhostScript mã nguồn mở để làm việc với các tệp PDF và PostScript, nhưng sau đó bạn có thể sử dụng XnViewMP để xuất PDF sang bất kỳ định dạng hình ảnh chuẩn nào.Hãy nhớ rằng tất cả các phông chữ sẽ được chuyển đổi từ định dạng TrueType có thể mở rộng thành bitmap và văn bản nhỏ sẽ trông có khối.

Nếu bạn muốn các tùy chọn xuất được tinh chỉnh, bất kỳ trình chỉnh sửa PDF thương mại nào cũng có thể xuất thành tệp hình ảnh.FineReader, Acrobat và PDF-Xchange Editor (Mở trong cửa sổ mới) đều hoạt động với kết quả xuất sắc và bao gồm các tùy chọn để tạo các tệp nhỏ phù hợp để hiển thị trên web, chèn vào tài liệu hoặc sử dụng ở bất kỳ nơi nào khác nơi tệp PDF không được hỗ trợ hoặc tiện lợi.

Tất cả danh mục: Thông tin sửa lỗi