April 12 2020

文字 PDF 轉檔攻略(二):轉檔後的文件檢查

PDF 轉檔後,建議你將檔案打開稍微檢查一下,因為除非你的 PDF 檔案格式非常單純,否則幾乎鮮少有檔案轉出來是完全正確完美的。我個人認為,套句股票常用的術語,檢查這件事是「短空長多」。意思是檢查和整理短期內需要花時間,但長期來說可讓翻譯體驗大幅提升,而且反而可以節省時間。


...


1. 打開段落標記:確定換行正確

打開從 PDF 轉成 Word 的檔案,我會做的第一件事是打開「段落標記」,方便我判斷換行是否正確。
以下圖來說,打開段落標記就會看到轉出來的檔案,有些不應該換行的地方卻換行,而這種換行錯誤的問題必須修正,否則進了翻譯輔助軟體之後,就會看到好好的段落被腰斬得亂七八糟。

打開 Word 段落標記功能:檔案→選項→顯示→段落標記→勾選段落標記(操作影片)。

以上圖的例子來說,由於整份 PDF 文件轉檔出來後,出現太多換行錯誤的問題,每頁都有大量錯誤。如果一個一個手動把換行錯誤的地方「接回去」,將耗費太多時間,因此我決定放棄這次的轉檔結果,改用其他軟體轉檔。果然,換了一個軟體之後狀況好多了,換行錯誤的問題幾乎都沒有了。



2. 確定文字順序:確定文字順序正確

接著,我會用反白文字的方式,確定文字的順序是正確的。以下圖的例子來說,人類閱讀文字的順序分別是 1→2→3,轉檔後的文字也應該是這個順序。但轉檔後真的是這樣的順序嗎?這時只要慢慢反白文字,就可以知道是否如此。


慢慢反白文字後,會發現文字並非照上面的順序被反白,而是整片從上到下,這就表示文字的順序錯誤了。之所以會造成這種錯誤,主因是這份文件將兩頁的書面文字做在一個 Word 頁面。不過,和上述一樣,我通常會放棄這種轉檔結果,改用其他軟體轉。

我換了一個軟體轉檔,發現這個問題果然也解決了!用了另一個軟體轉檔後,反白的文字可以依照人類閱讀順序呈現了。



3. 圖片是否漂浮:漂浮的圖可能無法跟隨譯文

接著我會檢查圖片是否在文字裡,還是漂浮在文字上。檢查的方式也很簡單,只要點選圖片,圖片上方會出現綠色的圈圈,這就是漂浮的圖片。漂浮圖片是指圖片不是排在文字裡,而是「漂浮」在文字上方。

肉眼上也許看不太出來圖片是漂在上方,但只要按 Enter 換行就可以看出,因為漂浮的圖片不會跟著 Enter 換行移動。這種漂浮圖片的缺點是,當文字長度改變後,圖片不會出現在它應該出現的位置(因為漂浮在上方)。
例如,原文是英文的文章翻成中文後,中文的長度通常會比較短,這時候如果文字後面的圖片沒有「跟上來」,就會變成圖片漂到遙遠的地方,變成「圖文不符」的情況。


將漂浮的圖片改成不再漂浮的圖片也很簡單,只要對這圖片按滑鼠右鍵,會出現可調整格式的設定。

按下去後,在版面配置選項那邊點擊與文字排列

不過,如果太多圖片都是漂浮圖,我會建議直接換軟體轉檔,因為有些軟體已經能夠很好處理這個問題。


4. 頁首頁尾、浮水印:手動刪除

有些文件,尤其是書籍,都有頁首頁尾。如果是書籍,通常我會把頁首頁尾拿掉,因為編輯並不需要這些東西。目前許多轉檔軟體都無法正確將頁首頁尾還原成原本 Word 的格式,換句話說我們需要手動一一將頁首頁尾刪除。

類似的狀況也出現在浮水印。轉檔後的浮水印不再是原來 Word 格式的浮水印,而是變成一個漂浮的圖檔。遇到這種情況,通常只能手動刪除浮水印。


5. 跨頁腰斬:手動接回

目前我看到的轉檔軟體裡,幾乎都無法處理跨頁腰斬的問題,所以我都會手動將跨頁腰斬的地方手動接回去。


6. 強制換行:取代成一般換行

強制換行(↓)和一般的 Enter 換行不一樣,有時候匯入軟體內可能會造成一些不便,因此我會用 Word 的搜尋取代功能,把強制換行 ^l 取代成一般換行 ^p。
^l(L的小寫)


...


以上是我檢查 PDF 轉檔成 Word 後會檢查的要點,整理如下:

  • 打開段落標記,確定換行正確(好的軟體可處理)
  • 反白文字,確定文字順序正確(好的軟體可處理)
  • 確定圖片在文字內,不會漂浮(好的軟體可處理)
ConvertioIlovepdfSmallpdf 是不錯的軟體,處理格式上已經很不錯了
  • 頁首頁尾與浮水印(手動刪除)
  • 跨頁文字腰斬問題(手動接回)
  • 強制換行取代問題(手動取代)
手動處理這部分比較麻煩,但清掉會有助於翻譯。


我是 Termsoup 創辦人 Joanne。Termsoup 是給專業譯者使用的軟體,協助譯者翻譯得更有效率。如果你還沒有用過相關軟體,或你用過 Trados、Memoq 等軟體但覺得太複雜,歡迎你試用我開發的軟體。身為譯者和網頁設計師,我最大的心願是讓譯者更輕鬆、愉快完成手上的任務。

軟體

作者

Joanne Chou

Joanne is an English-Chinese translator, a UI/UX designer, and the co-founder of Termsoup.