為什麼 PDF 要先轉檔才能用軟體翻譯
譯者常遇到客戶給 PDF 檔,PDF 檔案基本上無法直接上傳到翻譯輔助軟體(CAT),因為 PDF 屬於不可編輯的檔案,要先經過轉檔軟體,將它轉成可編輯檔案的格式,例如 Word、Powerpoint、Excel 等,才能匯入 CAT。
CAT 軟體是透過處理文字才能做到許多功能,包括詞彙庫、翻譯記憶、機器翻譯等,這些功能都要靠程式運算文字才能達成,而文字要能夠運算,前提是它必須可編輯。其實不只有 CAT 軟體,任何一種需要處理文字的軟體都是如此,例如電子書編輯軟體、文字排版軟體、語義分析軟體等。
💡 TIP:只要是需要處理文字的軟體,都需要先將文字轉成可編輯格式。
我的經驗是,處理 PDF 轉檔是一件繁瑣無趣的工作,任誰都希望趕快處理好。不過,這個階段其實非常重要,你能否將本來不可編輯的文字,轉換成乾淨整齊的可編輯文字,將影響你之後在軟體翻譯的效率。當然,最好的情況是客戶一開始就給可編輯的檔案,這樣就可以從源頭省掉這個工作。
...
處理 PDF 檔案的步驟
當客戶給你 PDF檔案時,你會經過三個步驟:判斷、轉檔、檢查。
判斷:判斷你拿到的 PDF 是哪一種
PDF 有兩種:文字 PDF 與掃描 PDF。文字PDF 是指 PDF 是從可編輯的文件轉檔而來,掃描 PDF 是指 PDF 是從掃描的圖片集結而成。分辨這兩種 PDF 的方法很簡單。
掃描 PDF:用 OCR 軟體處理,也就是所謂的光學字元辨識軟體
這篇文章要分享的是如何處理文字 PDF,所以以下將說明 PDF 轉檔軟體。
...
轉檔:選擇合適的軟體轉檔
我的經驗是,很難說哪一個 PDF 轉檔軟體最好,因為不同檔案都有不同結果。有時候過了一陣子,本來覺得不夠好用的軟體又表現得比較好。不過,選擇軟體還是有一點要注意:是否支援上到下的直排或右到左的橫排。
中文和日文有時候會以直排呈現,而阿拉伯文和希伯來文則是從右到左的橫排,轉檔時如果軟體不支援這類排版,轉出來文字順序可能會完全顛倒。開發這類軟體的公司多半來自歐美,因此支援的語系也以歐語系為主,或歐語系的效果較佳。我先前曾幫譯者處理日文直排轉檔,結果轉出來的文字必須從下往上讀,看起來十分搞笑。
在此分享幾個我目前常用的 PDF 轉檔軟體。
ABBYY PDF Transformer
Abbyy 是老牌的文字處理專家,這家公司出了非常多文字處理相關軟體,它們的文字辨識軟體也很強。你可以下載免費試用版,若覺得效果很好可線上購買。最低一次付美金 199 元,需要升級的話是 129。如果你常常需要轉檔,且希望擁有平均來說有較好的轉檔效果,ABBYY 的軟體值得你嘗試。
Convertio
我用 Convertio 是因為它是各種檔案格式的轉檔大全,不只是文件格式轉檔,還包括文字辨識、影片、聲音、圖片、電子書等,非常齊全。另外,它有 Chrome 外掛,評分相當高,是一款便利、轉檔效果也很不錯的軟體。Convertio 是免費軟體。
Ilovepdf
這幾年 PDF 相關軟體如雨後春筍般冒出來,Ilovepdf 算是比較早就在做這個領域的軟體。它的轉檔效果很不錯,而且還有桌機版可免費下載使用。桌機版有轉檔次數限制,介面則也很簡潔好用。
...
在下一篇文章裡,我將詳細說明轉檔後的檢查,而檢查大概是最重要的步驟。目前沒有任何一個軟體能夠 100% 轉檔正確,所以轉檔後將檔案打開來檢查過非常重要,可大幅減少譯者在翻譯輔助軟體裡遇到的文字錯誤,也可提升整體翻譯體驗。
我是 Termsoup 創辦人 Joanne。Termsoup 是給專業譯者使用的軟體,協助譯者翻譯得更有效率。如果你還沒有用過相關軟體,或你用過 Trados、Memoq 等軟體但覺得太複雜,歡迎你試用我開發的軟體。身為譯者和網頁設計師,我最大的心願是讓譯者更輕鬆、愉快完成手上的任務。