Mar-29-20

文字 PDF 轉檔攻略(一):轉檔軟體推薦

為什麼 PDF 要先轉檔才能用軟體翻譯

譯者常遇到客戶給 PDF 檔,PDF 檔案基本上無法直接上傳到翻譯輔助軟體(CAT),因為 PDF 屬於不可編輯的檔案,要先經過轉檔軟體,將它轉成可編輯檔案的格式,例如 Word、Powerpoint、Excel 等,才能匯入 CAT。

CAT 軟體是透過處理文字才能做到許多功能,包括詞彙庫、翻譯記憶、機器翻譯等,這些功能都要靠程式運算文字才能達成,而文字要能夠運算,前提是它必須可編輯。其實不只有 CAT 軟體,任何一種需要處理文字的軟體都是如此,例如電子書編輯軟體、文字排版軟體、語義分析軟體等。

💡 TIP:只要是需要處理文字的軟體,都需要先將文字轉成可編輯格式。

不過,有些軟體會幫使用者做轉檔的工作,例如 Google 翻譯允許你上傳 PDF 檔,有些 CAT 軟體也可讓你上傳 PDF。我們曾在 Termsoup 嘗試這樣做,串接第三方轉檔軟體幫大家處理 PDF,但發現目前的 PDF 轉檔軟體的精準度仍有限,因為許多文件的格式非常複雜,沒有一個軟體適用於所有文件,反而可能增加譯者事後修改的不便(CAT 主要用來翻譯,因此文字編輯的功能非常少,有時出於保留格式的目的甚至不允許編輯),因此我們放棄內建轉檔功能的作法。

我的經驗是,處理 PDF 轉檔是一件繁瑣無趣的工作,任誰都希望趕快處理好。不過,這個階段其實非常重要,你能否將本來不可編輯的文字,轉換成乾淨整齊的可編輯文字,將影響你之後在軟體翻譯的效率。當然,最好的情況是客戶一開始就給可編輯的檔案,這樣就可以從源頭省掉這個工作。


...


處理 PDF 檔案的步驟

當客戶給你 PDF檔案時,你會經過三個步驟:判斷、轉檔、檢查。


判斷:判斷你拿到的 PDF 是哪一種

PDF 有兩種:文字 PDF 與掃描 PDF。文字PDF 是指 PDF 是從可編輯的文件轉檔而來,掃描 PDF 是指 PDF 是從掃描的圖片集結而成。分辨這兩種 PDF 的方法很簡單。

1. 反白 PDF 文字:如果可以文字可以反白,就是文字 PDF,反之則是掃描 PDF。
2. 放大 PDF:將 PDF 畫面放到非常大,例如 400%。掃描 PDF 的文字會出現鋸齒狀或模糊的狀況,文字 PDF 文字的邊角仍將非常清楚銳利。


文字 PDF 放大後,文字邊角仍銳利清楚



掃描 PDF 放大後,文字變得模糊


文字 PDF:用 PDF 轉檔軟體處理
掃描 PDF:用 OCR 軟體處理,也就是所謂的光學字元辨識軟體

這篇文章要分享的是如何處理文字 PDF,所以以下將說明 PDF 轉檔軟體。


...


轉檔:選擇合適的軟體轉檔

我的經驗是,很難說哪一個 PDF 轉檔軟體最好,因為不同檔案都有不同結果。有時候過了一陣子,本來覺得不夠好用的軟體又表現得比較好。不過,選擇軟體還是有一點要注意:是否支援上到下的直排或右到左的橫排

中文和日文有時候會以直排呈現,而阿拉伯文和希伯來文則是從右到左的橫排,轉檔時如果軟體不支援這類排版,轉出來文字順序可能會完全顛倒。開發這類軟體的公司多半來自歐美,因此支援的語系也以歐語系為主,或歐語系的效果較佳。我先前曾幫譯者處理日文直排轉檔,結果轉出來的文字必須從下往上讀,看起來十分搞笑。

在此分享幾個我目前常用的 PDF 轉檔軟體。


ABBYY PDF Transformer

Abbyy 是老牌的文字處理專家,這家公司出了非常多文字處理相關軟體,它們的文字辨識軟體也很強。你可以下載免費試用版,若覺得效果很好可線上購買。最低一次付美金 199 元,需要升級的話是 129。如果你常常需要轉檔,且希望擁有平均來說有較好的轉檔效果,ABBYY 的軟體值得你嘗試。


Convertio

我用 Convertio 是因為它是各種檔案格式的轉檔大全,不只是文件格式轉檔,還包括文字辨識、影片、聲音、圖片、電子書等,非常齊全。另外,它有 Chrome 外掛,評分相當高,是一款便利、轉檔效果也很不錯的軟體。Convertio 是免費軟體。



Ilovepdf

這幾年 PDF 相關軟體如雨後春筍般冒出來,Ilovepdf 算是比較早就在做這個領域的軟體。它的轉檔效果很不錯,而且還有桌機版可免費下載使用。桌機版有轉檔次數限制,介面則也很簡潔好用。


...


下一篇文章裡,我將詳細說明轉檔後的檢查,而檢查大概是最重要的步驟。目前沒有任何一個軟體能夠 100% 轉檔正確,所以轉檔後將檔案打開來檢查過非常重要,可大幅減少譯者在翻譯輔助軟體裡遇到的文字錯誤,也可提升整體翻譯體驗。


我是 Termsoup 創辦人 Joanne。Termsoup 是給專業譯者使用的軟體,協助譯者翻譯得更有效率。如果你還沒有用過相關軟體,或你用過 Trados、Memoq 等軟體但覺得太複雜,歡迎你試用我開發的軟體。身為譯者和網頁設計師,我最大的心願是讓譯者更輕鬆、愉快完成手上的任務。

軟體 翻譯 CAT

作者

Joanne Chou

Joanne is an English-Chinese translator, a UI/UX designer, and the co-founder of Termsoup.