Showing posts with label 筆譯. Show all posts
Showing posts with label 筆譯. Show all posts

2008-04-16

翻譯軟體: OmegaT (翻譯記憶)

你雖然可以花多一筆錢買Trados,但是也許你先要了解這種軟體好不好用,所以一開始不想花太多錢。或者你是學生,根本沒有太多錢可以花。或者你發現,自由軟體其實蠻不錯,本來就做得到你需要的。

反正,我在這裡想介紹OmegaT,一個我認為真不錯的翻譯軟體。它是Java軟體,所以你電腦上沒有裝Java,你沒有辦法執行它。如果你不確定你電腦有沒有裝,你可以下載包含Java的套件。目前的官方版本還沒有安裝程式,你只要下載ZIP檔,然後把裡面的檔案解壓縮到適合的地方。在Windows,你要點OmegaT.bat啟動它。

啟動之後,我們先要建立新的方案(project)。一個方案只適合用在一個語言方向(例如英翻中),但是可以包含幾個文件。一個方案的文件會共用翻譯記憶跟詞庫。建立方案的時候,軟體想知道一些設定:


最重要的是原語言跟目標語言的設定。因為一個句子包含比較完整的意思,我們最好也要選sentence-level segmenting。(等一下就能看到這是什麼,先相信我,OK?)你先最好不要進去"Segmentation" - 這個也請你相信我。那邊都已經設好,需要修改的可能率很低。而且,你最好先多了解這個軟體才要考慮修改這些設定。

你會發現OmegaT在方案的目錄下想建立另外一些目錄。平常沒有必要改這些。在source files有原來的(原語言)文件,這些不會被修改。Translation memory是翻譯記憶檔案,而在glossary可以自己放詞庫檔案。我們翻完的文件會在translated files (target)裡面出現。設完之後,我們的方案當然需要文件。


我已經加一個原語言文件:pigs.txt。(我猜你應該知道這個故事。等一下你會了解為什麼我這裡要用它。)OmegaT能處理普通的文字檔、HTML、ODT,而最近好像也開始支援XLIFFOOXML。 (Grrrrrrr...)


主要的視窗之後可能變成如上的樣子。好像不太精彩:沒有3D,沒有敵人,沒有其它槍可以選... 而且,fuzzy matches視窗跟glossary視窗(目前看不到)也都沒有東西,我是不是還要自己動手翻?

是。一開始,這種軟體對你不會是很大的幫助。但是你用它越久,它幫助越大。目前我們最好先高興地發現它在原語言的文件裡好像有把標題獨立出來。標題就是第一個segment,第一個分段。Segment 0001 跟 end segment之間我們可以寫目標語言版本,上面(綠色)都會有原語言版本。


這裡可以看到分段裡面,原語言跟目標語言的句子都在。我寫完目標語言版,現在可以刪除原來的句子。我其實也可以一開始直接刪除,因為上面會有無法刪除的原語言版本,但是我個人比較喜歡翻完才拿掉原來的句子。不過,到這裡好像還是沒有特別的“動作”,軟體還沒有幫我任何忙。好吧,繼續翻...


Ooops,軟體終於睡醒了!這裡發生了什麼事?我目前翻的句子比較像我之前翻的另一個句子。OmegaT認為之前的句子像目前的44%,籃色的詞是跟目前的句子不同的地方。Hmm,然後呢?

然後我有選擇:我可以不理軟體的建議。(別忘記你有這個選擇。)我可以把之前的目標語言句子插入目前的分段。(Ctrl-I) 或者我可以把目前分段裡面的原語言句子換成之前的目標語言句子。(Ctrl-R)

不過,44%還不是很高的數字,而如果我們看籃色的部分多大,不管我們決定哪一個選擇,都還需要一些手工。但是我們其實也剛才開始,所以就繼續翻吧!


Voila! 這個比較有趣。OmegaT發現已經有兩個句子像目前要翻的。最像的當然排第一名,因為如果我要用記憶裡面的句子,它應該是第一個選擇。只有兩個詞不同,像度80%,相當高。我個人這次會選取代,按Ctrl-R,把第一個目標語言句子放進分段,然後修改那兩個不同的詞。

也許你現在了解為什麼我要剛好用這個故事:這裡有一些重復的句子,只有少數的詞不同,所以我們這麼快就可以看到效果。如果我用OmegaT更久,它會記住更多我翻的句子,給我更多,更方便的選擇。此外:軟體雖然會幫你記住很多句子,但是我也想建議你記住它的快速按鍵。這樣工作才真快...

到現在我們好像一直沒有看到glossary(詞庫)這個視窗。其實,OmegaT可惜不是完美的軟體。這不能算是錯誤,只是使用者介面的問題,但是... 你可能不小心把三個視窗其中一個或兩個關掉,然後不知道怎麼再叫回來,所以可能沒辦法正常工作。放心,只要到Options - Restore Main Window,它就會還原視窗的排版。


現在我們終於也可以看到glossary視窗,而它好像也有意見。OmegaT可以使用一個詞庫,一個簡單的辭典。這種檔案原則上是簡單的文字檔,每一行有一個原語言的詞跟一個目標語言的詞,中間用tab隔開,像這樣:


這種檔案的名稱可以自己定,但是副檔名要用"utf8"。如果你把這個相當小的詞庫跟上面glossary視窗的建議,還有剛要翻的句子比較的話,你應該會發現軟體沒有提到bricks的翻譯。原因很簡單:我的詞庫裡面只有單數的brick,但是句子裡面有復數的bricks。所以,最好要注意這一點。(雖然你的母語不會特別分...)

我當然可以中間停,把軟體跟電腦關掉。下次啟動OmegaT我只需要開之前的方案,它就會告訴我每一個文件的進度:


翻完一個文件,你要到Project - Create Translated Documents,軟體就會在目標語言的目錄(target)裡輸出目標語言的文件。原來的文件一樣還在source目錄裡面,沒有被改過。

這樣好用吧!而且,你不用花幾萬塊的錢...

2008-04-07

翻譯軟體: 翻譯記憶 (Translation memory)

在台灣,如果有人提到“翻譯軟體”,大部分的人應該會想到一個軟體:Dr. Eye。它不錯 - 當一個辭典。而它就是一個辭典,電子化的辭典。我幾年前也用過,那時候發現技術方面(例如電子)的詞還蠻多,蠻正確。

當一個電腦上的電子辭典,Dr. Eye可以提供一些“方便”:自動地把文章的詞翻成另一個語言。因為有這個方便,一些教翻譯的老師們好像不太喜歡Dr. Eye。他們覺得,這樣不是學生翻的。不過,Dr. Eye也只是一個方便一點的辭典,它沒有辦法取代人。

在我的周邊,不少人(老師們跟學生們都一樣)雖然不這麼認為。他們覺得只要有一個“比較好的翻譯軟體“,就會變成一個很勵害的翻譯!夢想... 如果真的可以,那為什麼還要教筆譯?電腦技術還沒有那麼發達。如果你自己不行,你用什麼軟體也沒有關系。

但是(電子)辭典不是唯一對翻譯(還是該說“筆譯”?)有用的軟體。我認為更重要的是“翻譯記憶”(Translation Memory)。你的老師沒有提過這種東西?Hmm,(在台灣)教微控制器的老師們好像也比較少會提到8051之外(例如AVR、 MSP系列)的晶片。不過,我現在跟你介紹這個東西,然後你自己決定要不要用。

翻譯記憶不會讓你覺得自己突然變成超人。如果我不懂一個詞,我可以查辭典,它會告訴我另一種語言的版本。所以,我突然“知道”一件之前不知道的事情。不太懂的人當然根本不會發現辭典剛給他的版本完全不對,他還是有“超人感”。翻譯記憶不會這麼騙你。

如果你想用翻譯記憶,你必須在這個軟體裡面翻你的文章。一開始,你不會發現任何好處或幫助,但是軟體一直在學。它會記錄你翻的每一個句子 - 原語言跟目標語言。然後,它一直會比較你目前翻的句子會不會比較像它之前記錄過的句子。

如果軟體發現比較像的句子(平常也會告訴你像百分之幾),它會提醒你之前有翻過的句子跟翻譯版。你現在可以自己判斷要手動“模仿”同樣的部分,然後把不同的地方再翻或者用軟體提到的句子直接取代目前的句子 - 而後來修改可能需要修改的地方。

你用這種軟體越久,它越有幫助。它會“學”你的風格:你翻錯,它也“學錯”。不過,不用但心,你後來當然還可以教它正確的版本。那為什麼我會覺得這種軟體對筆譯重要?它不會做你自己不會做的,但是它會讓你的工作越來越輕鬆。

而且,如果你要翻同樣題目的文章(不管是技術文件或小說系列),軟體會知道你之前把一些“特殊“(也需在辭典裡根本找不到)的詞、詞組或句型翻的如何,所以你這次可以用提同樣的方法。如果你真的了解翻譯,你應該知道需多時候可以用幾種方式翻。翻譯記憶幫你避免每次在目標語言用不同的版本。

你現在可能問為什麼這種軟體要處理完整的句子,而不是像Dr. Eye跟你提每一個你之前翻過的詞。原因很簡單:不管是口譯或筆譯,我們翻的不是一個一個詞,做翻譯的時候我們把人在一種語言表現的意思轉到另外一種語言。在目標語言我們可能要用不同的詞,甚至完全不一樣的句型,重要的是意思。而最小的,提供比較明確意思的單位是句子。

講了這麼多,我好像還沒有提出任何具體的軟體。好吧:如果你有錢,或者你真的要靠筆譯生活,你可以考慮買Trados。很多“專業”的筆譯在用它,但是它真“不便宜”。在台灣,我聽過超過五萬的報價,包含教育訓練。而對“社會組”的人來講,不要花教育訓練的錢,你也不用花軟體的錢 - 你不會知道怎麼正確使用它。

不過,這個軟體不管多好,它還是有一些限制:你必須用Windows,你必須用Word。雖然很多“社會組”的成員因為不太了解技術相關事情,所以就用廣告叫他們用的軟體(Windows跟Word),所以還有另外一些這方面的軟體:Wordfast (shareware)跟Wordfisher (freeware),但是我還是比較喜歡不會那麼限制我的軟體。

如果你想用免費、公開、多平台的軟體,你可以參考OmegaT。它是獨立的軟體,可以處理幾種檔案格式。如果你想多了解它,你可以自己摸摸看,或者等我下一篇文章寫完...