|
|
|
| |
|
谷歌輔助翻譯系統(tǒng) Google Translator Toolkit 使用指南
谷歌輔助翻譯系統(tǒng)簡介
2009年6月,Google 公司發(fā)布了在線計算機輔助翻譯平臺(Online Computer Aided Translation System):Google Translator Toolkit(以下簡稱GTT)。這是繼嵌入式CAT、獨立式CAT之后的一個比較成熟的在線CAT系統(tǒng)。
GTT的鏈接是: http://translate.google.com/toolkit
從外表來看,GTT秉承了 Google 產(chǎn)品一貫的簡單實用風格,管理界面一目了然,GTT采用左右布局,功能鍵位于上方,見下圖:
谷歌輔助翻譯系統(tǒng) Google Translator Toolkit的管理界面
左側(cè)的控制欄分別是:
All translations(翻譯件) Active(活躍文件) Hidden(隱藏文件) Trash(垃圾桶) Shared with...(分享)
All translation tools(翻譯工具) Translation memories(翻譯記憶) Glossaries(術語) 如下圖所示:
GTT支持從英文到其他50多種語言的翻譯。這個平臺整合了谷歌翻譯(Google Translate)、所見即所得(WYSIWYG)編輯器、開放的評定系統(tǒng)、分享系統(tǒng)、維基百科以及Knol。
目前,GTT的翻譯件支持一些常見的文件類型,包括:網(wǎng)頁文件HTML (.html), Word文件 (.doc), Openoffice文件 (.odt), 文本文件 (.txt), 富文本文件(.rtf)格式,文件的大小限制在1MB之內(nèi)。
GTT的翻譯工具主要是翻譯記憶工具(Translation memories)和術語工具(Glossaries),輔助工具是Google原有的機器翻譯工具(Google Translate)和詞典(Dictionary)。 在翻譯過程中,如果打開Toolkit(快捷鍵Ctrl+O), 這四個工具都會顯示在屏幕下方,對譯者進行提示,其中:
1). Translation Search Results(翻譯搜索結(jié)果)是搜索翻譯記憶的結(jié)果。 2). Glossary(術語)是搜索術語庫的結(jié)果。 3). Computer Translation(機器翻譯結(jié)果)是Google Translate自動翻譯的結(jié)果。 4). Dictionary(詞典)可供譯者查詞。
GTT翻譯界面見下圖:
谷歌輔助翻譯系統(tǒng) Google Translator Toolkit的翻譯界面
谷歌輔助翻譯系統(tǒng)入門
1.準備翻譯術語庫 GTT的一個術語庫支持多種語言,且支持詞性和釋義。GTT術語庫的制作步驟由google來完成,需要譯者做的工作只是準備一個csv格式的術語對照文件(小于1MB),然后上傳即可。
GTT對這個csv文件有特定的要求: A. 術語按語言逐列排列 B. csv文件的第一行的區(qū)域代碼必須正確。對于中-英翻譯而言,英文的區(qū)域代碼是en, 簡體中文的區(qū)域代碼是zh-hans。 簡便起見,我們只制作一個簡單的英文-簡體中文的術語表,不標明詞性和釋義,如下圖。
準備安csv文件之后,點擊Glossaries, -> Add,
出現(xiàn)上傳對話框,如下圖,選擇剛才做好的csv文件,上傳后的文件可以重新命名,準備妥當后可點擊Upload glossary。
上傳完畢后,Google也在后臺完成了術語庫的制作,顯示在我們面前的就是剛才命名的那個術語文件,如下圖:
譯者可以選擇把這個文件與其它人共享,如下圖:
2. 準備翻譯記憶庫
GTT支持翻譯記憶交換文件(.tmx),即Translation Memory eXchange文件。文件的大小限制在50MB之內(nèi)。 使用過trados或dejavux的譯者應該對此比較熟悉?梢灾苯訌倪@些CAT軟件中把翻譯記憶直接導出成tmx文件,上傳即可。
不過即使沒有TMX文件也不用害怕,對于那些沒有使用過CAT軟件的譯者,即使沒有tmx文件也可以照常使用GTT。GTT提供了一個“公共翻譯記憶庫”,叫做Global shared TM。我們直接使用這個“公共翻譯記憶庫”即可。
3. 準備待翻譯件 回到GTT的管理界面,點擊“Active”,再點擊”Add”,彈出對話框,如下圖:
選擇要翻譯的文件(test.txt),選擇原文(English)和譯文(Chinese(Simplified)),然后使用Global shared TM和剛才上傳的glossary術語庫,上傳。
準備工作到此結(jié)束,下面開始翻譯
4. 翻譯
在翻譯管理界面下點擊剛才上傳的這個test.txt文件,彈出翻譯界面,如下圖:
在默認的情況下,GTT會先用Google Translate自動把原文翻譯一遍,并把結(jié)果一一對照地顯示在右側(cè)的譯文欄中。如果想修改這一設置,需要點擊右上角的Settings, 在彈出界面中選擇: Pre-fill with machine translation instead of source text(預填入機器翻譯譯文,而不是原文) Pre-fill with source text instead of machine translation(預填入原文,而不是機器翻譯譯文)
在默認的情況下Toolkit不是自動顯示的,需要點擊Show toolkit打開,如下圖。
點擊“Next”翻譯下一句,或點擊“Previous”修訂上面已經(jīng)翻譯過的譯文。譯者也可以直接點擊某一句譯文,進行修訂。
在翻譯過程中,如果想臨時改變TM或glossary,可以點擊右下方的Edit->Properties進行修改。如下圖:
在“視圖(Views)”下可以進行其它操作,如:添加注釋(View->Comments)操作,如下圖:
此外,還可以修改完全匹配的顯示(Gray out exact matches)、隱藏編輯框(Hide edit box)、拖動編輯框及水平或垂直顯示原文和譯文等,如下圖:
在“編輯(Edit)”界面下還可以進行“查找和替換”(Find and replace)操作。如下圖:
下面幾個截圖是打開Toolkit后的四個選項:Translation Search Results(翻譯搜索結(jié)果),Glossary(術語),Computer Translation(機器翻譯結(jié)果),Dictionary(詞典)。
總結(jié)
GTT平臺是一個在線CAT平臺,但是融合了Google的機器翻譯工具(Google Translate)和詞典(Dictionary),譯者可以在同一個界面下完成翻譯、查詞、TM查詢、術語查詢的工作,大大方便了譯者。
GTT平臺具有分享功能,可以讓多名譯者協(xié)同翻譯,有助于團隊協(xié)作,最為重要的是:這種協(xié)作是免費的。對于譯者和小公司而言,這個免費的午餐要比目前的各大CAT生產(chǎn)商Group版動則幾十萬的漫天要價現(xiàn)實得多。
對于翻譯來源,除了本文提到的文件上傳方式以外,譯者還可以直接通過URL地址獲取。此外,GTT還提供了直接從 Wikipedia 和 Knol(Google的百科全書)進行翻譯的功能。后面幾種功能對于真正的譯者而言沒有太大的實用性(因為一名以翻譯為生的人不會花太多時間去做公益事情),但是對于熱于奉獻的Volunteers,實在是不錯的功能。
GTT的“公共翻譯記憶庫”(Global shared TM)讓全世界的翻譯使用同一個翻譯記憶,在譯者之間,你可以使用我的翻譯記憶,我可以利用你的。人人為我,我為人人,不得不說這是一個偉大的創(chuàng)舉。也許曾經(jīng)有許多人、許多公司有過這個想法,但是,真正實現(xiàn)的只有Google。
此外,在“翻譯搜索結(jié)果”(即TM)中,譯者還可以對別人的翻譯結(jié)果進行評價,這也有利于辨別翻譯記憶的質(zhì)量以及Global shared TM的不斷完善。
但是,在驚嘆Google的諸多創(chuàng)新之余,我們又不得不提出來這個online CAT的一些欠缺:
(1). 術語庫方面
A. 術語管理功能過于簡單 GTT提供了術語庫的一些基本維護功能,如添加術語(Upload entries)和搜索術語(Search entries),但是這些功能畢竟過于簡單。如譯者想對其中的一些術語進行修改、或在翻譯界面下(即翻譯過程中)直接從原文和譯文中選定術語添加到術語庫,GTT就無能為力了。
B. 術語無法直接填入到譯文 在翻譯界面中,Toolkit中的Glossary只有提示的作用,但是無法直接填入到譯文(至少我試了多次都沒有成功,無論是雙擊還是右鍵etc.),這一點非常不方便。
(2). 翻譯記憶方面
A. 保密性 剛才提到“公共翻譯記憶庫”確實是一個偉大的創(chuàng)舉,但是同時又涉及到保密問題。在實際翻譯項目中,有很大一部分客戶要求譯者或翻譯公司對其翻譯項目保密,簽署保密協(xié)議。這種項目的翻譯記憶是不能上網(wǎng)的。
B. 質(zhì)量 據(jù)我所知,Google買下了歐盟的翻譯記憶庫,為這個“公共翻譯記憶庫”奠定了大好的基礎。但是,在將來,如果越來越多的人使用這個“公共翻譯記憶庫”,用戶中良莠不齊,如果沒有一支強大、合格、有責任心的譯審隊伍,GTT也無法保證翻譯記憶中的質(zhì)量。
(3). 文件大小限制
GTT的csv格式的術語對照文件不能大于1MB,待翻譯文件不能大于1MB,翻譯記憶交換文件(.tmx) 不能大于50MB。對于專業(yè)譯者而言,一個幾百MB的TM,幾十MB的術語庫,幾十MB的待譯件是完全可能的。特別是遇到大項目需要多人協(xié)同翻譯時,GTT的文件大小限制會成為一個大問題。
這篇文章只是對谷歌輔助翻譯系統(tǒng) Google Translator Toolkit 的使用做一個簡單的介紹,目的是讓更多的人了解這個工具,用起來這個工具,其中還有許多小功能沒有提及。歡迎大家到翻譯中國的論壇(http://www.fane.cn/forum.asp)中討論心得體會?偠灾,Google在在線CAT領域邁出了重要的一步,我們譯者對GTT這種免費的好工具求之不得,愿GTT在將來多做出改進,真正切實地成為在線CAT的No. 1 !~
|
|
| |
|
|
|