《多語編輯器》使用者指南

5. 編輯檔案總管中的文字檔 內容表 7. Unicode 相關轉換
 

6. 智慧型高精度簡繁體轉碼


6.1 行業領先的智慧型高精度簡繁體轉碼引擎
6.2 剪貼簿轉碼、編輯區轉碼、檔案轉碼和站台轉碼
6.3 GBK 大碼表內的「簡」「繁」體互轉
6.4 實現 Unicode「簡」「繁」體互轉
6.5 智慧詞彙修正
6.6 如何利用《多語編輯器》實現完美品質轉碼
6.7 《簡繁大師》
 

6.1 行業領先的智慧型高精度簡繁體轉碼引擎
精致工作室致力於實現高品質的簡繁體轉碼。現在,使用者已經可能利用《多語編輯器》針對指定工作實現專業品質的簡繁體轉碼工作。

 

精致工作室投入大量精力以提高轉碼引擎的精度。透過各種特別設計的流程及私人程式對 GBK 碼表、GB2312 碼表及 Big5 碼表進行逐字審核,參考了多種相關標準,並透過海量當代文字資源反覆校對,以確保轉碼準確合理。根據我們的內部測試,當前版本的《多語編輯器》在 GBK 碼表、GB2312 碼表及 Big5 碼表的轉碼準確性已分別處於行業領先水平。除了品質優異的內核字庫,《多語編輯器》具體目前最先進的詞彙修正技術,提供一系列精心設計形成的詞彙修正庫,並針對不同轉碼工作提供修正包管理體系。使用者透過詞彙修正包可以輕鬆地為指定轉碼工作組態專門的簡繁體轉碼方案,其轉碼品質可以達使用者對轉碼軟體的最高期望——完美。與此相關的進一步細節請參考 6.5 智慧詞彙修正

 

《多語編輯器》的轉碼引擎經過特別最佳化,轉碼速度在同類軟體中相對比較快。實際作業中,轉碼速度與您所用電腦效能,以及用到的詞彙修正庫中詞條量有關。

 

6.2 剪貼簿轉碼、編輯區轉碼、檔案轉碼和站台轉碼
從 1.1 版起,《多語編輯器》提供全系列簡繁體轉碼(GBK<->Big5)服務,包括剪貼簿轉碼、編輯區轉碼以及檔案和站台轉碼。其中進行編輯區轉碼時,除了可以進行 GBK 和 Big5 的互轉,還可以實現 GBK 大碼表內部的「簡」「繁」體互轉。

 

 

圖 UG-6-1 全部轉碼功能均可在「轉碼」子功能表下找到。

 

 

圖 UG-6-2 源工具列上的編輯區轉碼按鈕

 

剪貼簿轉碼

剪貼簿轉碼功能對記憶體中的文字進行轉碼。剪貼簿轉碼的速度很快,100 KB 以下的文字轉碼瞬間即可完成。如果您對 100 KB 以上的記憶體文字進行轉碼,速度也很快,不過《多語編輯器》將彈出一個進度欄即時顯示轉碼進度。

 

 

圖 UG-6-3 對 100 KB 以上的字元進行剪貼簿轉碼或編輯區轉碼時,您可以看見一個轉碼進度欄

 

編輯區轉碼

編輯區轉碼功能可實現文字的視覺化轉碼。您可以設定將源編輯區內的文字進行自身轉碼,轉碼結果將仍在源編輯區內顯示;也可以設定將轉碼結果顯示在目的編輯區。多數情況下,建議您將轉碼結果顯示在目的編輯區中,這樣可以方便地對照檢查轉碼效果,也可以保留源編輯區中的原文。

 

和剪貼簿轉碼一樣,如要轉的字元數超過 100 KB,您將會看見一個進度欄。《多語編輯器》的轉碼引擎本身速度很快,不過如果您要轉的文字字元數比較多,將轉碼結果放入編輯區顯示出來可能會花一些額外的時間。

 

編輯區轉碼,除了可以實現正常意義的簡繁體 (GBK<->Big5)轉碼,還可以實現 GBK 大碼表內部的「簡」「繁」體互轉。進一步資訊請參考 6.3 GBK 大碼表內的「簡」「繁」體互轉

 

 

圖 UG-6-4 編輯區轉碼對源編輯區中的文字進行轉碼。如果編輯區轉碼選項設為「源->源」,轉換結果將寫回源編輯區中;如果設為「源->目的」,結果將寫入目的編輯區。

 

 

圖 UG-6-5 編輯區轉碼結束後,編輯區的文字顯示語言將自動調整,從而可正確顯示轉碼語言。上圖是個繁轉簡的例子。轉碼結束後,源編輯區顯示語言被調整為繁體中文,目的編輯區的顯示語言被調整成簡體中文。

 

檔案/網頁轉碼和站台轉碼

檔案轉碼和站台轉碼使用同一個對話方塊。您可以從轉碼對話方塊功能表下找到「檔案/網站轉碼」指令,也可以透過源工具列上的「檔案/網站簡繁體轉碼」按鈕(圖 UC-5-2 中右邊圈中的按鈕)開啟這個對話方塊。當選擇進行檔案轉碼時,對話方塊中的選項和提示資訊是針對檔案轉碼的選項和提示資訊。進行站台轉碼時,對話方塊中的選項和提示資訊則為針對站台轉碼的選項和提示資訊。

 

1. 檔案/網頁轉碼

如您將「轉換物件」設為「一個檔案」時,您看到的是針對檔案轉碼的設定資訊。

 

如您選擇「轉換結果另存新檔」,目的檔案必須與原始檔不同,這種選項可以保護您的原始檔不會被無意中覆寫。如果不選擇「轉換結果另存新檔」,轉換結果將寫入原始檔。

 

您可以按一下右邊的檔案圖示檢視原始檔或轉換結果。

 

如您對一個網頁檔案進行繁->簡轉碼時,《多語編輯器》將會把轉換結果網頁的語言內容改為簡體中文。如您將一個簡體中文網頁轉換成繁體中文,《多語編輯器》也會將轉換出的繁體中文網頁的語言內容設為繁體中文。

 

 

圖 UG-6-6 檔案轉碼介面

 

2. 站台轉碼

站台轉碼就是資料夾轉碼。之所以稱之為站台轉碼,是因為站台轉碼常見的應用場合是對一個網站進行整體簡繁體轉碼。

 

當您將轉換物件設為「一個網站」時,對話方塊將顯示針對站台轉碼的選項和提示資訊。

 

如您選擇「轉換結果另存新檔新網站」,目的網站必須為一個不存在的待建資料夾,或一個沒有內容的空資料夾。這樣可以確保您不會無意破壞一個現有資料夾中的內容。如您將轉換結果另存新檔新網站的話,可以選擇讓《多語編輯器》將無需轉換的非文字檔同時複製到新資料夾下的相應位置。這些非文字檔往往也是網站的必要組成部分,如圖片、壓縮檔案或其它網頁中提供了連結的資源。

 

按一下路徑編輯方塊右側的資料夾圖示,可以檢視源網站或轉換結果(轉碼完成後可檢視)的資料夾結構。

 

新網站下全部網頁檔案的語言內容將被自動改為目的碼。如下圖中進行了站台繁體轉簡體,轉換完成後,「F:\lanlib1\big5 lanlib gbk」資料夾下網頁檔案的語言內容將自動由原來的繁體中文 (Big5)改為簡體中文(gb2312)。

 

 

圖 UG-6-7 站台轉碼介面

 

 

圖 UG-6-8 正在進行站台轉碼。上例中在 Windows 98 下對一個 40 MB 左右的網站進行轉碼,花了大約 6 分左右完成。如果您在 Windows 2000 下進行同樣的轉碼,速度可以快得多。進行站台轉碼時,主程式標題將會即時顯示轉碼狀態。如果您對一個大型網站進行轉碼時,就可以一邊做其它工作,一邊可從工作列上看見轉碼狀態。如您想終止轉碼,可按一下轉碼對話方塊中白圈所示按鈕。

 

6.3 GBK 大碼表內的「簡」「繁」體互轉
GBK 大碼表內建了一整套「繁體」字。《多語編輯器》提供了「GBK 簡體轉繁體」或「GBK 繁體轉簡體」功能,幫助您實現 GBK 表內的簡繁互轉。

 

6.4 實現 Unicode「簡」「繁」體互轉
《多語編輯器》沒有提供專門的 Unicode 簡繁互轉指令。不過您可以透過組合指令實現些功能。

剪貼簿 Unicode 簡轉繁:

1. 剪貼簿轉碼:Unicode->ANSI(簡體中文)

2. 剪貼簿轉碼:GBK->Big5

3. 剪貼簿轉碼:ANSI(簡體中文) -> Unicode

 

剪貼簿 Unicode 繁轉簡:

1. 剪貼簿轉碼:Unicode->ANSI(繁體中文)

2. 剪貼簿轉碼:Big5->GBK

3. 剪貼簿轉碼:ANSI(繁體中文) -> Unicode

 

關於 Unicode 相關轉碼的介紹,請參考 Unicode 相關轉換

 

6.5 智慧詞彙修正
《多語編輯器》提供智慧詞彙修正功能,可以進一步提高轉碼精度。

 

經過詞彙修正的轉碼效果要比沒有經過詞彙修正的轉碼效果好得多。

1. 部分簡體字如「製」-「制度」、「複製」,在繁體中文中根據使用環境不同,可將對映到不同的繁體字,如「制度 複製從繁體向簡體轉碼時也時有這樣的情況出現。如繁體中的「」-「你看著我著作,在簡體中文裡就是你看著我著作

2. 現代漢語中的一些新名詞和日常用法,在簡繁體中也往往有所不同。如英文的 modem(上網用的「貓」),在簡體中文中的正式名稱是「數據機」,在繁體中文中,則稱之為「資料機」。

透過詞彙修正技術可以實現以上轉碼要求。除實際的詞彙差異外,您也可以合理利用詞彙修正技術在合適的時間對您想改的任何內容進行調整。

 

 

圖 UG-6-9 按一下「轉碼」子功能表下「詞彙修正」指令,可以開啟詞彙修正主介面。頂端的清單和按鈕組可用於詞彙修正包的管理(新增、移除、編輯、套用等)。左下角說明按鈕旁的 4 個按鈕可用於實現詞彙修正庫的融合、有效性檢查/錯誤自動修正,及在一個或所有庫中搜尋指定詞彙。右下角的按鈕組可用於詞彙修正庫的管理。當你把滑鼠放在任何一個元件上時,最底端的狀態列中可以顯示相關說明。

 

 

圖 UG-6-10 編輯詞彙修正庫。您可以在此編輯語彙修正庫。只有當您選擇「套用本庫」時,轉碼時才會呼叫這個庫。如果此詞庫內碼與當前作業系統內碼不一致時,可能無法正確顯示,但選中條目的兩個詞可以在清單上的編輯方塊中正確顯示出來。如果您不喜歡這樣一個詞一個詞進行編輯,您可以按一下清單右側圈中的檔案圖示,新開一個《多語編輯器》對這個庫內的內容進行全文編輯。全文編輯應在本對話方塊開啟時進行,全文編輯結束並儲存變更結果後,《多語編輯器》會提示您可用全文編輯的結果取代當前庫。和圖 UG-6-9 所示一樣,您也可以在此對話方塊中對進行有效性檢查,只不過這裡僅對當前庫檢查/修正。打勾的按鈕可幫助您發現錯誤時自動修正錯誤,或指導您修正錯誤。

 

詞彙修正庫共有兩組 - 一組繁體庫用於簡轉繁時的修正,一組簡體庫用於繁轉簡時的修正。

 

《多語編輯器》安裝後,將為每組庫提供 3 套系統庫,另加幾個自訂專業庫。

 

您不能移除系統庫,但可以編輯它。不過如果您不是這一行的專家,建議您不要動它。下面對這些庫作簡要說明:

 

系統庫:

基礎庫: 基礎庫對不同語境下的單字進行修正。本庫是 GBK 和 Big5 碼表間詞彙修正的核心。基礎庫對簡繁體間一對多的問題進行修正。

習慣用語修正基本庫: 由於幾十年的分隔和缺乏交流,兩岸對一些相同或相似的事物或行為採用了不同的詞彙加以描述。如大陸所稱的「軟體」,「硬體」,在港台一般稱之為「軟體」,「硬體」。本庫收錄這種存在差異的詞彙中的常見詞。它提供簡繁體間不同習慣用語的對應表。

習慣用語修正基本庫 2: 對習慣使用者修正基本庫未能修正的詞彙進行補充修正。

最終修正庫: 同時使用多個庫時,理論上可能存在極少量意想不到的情況————可能某一庫中一個待修正詞,或它的一部分在修正前已經被另一個庫,或本庫前面的一個詞取代了;或修正後又被本庫後面的詞或後面庫中的某一詞取代或取代了一部分,致使少量修正要求未能正確實現。請把本庫放在庫清單的最後,並在其中新增相關條目,對你發現的這種意外情況進行最終修正。

最終修正庫 2: 對最終修正庫未能修正的詞彙進行補充修正。

最終修正庫 3: 對最終修正庫 2 未能修正的詞彙進行補充修正。

 

自訂庫:

IT 庫: 提供 IT 行業專業詞彙的修正。

IT2 庫: 對 IT 庫未能修正的詞進行補充修正。

Windows 庫: 對 Microsoft Windows 中特有的詞進行修正。

Windows2 庫: 對 Windows 庫未能修正的詞進行補充修正。

Network 庫: 對網路相關的詞進行修正。

Network2 庫: 對 Network 庫未能修正的詞進行補充修正。

 

自訂最終修正庫:

HongKong 庫: 香港地區繁體使用者的語言習慣與台灣略有不同,本庫針對香港使用者的習慣提供附加修正。

 

使用者需要注意的一點是,詞彙修正庫的應用順序是按表 UG-6-9 中所示從上向下順序套用。如您發現某一個庫引發了什麼問題,您可以在它下面的庫中進行更正。

 

6.6 如何利用《多語編輯器》實現完美品質轉碼
透過合理利用包管理功能,即可輕鬆實現完美或基本完美的簡繁體轉碼。

 

普通轉碼工作

對於普通的轉碼工作,請套用「預設包」。對於與 IT 相關的轉碼工作,請套用「IT」包。即可對大多數轉碼工作實現專業品質轉碼。

 

專業轉碼工作

實現完美品質轉碼的關鍵在於兩點:

1。為每一項重要的轉碼工作特別建立一個私人修正包。利用此包將您為此工作所做的庫選配和修正設定儲存下來,統一管理。調配好這個包後,您需要為此工作進行轉碼時,只需套用此包即可實現專業品質的轉碼。

2。在此包內,針對您的工作為 GBK 和 Big5 轉碼需求分別組態 1-2 級自訂最終修正庫。

 

其它建議:

1。熟悉併合理利用《多語編輯器》《多語編輯器》安裝套件中提供的系列修正庫:

a) 瞭解這些庫(分 GBK 和 Big5 兩組,每組包括 6 個系統庫,幾個主題自訂庫,幾個主題最終修正庫)是做什麼的。

b) 一般情況下,請套用全部 6 個系統庫。預設情況下它們都被設為套用,不要隨意關掉它。

c) 如果您要對 IT 類的文獻進行轉碼,請套用簡體 IT 庫和繁體 IT 庫。IT 庫的的詞彙均經過仔細調研,可以較好地對 IT 類檔案進行修正。如果轉碼的物件不是 IT 類文獻,沒有必要套用 IT 類庫。

d) 安裝套件中還有幾個自訂最終修正庫,如有需要,也可選用。

2。一般情況下,建議不要變更系統庫或我們提供的其它修正庫。如您需要新增自訂修正詞條,建議新增在自訂最終庫中,這樣《多語編輯器》的引擎升級後,您的庫不會受到影響,並便於於維護。

3。合理利用您的自訂最終修正庫:

a) 您可在此存放您為您的工作特別修訂的修正詞對。如果一級修正未能達到目的,可以在二級庫中進行補充修正。

b) 可以自訂字串對對簡繁體站台中的不同連結進行修正。如簡體庫中的許多連結是「...\gb2312\abc.htm」,而到了繁體中變成「...\big5\abc.htm」,您可以在您的自訂修正庫中加一條「\gb2312\」->「\big5\」,即可以在轉碼過程中直接對其進行變更,而不必在轉碼結束後再手工調整。

 

6.7 《簡繁大師》
對於普通要求的簡繁轉換,《多語編輯器》可能滿足得很好。不過如果您需要經常進行專業水平的簡繁轉換,建議您使用我們的私人產品《簡繁大師》,《簡繁大師》集中了我們最高品質的簡繁轉換資料和技術。 該軟體的首頁是:

 

《簡繁大師》:http://www.speedy7.com/cn/stguru/index_cht.html