簡繁大師(STGuru)首頁

 

 

精緻甲、乙版《紅樓夢》電子書

 

為 GBK、Big5 特別度身訂製,並經反覆修訂,方便純文字閱讀

 

下載

 

《紅樓夢》(精緻甲版)

《紅樓夢》(精緻乙版)

《紅樓夢》簡繁轉換私人包

GBK 編碼純文字簡體中文版(約 1 MB)

GBK 編碼純文字繁體中文版(約 1 MB)

Big5 編碼純文字繁體中文版(約 1 MB)

精排版 PDF 簡體中文版(約 3 MB)

精排版 PDF 繁體中文版(約 3 MB)

GBK 編碼純文字簡體中文版(約 1 MB)

GBK 編碼純文字繁體中文版(約 1 MB)

Big5 編碼純文字繁體中文版(約 1 MB)

精排版 PDF 簡體中文版(約 3 MB)

精排版 PDF 繁體中文版(約 3 MB)

簡繁轉換私人包(約 10 KB)

請使用《簡繁大師》3.3以上版本

 

               * 電子檔可隨意發佈、下載、傳播。
               * 傳播時建議保留檔案中的版本說明供查閱與辨識。
               * 未經修訂者同意,不得將此版本用於商業用途。
 

簡介

 

 

我們從網路上蒐集了一些《紅樓夢》的簡繁體純文字版本,試圖進行簡繁轉換測試與研究,結果發現網路上尚無可以完美相容 Big5 編碼的繁體中文版。在網上找到的繁體版或者多處缺字(顯示為方塊或空白,甚至直接就沒了),或者大量採用非 Big5 編碼字元,而後者也同樣有少量缺字。這兩類繁體版給習慣於使用 Big5 編碼的繁體中文使用者閱讀紅樓夢帶來了困難。

 

出現這一問題,一方面是因為紅樓夢成書於清代中期,書中大量採用清代的文字描述當時的社會風物,同時也大量引用古代經典軼事、詩歌詞文,將它的筆觸發散到整個中國古代文化中去。如此寬厚的資訊承載,讓收字量有限的 Big5 編碼集難以承受;另一方面,也許正因為此原因,港台的紅樓夢研究者或許是擔心破壞紅樓夢用字的準確性與完整性,或者是感到此工作過於糾結困難,也未曾專門編訂過一個全面相容 Big5 字集的繁體版紅樓夢。

 

作為遊走於簡繁體間的純文字軟體產品的研究者與開發者,我們決定承擔此責任,編制出能安全相容 Big5 編碼的繁體版。我們基於網上找到的一個繁體版(由台大中文系徐富昌教授發佈)和一個簡體中文版(出處已無從查考),參考了大量文獻,透過電腦、人腦結合的方式進行了大量修訂,編制出兩套純文字簡繁體版本。版本修訂說明如下:

 

 

版本及轉碼包

 

 

由於兩套參考版本在文字細節上有大量出入(基本每行字都有些區別),故並未合併為一套,而是分別修訂,最後仍編訂出兩個版本,分別命名為:

 

1)「精緻甲版」(Anasoft A)

2)「精緻乙版」(Anasoft B)

 

每套又各含 5 個簡繁體版本:

 

3 個純文字版:GBK 簡體中文版、GBK 繁體中文版、Big5 繁體中文版

2 個 PDF 版,均進行了精心排版:PDF 簡體中文版、PDF 繁體中文版

 

您可使用我們提供的「紅樓夢轉碼私人包」(Red Mansions (Anasoft))在每套的三個純文字版本間相互轉換。

此轉換包要求採用《簡繁大師》3.3(2010年9月)以上版本,才可獲得完美品質。甲乙兩套版本共用此轉碼包。

 

 

修訂的過程與內容

 

 

包括電腦修訂在內,兩個版本各自作了數千處文字上的修訂。修訂工作包括:

 

1)使繁體版完全相容 Big5 編碼集,只採用 Big5 編碼集中的字元

將繁體版中原有的簡體字改為對應的繁體字;將雖非簡體,但也未被 Big5 編碼集收錄的一些罕見字(有些只收錄於 GBK 編碼集中,有些甚至只知其形,但連 GBK 編碼集也未收錄)改為 Big5 編碼集中的異體字、同義字、近義字或形似字;有些字在 Big5 編碼集中連相似字也找不到,就以描述的方式取代,如「一味的床(原字為左口右床)酒」。

 

2)使簡體版完全相容 GBK 編碼集,只採用 GBK 編碼集中的字元

由於 GBK 編碼集比 Big5 編碼集大40%左右,所以此工作容易些。但仍有些罕見字在 GBK 編碼集中也未見收錄,則採用了異體字、同義 字、近義字或形似字,或以描述的方式取代,如「一味的床(原字為左口右床)酒」。

 

3)用字規範化

將一些不規範的用字改為規範用字,主要是一些詞有時以規範形式出現,有時以不規範形式出現,則統一採用規範繁體或簡體。如繁體「酒肴」->「酒餚」、「游戲」->「遊戲」等。對於一些總以某種形式出現的「非規範」(相對於現代習慣而言)用法,則可能適當保留未作修訂。

 

4)修訂錯別字

修訂時如發現原稿中存在明顯的錯別字、錯用的標點符號,則盡量改了過來。

 

5)其他修訂

如內容缺失、重複、亂碼、段落篇章格式不統一、特定名稱的寫法不統一、使用了半形數字/字母/標點(改為中文全形字元)、空白/標點/換行/版面隨意、不統一、不優雅,等等。

 

6)編制簡繁轉換包、編制多個版本

在以上基本編輯修訂的基礎上,又製作了《紅樓夢》簡繁轉換私人包,反覆測試,確保基於甲版繁體原始版轉換而成的簡體版及基於乙版簡體原始版轉換而成的繁體版的品質達標,且轉換版再經一次轉換可以 100% 轉回原版。 透過此方式為每套製全了 GBK 簡體、GBK 繁體和 Big5 繁體共三個純文字版本。

 

基於簡體中文純文字版製作了簡體中文 Word 版(.doc)。對該版進行了精緻排版。透過《簡繁大師》的 Word 簡繁轉換功能進而製作出繁體中文 Word 版。基於簡繁兩套 Word 版,使用 Acrobat Professional 製作了簡繁體 PDF 版。

 

7)手段、工具、資源及過程

一直採用簡繁大師,並製作了紅樓夢私人轉換包。 在製作及反覆測試紅樓夢私人簡繁轉換包的過程中對簡繁大師的內部核心字庫進行了地毯式全覆寫複檢及修補,從而確保轉換具有最高品質。此外,採用了簡繁大師自帶的多種工具(重複行(冗餘行)偵測、字頻統計、批量取代、上下區文字差異檢查、中文文字清理巨集)、一些特別自訂的編輯/偵測/轉換/處理內部程式、協力廠商專業軟體、一些專業的漢字檢索研究網路資源、參考了網上的多種紅樓夢版本及相關資源,並就一些細節問題向一些紅樓夢愛好者進行了專門的諮詢。停停續續,歷時凡七個月。

 

 

如有疑問,請聯絡:service@speedy7.com