简繁大师(STGuru)主页

 

 

精致甲、乙版《红楼梦》电子书

 

为 GBK、Big5 特别度身订制,并经反复修订,方便纯文本阅读

 

下载

 

《红楼梦》(精致甲版)

《红楼梦》(精致乙版)

《红楼梦》简繁转换专用包

GBK 编码纯文本简体中文版(约 1 MB)

GBK 编码纯文本繁体中文版(约 1 MB)

Big5 编码纯文本繁体中文版(约 1 MB)

精排版 PDF 简体中文版(约 3 MB)

精排版 PDF 繁体中文版(约 3 MB)

GBK 编码纯文本简体中文版(约 1 MB)

GBK 编码纯文本繁体中文版(约 1 MB)

Big5 编码纯文本繁体中文版(约 1 MB)

精排版 PDF 简体中文版(约 3 MB)

精排版 PDF 繁体中文版(约 3 MB)

简繁转换专用包(约 10 KB)

请使用《简繁大师》3.3以上版本

 

               * 电子文件可随意发布、下载、传播。
               * 传播时建议保留文件中的版本说明供查阅与识别。
               * 未经修订者同意,不得将此版本用于商业用途。
 

简介

 

 

我们从网络上搜集了一些《红楼梦》的简繁体纯文本版本,试图进行简繁转换测试与研究,结果发现网络上尚无可以完美兼容 Big5 编码的繁体中文版。在网上找到的繁体版或者多处缺字(显示为方框或空白,甚至直接就没了),或者大量采用非 Big5 编码字符,而后者也同样有少量缺字。这两类繁体版给习惯于使用 Big5 编码的繁体中文用户阅读红楼梦带来了困难。

 

出现这一问题,一方面是因为红楼梦成书于清代中期,书中大量采用清代的文字描述当时的社会风物,同时也大量引用古代经典轶事、诗歌词文,将它的笔触发散到整个中国古代文化中去。如此宽厚的信息承载,让收字量有限的 Big5 编码集难以承受;另一方面,也许正因为此原因,港台的红楼梦研究者或许是担心破坏红楼梦用字的准确性与完整性,或者是感到此任务过于纠结困难,也未曾专门编订过一个全面兼容 Big5 字符集的繁体版红楼梦。

 

作为游走于简繁体间的纯文本软件产品的研究者与开发者,我们决定承担此责任,编制出能安全兼容 Big5 编码的繁体版。我们基于网上找到的一个繁体版(由台大中文系徐富昌教授发布)和一个简体中文版(出处已无从查考),参考了大量文献,通过电脑、人脑结合的方式进行了大量修订,编制出两套纯文本简繁体版本。版本修订说明如下:

 

 

版本及转码包

 

 

由于两套参考版本在文字细节上有大量出入(基本每行字都有些区别),故并未合并为一套,而是分别修订,最后仍编订出两个版本,分别命名为:

 

1)“精致甲版”(Anasoft A)

2)“精致乙版”(Anasoft B)

 

每套又各含 5 个简繁体版本:

 

3 个纯文本版:GBK 简体中文版、GBK 繁体中文版、Big5 繁体中文版

2 个 PDF 版,均进行了精心排版:PDF 简体中文版、PDF 繁体中文版

 

您可使用我们提供的“红楼梦转码专用包”(Red Mansions (Anasoft))在每套的三个纯文本版本间相互转换。

此转换包要求采用《简繁大师》3.3(2010年9月)以上版本,才可获得完美品质。甲乙两套版本共用此转码包。

 

 

修订的过程与内容

 

 

包括电脑修订在内,两个版本各自作了数千处文字上的修订。修订工作包括:

 

1)使繁体版完全兼容 Big5 编码集,只采用 Big5 编码集中的字符

将繁体版中原有的简体字改为对应的繁体字;将虽非简体,但也未被 Big5 编码集收录的一些罕见字(有些只收录于 GBK 编码集中,有些甚至只知其形,但连 GBK 编码集也未收录)改为 Big5 编码集中的异体字、同义字、近义字或形似字;有些字在 Big5 编码集中连相似字也找不到,就以描述的方式替代,如“一味的床(原字為左口右床)酒”。

 

2)使简体版完全兼容 GBK 编码集,只采用 GBK 编码集中的字符

由于 GBK 编码集比 Big5 编码集大40%左右,所以此工作容易些。但仍有些罕见字在 GBK 编码集中也未见收录,则采用了异体字、同义 字、近义字或形似字,或以描述的方式替代,如“一味的床(原字为左口右床)酒”。

 

3)用字规范化

将一些不规范的用字改为规范用字,主要是一些词有时以规范形式出现,有时以不规范形式出现,则统一采用规范繁体或简体。如繁体“酒肴”->“酒餚”、“游戲”->“遊戲”等。对于一些总以某种形式出现的“非规范”(相对于现代习惯而言)用法,则可能适当保留未作修订。

 

4)修订错别字

修订时如发现原稿中存在明显的错别字、错用的标点符号,则尽量改了过来。

 

5)其他修订

如内容缺失、重复、乱码、段落篇章格式不统一、特定名称的写法不统一、使用了半角数字/字母/标点(改为中文全角字符)、空格/标点/换行/版面随意、不统一、不优雅,等等。

 

6)编制简繁转换包、编制多个版本

在以上基本编辑修订的基础上,又制作了《红楼梦》简繁转换专用包,反复测试,确保基于甲版繁体原始版转换而成的简体版及基于乙版简体原始版转换而成的繁体版的品质达标,且转换版再经一次转换可以 100% 转回原版。 通过此方式为每套制全了 GBK 简体、GBK 繁体和 Big5 繁体共三个纯文本版本。

 

基于简体中文纯文本版制作了简体中文 Word 版(.doc)。对该版进行了精致排版。通过《简繁大师》的 Word 简繁转换功能进而制作出繁体中文 Word 版。基于简繁两套 Word 版,使用 Acrobat Professional 制作了简繁体 PDF 版。

 

7)手段、工具、资源及过程

一直采用简繁大师,并制作了红楼梦专用转换包。 在制作及反复测试红楼梦专用简繁转换包的过程中对简繁大师的内部核心字库进行了地毯式全覆盖复检及修补,从而确保转换具有最高品质。此外,采用了简繁大师自带的多种工具(重复行(冗余行)检测、字频统计、批量替换、上下区文本差异检查、中文文本清理宏)、一些特别定制的编辑/检测/转换/处理内部程序、第三方专业软件、一些专业的汉字检索研究网络资源、参考了网上的多种红楼梦版本及相关资源,并就一些细节问题向一些红楼梦爱好者进行了专门的咨询。停停续续,历时凡七个月。

 

 

如有疑问,请联系:service@speedy7.com