《简繁大师》用户指南

8. 调整界面布局 目录 附录 1. 快捷键列表
 

9. 实用工具


9.1 简繁英文本、文件、目录字词统计
    1) 编辑区文本字数统计
    2) 文件/文件夹字词统计
    3) 简繁大师与 Word 在字词统计上的差异
9.2 字频统计
9.3 文本差异检查
9.4 行排序

9.5 冗余行管理

9.6 中英文词汇表管理 - 词条合并、分割、交换等
9.7 从 GBK/Big5/Unicode 汉字转换为十进制/十六进制 Unicode 代码
9.8 简繁英页面清理

9.9 术语管理系统

 

9.1 简繁英文本、文件、目录字词统计
 

此功能可在“工具”菜单下找到。

 

1) 编辑区文本字数统计

 

您可以使用工具菜单下的“字数统计”命令统计当前编辑区中文本的字数,如当前活动编辑区是上区,则将统计上区文本,如当前活动编辑区是下区,则将统计下区文本。如该编辑区中有文本被选中,则将只统计选中部分的数据。

 

统计的数据包括:

1)文件信息:文件路径、创建时间/修改时间/访问时间、各种文件属性(只读/隐藏/存档/系统);

2)字、词、段落、行统计:字符数(全部/ANSI,即文件/文本长度)、字符数(全部,每个全角字符算作一个字符)、字符数(不计空格)、字符数(计空格)、字数(全部)、字数(非中文单词/半角字符)、字数(中文字符和朝鲜语单词)、段落数(指非空自然段的数目)、行数(指所有自然段的数目,包括空行)。

 

统计完成后,用户可以点击对话框右下角的“文本报告”,查看纯文本格式的统计报告。

 

2) 文件/文件夹字词统计

 

点击此命令后,将弹出一个文件/文件夹 统计对话框。您最近统计过的文件或文件夹将显示在路径列表中。您从列表中选择的路径或输入路径编辑框中的路径如果近期统计过,其统计结果将直接显示在统计信息框中。软件自动保留一定天数以内的统计信息,您可以在软件的“工具 > 选项”对话框中设置设置下拉列表中路径数的最大值以及统计数据保留的天数。

 

您可以手工输入、粘贴进路径,可以通过文件/目录打开对话框选择路径,也可以从资源管理器中拖入一个或多个路径进行统计。如您输入的路径已经统计过,则统计数据将会自动显示在统计数据框中,不必再次统计。如您输入的路径为有效路径,输入后,软件会实时检测该文件的编码、语言、文件大小和上次修改时间,并显示在下面的状态栏中。

 

采用拖放方式时,可以一次性拖入多个文件或目录进行统计,多个文件统计完成后,您可以在文件列表的顶部找到这些文件路径,选择任一路径后,相关统计数据即会在下面的统计数据框中显示出来。

 

如果您提交统计的是一个文本文件,将统计该文件,如果提交统计的是一个文件夹,将统计整个文件夹下(包括所有各级子文件夹下)的所有文本文件。非文本文件将被自动略过。

 

统计完成后,将弹出统计结果报告。报告包括每一文件检测到的文件编码、语言、ANSI 字符数(即文件长度)、总字符数(计入回车字符的总字符数,一个中文字符按一个字符统计)、字符数(不计空格)、字符数(计空格)、总字数(即单词数)、字数(非中文单词/半角字符)、字数(中文字符和朝鲜语单词)、段落数(非空自然行)和行数(所有自然行,包括空行)。报告最后提供以上这些统计数据的总计数据。

 

当检测到的语言编码为简体中文(GBK)或英文时,该文件的统计结果将与 Word 简体中文版统计结果一致,而当检测到的语言编码为繁体中文(Big5)时,统计结果将与 Word 繁体中文版统计结果一致。如软件未能检测出语言编码(如文件为 GBK 格式的繁体中文,或简繁体共存,有时会检测不出),将当作简体中文编码(GBK)文件进行统计。

 

如您需要统计的文件分布在硬盘的不同位置,可以将它们复制到同一个指定文件夹下,统一进行统计。

 

3) 简繁大师与 Word 在字词统计上的差异

 

项目 简繁大师 MS Word 说明

字符数(文件长度)

字符数(总字符数,包括回车)

有统计

未统计

 

字符数(不计空格)

字符数(计空格)

字数(全部)

字数(非中文单词/半角字符)

字数(中文字符和朝鲜语单词)

有统计

(结果一致)

简繁大师与相应语言版本 Word 的统计结果一致。

当当前编辑区编码为简体中文时,这些数据与简体中文版 MS Word 的统计结果一致,而在当前编辑区编码为繁体中文时,这些项上的统计结果与繁体中文版 MS Word 的统计结果一致。

段落数

有统计

(结果一致)

“段落数”指未计入空行(仅有空白字符的行也算空行)的自然段落的数目。

行数

简繁大师统计的“行数”指所有自然行,即自然段落(包括空行)的数目。

该“行数”与“段落数”的差别在于“段落数”未计入空行(仅有空白字符的行也算空行),而“行数”则计入了空行。

MS Word 中统计的行数指屏幕上实际显示的行数,即使文本未有任何变化,只要改变显示字体大小或页宽,Word 统计出的行数也会变化。  
其他差异

有时,“同样的”文本在简繁大师和 MS Word 中的统计数据不同。

有时将文本从简繁大师复制到 MS Word 或从 MS Word 复制到简繁大师中,由于两个编辑器编码不同,在这两个方向上的复制+粘贴都可以引起部分字符变化(比如全角变半角,或半角变全角),变化的一般都是些不重要的字符的形态。

由于文本发生了细微的变化,所以统计值不同。

如您来回各复制+粘贴一次,则一般这些差异变化就到了头,此时再统计,你会发现简繁大师和 Word 在字符数、字数和段落数上的统计值是一样的。

 

9.2 字频统计
 

此功能可在“工具”菜单下找到。

 

可以用它分析出一篇文本中出现过的所有字符及每个字符出现了多少次(字频)。字频数据可按自然顺序(即以字符在 Unicode 字符集中的值排序)或按字频正向或倒向排序。

 

字频统计对于经常需要对中文文件进行编辑、校对,高度关注文字品质的人士具有重大帮助。一般中文文件中用到的汉字不到4000个。如选择按自然顺序排序,半角英文的数字、字母和标点率先出现,其后是全角中文,其中字符、常用简体字、繁体字和罕见字又会分区列出。如果您的文件是纯中文文件,如果其中出现半角英文字符或不常用字符、乱码,一眼就能看出。另外,如果通过字频排序,从低频字中很容易发现一些不该出现的字符,错别字往往就在其中。发现可能存在的问题后,可以通过全文查找功能定位错误并加以修改。 您可借此命令对照检查上下区中文本内容的差异,检查结果中将显示有差异行的行号和内容。

 

本功能统计的对象是当前编辑区中的文字。如果光标在上编辑区,统计针对的就是上编辑区中的文本;而如果光标在下编辑区,统计的对象就是下编辑区中的文本。

 

9.3 文本差异检查
 

此功能可在“工具”菜单下找到。

 

您可借此命令对照检查上下区中文本内容的差异,检查结果中将显示有差异行的行号和内容。

 

使用此功能时,上下区语言及字体应一致。如您使用较小的字体,界面调到较宽,可以很容易找出有差异的行。如您将界面调得较窄,则可方便找出具体不同之处。

 

9.4 行排序
 

此功能可在“工具”菜单下找到。

 

使用此命令,可分别对上下编辑区、上下编辑区中的选中内容或剪贴板中的内容按行正向或反向排序。

 

9.5 冗余行管理

 

此功能可在“工具”菜单下找到。

 

本命令可用于分析或删除完全一样的冗余行。

 

作用对象:上下编辑区、上下编辑区中的选中内容,或剪贴板中的内容。

操作:1。分析重复行;2。删除重复行。

 

得到分析结果后,点“详细”,可查看重复行的具体内容和每组重复行中多余行的数目。

 

选择删除冗余行的结果,是对同一组重复行保留第一次出现的行,以后出现的完全一样的行将被删除。

 

9.6 中英文词汇表管理 - 词条合并、分割、交换等

 

本命令有助于按不同形式整理中英文词汇表。

 

作用对象:上下编辑区、上下编辑区中的选中内容,或剪贴板中的内容。

 

整理前的中英文词条可为以下形式:

1)一组中英文词汇排为上下紧邻的两行,可以中文在上英文在下,也可以英文在上中文在下。

2)一组中英文词汇排一行,可以中文在左英文在右,也可以英文在左中文在右。

3)同一行有多组中英文词汇连续排列。

 

整理的结果,也可以是以上几种形式之一。当然,相对于整理前,整理结果可以是以上几形式中不同形式。如整理前是中英文在同一行中连续排列,整理后改为每一组单列一行。也可能整理前一组中英文词汇为一行,其中中文在左,英文在右,而整理后变成英文在左,中文在右等。

 

软件中提供了空格、英文逗号、分号、冒号等几种分隔符。如您所用分隔符与此不同,只需在整理前或整理后进行替换处理即可。

 

9.7 从 GBK/Big5/Unicode 汉字转换为十进制/十六进制 Unicode 代码

 

此功能可以在“工具”菜单下找到,名称是“汉字转十进制/十六进制 Unicode 代码”。

 

此功能以前称为“百度发帖助手”,用于在百度贴吧发表繁体字贴。由于百度后来取消了相关功能接口,原功能取消。不过可能有些用户在某些其他特定应用中仍需要将 GBK/Big5/Unicode 汉字转入十进制/十六进制 Unicode 代码的功能,故改用现名并相应做了少许优化。

 

使用本功能时,您可以将 GBK 或 Big5 编码汉字贴入“汉字源文本”编辑框中并自动转换,也可以以事先复制到 Windows 剪贴板中的 Unicode 格式文本作为源文本,然后手动转换。

 

将转换结果贴入网页代码,在网页显示时可以显示相关汉字。例如,汉字“街道”转换出的十进制和十六进制代码分别为“街道”和“街道”,如将其贴入网页代码中,该网页正常显示时将在相应位置显示“街道”。

 

转换“汉字源文本”编辑框中的文本

 

当您在“汉字源文本”编辑框右上的下拉列表框中选择前三项“GBK(自动转换)”、“Big5(自动转换)”和“自动检测编码(自动转换)”时,转换时采用的源文本将是“汉字源文本”编辑框中的文本,该编辑框中的编码相应分别为 GBK、Big5 和由软件自动检测。采用此模式的好处是所见即所得,您可以在“汉字源文本”编辑框中根据自己的需要可视化编辑最终需要显示的文本。您编辑时,下面的代码框中将同步自动生成相应的代码。编辑检查完成后,单击下面的“复制”按钮复制代码,然后贴入百度贴吧或知道发出即可。

 

转换剪贴板中的 Unicode 格式文本

 

当您在“源文本”编辑框右上的下拉列表框中选择最后一项“使用剪贴板中的 Unicode 格式文本”时,转换时采用的源文本将是剪贴板中的文本,该文本的格式应为 Unicode 格式。只要您使用的不是古老的 Windows 98/Me,而是 Windows 2000 以后的各种操作系统,您从 Windows 的记事本等自带软件界面、Office 和网页上直接复制来的文本都是 Unicode 格式文本。

 

采用此模式时,您需要手工点一下代码框上方的“转换”按钮才会进行转换。

 

采用“汉字源文本”编辑框中的文本为源文本时,源文本只支持 GBK 和 Big5 字符集中的字符,而采用剪贴板中的 Unicode 格式文本做为源文本时,可以支持整个 Unicode 字符集,可转换的字符将更多更全。

 

“十进制”和“十六进制”

 

如您选左下角的“十进制”,输出代码将显示为 5 位长十进制码。如果您选择了“十六进制”,输出代码的形式将是 4 位长十六进制代码。默认格式为 十进制。

 

9.8 简繁英页面清理

 

执行

 

页面清理功能并不位于“工具”菜单下,而是附带于“批量替换”功能中。执行方法是:

 

1)打开上编辑区的“查找/替换”对话框(可通过“编辑”菜单中的相应命令或上工具栏上的相应按钮打开)。上编辑区中需要有文本,才可打开此对话框,如果上编辑区中没有文本,可以自己贴一些进去。

2)点击“批量替换”按钮,打开“批量替换”对话框。

3)点击“打开”按钮,会弹出一个路径下拉列表,对于新安装的软件,这里会有 3 个默认清理宏,分别是 page clean.txt(英文页面清理宏“Page Cleaning”)、page clean-GBK.txt(GBK 格式中文页面清理宏“Page Cleaning for GBK”)、page clean-Big5.txt(Big5 格式繁体中文页面清理宏“Page Cleaning for Big5”)。需要哪个,选用哪个即可。

 

功能

 

英文页面清理宏“Page Cleaning”用于清理纯英文文本,另两个分别用于清理和规范 GBK 和 Big5 编码的中文文本,适用于整理基本为全中文的文章段落内容(不推荐采用中文宏清理英文或中英混合文本)。三种宏在制作时分别参考了英文和中文语言专家的专业意见,针对三种语言(编码)使用相应清理宏,可使杂乱、不规范的的英中文本在标点、空格、段落布局上迅速变得规范、整洁。

 

定制专用清理宏

 

如果您有特殊页面清理要求,可以在相应标准清理宏的基础上,制作供自己专用的自定义清理宏。

 

您只需修改宏路径并加以保存,就可以将标准宏另存为自己的专用宏。然后您就可以在此基础上修订宏名称、描述及此批处理宏中的各项操作,经数次测试修正,使其达到自己的特殊清理要求。这样做成了您自己的专用清理宏。

 

9.9 术语管理系统
 

本软件的词汇修正系统(“转换”->“词汇修正”)本身就是一个一流的术语表管理系统。

 

可实施项目包管理,每个转换包就是一个术语项目包,包下可管理多个术语库。每个项目包自成体系,仅由一个简单的文本格式项目包管理文件(后缀为.stcp)和一个或多个文本格式库(词汇表)文件构成,便于迁移、共享 。在资源管理器中双击 .stcp 即可加载此项目包。也可以在词汇修正主界面上部的包列表中选择它。

 

可以方便地添加、修改、删除、查找/搜索、剪切、复制、粘贴词条。添加、修订词条时会自动查重,保证不会在同一库中重复添加。术语在库(即词汇表)中已自动排序,与库(词汇表)对应的源文本即是一个排序好的 词汇表文本文件。

 

每一词条可包括术语、解释和注释三部分。“编辑词条”对话框针对术语表词条的编辑进行过专门优化,界面大小可调整,可以显示或隐藏注释部分,界面最小时只显示几行,精巧玲珑,最大时解释部分可以完全显示 1000 个汉字或 300 个英文单词。

 

术语库可以方便合并(两个源文件简单地拼起来即可),合并完成再打开后会自动整理,如有重复,会弹出词条合并向导,指导您逐条合并。