简体中文输入法用户指导手册
II. 输入窗口区域
预编辑区
状态区
候选词查找区
辅助窗口
III. 输入法基本功能
1. 开启/关闭输入法IV. 输入法辅助工具
2. 选择输入法
3. 循环切换输入法
4. 切换全角/半角模式
5. 切换中/英文标点模式
1. 选择工具菜单
2. 输入法选择工具
3. 输入法选项设置工具
4. 字符查找表基本编码的字符查找表5. 虚拟键盘
UNICODE字符查找表
特殊字符查找表PC键盘6. 用户自定义字符(UDC)
希腊字符键盘
俄文字符键盘
注音字符键盘
中文标点符号键盘
数字符号键盘
数学符号键盘
制表符键盘
特殊符号键盘
7. 输入法帮助
V. 输入法功能描述
1. 英文输入模式
2. 新全拼/新双拼输入法
3. 全拼输入法
4. 双拼输入法
5. 英汉输入法
6. 内码输入法
7. 五笔输入法
VI. 码表输入法接口
1. 接口简介
2. 创建码表
3. 码表转换成二进制格式
4. 码表转换成文本格式
5. 创建新的码表输入法
预编辑区: 高亮度(如反显或下划线)显示输入区。
状态区: 指示当前输入状态的区域。
候选词查找区: 显示可供选择的选项的区域。
辅助窗口: 用于输入法管理的辅助窗口。
再次键入 [Control+Spacebar] ,中文输入法关闭, 回到英文状态,
辅助条关闭。
然后从菜单中选择您想要使用的输入法。
表示输入系统处于全角字符状态。
表示输入系统处于半角字符状态。
当系统处于全角字符状态时, 输入键的全角字符将被提交给应用系统。
例如: 全角状态下输入'a', 其全角字符将被提交给应用系统。 如下:
表示输入系统处于中文标点模式。
表示输入系统处于英文标点模式。
当系统处于中文标点模式时, 并且输入一个英文标点键时,其相应的中文标点将被提交给应用系统。
例如: 中文标点模式下输入'$', 简体中文货币符号
将被提交给应用系统。 如下:
英文标点键包括: . / <> :;'"\$!^&_-
英文标点键与中文标点符号的对应表如下:
这些辅助工具包括:
然后从菜单中选择一项您想使用的输入法工具。
用鼠标从工具菜单中选中“输入法选择”项, 输入法选择工具显示如下:
选定某些输入法后,点击“确定” 或“应用”按钮, 输入法选择设定将被系统置为有效。
选定的第一个输入法即为用户的缺省输入法。
这时, 在应用系统窗口中键入 [Control+Spacebar]
开启输入法,缺省输入法将被置为当前输入法;然后键入"
F2"切换至第一个输入法, "F3" 切换至第二个输入法,
"F4" 切换至第三个输入法, 等等。
使用这个选项设置工具, 您可以设置输入法的属性。 设置完后, 点击“确定” 或“应用”按钮, 输入法选项设定将被系统置为有效。
对于基于码表的输入法, 有以下四个选项可以设置:
- 如该选项被选中: 当每输入一个正常键,输入法引擎将立即搜索码表并在候选词查找区中显示匹配的候选词。
- 如该选项未被选中: 当每输入一个正常键,输入法引擎不立即搜索码表, 只有当用户键入空格键后, 输入法引擎才搜索码表并在候选词查找区中显示匹配的候选词。
这个选项能够帮助用户学习这个输入法, 如告诉用户某个汉字在该输入法中对应什么外码。
- 如该选项被选中:在候选词查找区中的每个选项后都显示这个候选词的外码。
- 如该选项未被选中:则在候选词查找区中的每个选项后都不显示这个候选词的外码。
- 如该选项被选中:当只有一个候选词对应该外码时, 输入法直接将该候选词提交给应用系统。
- 如该选项未被选中:则当只有一个候选词对应该外码时, 输入法不直接将该候选词提交给应用系统, 而是将该候选词显示在候选词查找区。
- 如该选项被选中: 当每输入一个正常键, 其对应的键对应字符将显示在预编辑区。
- 如该选项未被选中:则当每输入一个正常键, 其对应的键对应字符将不显示在预编辑区, 而是这个字符本身。
输入系统提供了三种类型的字符查找表:
在 zh/zh_CN/zh_CN.EUC 中文环境(locale)中, 系统提供GB2312编码的字符查找表; 在 zh_CN.GBK 中文环境(locale)中, 系统提供GBK编码的字符查找表;在 zh_CN.GB18030 中文环境(locale)中, 系统提供GB18030编码的字符查找表 。
简体中文环境支持以下的虚拟键盘:
用户可以点击虚拟键盘上的按钮来输入该按钮上的字符。 PC键盘图示如下:
- PC键盘
- 希腊字符键盘
- 俄文字符键盘
- 注音字符键盘
- 中文标点符号键盘
- 数字符号键盘
- 数学符号键盘
- 制表符键盘
- 特殊符号键盘
用鼠标从工具菜单中选中“用户自定义字”项, 用户自定义字符工具显示如下:
在 zh/zh_CN/zh_CN.EUC 中文环境(locale)下:
键入 [Control+spcaebar] 开启或关闭中文输入法。
键入 [Control+Escape] 循环地切换中文输入法。
窗口状态区显示
表示应用系统处于英文输入模式, 当处于中文输入模式时,窗口状态区将显示当前的输入法名字。
基于拼音的输入法在中国大陆非常流行,目前有很多基于拼音的输入法, 其中就有新全拼和新双拼。
新全拼及新双拼输入法有以下功能:
(1). 用户自定义词组
以下图例解释如何定义词组 "ke lin dun", 并且保存下来以供以后使用。
键入 "kelindun" , 新全拼/新双拼输入法会自动加入空格, 如下:
然后, 键入数字键来选择相应的候选字。如键入'2'选择第一个候选字,终端显示如下:
按相同步骤选择自定义词组的第二个和第三个字。 如下:
这时新词组被定义并且被存入用户字典文件, 当下次再键入"kelindun "时,新词组将出现在候选词查找区中。见图:
(2). 动态词频调整
被选中的候选词将会在候选词查找区中前移, 这样常用词将会出现在候选词查找区的前面部分, 便于查找。
下面图例解释该项功能:
键入 "sh yi"。 注意第五个候选词的位置:
然后, 选择第五个候选词, 再键入 "sh yi" :
注意第五个候选词已经移到第一个位置。这表示常用词将被提前便于查找。
(3). 输入长拼音串
新全拼输入法最长可以输入 222 个拼音字母。
下例解释如何输入长中文词组:
>>meiguoztongkelindunzhengzaitaolunhaiwanjushiwenti<<
结果是如下的长词组:
(4). 声母输入
用户可以只输入声母来输入词组。如图:
(5). 支持 GBK 标准
在 zh.GBK/zh_CN.GBK 中文环境中, 新全拼/新双拼输入法缺省支持 GBK 标准。 如图:
词组
中的第二个字
就是一个GBK字。
GBK 候选字被放在GB2312候选字的后面, 键入 [Return ] 可从GB2312 候选区切换到GBK 候选区。
在 zh.GBK/zh_CN.GBK 中文环境中, 新全拼/新双拼输入法都缺省支持 GBK 标准, 但是, 如果用户只输入声母,输入法将不显示GBK候选字。
例如: 键入"rong ", 输入法将显示GBK候选字,因为它是一个完整的拼音串。
但如只键入 "r", 则不显示GBK候选字, 因为它只是一个声母。
(6). 键盘定义
键位 | 定义 |
[a-z] | 拼音字母 |
Home | 光标移至预编辑区开始处 |
End | 光标移至预编辑区结尾处 |
Left | 光标在预编辑区中往左移动一位 |
Right | 光标在预编辑区中往右移动一位 |
Delete | 在预编辑区中删除光标后的拼音字母 |
Backspace | 在预编辑区中删除光标前的拼音字母 |
键位 | 定义 |
- = | 往前/往后翻页 |
[ ] | 往前/往后翻页 |
, . | 往前/往后翻页 |
Return | 快速切换GB2312 和 GBK字符集 |
例如:拼音字串 [jiang] 可被解释为 [jiang], 也可解释为 [ji][ang], 两种解释都是正确的。
但在新拼音中, [jiang] 只被解释为[jiang], 而[ji'ang] 才被解释为[ji][ang];
新双拼则不需要使用分隔符 (')。
(7). 字典文件
新全拼和新双拼共享两个系统字典文件: PyCiku.dat 和 Ud.Ciku.dat 。它们被放在目录 /usr/lib/im/locale/zh_CN/data/ 下。
用户不能改写这两个文件, 但是用户可以通过用户字典文件来进行词频调整和用户自定义词组
, 用户字典文件为 ~/.Xlocale/PyCiku.dat 和 ~/.Xlocale/UdCiku.dat
(~ 表示用户的HOME目录) 。
(8). 新双拼特性
双拼是全拼的一种简化形式, 比全拼复杂, 但输入比全拼快。 新双拼支持新全拼的所有特性、键盘定义 以及字典文件。
下表是新双拼输入法支持的键盘映射:
键位 | 定义 |
i | ch |
u | sh |
v | zh |
a | a |
b | ou |
c | iao |
d | uang, iang |
e | e |
f | en |
g | eng |
h | ang |
i | i |
j | an |
k | ao |
l | ai |
m | ian |
n | in |
o | o, uo |
p | un |
q | iu |
r | uan, er |
d | iong, ong |
t | ue |
u | u |
v | v, ui |
w | ua, ia |
x | ie |
y | uai, ing |
z | ei |
一个拼音字串对应多个汉字,候选词查找区显示所有匹配该拼音字串的汉字。 用户可以键入点号(.) 或 [PageDown] 键来显示下页候选字, 键入逗号(,) 或 [PageUp] 键来显示上页候选字; 然后键入某候选字前的数字标号键来输入该候选字。
下面图例解释如何使用全拼输入法输入汉字:
(1). 开启一新终端, 键入[Control+Spacebar ] 启动中文输入法。
(2). 键入功能键 F5 切换到全拼输入法, 或用鼠标点击辅助条上的输入法选择按钮, 然后从输入法选择菜单中选择全拼输入法, 终端状态区显示当前输入法为全拼输入法。 如图:
(3). 键入 zhang.
全拼输入法先找到六个匹配字, 候选词查找区显示如下:
(4). 键入数字键来选择相应的候选字。如键入'1 '选择第一个候选字,终端显示如下:
例如:对于汉字
,其全拼为"zhang",而双拼为 "vh"。
双拼输入法中键位与声母/韵母的关系如下:
键位 | 声母/韵母定义 |
i | ch |
u | sh |
v | zh |
a | a |
b | b |
c | iao |
d | uang, iang |
e | e |
f | en |
g | eng |
h | ang |
i | i |
j | an |
k | ao |
l | ai |
m | ian |
n | in |
o | o, uo |
p | un |
q | iu |
r | uan, er |
s | iong, ong |
t | ue |
u | u |
v | v, ui, ue |
w | ua, ia |
x | ie |
y | uai |
z | ei |
; | ing |
一个双拼字串对应多个汉字,候选词查找区显示所有匹配该双拼字串的汉字。 用户可以键入点号(.) 或 [PageDown ] 键来显示下页候选字, 键入逗号(,) 或 [PageUp] 键来显示上页候选字; 然后键入某候选字前的数字标号键来输入该候选字。
下面图例解释如何使用双拼输入法输入汉字:
(1). 开启一新终端, 键入[Control+Spacebar ] 启动中文输入法。
(2). 键入功能键 F6 切换到双拼输入法, 或用鼠标点击辅助条上的输入法选择按钮,然后从输入法选择菜单中选择双拼输入法, 终端状态区显示当前输入法为双拼输入法。 如图:
(3). 键入 vh.
双拼输入法先找到六个匹配字, 候选词查找区显示如下:
(4). 键入数字键来选择相应的候选字。如键入'1'选择第一个候选字,终端显示如下:
如果一个英文单词对应多个中文词组,候选词查找区显示所有匹配该英文单词的中文词组。 用户可以键入点号(.) 或 [PageDown] 键来显示下页候选词, 键入逗号(,) 或 [PageUp] 键来显示上页候选词; 然后键入某候选字前的数字标号键来输入该候选词。
下面图例解释如何使用英汉输入法输入代表英文单词"hello "意思的中文词组:
(1). 开启一新终端, 键入[Control+Spacebar ] 启动中文输入法。
(2). 键入功能键 F7 切换到英汉输入法, 或用鼠标点击辅助条上的输入法选择按钮,然后从输入法选择菜单中选择英汉输入法, 终端状态区显示当前输入法为英汉输入法。 如图:
(3). 键入 hello
(4). 键入数字键来选择相应的候选词组。如键入'1'选择第一个候选词组,终端显示如下:
(5). 用户可以使用匹配符 ( * or ? )来搜索英汉词典, '*'代表一个或多个字母,而 '?'仅代表一个字母。例如:要搜索所有以 'lution ' 结尾的英文单词,键入 '*lution ', 候选词查找区显示如下:
或搜索所有以'c' 开头并且只有 3 个字母长的英文单词, 键入 'c?? ',候选词查找区显示如下:
下面图例解释如何在zh/zh_CN.EUC 中文环境下使用GB2312内码输入法输入 汉字或符号:
(1). 开启一新终端, 键入[Control+Spacebar ] 启动中文输入法。
(2). 用鼠标点击辅助条上的输入法选择按钮,然后从输入法选择菜单中选择GB内码输入法, 终端状态区显示当前输入法为GB内码输入法。 如图:
(3). 键入某汉字内码的前三位。 例如: 对汉字 0xb0a1 , 如下:
(4). 键入该汉字内码的第四位字符。 如本例, 键入'1 ', 该汉字自动被提交给应用系统。如图:
下面图例解释如何在 zh.GBK/zh_CN.GBK 中文环境下使用GBK内码输入法输入汉字或符号:
(1). 开启一新终端, 键入[Control+Spacebar ] 启动中文输入法。
(2). 用鼠标点击辅助条上的输入法选择按钮,然后从输入法选择菜单中选择GBK内码输入法, 终端状态区显示当前输入法为GBK内码输入法。 如图:
(3). 键入某汉字内码的前三位。 例如: 对汉字 0x8141 , 如下:
(4). 键入该汉字内码的第四位字符。 如本例, 键入'1 ', 该汉字自动被提交给应用系统。如图:
下面图例解释如何在 zh_CN.GB18030 中文环境下使用GB18030内码输入法输入汉字或符号:
(1). 开启一新终端, 键入[Control+Spacebar ] 启动中文输入法。
(2). 用鼠标点击辅助条上的输入法选择按钮,然后从输入法选择菜单中选择GB18030内码输入法, 终端状态区显示当前输入法为GB18030内码输入法。 如图:
(3). 对于GB18030的二字节内码,先键入某汉字内码的前三位。 例如: 对汉字 0x8141, 如下:
(4). 键入该汉字内码的第四位字符。 如本例, 键入'1 ', 该汉字自动被提交给应用系统。如图:
(5). 对于GB18030的四字节内码,先键入某汉字内码的前七位。 例如: 对汉字 0x8139ef30 , 如下:
(6). 键入该汉字内码的第八位字符。 如本例, 键入'0 ', 该汉字自动被提交给应用系统。如图:
五笔输入法的最大特点就是用户可以快速输入汉字, 因为一个五笔码很少对应多个汉字; 而且由于五笔输入法是基于字形编码的汉字输入方法, 所以几乎所有中文字,日文字,韩文字都可以用五笔来编码, 而基于拼音的输入法则不行。
关于五笔编码规则, 可参考 《标准五笔字型教材》。
Solaris 王码五笔输入法支持如下功能:
支持GB18030字符集。 支持简码。 支持容错码。 支持步进式识别码三级输入法。 支持 “z/Z”作为帮助键。 支持词组输入及可选专业词库。 支持字词联想。 支持属性设置。
(1) 支持GB18030字符集。
GB18030汉字集是国家2000年颁布的一个强制性汉字编码标准, 其编码长度为1~4个字节。其中包括:
现有GB18030汉字集包括27533个汉字, 其中21003个双字节汉字, 6530个四字节汉字。五笔输入法能够输入所有这些汉字。
- 单字节,其值从0到0x7F。
- 双字节,第一个字节的值从0x81到0xFE,第二个字节的值从0x40到0xFE(不包括0x7F)。
- 四字节,第一个字节的值从0x81到0xFE,第二个字节的值从0x30到0x39,第三个字节的值从0x81到0xFE,第四个字节的值从 0x30到0x39。
另外, 五笔输入法同时也支持GB2312, GBK字符集。 用户可以以“拉杆天线”式来切换字集。
Solaris 王码五笔输入法将GB18030分为若干个字集: GB2312, GBK, GB18030。 其中GB2312字集包括6763个常用汉字, GBK字集包括21003个汉字, GB18030字集包括27533个汉字。
用户在输入过程中,可以象“拉杆天线”一样,任意切换字集。 如:
(2) 支持简码。
常用的汉字,除可以按它的全码输入外,多数都还可以只取其最前边的一至三个字根,再加空格键输入。也就是只取其全码的最前边的一个、二个或三个码,再加打 空格键(表示输入结束),形成所谓一、二、三级简码,从而提高了输入速度。
(3) 支持容错码。
“容错码”的涵义是:“容易”编错,但“容许”编错的码。
容错码的设置,是为了照顾不同的取码习惯,使他们用容易编错的码,照样可以打出所要的字来。
例如: “长”字的标准五笔码为: “tayi”。 但用户也可以输入“atyi”来输入该字。
“atyi”即为该字的容错码。
(4) 支持步进式识别码三级输入法。
王码五笔字型的关键技术之一就是“末笔字型识别码”。 为帮助初学者尽快掌握这一技术, 五笔输入法支持“步进式C,B,A三级学习法”。 C级指不带识别码即可输入, B级指只有左右型的汉字带识别码, A级则指三种字型(凡不足4码的字)都带识别码。 “三级学习法” 为初学者从“初级阶段”向“高级阶段”步进式提高提供了极大的便利。
例如: 在C级状态下, 输入: “tkg”, 再打一下空格键, 汉字:“和”、“程”,
将被列出。但在A级状态下,输入“tkg", 则汉字“和”被直接提交给系统。
(5) 支持 “z/Z”作为帮助键。
当输入汉字时, 如果不知道其五笔编码, 或不知道某个字根在哪个键上时, 或不知道“识别码”时, 都可以用“万能学习键Z”来代替你不知道的那个输入码。
例如: 输入“azzd”, 则所有五笔编码中以“a”开头并以“d”结尾的字将被列出。 如图:
(6) 支持词组输入及可选专业词库。
王码五笔输入法支持词组输入,其中包括9万多条基本词汇,另外还为用户配有11个专业词库。用户可以根据自己的专业领域来选择相应的专业词库。
专业词库如下(各有3000 - 20000条词):
例如: 当用户选择“医药卫生”专业词库时, 输入:“mino”, 一些医学词组将被列出以供选择。 如图:交通运输 电脑家电 经济金融 农业机械 医药卫生 矿业冶金 外贸旅游 军事国防 法律美学 地名库 成语库
(7) 支持字词联想。
当用户输入一个汉字或词时, 以该字或词开头的词组将被列出以供选择。
例如: 用户输入: “iuxx”, 汉字“滋”自动被提交给应用程序, 并且以“滋”开头的词组将被列出以供选择。 如图:
(8) 支持属性设置。
Solaris 王码五笔输入法可以设置如下属性:
例如: 设置汉字字集, 如图:
例如: 设置专业词库, 如图:
例如: 设置识别码模式, 如图:
下面例图就是一个码表文件的例子:
一个码表文件包含以下几个功能描述段:
每个段的描述如下:
- [ Description ] 段
- [ Comment ] 段
- [ Key_Prompt ] 段
- [ Function_Key ] 段
- [ Phrase ] 段
- [ Single ] 段
- [ Options ] 段
因此该段包含以下几项:
(1). "Name:", 描述码表的中文名。
(2). "Encode:", 描述码表使用的编码,该值可以是UTF-8, GB, GB2312,
GBK, GB18030, EUC_TW, BIG5, BIG5HK.
(3). "WildChar:", 描述输入码元的匹配符, 缺省值是 '*' 和 '?'。
(4). "UsedCodes:", 描述合法的输入码元。
(5). "MaxCodes:" , 描述最长码元。
因此该段包含以下几项:
(1). "PageUp:"
(2). "PageDown:"
(3). "BackSpace:"
(4). "ClearAll:"
注意: '^' 代表 [ Control ] 键, 例如: '^N'
代表 '[Control+N ]' 键.
因此该段包含以下几项:
(1). "HelpInfo_Mode:" 可选值: "ON"
或 "OFF"
(2). "KeyByKey_Mode:" 可选值: "ON" 或 "OFF"
(3). "KeyPrompt_Mode:" 可选值: "ON" 或 "OFF"
(4). "AutoSelect_Mode:" 可选值: "ON" 或 "OFF"
(5). "SelectKey_Mode:" 可选值: "Number", "Lower"
或 "Upper"
每行格式如下:
键元序列 汉字序列
注意: "汉字序列" 表示一串没有空格隔开的汉字列表。
每行格式如下:
键元序列 词组1 词组2
词组3 ...
该工具 "txt2bin" 位于目录: " /usr/lib/im/locale/zh_CN/common/"
命令语法为:
# /usr/lib/im/locale/zh_CN/common/txt2bin
source_codetable_file
binary_codetable_file
该工具 "bin2txt" 位于目录: " /usr/lib/im/locale/zh_CN/common/"
命令语法为:
# /usr/lib/im/locale/zh_CN/common/bin2txt
binary_codetable_file
source_codetable_file
按照上面所描述的码表格式准备一个码表源文件。
(2). 将该码表源文件转换成二进制格式。
使用工具 "txt2bin" 将该码表源文件转换成二进制格式。
命令语法为:
# /usr/lib/im/locale/zh_CN/common/txt2bin source_codetable_file
binary_codetable_file
(3). 将该二进制格式的码表文件拷备到目录: " /usr/lib/im/locale/zh_CN/common/data "。
(4). 将该码表信息加入到输入法配置文件中。 输入法配置文件为:" /usr/lib/im/locale/zh_CN/sysime.cfg ".
(5). 重新启动输入法服务器 (htt), 然后重新登录。
重新启动输入法服务器 (htt), 需要以 root 身份运行如下命令:
# /etc/init.d/IIim stop
# /etc/init.d/IIim start
然后, 新输入法就可以使用了。
例如: 创建一个名为 "new_codetable_im" 的新码表输入法:
(1). 先创建并编辑一个名为 "new_codetable_im.txt"码表源文件。
(2). 使用工具 "txt2bin" 将该码表源文件转换成名为" new_codetable_im.
data"的二进制格式的文件。
(3). 然后把该二进制文件拷备到目录 "/usr/lib/im/locale/zh_CN/common/data
"。
(4). 把码表文件名"new_codetable_im" 加入到输入法配置文件 "/usr/lib/im/locale/zh_CN/sysime.cfg
"中。
(5). 重新启动输入法服务器 (htt), 重新登录即可。