二、编码方法
对于汉字拆分后形成的部分按书写笔画进行编码
【口诀】键 盘 字 母 分 区 位 书 写 笔 画 相 应 对
依 次 两 笔 编 码 定 位 移 单 笔 记 心 中
码 分 主 辅 声 补 充 四
码 字 词 自 上 屏
【说明】
1、按照先左后右、先内后外、先上后下的顺序,将计算机键盘的25个英文字母键(Z除外)分成5个区,分别用汉字的5种基本书写笔画一(横,包括提笔)、丨(竖)、丿(撇)、丶(点,包括捺)、乛(折,包括各种折笔)(分别用1、2、3、4、5表示)标示;再按先中间后两边的顺序,将每个区分为5个位,也分别用一、丨、丿、丶、乛(1、2、3、4、5)标示,区号在前,位号在后,得到如下键盘字母区位图:
键 盘 字 母 区 位 图
| Q35 |
W34 |
E33 |
R32 |
T31 |
Y41 |
U42 丶丨 |
I43 丶丿 |
O44 丶丶 |
P45 丶乛 |
|||||||||
| A15 一乛 |
S14 一丶 |
D13 一丿 |
F12 一丨 |
G11 一一 |
H21 丨一 |
J22 丨丨 |
K23 丨丿 |
L24 丨丶 |
||||||||||
| X55 乛乛 |
C54 乛丶 |
V53 乛丿 |
B52 乛丨 |
N51 乛一 |
M25 丨乛 |
|||||||||||||
注:为了标示方便,键位略有变异(下同)。
2、将汉字拆分后形成的部分按照书写笔顺依次取前两笔,前一笔对应区号,后一笔对应位号,即可从键盘字母区位图中得到一个英文字母编码。
3、为离散重码,对少量字块进行了位移(见图示)。单笔画在各区均取横位,其对应关系是:
一____G; 丨____H ;丿____T ;丶____Y
;乛____N。
字 块 位 移 图
| Q |
W |
E |
R |
T |
Y |
U 心忄 宀 |
I |
O |
P
|
|||||||||
| A |
S 木艹 |
D |
F |
G |
H 目 |
J 日刂 |
K 口 |
L 囗 |
||||||||||
| X |
C |
V |
B |
N |
M |
|||||||||||||
注:“亅”视作折。
【口诀】
横区:“草”(艹)“木”定点(点位)栽
竖区:长刀(刂)竖(竖位)起来
封闭结构全移开
由繁至简依次排
余者边上呆
注:⑴“且”同“目”。
⑵田、皿、凹、凸、罒等均“边上呆”(L位)。
⑶封闭结构被单笔画贯通的仍视为封闭结构,如申、电、曳、中、虫、史、柬等;没有贯通的按正常笔顺编码,如甲、由、曲、黑等。
撇区:“几”“月”到中间(撇位居中)
点区:齐心(心、忄)携宝(宀)树(竖)下敛
4、编码分主码、辅码、声码三种。
(1)主码:
主 码 各 部 前 两 笔
注:“各部”指拆分后形成的部分(下同)。
(2)辅码:
辅 码 各 部 后 部 取
特 征 末 笔 末 两 笔
注:①除单笔、两笔的辅码和主码相同外,三笔以上的,辅码一般不能取第一笔,只能从“后部取”。顾名思义,辅码只起到辅助作用,在以词组方式输入时,除少量独体字外,98%以上的字用不到辅码。
②“特征”包括(例字没有列举兼容码):
——完整的独立的有理部分。如:
“特”拆分为牜、寺,“寺”的辅码由“寸”取为A;“整”拆分为敕、正,“敕” 的辅码由“攵”取为T等。
——区别于他字的部分。如:
更、吏;束、朿、柬,辅码各取中间部分,分别为J、K;K、M、L;
凹、凸,辅码分别取“凵”、“冂”为B、M等。
——直观、醒目的部分。如:
甘、日、白等取横,编码为G;
王、里、由等取竖,编码为H;
亚、业、立等取丷,编码为I;
廿、皿、曲、血等取两竖,编码为J;
舟、母等取两点,编码为O;
其他如“龙”取“ 匕”,编码为Q;“五”取折笔,编码为N;“米”取“十”,编码为F;四等取“儿”,编码为Q;丹等取点,编码为Y;“必”取撇,编码为T等。
③特征不明显,末笔独立、清晰、易辨的取末笔。如:
与、卫、工、土、上、止、冉、鸟、本、丝等取横,编码为G;
车、斤、丰、丫、申、中、甲、年、升、忄等取竖,编码为H;
才、牙、矛、曳、少、尸、乒、乡、犭等取撇,编码为T;
寸、戈、瓦、爪、尺、丸、乓、长、刃、书等取点,编码为Y;
屯、巴、事、弓、片、鼠、毛、手、今、饣等取折,编码为N。
④特征、末笔均不明显,末两笔清晰易辨的取末两笔。如:
辰、大、豕、丧、夫、未、果、内、央、艮、象、木、飞、小、水、亥、文、亦等取撇、点,编码为W;
干、千、午等取“十”,编码为F;
亏、于、民、氏、乇等取横、折,编码为A;
元、无、免等取“儿”,编码为Q;
虫、禺、禹等取横、点,编码为S;
心取两点,编码为O等。
⑤对于少数辅码不易选取或不需选取的,辅码取首码。
如:口、之、久、门、扌、彳、囗、氵、辶、夂、艹、宀、纟等。
注:实际应用时,辅码可凭感觉取,方案给予了充分的兼容。
(3)声码:
汉语拼音的第一个字母
5、最大码长为四,取足四码,编码对象(字、词)会自动到达编辑文件的指定位置。设计码长为四,一是因为汉字最多只有四个构成部分;二是因为汉语词汇主要是二字词和四字词,四码便于编码;三是有足够的编码空间(25 + 25×25 + 25×25×25 + 25×25×25×25=406900)。
6、笔顺以1997年4月7日国家语言文字工作委员会和国家新闻出版署联合发布的《现代汉语通用字笔顺规范》为准(遇有疑难,请查阅《使用参考》)。