创新思维
   
五笔汉字输入技术的发明
 www.hxin.org  2010-03-01

  在人类文明史上,计算机的发明,延伸了人类的大脑,使之挣脱时间和空间的限制,进入信息化社会。计算机正急速地改变着人类的生活方式和工作方式,成了现代文明的同义词。然而,计算机的发明者,根本没有照顾到汉字成千上万、字形复杂的特点,而我们的老祖先在创造汉字时,也更不可能预见到会有计算机出现。如何把成千上万的方块汉字,输入只有26个字母键的计算机,成了举世称难的问题。西方有人惊呼:“不废除汉字,中国便不能进入现代文明。”东方文化,面临着严峻的考验;祖国文字,遇到了生死的抉择。
  20世纪70年代初,一个名不见经传的青年——王永民愤然而出,呼啸而起,决心在茫茫的汉字汪洋中,奋勇开拓,在汉字输入技术上作出新的发明创造。
  1978年秋天,王永民开始参与“汉字校对照排机”的科研项目。为了甩掉手动大字盘输入汉字的笨办法,寻找先进高效方法,王永民风餐露宿,来往于无锡、南京、常州、上海之间,搜集了许多资料、情报以及照片。在此基础上,他有了自己的新设想。他对“照排机”课题设计的“幻灯式”汉字输入键盘提出不同看法。他认定:用几十张胶片像放幻灯片那样把几千汉字轮番投影到一个大键盘上,从中找字按键输入汉字,只能是闭门造车,技术倒退;只有跟踪国内外最先进的技术,用数字或字母来代表汉字,才有可能从根本上解决汉字的输入问题。但编码研究是一个陌生的课题,无从下手。为尽快完成“照排机”的课题,他决定首先寻找一个现成的汉字输入方案,自己专心致志设计键盘,以应急需,就可望跨出事业的第一步。
  从此,他整天与天书般的《甲骨文编》、《说文解字》、《康熙字典》等文字学书籍为伴;与大本大本的《中华大字典》、《现代汉语词典》、《四角号码字典》、《新华字典》、《常用字字典》、《印刷通用汉字集》、《中国语文》为侣,日夜攻读,苦思冥想,考证摘录,对汉字的字源和构字规律作了历史的分析和深入的研究,发现了一条别人还从未走过,而又必须要走的路径,这就是:首先对构成汉字的基本“块块”——字根,进行定量的统计。王永民以《现代汉语词典》为研究对象,把密布在其中的一万二千多个汉字,逐字拆分,反复琢磨。一个“疆”字,就拆成“弓、土、一、田、一、田、一”七个字,又抄成七张卡片。总共抄了五六万张,再归类统计,登录排序。他在这浩繁艰巨的工程中,得出了一个十分重要的科学结论:原来,一万二千多个汉字,是由六百多个字根像搭积木一样组成的啊!他如获至宝,归纳总结出了我国第一张“汉字字根组字频度表”,从而,把组成汉字的核心部分——字根,首次纳入了科学的轨道,为他后来的探索和研究奠定了第一块基石,也为我国汉字输入的研究,提供了重要的理论依据。
  600多个字根,可以组成一万多个汉字,正如100多种原子可以组成千万种分子一样,问题大为简化!但总不能做600个键的键盘吧?如何把这些字根归纳、合并在少数键位上,而又重码最少,这才是决定汉字输入能否与西文相比、能否进入信息时代的“卡脖子”的最大难题!
  怎么归纳?怎么合并?他不知撒下了多少张金色的网,做了多少次迷人的梦,但闯来闯去,一无所获。一天雷雨过后,灿烂的晚霞挂在天边,映照着美丽的南阳盆地。当王永民紧锁眉头,匆匆走过市郊,看到不远处的大村庄里,母亲携着孩子,丈夫偕同妻子,各自走进家门。这幅“农家乐”图景,使他产生了奇妙的联想:“一千来口人,只有两百多个家,我如果把600多个字根也像家庭那样,按其亲缘关系组织合并,其数目不就大为下降了吗?”他急忙赶回实验室,一个个地考证字根的亲缘关系,反复地排列组合,一气折腾了三天三夜,果然把600多个字根合并成了180个小组。
  180组字根,还远不是理想的彼岸。王永民必须继续把键数往下压。 1982年春天,“六笔字型汉字编码方案”问世。这个方案仅仅使用标准键盘上的36个键,便可向计算机输入成千上万的汉字,成了独步国内的优秀方案。但是,王永民在检验过程中,发现了“36键方案”不能方便地输入数字,双手控制四排键也难于实现高速盲打。他冷静思考之后,做出放弃“36键”的决定,并开始研究更好的方案。
  有一天,王永民下意识地翻着那只剩下七天的台历。突然,他紧紧地盯住了日历右上角“农历壬戌年”这几个字,一个奇妙构想产生:“甲乙丙丁戊己庚辛壬癸;子丑寅卯辰已午未申酉戌亥。‘天干’10个,‘地支’12个,两两搭配,就可以配出60个年号,而且,年年都不相同……”
  “妙啊!”王永民猛锤一下桌子,智慧的火炬烈焰升腾:“汉字是图形文字,其字型和末笔画刚好是两种未曾用过的信息。如果我将五种笔画、四种字型的代号,两两搭配,形成一种组合代码,各不相同,不就可以将大量的重码字区分开来了吗?”经过努力,奇迹出现了:总重码数从600多对,急剧下降到100多对。“26键方案成功了!”
  对成就永不满足的王永民,又以他敏锐思想的锋刃,立即发现,这并不是峰点。因为排列得杂乱无章的键盘字根,必然难记难用,即使排列很有规律,如果不能按各手指的灵活程度来合理分配各手指的击键负担,这个键盘也难于实现高效率。所以只有使字根在键面上排列得井井有条,同时,又做到合理分配各手指的负担,才算是攀登了真正的峰顶。但要向“摩天岭”上再攀上这两步,又怎不难上加难?
  200来个字根,25个键位,可以拼合成千上万的汉字。如果照顾字根在键面上的规律性,就必须破坏原先费了九牛二虎之力才获得的组合,即打乱字根的“相容性”,使重码回升,二者如何得兼?必须寻求更佳的组合。他又把全部卡片翻腾数十遍,终于做到了25个键,分成五个区,每区分成5个位。井井有条,仿佛是一件精美的艺术品,仿佛是一张神秘的“联络图”。
  终于,像一代科学巨匠门捷列夫发现元素周期率那样,王永民集汉字结构规律、信息处理科学和键盘设计原理之大成,用血与火将它们熔炼成一张“五笔字型字根周期表”。
  1983年,王永民发明的“五笔汉字输入技术”震惊国内外,这项具有世界先进水平的汉字输入技术,以其简便、高效的强大优势,迅速成为我国众多的汉字输入技术中最受广大用户欢迎的佼佼者。举世之难,迎刃而解。
  
  (汇新摘自《实用创造学》 石光明/主编)