• 使用淘宝购物搜索,在输入框内键入要搜的商品

  • 1015 阅读
  • 2 回复

进化版巨硬码表 for 掌易2.20(GB&GBK&Big5) 给你个理由舍弃巨硬?

作为一个巨硬的忠实用户,本来一直是在用巨硬,因Java的中文输入,也装了掌易+巨硬码表(Bob的)辅助备用。为了用的更加顺手,对其做了些改进。

1.删除了重复的字
  掌易的巨硬GBK码表,用在掌易上时会出现很多字是重复的,删除了重复的,优先级顺序未改变

2.添加免隔音符词汇
  例如:xian可以直接输入“西安”,piao可以直接输入“皮袄”,tuan可以直接输入“图案”……等等,请大家在输入的时候第一页没有的话,不妨往后翻一翻,可能有惊喜发现。常用的基本上都有了,欢迎补充。

3.解决了掌易的某些拼音切音不当问题。如输入“别人”、“办公室”、“一个人”、“电棍”等词,相信大家都有经历,现在已基本解决。

4.针对掌易的切音问题,添加了一些词汇,方便输入,可带来一定程度的改善
  例如:要输入”尘埃“,输入chenai后,掌易会自动切音为che’nai,无法直接显出”尘埃“两字......类似的情况有很多,又如changan长安、chuangan传感。针对此问题,添加了很多词,上述情况可以直接输入。(补充了非常多,但因时间精力原因,还可能不能完全满足大家,希望大家补充)

5.添加了一系列特殊符号,方便输入(Java中输入下划线的问题也同时迎刃而解,不需要任何辅助软件了)

6、添加一些常用的表情符号,用 i 键调出。打完一句话,可直接用“i”键添加表情,表情符号的前面会自动加上一个中文标点符号中的逗号“,”  

7.添加一些快捷回复的常用语,按“uu”键启动,使在不方便双手操作的场合下也能快速回复。

8.在巨硬GBK码表的基础上,对比GB2312中的6763个汉字,整理出巨硬的GB码表。(具体情况请看更新说明部分。现有问题有好的解决办法的话,敬请告知)

为了装上后不与原来的码表冲突,pdb的名称改为PIME_MHPY+_GBK、PIME_MHPY+_GB等。


经过上面的改进,掌易拼音的输入体验会大大改善,基本可达到巨硬的水平,掌易又可方便在Java、DTG输入中文,弃用伴随我们已久的巨硬?



欢迎大家试用并报告体验,如有问题请贴出。

Enjoy!


--------------------------
20080612



1. 解决了类似“zhuang'ong专攻、chuang'ong串供、shuang'uo涮锅”这样的切音问题



2. 鉴于使用大家习惯,将“liang靓”从OGBK码表移到GB码表中。









隔了一个多月,想必大家累计了不少个人词库,大家看着办吧。。。






同时期待掌易开源后新版的出现能直接解决这些问题。。。




--------------------------
20080422
修正类似“接你”等词的拼音切音问题
--------------------------
20080421
发现20080418巨硬版的词组部分排序还是有错误,已修正上传。(抱歉,没时间做太多测试)
--------------------------
20080420更新:

应大家要求,放上巨硬和搜狗的结合版,即巨硬的字+搜狗的词(四字及四字以下),功能上和前面巨硬版本的没有任何区别,区别仅在于词组部分换成了搜狗词组、以及体积的增大,供内存大的机器选择。

还是有三个文件,GB、OGBK、GBK,区别与前相同,大家可以选择RAM里GB+卡上OGBK,或者RAM里GBK,两种方式选其一就行了,速度快慢大家自己比较。

另,有关掌易使用及其码表安装问题,大家直接看掌易帮助就行了,请不要再给我发信了。。。

--------------------  
20080419更新:

1.  昨天的版本里有些多音字的词组是错误的,现已修正。

2.  对GB单字又校对了一遍,发现了少了GB2312中的“嗯”和“呒”,现已修正。

3.  增加个GBK的繁体版本,可能有些人或有些时候会用得着。

其实昨天就弄好了,后来网络有点问题,没发出来,打包文件的日期就还是20080418吧

--------------------  
20080418更新:

1.  删除了GB版中多出来的将近两千个带生僻读音的单字(这些多音字读音都不是GB范围内的),更干净了,这次GB版应该和GB 2132差不多都能对上了。OGBK版也进行了相应的改动。


2.  为了方便使用掌易的“渐近查找”功能,对GB、GBK、OGBK的单字都重新进行了排序,单字出现时更符合我们的习惯,相同情况下优先级并未改变。

   比如输入“ni”的时候,所有以“ni”为完全拼音的字就会排在前面,以“nin”、“nian”为拼音的字不会排在前面(如果不开“渐进查找”,则只会显示前者)。这样的话,我们在查找某些以“ni”为拼音的生僻字时,不用一直往后翻页去查找。但只是上述类似情况中,匹配等级不同的字之间改变了顺序,相同匹配等级的并未改变(相对于原巨硬码表)。

    巨硬码表单字分为前后两部分,前面是常用的,后面是不常用,前一版本的做法是前后分别排序,然后再放在一起,这样不是很彻底,仍然会出现查找某个单字要翻页半天的情况,这次做法是把前后两部分放在一起统一排序。

---------------------

20080416更新:

1.  删掉了若干个隐藏在原巨硬码表词组间的重复单字。现在应该没有重复的了。

2.  针对掌易的“渐近查找”功能,对本码表进行了较大调整。(解决所谓的“掌易问题”)

   在巨硬上开渐近查找后,有时候会出现看起来不太合理的结果,比如输入“nihao”后,首选词是“年号”,“你好”却在旁边(这个大家估计现在都看不到了);又比如输入“qingshu”,它会把“清水”作为首选词,把“情书”放一边(这个估计大家输入的比较少,现在应该还能看到)。 这种情况还有很多,导致了我使用巨硬的时候一直不用渐进查找功能。巨硬的词库用在掌易上之后,这个毛病仍然存在(或许有人不认为这是,但我总觉得不舒服)。    

    现在对所有的词和词组都进行了调整,开启“渐近查找”后,出现的都是我们认为应该会出现的字或词,即符合拼音编码顺序(某些多音字可能没有校对到)。相同情况下单字的优先级应该没有改变,词组会稍有变化。(这个比较费时,多重排序完了里面还有很多多音字,搞了一晚上。。)

   推荐大家在掌易上开启本码表的“渐近查找”功能。像大家说的,输入“mianb”的时候,“面包”就出现了。。。基本和巨硬无异,且不会有原来的那个问题了。

3.  增加了一些快捷回复的常用语,按“uu”键启动,使在不方便双手操作的场合下也能快速回复。

4.  增加了个文件PIME_MHPY+_OGBK.pdb,在掌易中显示名称为“巨硬OGBK”。

    OGBK就是Only GBK(是不是有点土?),这个是原GBK码表分离出GB码表后剩余的GBK单字部分,只含非GB的单字。     建议大家可以把GB码表装进RAM,把这个文件装在卡上掌易指定的文件夹中,留着备用,遇到GB码表打不出的字时,再用掌易即时切换到这个码表就OK了(GBK版的似乎有点多余了,呵呵)

不知道大家使用GB版码表的感觉如何?  我怎么感觉反应速度上和巨硬没有什么差别了,看来去掉GBK多出来的两万多单字后,确实有效果。 好了,我要删掉陪伴已久的巨硬了。。。

------------------
20080415更新:
1.  针对掌易的切音,添加添加了更多更多的词汇,使输入更加流畅,包括“掩耳盗铃”、“因人而异”等多字词组的输入。
建议大家在输入时,先不要管切音是否有问题,等拼音全部输入完成后,如若不理想,再做相应调整。
现在用起来,感觉已经很流畅了。(我的输入习惯是输入全拼,不开渐进查找)  大家不妨把本帖中的文字输入一遍,试试效果。 :-)  

2.  将码表在打字时显示的名称改为“巨硬加加”,在切换码表时容易与原来的码表区分。

3.  补充了巨硬原来打不出的字,如曝(bao)光的“曝”等,删掉了几个上次处理时漏删的重复字(原掌易巨硬码表的),自己发现的,大家没发现? 说不定还有,请大家报告。

4   更新GB版的码表,不完美,简单的说就“没有乱七八糟的字,但有乱七八糟的音”。
    巨硬的码表中很多字是多音字,有的字在古汉语或人名中有许多不常见的生僻读音,应该不属于GB范围(不知道巨硬是如何判断的),GB2312的6763字好找,但每个字的标准拼音不好找,也不好一一对应,转换时人工去每个字都检查一遍不太现实。。。。所以,大家在打字的时候可能会发现很多熟字的生僻读音(并非错误,除非巨硬的码表是错的),其实已经删掉很多了,但精力有限,大家就先忍忍,遇到时就当学习一下吧   -_-!!  
(GB版并没有比GBK版的体积小很多,只小了不到110K,因为码表中词组占了相当大的比重,这部分没有动。GBK版至少放卡上备用吧,遇到GB打不出的字就有用了)

---------------------
20080413更新:
针对版友提出的问题,做如下改动:nue=nve,lue=lve   请试用

GB & GBK:


GBK的繁体版,可能有些人或有些时候会用得着


Big5版(由GBK版转换而来,部分符号显示为乱码)


巨硬搜狗加加:


另,掌易可以即时切换码表的,好像还是有人没有注意到这个实用功能。通过掌易的”高级设置中“中英文及码表切换”选项设置,在系统可输入的状态下,短按是中英文切换,长按则是码表切换,就会弹出”选择码表“的浮动窗口了
符号表
(由于掌易对码表的某些限制,在输入英文标点和Palm系统标点时,前面都加了一个中文标点符号“|”,请手动删除。其他的分类无此问题。)
启动键



分类



符号示例



uzb



中文标点



“”



uyb



英文标点



@,_|



upb



Palm系统自带标点



, . _



uxl



希腊字母



αΠ



uzs



中文数字






urs



罗马数字






uys



圆圈数字






uks



括号数字






ukd



括号大写数字






usd



数字加点






uhb



货币符号






usx



数学符号



×



udw



单位符号






upy



拼音字母



ā



uzy



注音符号






uew



俄文符号



й



uzf



制表符






uts



特殊符号






ujt



箭头






upj



日文平假,片假名






ucx



缩写查询



中文标点 zb







附:



本帖最后由 kijoer 于 2010-03-10 15:15 编辑

帖子附件

您需要 登录 才可以查看或下载附件. 没有帐号, 点击此处注册.
是朋友,会相聚。路越远,心越近!
哇....被我逮到了....嘿嘿
逮到能怎样~~~~