简化选择,但又不能完全放弃选择,让用户有一个词库可选,却有多种方案可用。于是首先想到的是合并词库,每个方案都有自己的特定词库,他们编码方式不一样,词库内容和词频不一样,如果将其合并为一个词库,并解决这个词库的丰富度,解决词频问题,那将成为可扩展的元词库,我们将其称为——万象词库。
#词库解码顺序为:全拼拼音;墨奇;鹤形;自然码;简单鹤;仓颉首末;虎码首末;五笔前2 万 wan;av;ap;ag,ap;du;ms;fp;dn; 87991 象 xiang;du;dn;du,pd,ua;gh;no;wx;qj; 3107 拼 pin;fk;fk;fb;jp;qt,qj;ul;ru; 5904 音 yin;lo;lo;lo;cc;ya;xy;uj; 13619
这样的编码方式使用全拼作为基础意味着他能转换为任意一种双拼编码,有了共同的基底,后面通过分号隔开分别列举多种辅助码方式,我们可以通过运算规则来调用不同的辅助码。
如何实现我们设想的两两组合呢,是否真的可以做到,经过分析使用自然码举例:
下面来看自然码双运算规则,我们要把编码拼音部分做转换,但要保留第一个分号后及其后面所有内容:
algebra_zrm: __append: - derive/^([jqxy])u(;.*)$/$1v$2/ - derive/^([aoe])([ioun])(;.*)$/$1$1$2$3/ - xform/^([aoe])(ng)?(;.*)$/$1$1$2$3/ - xform/^(\w+?)iu(;.*)$/$1Ⓠ$2/ - xform/^(\w+?)[uv]an(;.*)$/$1Ⓡ$2/ - xform/^(\w+?)[uv]e(;.*)$/$1Ⓣ$2/ - xform/^(\w+?)ing(;.*)$/$1Ⓨ$2/ - xform/^(\w+?)uai(;.*)$/$1Ⓨ$2/ - xform/^(\w+?)uo(;.*)$/$1Ⓞ$2/ - xform/^(\w+?)[uv]n(;.*)$/$1Ⓟ$2/ - xform/^(\w+?)i?ong(;.*)$/$1Ⓢ$2/ - xform/^(\w+?)[iu]ang(;.*)$/$1Ⓓ$2/ - xform/^(\w+?)en(;.*)$/$1Ⓕ$2/ - xform/^(\w+?)eng(;.*)$/$1Ⓖ$2/ - xform/^(\w+?)ang(;.*)$/$1Ⓗ$2/ - xform/^(\w+?)ian(;.*)$/$1Ⓜ$2/ - xform/^(\w+?)an(;.*)$/$1Ⓙ$2/ - xform/^(\w+?)iao(;.*)$/$1Ⓒ$2/ - xform/^(\w+?)ao(;.*)$/$1Ⓚ$2/ - xform/^(\w+?)ai(;.*)$/$1Ⓛ$2/ - xform/^(\w+?)ei(;.*)$/$1Ⓩ$2/ - xform/^(\w+?)ie(;.*)$/$1Ⓧ$2/ - xform/^(\w+?)ui(;.*)$/$1Ⓥ$2/ - xform/^(\w+?)ou(;.*)$/$1Ⓑ$2/ - xform/^(\w+?)in(;.*)$/$1Ⓝ$2/ - xform/^(\w+?)[iu]a(;.*)$/$1Ⓦ$2/ - xform/^sh/Ⓤ/ - xform/^ch/Ⓘ/ - xform/^zh/Ⓥ/ - xlit/ⓆⓌⓇⓉⓎⓊⒾⓄⓅⓈⒹⒻⒼⒽⓂⒿⒸⓀⓁⓏⓍⓋⒷⓃ/qwrtyuiopsdfghmjcklzxvbn/
此时获得的输出是:
#词库解码顺序为:全拼拼音;墨奇;鹤形;自然码;简单鹤;仓颉首末;虎码首末;五笔前2 万 wj;av;ap;ag,ap;du;ms;fp;dn; 87991 象 xd;du;dn;du,pd,ua;gh;no;wx;qj; 3107 拼 pn;fk;fk;fb;jp;qt,qj;ul;ru; 5904 音 yn;lo;lo;lo;cc;ya;xy;uj; 13619
在此基础之上对于辅助码进行运算,这里针对不同位置的辅助码分别写了提取规则,但是提取之后则采用了统一格式的运算,这就大大减小了运算难度:
fuzhu_zrm: ########################################位于词库第三个分号后 __append: - xform|^(.{2});.*?;.*?;(.*?);.*$|$1;$2| - xform|^(\w+?);.*?;.*?;(.*?);.*$|$1;$2| #匹配当前方案,转换为 双拼;辅助码(当前方案)的形式 - derive/^(.{2}|\w+?);.*$/$1/ # 纯双拼的情况 - derive/^(.{2}|\w+?);(\w)(\w).*$/$1$2/ # 双拼+一位辅助码的情况 - derive/^(.{2}|\w+?);(\w)(\w).*$/$1[$2/ # 双拼+[一位辅助码的情况 - derive/^(.{2}|\w+?);.*?,(\w)(\w).*$/$1$2/ # 双拼+一位辅助码的情况 - derive/^(.{2}|\w+?);.*?,(\w)(\w).*$/$1[$2/ # 双拼+[一位辅助码的情况 - abbrev/^(.{2}|\w+?);(\w)(\w).*$/$1$2$3/ # 双拼+2位辅助码的情况,abbrev类型不可以整句内输入2位辅助码,必须加o或/ - abbrev/^(.{2}|\w+?);.*?,(\w)(\w).*$/$1$2$3/ # 双拼+2位辅助码的情况,abbrev类型不可以整句内输入2位辅助码,必须加o或/ - derive/^(.{2}|\w+?);(\w)(\w).*$/$1$2$3o/ # 整句模式下,输入syffo 出单字 增强单字性能 - derive|^(.{2});(\w)(\w).*$|$1$2$3/| # 整句模式下,输入syff/ 出单字 增强单字性能 - derive|^(\w+?);(\w)(\w).*$|$1$2$3/| # 整句模式下,输入syff/ 出单字 增强单字性能 - derive/^(.{2}|\w+?);.*,(\w)(\w).*$/$1$2$3o/ # 整句模式下,输入syffo 出单字 增强单字性能 - derive|^(.{2});.*,(\w)(\w).*$|$1$2$3/| # 整句模式下,输入syff/ 出单字 增强单字性能 - derive|^(\w+?);.*,(\w)(\w).*$|$1$2$3/| # 整句模式下,输入syff/ 出单字 增强单字性能 - derive|^(.{2});.*,(\w)(\w).*$|$1$2$3/| # 整句模式下,输入syff/ 出单字 增强单字性能
第一二条就是把很长的编码缩短到双拼+辅助码的形态,本来一条即可,为了照顾微软和搜狗方案中使用了分号作为一个韵母多写了一条,毕竟我们说了要自由搭配的,所以兼容性必须做。
输出:
万 wj;ag,ap 87991 象 xd;du,pd,ua 3107 拼 pn;fb 5904 音 yn;lo 13619
没错用逗号隔开的是辅助容错码,不管输入哪两个都可以打出这个字,这样大部分时候靠猜测也能利用起来辅助码,这个场景也做了兼容。
最后通过运算规则这个“万”字就有了以下几种组合可以输出:
万 wj 万 wja 万 wjag 万 wjap 为了增强整句中单字性能,通过增加o或者/的方式还可以获得以下输出 万 wjago 万 wjapo 万 wjag/ 万 wjap/
缝合: 在rime中speller/algebra:就是拼写运算之处,我们为了用户自定义变得方便,我们基于三个维度制作了一个表头,用来前置参数配置:
#本方案匹配词库解码顺序为:全拼拼音;墨奇;鹤形;自然码;简单鹤;仓颉首末;虎码首末;五笔前2 #############DIY你想要的方案组合,试试搭配一个自然码+墨奇辅助的方案吧!########################### schema_name: name: 万象拼音 #可以改成与你所选方案一致的描述,不改也行 set_shuru_schema: #配置此项就是选择什么输入法,同时拆分反查和中英文混输也将匹配该输入方案 __include: algebra_zrm #可选解码规则有 algebra_pinyin, algebra_zrm, algebra_flypy, algebra_ziguang, algebra_sogou, algebra_mspy, algebra_abc 选择一个填入 set_algebra_fuzhu: #配置此项就是选择什么辅助码 __include: fuzhu_zrm #可选辅助码有:fuzhu_kong,fuzhu_moqi, fuzhu_zrm, fuzhu_flypy, fuzhu_tiger, fuzhu_cj, fuzhu_wubi, fuzhu_jdh 选择一个填入 #Lua 配置: 超级注释模块 pro_comment_format: # 超级注释,子项配置 true 开启,false 关闭 fuzhu_code: true # 启用辅助码提醒,用于辅助输入练习辅助码,成熟后可关闭 candidate_length: 1 # 候选词辅助码提醒的生效长度,0为关闭 但同时清空其它,应当使用上面开关来处理 fuzhu_type: zrm # 用于匹配对应的辅助码注释显示,可选显示类型有:moqi, flypy, zrm, jdh, cj, tiger, wubi,选择一个填入,应与上面辅助码类型一致 corrector: true # 启用错音错词提醒,例如输入 geiyu 给予 获得 jiyu 提示 corrector_type: "{comment}" # 新增一个显示类型,比如"【{comment}】" __include: octagram/enable_for_sentence #启用语言模型 #__include: octagram/disable #禁用语言模型 ########################以下是方案配置######################################################
我们需要按照如下格式对speller/algebra:进行排序:
speller: # table_translator翻译器,支持自动上屏。例如 “zmhu”可以自动上屏“怎么回事” # auto_select: true # auto_select_pattern: ^[a-z]+/|^[a-df-zA-DF-Z]\w{3}|^e\w{4} # 如果不想让什么标点直接上屏,可以加在 alphabet,或者编辑标点符号为两个及以上的映射 alphabet: zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA`/ # initials 定义仅作为始码的按键,排除 ` 让单个的 ` 可以直接上屏 initials: zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA delimiter: " '" # 第一位<空格>是拼音之间的分隔符;第二位<'>表示可以手动输入单引号来分割拼音。 algebra: __patch: - set_shuru_schema #拼音转双拼码 - set_algebra_fuzhu #辅助码部分
至此只需要模块化分别列举出不同的双拼方案,不同的辅助码形态交叉调用即可实现自然码+鹤形,小鹤+自然码,搜狗+五笔,甚至全拼+辅助码的形态等各种奇怪的组合。
表头的第三个维度,为用户留出了初学需要看辅助码,可以用于记忆慢慢让字都能出现在第一位。
功能: 辅助码它可以在输入一个确定得拼音后面继续输入一个部首的读音,使得这个字出现在靠前甚至第一位。这种方式易于理解,无须记忆字根,一切基于拼音得基础上。例如: 功能1 如果想要 镇 字显示在前面 那么在本方案下提供两种方式,第一种就是辅助码声母,vf继续输入j 也就是金字旁得声母即可出现结果,如果还是出现不了你要的结果,可以输入另外主体字的声母来继续缩小范围。 功能2 第二种方式是通过反查字库来定位,只是通过不同的方案实现,在输入主要拼音后,通过符号` 来引导进入反查状态,引导后继续输入jn金 则包含金的字就会被选出来; 引导后继续输入mu 木则带木的字就会被选出来 功能3 通过 拼音状态下F字母来引导拆字模式 举例 震 假设你不认识,你可以通过雨和辰 来合并输入,拼音状态输入后,继续输入其它字符字母F会消失如下图,输入 yu if 即雨 辰,结果出现了我们要的震字,且给出了辅助码 y 和 i ,y是雨的声母y,i是辰的声母ch
功能4 句子中间或者单字输入时需要输入全位辅助码时由于与双拼词语重码,我们此时可以通过追加/的方式使其聚拢,这种方式是由于我们是直接辅助码导致的,如果我们通过一个符号引导辅助码,那么在输入时要每一个都用到符号,而采用这种方式我们只需要在必要的时候使用/节省了输入的按键开支,下面由两个图片说明问题:
其它亮点功能
date time week datetime timestamp
2024-07-04 19:37 星期四 2024-07-04T19:38:47+08:00 1720093174
# auto\_select: true # auto\_select\_pattern: ^[a-z]+/|^[a-df-zA-DF-Z]\\w{3}|^e\\w{4}
墨奇音形: 墨奇音形是一个基于一种新型开源的字形描述信息、递归拆分至最小字形,最后取首末双形音托的方案。查墨奇码的拆分:加群696353204 ②群10885687 输入“墨奇码拆 想拆的字”。支持4万字 拆分规则:
不明觉厉
专业!
大佬
Popular Ranking
Popular Events
痛点:
思路:
简化选择,但又不能完全放弃选择,让用户有一个词库可选,却有多种方案可用。于是首先想到的是合并词库,每个方案都有自己的特定词库,他们编码方式不一样,词库内容和词频不一样,如果将其合并为一个词库,并解决这个词库的丰富度,解决词频问题,那将成为可扩展的元词库,我们将其称为——万象词库。
这样的编码方式使用全拼作为基础意味着他能转换为任意一种双拼编码,有了共同的基底,后面通过分号隔开分别列举多种辅助码方式,我们可以通过运算规则来调用不同的辅助码。
如何实现我们设想的两两组合呢,是否真的可以做到,经过分析使用自然码举例:
最后在 speller/algebra: 段落下按照顺序列出,从而形成一个完整连贯的运算规则。
下面来看自然码双运算规则,我们要把编码拼音部分做转换,但要保留第一个分号后及其后面所有内容:
此时获得的输出是:
在此基础之上对于辅助码进行运算,这里针对不同位置的辅助码分别写了提取规则,但是提取之后则采用了统一格式的运算,这就大大减小了运算难度:
第一二条就是把很长的编码缩短到双拼+辅助码的形态,本来一条即可,为了照顾微软和搜狗方案中使用了分号作为一个韵母多写了一条,毕竟我们说了要自由搭配的,所以兼容性必须做。
输出:
没错用逗号隔开的是辅助容错码,不管输入哪两个都可以打出这个字,这样大部分时候靠猜测也能利用起来辅助码,这个场景也做了兼容。
最后通过运算规则这个“万”字就有了以下几种组合可以输出:
缝合:
在rime中speller/algebra:就是拼写运算之处,我们为了用户自定义变得方便,我们基于三个维度制作了一个表头,用来前置参数配置:
我们需要按照如下格式对speller/algebra:进行排序:
至此只需要模块化分别列举出不同的双拼方案,不同的辅助码形态交叉调用即可实现自然码+鹤形,小鹤+自然码,搜狗+五笔,甚至全拼+辅助码的形态等各种奇怪的组合。
表头的第三个维度,为用户留出了初学需要看辅助码,可以用于记忆慢慢让字都能出现在第一位。
功能:
辅助码它可以在输入一个确定得拼音后面继续输入一个部首的读音,使得这个字出现在靠前甚至第一位。这种方式易于理解,无须记忆字根,一切基于拼音得基础上。例如:
功能1 如果想要 镇 字显示在前面 那么在本方案下提供两种方式,第一种就是辅助码声母,vf继续输入j 也就是金字旁得声母即可出现结果,如果还是出现不了你要的结果,可以输入另外主体字的声母来继续缩小范围。
功能2 第二种方式是通过反查字库来定位,只是通过不同的方案实现,在输入主要拼音后,通过符号` 来引导进入反查状态,引导后继续输入jn金 则包含金的字就会被选出来;
引导后继续输入mu 木则带木的字就会被选出来
功能3 通过 拼音状态下F字母来引导拆字模式 举例 震 假设你不认识,你可以通过雨和辰 来合并输入,拼音状态输入后,继续输入其它字符字母F会消失如下图,输入 yu if 即雨 辰,结果出现了我们要的震字,且给出了辅助码 y 和 i ,y是雨的声母y,i是辰的声母ch
功能4 句子中间或者单字输入时需要输入全位辅助码时由于与双拼词语重码,我们此时可以通过追加/的方式使其聚拢,这种方式是由于我们是直接辅助码导致的,如果我们通过一个符号引导辅助码,那么在输入时要每一个都用到符号,而采用这种方式我们只需要在必要的时候使用/节省了输入的按键开支,下面由两个图片说明问题:
其它亮点功能
输入:
date time week datetime timestamp
得到:
2024-07-04 19:37 星期四 2024-07-04T19:38:47+08:00 1720093174
# auto\_select: true # auto\_select\_pattern: ^[a-z]+/|^[a-df-zA-DF-Z]\\w{3}|^e\\w{4}
墨奇音形:
墨奇音形是一个基于一种新型开源的字形描述信息、递归拆分至最小字形,最后取首末双形音托的方案。查墨奇码的拆分:加群696353204 ②群10885687 输入“墨奇码拆 想拆的字”。支持4万字
拆分规则: