生僻字识别小技巧-唐象
65808
0

在遇到古本当中有某个生僻字的时候,如果一时难以解决。不妨先搁置,先往下看。因为往往,在后面,如果同样出现这个生僻字,但因为在后文当中,是在一个特定术语里面,所以一猜就能猜到这个字是什么字。然后再反推到前面那个生僻字。

这样做的好处,是同样的一个本子,用自己本子上的字去解自己本子上的字,最精准。

如果刚开始就直接采用多种其他方式去查这个字,有时可能要花很多精力才能查到。即便查到,可能有些细节还不一样,不敢一时确定下来。

常用方法:

一、https://www.zdic.net/,汉典网,字库比较齐全。

查询的方法上,对于生僻字,比较常用的有:

1、右上角「汉字拆分查询」。选择字型结构,然后依顺序输入各个部件,看是否能够查到。如果不行,还有一个技巧。比如左右结构的字,左边不好输入,但右边是确定的。这个时候,输入的时候,不要选字型结构,直接输入右半部分。就会跳出来所有包含这个部件的字,然后再细查。

2、字典部首索引。这个和以前查新华字典差不多,先确定一个部首,然后看剩下是多少画,再直接到多少画里面去找。要一个一个仔细找。看有没有。

3、总笔画索引。这个藏得深,要先点到汉语字典,字典检索里,总笔画索引。这个字有多少划,就选到那里。这种情况,适用于特别难查的字。只有通过花更多时间精力,一个一个去找过去。

二、猜字法。

根据上下文意,自己尝试去猜一下,字看多了一般会有一种直觉,就是字型比较相近,会天然跳出几种可能的字。然后到汉典输入这个字的简体。

然后选择“字源字型”,去比对一下,是不是出现了一模一样的生僻字,如果出现了,那说明猜对了。如果没有出现,可能猜错了,或者字库不全。有些字可能字库里都没有。

三、替换部首法

有些字的部首,熟悉以后,某个字以前这个部首这样写,换到另一个字,还是这个部首,就可以尝试去替换,看看是不是会有灵感。

 

个人不常用方法,但思路上应该是可行的。

一、手写法。用鼠标写出这个字,然后系统可以直接去辨别。信息技术应该是可行的,但只是要找到非常优秀的生僻字查询系统,有这个功能就可以。现在主要不是信息技术问题,而是字库的问题。手机上比如百度输入法等等运用了人工智能技术的输入法,普通字的手写的识别率已经非常高了。

二、笔划输入法。中华书局古联输入法http://www.ancientbooks.cn/helpcore?input

其中有直接输入横竖撇捺折,然后找字。但不知字库是否充足。如果字库充足的话,这样去找会方便很多,前提是要掌握正确的书写笔划,可以多试试。

三、AI识别。AI识别,一定是生僻字识别的未来。http://codh.rois.ac.jp/,这个日本网站,有这样的技术框架。并运用在了古日文的识别上。将来随着AI古汉字识别技术发展,生僻字识别,应该不会是门槛。有待技术人员开发成熟,那会大大降低阅读古籍的文字门槛。

AI图像识别。已经找到了。https://mojizo.nabunken.go.jp/

上传图像后选择解析,就可以了。

测试过,效果并不理想。几个较难的字,目前识别不出,简单的字能够识别出来。

说明技术本身慢慢在成熟,只是字库扩充的问题,这只有靠时间,数据库大了以后,自然准确率就提高了。


5
打赏
收藏
点击回复
      全部留言
  • 0
更多回复
      你可能感兴趣的主题
技术圈
      圈内贴子35
  • 古书圈子成员57

扫一扫访问手机版

客服