【B208】MATLAB基于余弦形状相似度的书法字识别

2021-10-27 20:54:00      索炜达电子      681     

文件编号:B208

文件大小:27M

开发环境:Matlab2020

猿创承诺:该项目亲测正常运行,需远程调试部署需另外收费,确保正常使用,不能正常使用全额退款。

简要概述:任意给定一张书法字的图像,请编写程序自动判别图像并输出数据集中相同字的图案。

实验结果与分析:

通过设定检索区间,以匹配度最高的为基准在周围进行检索,保证了查准率,而查全率可以通过提高尝试次数来提高:

若不设定检索区间,匹配度排序确定的序列中,前n个字有m个是正确字,应该匹配到的总字数是a,则查全率为m/a,查准率为m/n。

设定检索区间,将范围缩小到范围为2*threshold的区间,跳过了序列前部存储位置差距巨大的字,而存储时草书文件夹和楷书文件夹互相交错,很大程度上减少了错字的发现。因此要提高查全率只需提高trial,即在序列的前trial个字中搜索。

此方法的弊端是:若匹配度最高的字为错字,则之后所查全为错字。

本次检索,目的是在楷书中检索楷书,在草书中检索草书,但由于形状匹配也会造成草书和楷书的匹配,所以会出现混杂。若需要混合检索,只需调高threshold即可。

总之,本文提供了一个用户自定义参数来检索相似书法字的MATLAB程序,用户使用上包括ui界面批处理数据,ui界面读取测试图,输出匹配图案以及名称等功能。

内部实现了图像归一化处理、形状属性提取、图像匹配的功能。

理论来源为:《根据形状相似性的书法内容检索》(中图分类号TP39)《计算机辅助设计与图形学学报》第17卷 第11期

查全率-查准率曲线由于统计工作需要数据量,而检测正确率需要人工,时间紧迫,无法绘制。以下是一些运行实例。

本次实验采用了设定检索区间的方法保证了检索的正确率,但前提是数据集的字符存储是有序的,如果仅依靠形状相似度,以下因素会降低查准率:

1)图像压缩损失细节(细笔画、密集笔画等);

2)区域判断函数my_area 中的雷达区间划分长度为经验划分;

3)单字匹配度的欧氏距离的权重a为经验值;

4)匹配点判断时,进行判断前提条件为距离小于某个值(isClose函数),该值也为经验值;

5)汉字的形似字不易区分:日和月、丈和万、散和众(繁体)等;

6)某个字中含有样本字的一部分(子图也可能判断相似),如有和月。

按需写作:

【B208】MATLAB基于余弦形状相似度的书法字识别

演示视频:

【B208】MATLAB基于余弦形状相似度的书法字识别

点击查看:系统演示视频

运行结果

【B208】MATLAB基于余弦形状相似度的书法字识别

【B208】MATLAB基于余弦形状相似度的书法字识别

远程协助:

温馨提示:索炜达.猿创官方提供收费远程协助,确保您项目运行成功。

点击查看:远程协助相关事项

我们提供完整项目文件清单如下:

文件目录

 ├ 1.项目源码

 ├ 2.运行截图

 └ 3.演示视频

TAG书法字识别
  • 3 次
  • 300 分