2021-10-27 20:54:00 索炜达电子 1073
文件编号:B208
文件大小:27M
猿创承诺:该项目亲测正常运行,需远程调试部署需另外收费,确保正常使用,不能正常使用全额退款。
简要概述:任意给定一张书法字的图像,请编写程序自动判别图像并输出数据集中相同字的图案。
实验结果与分析:
通过设定检索区间,以匹配度最高的为基准在周围进行检索,保证了查准率,而查全率可以通过提高尝试次数来提高:
若不设定检索区间,匹配度排序确定的序列中,前n个字有m个是正确字,应该匹配到的总字数是a,则查全率为m/a,查准率为m/n。
设定检索区间,将范围缩小到范围为2*threshold的区间,跳过了序列前部存储位置差距巨大的字,而存储时草书文件夹和楷书文件夹互相交错,很大程度上减少了错字的发现。因此要提高查全率只需提高trial,即在序列的前trial个字中搜索。
此方法的弊端是:若匹配度最高的字为错字,则之后所查全为错字。
本次检索,目的是在楷书中检索楷书,在草书中检索草书,但由于形状匹配也会造成草书和楷书的匹配,所以会出现混杂。若需要混合检索,只需调高threshold即可。
总之,本文提供了一个用户自定义参数来检索相似书法字的MATLAB程序,用户使用上包括ui界面批处理数据,ui界面读取测试图,输出匹配图案以及名称等功能。
内部实现了图像归一化处理、形状属性提取、图像匹配的功能。
理论来源为:《根据形状相似性的书法内容检索》(中图分类号TP39)《计算机辅助设计与图形学学报》第17卷 第11期
查全率-查准率曲线由于统计工作需要数据量,而检测正确率需要人工,时间紧迫,无法绘制。以下是一些运行实例。
本次实验采用了设定检索区间的方法保证了检索的正确率,但前提是数据集的字符存储是有序的,如果仅依靠形状相似度,以下因素会降低查准率:
1)图像压缩损失细节(细笔画、密集笔画等);
2)区域判断函数my_area 中的雷达区间划分长度为经验划分;
3)单字匹配度的欧氏距离的权重a为经验值;
4)匹配点判断时,进行判断前提条件为距离小于某个值(isClose函数),该值也为经验值;
5)汉字的形似字不易区分:日和月、丈和万、散和众(繁体)等;
6)某个字中含有样本字的一部分(子图也可能判断相似),如有和月。
按需写作:
演示视频:
点击查看:系统演示视频
运行结果:
远程协助:
温馨提示:索炜达.猿创官方提供收费远程协助,确保您项目运行成功。
点击查看:远程协助相关事项
我们提供完整项目文件清单如下:
文件目录
├ 1.项目源码
├ 2.运行截图
└ 3.演示视频