![]() |
|
||||||||||||||
| . 网站首页 . 新闻 . 新品 . 方案 . 专访 . 活动 . DSP . EDA . 评测室 . 技术文库 . 会员区 . 商城 . 服务导航 . 邮购 . 资源 . | ||
|
||
|
|||||
| 人眼识别的几点想法(三) | |||||
作者:admin 文章来源:本站原创 点击数: 更新时间:2004-7-27 ![]() |
|||||
|
前面我们说了大脑的三种操作:存储、传递信息、建立反射(映射)。还有一个操作功能就是比较。大脑的全部操作功能就是这四种,比计算机CPU的功能少多了。然而对于大脑来说,这些操作也足够了。计算机完成这四种操作简直是小菜一碟。完全不象人们估计得那么困难。我们不说嘴了,看看计算机怎样能模拟人眼吧! 1、基本模版的建立。假定我们已经得到当前图象的线条图(由于目前的各种算法在提取线条图方面还有困难,特别是克服不了光线信噪干扰,我们另做讨论)。那么如何使电脑取得基本线条图呢?有两条路,一条是学习,一条是输入。 学习这个概念,有很多不同的含义,单纯记忆是一种学习,单纯模仿也是一种学习,在活动中增长经验还是一种学习,通过对环境的认识,产生自己的知识更是一种学习。很多人都在说“我的”算法、“我的”程序如何能学习,但是他并没有说明他搞得是哪一种学习?实际上单纯记忆的学习很简单,用几百字节的机码程序就可以实现。 我们这里的学习很简单,就是一种记忆。基本线条图的学习,是靠某个简单的线条图的大量出现,大脑把它记忆为基本模版。比如圆,这个线条图里也有圆,那个线条图里也有圆,就把圆记忆为基本模版。完成这样的工作必须要求传送到大脑的线条图越简洁越好。用现在计算机识别中提取的复杂图象信息,你怎么也“看”不出很多图中有圆。而在线条图上,就可以看出圆来。“看”出一些图中有圆的操作也很简单,就是用比较操作,把两个图的各个部分比较,找出一致的地方。这里没有深奥的数学或生物学道理,计算机实现起来应该不会很困难。 另一条路更简单,干脆由人编好线条图输入到计算机中。 2、基本模版概念的建立。我们说过,人眼识别中概念的参与起很大作用。为了模仿这一点,我们就要在电脑中建立与基本模板对应的概念。 用人的交流语言的建立概念比较麻烦,模仿人脑使用内部语言的方式,可以为每个基本模版创造一个内码,作为基本模板的概念。最简单的内码是把基本模板的产生顺序数赋予它。为了能够用交流语言表达给人,每个内码由要与相应的词汇对应,必要时调出交流语言,表达给人。 内码应该有相应的数据库保存,并且和基本模版保持互相调用的关系。这一点对于计算机来说,也不是什么困难的工作。 3、拼图模版的建立。下面的工作就是在基本线条图的基础上建立拼图模版。这里还需要一些描述基本模版间关系的内码,它要表示基本模版组成拼图时的方位、大小、连接情况等。这些内码也要与相应的交流语言符号对应,以便必要时用交流语言表达。比如一个人形的拼图模版的内容用交流语言表达,就是人头在上,下面有身子,身子上方左右有胳臂,身子下方是两条腿。 拼图模版的产生也有学习和输入两种方式。由人向计算机输入大量这种模版,人的工作量大,使用也不方便。还是计算机自己学习好。这里的学习仍然是以记忆为主的学习。学习过程中比较操作仍然是核心。在一幅实际线条图上,计算机用模版比较,找到相匹配的部分。如果大小不一样就进行放大缩小的操作,直到确定一个基本模板在实际图型上的位置,然后是找另外基本图的相对位置,找的过程记录下两个基本模版的位置。最后一个实际线条图被用内码表示的拼图模版代替。 拼图模班建立后,同样也要为他们建立对应的内码,并建立与交流语言的对应关系。这样就完成了模板的识记过程。以后根据情况,两种模版都会有补充,但基本模版数量不能太多,多了就不是基本了。拼图模版不要太复杂,太复杂了,就代替更高层次的识记了。 人在幼儿时期由于基本模版和拼图模版还没有建立完整,他对复杂形象的识别能力就很差。现在电视机多了,你认真观察,会发现一岁左右的幼儿不喜欢动画片,而喜欢天气预报和广告。在播大孩子喜欢的动画片时,他们毫不在意。到天气预报和广告出现时,他们定睛观看。这两个节目相同图象重复率高,画面较简单,便于幼儿识别。对动画片,这时他们还无法识别,更无法理解。稍大一些孩子,喜欢看动画片而不常看真实人物片,也是因为片中的图象比较容易识别,内容也好理解。 4、高层图形的识记。更复杂的线条图形,由高层识记过程完成。他们也是用内码描述的拼图,不过描述他们的不是基本模版,而是拼图模版。高层图形的产生与描述方式与拼图模版类似。只是它们的内容要复杂的多。它们是识别和再识的依据。比如,它可以描述出一个人(一个拼图模版)站在马路上,周围有很多行人(一些拼图模版)和车辆(一些拼图模版)的复杂图景。 高层拼图一般不再建立内码,实际上你也不会为记忆中的图景命名,例如把前面人在马路上的图景叫做“人在马路图”。但高层拼图还要建立与交流语言的对应关系,一个人是靠语言表达回忆这些高层图形的。比如,你可以用语言生动地表达你在马路上的情景。 由于建立高层拼图的工作过程与拼图模版类似,不再多说。 5、识别特征和识别模版。以上两种模版和高层拼图,都代表一般情况下的图形。它们相当于我们描绘一个人时说的,大眼睛、高鼻梁、长方脸、大高个,有点胖。至于一个具体人,还有它具体的识别特征。要想快速识别,还要为具体对象建立具体的识别特征。 每个具体的识别对象,都有它的具体识别模版。这种具体识别模版包括两个部分:高层拼图和识别特征。这里关键是特征的提取。完成特征提取的还是个识记过程。 特征的提取是一个多次完成的过程。比如对象是某个人,他出现几次后,他经常出现的部分,就会被作为特征单独保留,附属在高层拼图旁。但是以后发现这个特征不见了,这个特征就被放弃,另确立特征。直到稳定的特征被找到,特征提取工作完成。 计算机完成特征提取,也主要靠比较和记忆操作完成。把实际线条图于高层拼图比较,就会发现不同之处,先把它作为特征保存,然后就进入淘汰和再提取过程,直到最后确定特征。用程序实现这些并不难。 这里出现一个时间问题,这样做好象需要太多的时间。其实识记过程的“长”,就是为识别过程的“短”打基础的。特征提取好了,在识别时,有时还没有做与模版匹配的工作,识别已经完成。 |
|||||
| 欢迎点击进入:TI德州中文网 (国内唯一针对TI应用的中文技术网站) 文章录入:admin 责任编辑:admin | |||||
| 【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口】 | |||||
| 最新热点 | 最新推荐 | 相关文章 | ||
| 人眼识别的几点想法(一) 人眼识别的几点想法(二) |
| 网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!) |
| | 设为首页 | 加入收藏 | 联系站长 | 友情链接 | 版权申明 | 网站公告 | 管理登录 | | |||
|
|