网站公告列表

  没有公告

加入收藏
设为首页
联系站长
您现在的位置: 61IC中国电子在线 >> DSP >> FAQ >> 硬件开发 >> 文章正文
  人眼识别的几点想法(一)         ★★★ 【字体:
人眼识别的几点想法(一)
作者:admin    文章来源:本站原创    点击数:    更新时间:2004-7-27    
人眼识别的几点想法(一)
我发现,现在搞视觉识别的,总是希望处理的信息量大一些,全面一些,以为这样才能得到准确的识别效果,其实这个思路和人眼识别的实际情况是相反的,人眼往往能够在信息量非常小的情况下做出准确识别。
一、“从背影认出他”现象:这个小标题有点俗吧?实际上,我们经常会遇到这种现象。背影应该说是人体信息量最少的一面,但是对于人眼的识别来说,这种识别情况再常见不过了。当然这种识别的对象一定是熟人,你只见过一面的人,下次很难从背影认出他。另外这种识别没有法律意义,仅凭背影确定罪犯,法律往往不会采信。这种识别的道理很简单,无非整个识别不凭借全部信息,而只凭借局部特征。如果选择的特征代表性强,那么信息量小也能准确识别。
这种现象提醒我们,搞视觉识别应该在提取信息量小的特征方面下工夫。越是信息量大,越可能“淹没”有用的特征信息。显然,无论从处理速度上看,还是从视觉识别的发展看,信息量小又准确的识别都是不可忽视的。
在人眼的识别中,常常有一眼认出的现象,它表明人眼的准确识别速度非常快。实现这种速度快的识别,只有两个方向:一个是加快处理速度,一个是减少信息处理量。目前的视觉识别靠的是前者,而人眼的识别应该是靠后者。
但是凡事只看到方向不行,会看方向的人很多,找出解决方法才会使看到的方向有用,否则仅仅是看到而已。
二、如何选取有效的特征。这里要解决的是人眼靠什么识别。我们常会看到一个小孩在纸上歪七扭八地划出线条图,说这个是妈妈,那个是爸爸。他画不好,有他画图技术上的原因,但起码他认同那个线条图是他头脑中爸爸、妈妈的形象。如果让一个技术好的人,几笔勾画出他父母的轮廓线条,孩子会更加认同。
这表明人眼识别的最终形式,应该是线条图形式,它简单,信息量少,但是能够准确把握人脸、人体的视觉特征。这应该是识别基本的依据。
在孩子画画时,一个圆,可以是球,可以是烧饼,也可以是脑袋。但是一个圆下面有一条竖线,竖线两边再出现上下四个分杈,就一定不是球,不是烧饼,而是人了。为什么这个和人体图象相差很多的线条图竟被认同为人呢?因为在人眼识别时不是对图象进行全信息处理,而是以基本线条图为基元,用它们的组合(拚图)进行识别。基本线条图就是圆、方形、直线、角、各种曲线等图形。
在对线条图的识别中,大脑中保存有一些基本线条图为模版,并保存由哪些模版组成哪些形象的概念描述。当接收到的图象转化为线条图后,它与一些模版的组成一致,便转化成相应的概念。完成了识别。
然而这还不是人眼识别的全部。
三、逐步补充在识别中的作用。小孩在家中只见到爸爸、妈妈,头上画两根头发就是妈妈,眼睛处画两个圈(眼镜)就是爸爸。这表明他在这个环境,可以用这样简单的特征,确认识别对象。但是当他接触人多了,这种简单的特征不够了,于是他便寻找新的识别特征,比如,妈妈爱穿连衣裙,幼儿园阿姨爱穿花长裙,成为他区分识别对象的特征。这在心理学中叫“分化”。
这种现象表明,识别特征在不断补充,人眼是用不断补充信息的方式识别的,而不是一次完成识别的。事实也是这样:成人看到一个人,远远就能够从特征上判断男女、老少、美丑等。近了,仔细看了,才能从细节特征上认出此人。熟悉的人,需要特征少,凭一条围巾、一对眼睛、一个笑容等简单特征就能够准确认出。不熟悉的人就麻烦了,要左看右看,终于找到识别特征,才能认出。这里就有一个收集补充信息的过程。
复杂的、精细的识别也是这样:专家鉴别一幅名画,先大略看出画的内容,再根据自己的经验确定画的风格,这样就能看出是否是某某的画。但是还要确定真伪。专家就要观察能够辨别真伪的细节特征。有时印章上的一个残缺,画卷上的一块缺痕,都能成为准确识别的依据。
在逐步补充信息的过程中,局部特征、细节特征才起决定性作用。由于识别中有这个逐步补充信息的过程,人眼识别不担心提取的信息量不全。这和现在模式识别的思路也是不同的。
三、概念在识别过程中的作用。人脑没有什么计算能力,它的识别不需要算。人脑的基本功能是传输、保存信息,还有一个人们不大注意的功能就是建立反射关系。反射关系就是在若干神经间建立联系。这种联系相当于数学中的影射,可以使很多记忆资料相互对应起来。概念就是靠这种影射形成的。
概念实际是一些语言符号,在大脑里,用听觉信号保存也好,用视觉信号保存也好,都是较为简洁的东西。图象,即便是线条图也比它们复杂。在人眼识别过程中,用概念描述形象起着非常重要的作用。
识别图形时,大脑从图象中(通过线条图)提取出概念和用概念对图象做的描述进行识别。这种识别,模版是用概念描述的,图象是用概念描述的。这种识别叫做概念识别。它比就图象识别图象有很大的优越性。
首先它是人眼识别的目的,识别与再识不同,再识要求确定它们是同一个,识别就是要把图象转化为概念,转化为语言描述。其实由概念帮助再识,效果也是很好的。
其次它是别人确认你完成识别的依据,你不能用概念组成语言表达出图象,你的识别对别人就毫无意义。那怕只是回答:是与不是,也是你识别的结果,也是在你产生概念后形成的一种表达方式。
再其次,在逐步识别的过程中,概念是你保存以前识别结果的最好方式,它简单易存,描述清晰。在前面结果保存后,你继续识别的结果形成新的概念,只需要把前后的概念组织成语言,就可以得出识别结果了。
最后,用概念保存识别模版,比用形象保存识别模版,保存的信息量少,识别的速度快。这个问题我们说得稍细一些:大脑中保存的图形是基本线条图,它们先与概念建立起对应关系。再用这些概念描述它们的组成的一些图形,把这个描述保存起来作为识别依据,显然比直接保存具体形象的线条图节省内存。在识别的时侯,不是用图象比图象,而是用概念组合比概念组合,那样做,信息处理量也大大较少。同时也容易发现需要补充的东西,及时向眼睛要补充信息。
顺便说一下:我们所说的语言描述,不是指人们间都能听懂的交流语言描述,那样的描述也比较复杂。它是一种只有大脑懂的内部语言,比交流语言更为简洁,更易保存,更易进行识别操作。
这里我们只讨论了人眼识别的基本情况,我们已经看到了,小信息量提取实现准确识别是完全可能的,同时看到这种识别方式的基本过程:第一,简化(分五步)成线条图,在这种小信息水平进行识别。第二,识别的模版有两种:基本线条图(保存为图象),简单图形的概念描述(保存为内部语言),在概念的级别上进行识别。第三,识别特征提取不足,采用逐步识别的方式不断提取新特征,完成识别。
人眼识别远比这个复杂,我们以后再讨论。
               欢迎点击进入:TI德州中文网   (国内唯一针对TI应用的中文技术网站)    文章录入:admin    责任编辑:admin 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    最新热点 最新推荐 相关文章
    人眼识别的几点想法(二)
    人眼识别的几点想法(三)
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    站长:61IC 湘ICP备05002478号