爱犯错的智能体 – 视觉篇系列:外国的月亮比较圆? - AI科普 - 广西人工智能学会

爱犯错的智能体 – 视觉篇系列:外国的月亮比较圆?

2018-09-20| 作者:张军平  |  来源: CAA混合智能专委会| 查看:

 
        还有几天就是中秋佳节了,和家人一起一边赏月,一边吃着五仁月饼 ,真是其乐融融。赏月的时候,有时会禁不住想起这句“外国的月亮比较圆”,然后会引申出各种崇洋媚外的批判感悟。
 
        到底有没有比较圆呢? 2015年9月28日中秋节,广东天文学会就指出,当年那天的中秋月会与超级月亮和月全食相连,会出现平均九年一次的最大最圆的中秋月。不过遗憾的是,只有南美洲、北美洲东部和非洲西部能看到月全食和欣赏到最大红月亮,而中国则无法看到。那一天,外国的月亮又圆又大。
 
        但在多数情况下,月亮到地球的距离从不同地点来看差异不大,不管是用经纬仪还是拍照后测量,月亮的大小除了轻微的物理变化外,相差无几。视觉上产生这种感觉只是心理作崇而已。
 
        虽然“外国的月亮比较圆”并不成立,但在月升月落之间,人对月亮大小的心理感知确实存在差异。最明显的例子是,月亮在地平线上的大小会比在天上看上去会更大一些,俗称“月亮错觉”(Moon Illusion)。 虽然这并非真正的月亮大小问题,但这种心理感受的大小差异却仍是一个未解之谜。
 
        追踪下文献不难发现,感受过、研究过“月球错觉”的人还真不少。对国人来说,曾记录过这一感受的首推哲学家王阳明。他在1484年12岁的时候写过一首很有名的小诗,《蔽月山房》。这首诗就记录了他对月亮错觉的感受。
 
山近月远觉月小,
便道此山大于月。
若有人眼大如天,
当见山高月更阔。
 
        而国外则对这一现象有着非常长期的分析和思考。最早可以追溯到古代的公元前4世纪。希腊著名哲学家亚里斯多德就记录过,他认为“月亮在地平线比天上大”的原因是因为地球的大气起到了放大的作用,导致了人眼产生了感知错觉。
 
       最早基于距离理论的解释是Cleomedes在大约公元200年时提出的。他认为地平线上的月亮大是因为其看上去显得更远。原因在于在地平线的角度上,人会参照其它物体的大小来感受月亮的大小。而在天顶时,没有其它参照物可以借用,于是感觉上就会觉得天上的月亮离地球要近一些,因而会觉得比地平线的月亮更小。
 
        1813年,Schopenhauer认为这种错觉是大脑的行为而非光学原因。他认为大脑对于水平角度的目标判定,直觉的感受理解就比垂直方向的显得更遥远,因而看起来更大。
 
        1962年两位科学家Kaufman和Rock进行了一个关键的实验,验证了月亮错觉模式与距离之间的关系,称为“庞邹错觉”(Ponzo illusion),如图1所示。从图上可以看出,当目标具有相同大小,但放在更远处时,随着视角的变窄或靠近消逝点,远处的目标会显得更大。举例来说,如果将两个相同大小的苹果分别放置在5米和10米的位置,后者的视角将比前者小一倍,但感觉上不会觉得后者的尺寸小一倍,而会是相同大小。相反,如果更远的目标与近的目标具有相同的视角,则视觉上会感觉有两倍的大小。
 
        另一种解释是相对尺寸假设,如图1所示。月亮在地平线时,其邻近的目标往往能展示更精致的细节,使得月亮看上去显得更大。反而,天顶的会大范围空的空间包围着,因为显得更小。这个效果又被称为"艾宾浩斯错觉(Ebbinghaus illusion)"。
 
        基于这样的感觉,有些科学家认为“地平线上的月亮看上去大是因为其感受的视角尺寸或物理尺寸更大,或两者均有”。
 
然而,基于距离理论的不足在于,尽管大多数人会认为地平线上的月亮既大又比天顶的月亮近,大约还有5%的人会觉得地平线上的月亮既大又远,还有一些人认为距离相同但地平线上的更大,还有一些人完全没有月亮错觉。
 
 
图1 左:月亮错觉;右:艾宾浩斯错觉
 
        为了探寻真谛,Hershenson在1989年主编了一本书,《月球错觉的神秘》。该书竟然用24章288页,详细介绍了不同错觉研究者从不同角度给出的解释。然并卵,没有达成一致结论,也没有终结对月亮视觉大小差异的疑问。
 
2、人工智能中的透视问题
 
       如果把月亮大小的感觉看成是与心理因素相关的透视问题,那么需要说明的是,这种心理原因导致的透视错觉目前还没有什么好的理论和算法去量化成计算机程序并实现。但在客观存在的透视问题上,研究就多多了,因为客观的透视在很多计算机视觉、图像处理领域的实际应用中都有着重要的作用,而这些应用又直接影响了人工智能的相关研究。
 
        比如人群计数研究。人群数量否准确预测,对于安防、旅游景点和地铁应急疏散、商场商品的位置摆放等都有着关键的作用。但要想有效估计人群数量,又并非容易的事情。用手机来监控的话,GPS定位信息的漂移现象往往会显著影响计数性能。尤其在开放环境下如外滩的人群计数,周边办公大楼的信号都可能不期而至导致误估。而场馆内则会出现GPS信号丢失的问题。有人也尝试过用无线路由器的信号来监控馆内人群,但精度上无法保证。更合理的方式是通过摄像机来获取图像,并对图像或视频中的人群进行计数。不过,摄像头的角度设置是有讲究的。垂直角度如无人机,可避免人与人的遮挡,但电池的待机时间存在问题,而烧燃油的又不是一般部门能玩的且噪声巨大;近景的如安装在公交车站上车处的,则会因为前面的人在视频中占的比例太大,导致视频范围内可以计数的人变得很少,实用价值降低。中等角度如安置在楼宇屋顶的,可观察的角度相对来说更好些, 适合于较稠密的人群计数。但由于摄像机的角度问题,远近人群在图像中的比例会因透视而发生改变,如果不进行透视角纠正,则可能会影响随后的计数性能。这是客观透视的一个应用。
 
 
图2  人群计数中的透视问题 [2,3]
 
        另外,在交通领域,大货车的侧方盲区和尾部一直是马路致死率很高的问题。为减少它的影响,一些国家要求强制在两侧安装有广角镜,比较先进点的还能把盲区的视频信息返送到驾驶室内。但由于广角镜透视变形的原因,驾驶员容易对行人和非机动车驾驶员离车辆的远近、运动速度产生误判。此时,就需要有相应的算法来帮助还原真实的距离和运动速度了,以减少不必要的风险。
 
        除此以外,在计算机视觉领域还有人研究基于图像的测距问题。这一问题在智能手机流行后似乎研究意义更大了。科学家们希望能对给定的图像或视频,不依赖于真实的测量仪如米尺,就能直接测量出图中的目标尺寸和目标间的相互距离。这一研究,显然也涉及到透视关系以及透视意义下的比例问题求解。
 

 
图3  基于图像的测距研究示例[5]
 

3、透视角度对心境的影响:
 
        情绪、情感对人工智能的研究至关重要,因为它关系到是否能真正通过计算机模拟出一个真正像人的机器,而非看上去像。那么,如何形成、在哪里能形成这种情绪、情感就需要仔细思考了。
 
        透视角度的选择对心境就能表现出很复杂的影响,尤其在高层语义上。所以,画家对于透视角度的选择看得很重,因为它影响了人们评判绘画的美感。 要让人工智能像人类一样能创作,攻破艺术这个关口,可能也得好好研究下透视对心境的影响。
 
        我们不妨回顾下人工智能科普奇书《集异壁之大成》中提到的一位荷兰画家莫里茨·科内利斯·艾舍尔的创作经历,以及他对透视的运用。
 
        学画都是从临摹开始的。后来,艾舍尔为了能让自己的绘画有与众不同的感受,他对透视角有过非常深的思考。这能从他不同时期的绘画作品中窥其堂奥。
 
        最初,他喜欢去山顶绘画,希望得到俯瞰视角下的景色描绘;后来,他改成了从窗户往外看,窗内窗外的透视又形成了一组奇特视角的画。再后来,他干脆手上拿个水晶球,画了观察自己的自画像。有了自画像后,他似乎找到了循环,便有了许多自指的杰作。对透视角的不断深思,最终让他成为了以“不可能图形”而闻名的一代名画家。
 
 
图4 左:窗内视角的《静物和街景》;右:艾舍尔的《手与反射球体》
 
       透视角不仅能影响审美,产生奇妙的美感,它也能制造恐惧。在今年最新上映的韩国恐怖片《昆池岩》,导演别出心裁的采用了“第一”视角的方式拍摄。电影中,六名演员均在胸前安装了两个运动相机,一个对着自己脸部,一个对着自己观测的环境。由于镜头与人脸的距离非常近,对着自己脸部的相机让演员的脸产生了明显的拉伸变形。因为变形后的脸与正常脸有明显的差异,无形中将人的表情尤其是惊悚的表情放大了,使得电影的恐怖感一下就上来了好几个级别。这是透视角度对人内在情绪的影响。因为有点恐怖,图我就换张大概有点这个意思的给大家感受下好了。
 

 
图5 网红柴犬玛鲁近景照
 
        所以,透视对人在心理、距离、情绪等方面都有着重要的功能,也有着与人工智能相关的许多实际应用。可是,要解开透视中的谜团,尤其是主观透视现象,让其体现到人工智能的算法中,还是路漫漫其修远兮。
 
张军平
2018年9月20日
 

参考文献:
 
1. 维基百科 
  https://en.wikipedia.org/wiki/Moon_illusion
2. A.B.Chan, Z.J.Liang, N.Vasconcelos. Privacy preserving crowd monitoring:  counting people without people models or tracking. in:IEEE Conference on Computer Vision and Pattern Recognition,Anchorage, Alaska, USA, 2008.
3. Ben Tan, Junping Zhang, Liang Wang. Semi-Supervised Elastic Net for Pedestrian Counting. Pattern Recognition, vol. 44, issues 10-11, pp. 2297-2304, 2011
4. Ferdinand van der Heijden. Image Based Measurement Systems: Object Recognition and Parameter Estimation. Wiley; 1995.
5. Adrian Roserbrock. Measuring size of objects in an image with OpenCV. Mar 28, 2016 in Image Processing, Tutorials.
6.  侯世达. 哥德尔、艾舍尔、巴赫:集异壁之大成. 商务出版社,1997.
 

关于我们
联系我们
  • 主管单位:广西壮族自治区科学技术协会
  • 登记单位:广西壮族自治区民政厅
中国(广西)自由贸易试验区南宁片区金龙路2号广西能源大厦C座A601室
          太平洋世纪广场A座
邮箱:gxrgznxh@163.com
网址:www.gxaai.com
电话:0771-5383552
Copyright © 2018 广西人工智能学会 版权所有 桂ICP备18007185号-1