爱犯错的智能体 – 视觉篇系列:抽象的颜色 - AI科普 - 广西人工智能学会

爱犯错的智能体 – 视觉篇系列:抽象的颜色

2018-10-08| 作者:张军平  |  来源: CAA混合智能专委会| 查看:

     
        颜色感知是视觉的基本功能之一,也是智能的基本元素之一。可是,颜色从何而来呢?为什么会有这些功能呢?它又是如何被认知的呢? 
 
一、颜色的来源

        众所周知,自然界中充斥着电磁波。按波长由短到长来划分,电磁波包括了伽马射线、X射线、紫外线、可见光、红外线、无线电波等。与整个电磁波谱近10的16次方级差的波长范围相比,可见光只分布在380nm(纳米)到760nm之间,简直是太宅了(窄)。而偏偏是这段窄得不能再窄的波谱,对人类的生存和智能发展却起了重要作用。为什么人类没有选择其它更宽的波谱来形成颜色视觉呢?
 


图1     左:电磁波谱与可见光;

右:电磁波在进入地球大气后的分布
 
        一种可能的解释是,虽然自然界的电磁波分布广泛,但由于大气的保护作用,如臭氧层吸收掉了大量对大多数生物有害的紫外线、大气中的二氧化碳吸收掉了大量的远红外线、水蒸气吸收了近红外和微波,最终能进入地球大气层并到达地面的太阳辐射便以可见光谱范围为主,如图1右所示。而人类在演化中就选择了能量最强的这段光谱来感知世界,所谓之人择原理。然而,同样是电磁波,只是波长频率上的不同,为什么只有可见光能呈现颜色呢?
 
        事实上这样说也不是完全精准, 因为不同物种感知电磁波的能力是不同的,感受的颜色也有细微差异。比如蜜蜂。据说由于复眼的原因,蜜蜂能感受更短波长即紫外线段 的差异。结果,在蜜蜂的眼里,白色的花可能会有不同的颜色。这方便了蜜蜂识别不同类型的白花,如图2所示。而众说周知的响尾蛇则能通过位于眼睛和鼻孔之间的 “热眼”感应到更长波段的红外线的强度变化,以此来区分活体与非活体。
 


图2 人与蜜蜂视觉的差异[1];

人眼中的白花(左)与蜜蜂眼中的白花(右)
 
        不同于这两种动物,人类的颜色视觉感知范围都在380nm到760nm之间。按波长长短,粗分成了如彩虹的“红橙黄绿蓝靛紫”的颜色变化。国际照明协会甚至给出了无法通过其他颜色混合而成的相加三基色,即红、绿、蓝的波长定义,尽管每个基色实际都有一定的变化范围。考虑到打印、油画的颜色是通过反射获得的,它还给出了相减三基色,即青色、品红、黄色的定义。
 


图3 相加三基色与相减三基色
 
        不管如何定义,人类对颜色的感知方式基本是一致的。目前公认的是杨一赫姆霍兹(Young-Helmholtz)三原色学说,即认为视觉系统中存在对红、绿、蓝三基色光线特别敏感的3种视锥细胞、或相应的3种感光色素。其它颜色的光线则作用于这三种视锥细胞并进行混色,并形成相应颜色的感觉。该学说解释了混色现象的原因,但还不能满意的说明色盲、补色现象、负后像等现象。类似的学说还有,也无法形成圆满解答。另外,视觉神经元对三基色的感知的敏感差异也基本相同。如主要负责蓝色感知的视蓝素,虽然总量少,但却最为敏感。因为存在这些一致性, 颜色感知才能有利于人类形成对世界大抵相同的观点、对物体的共同印象和概念、对情绪和心理的共同感受。 
 
 
二、颜色的功能和错觉

        如果人类只能感受光线的强弱,而无法感知颜色,那必然会少了不少能力和乐趣 。因为有了颜色的感知,于是在智能发展上便有了很大的提升。
 
        第一个重要的提升是对目标识别能力的改善。随手拍张照片,如果换成黑白色,就会丢失不少结构信息,甚至彩色图像可能反映出来的深度信息也会损失不少。这是光强与颜色差异的区别。不仅如此,从视神经元的感受能力也能发现巨大的差异。人对光强度的分辨能力一般在20个灰度级左右,但对颜色的分辨却能上好几次数量级。这无形中拉大的目标或物体之间的区分度,为人类提高和加速识别目标提供了有利条件。
 
        人类也把这一技术挪到计算机上用于其他任务的识别。如 AlphaGo直接把围棋的棋盘视为颜色在棋盘上的分布,并根据分布来判断每一个棋盘的输赢。人类还把这一技术用到原本不可见的光谱上,如机场的X光机,帮助更有效地分辨危险物品。甚至将用于声波反射构成的医疗图像,如给B超图像着色,以提高医疗诊断的有效性。
 
        值得指出的是,颜色分辨能力在男女之间有着明显的差别。男性对颜色的敏感程度,从平均意义来讲,要远低于女性。打个不恰当、夸张的比方,男性能认全彩虹里的“红橙黄绿蓝靛紫”就不错了,女性却可能认识上千种颜色。不信的话,女性同胞们可以把图4中不同种类的口红颜色让男性朋友辨别下。
 


图4  不同种类的口红
 
        不过颜色认得少也不见得全是坏事,比如怕“鬼”的多是女性,有可能就跟颜色看得太多、容易产生的联想丰富有关。为什么要在智能体上形成性别差异明显的颜色感知呢?
 
        有一点可以肯定的是,颜色会影响人类情感的表达。不然,买那么多种口红就没意义了。 不同的色彩也能影响人对观察到的事件的判断,甚至给出截然相反的结论,如图5的着色。 颜色有的时候还可以帮助掩饰真实情感,如用艳丽的口红来掩饰不愉快的心情。
 
 

图5     救人还是?颜色的误导
     
 


图6   颜色影响图像的格调

(注:来自影像视觉杂志)  
 
        除此以外,颜色对于图像高层语义的表达也很重要。在摄影作品中,有时为了追求特殊的美感,会有意将照片的颜色退去,以形成所谓的高调、低调的黑白照片。但在多数情况下,彩色照片仍然占主导地位。在彩色图像上同一场景颜色明暗的变化会导致不同的感受,如图6。该图只是在颜色的明暗上做了些微变化,就影响了对图像中人物心情是忧郁还是略显阳光的判断。
 
        另外,现有的与人工智能相关的诸多应用,都要考虑对颜色的处理。如图像修复(Image Inpainting)中,需要考虑缺失部分与未缺失图像之间颜色的一致性;图像标注(Image Captioning)任务需要考虑颜色带来的意境。
 
        值得指出的是,古往今来的文人墨客从来没不吝啬用笔墨来描绘五彩斑斓的颜色。举例来说,鲁迅在《雪》中的一句对寒冬时节花草的描述:
        雪野中有血红的宝珠山茶,白中隐青的单瓣梅花,深黄的磬口的蜡梅花;雪下面还有冷绿的杂草。
 
        聊聊数笔,一幅有颜色的画面便跃然纸上。试想,如果没有颜色,由智能体、人类撰写的文学作品肯定会逊色不少 。
 
 
三、抽象颜色的认知

        既然颜色在智能体中起了如此广泛、重要的功能,颜色的辨识又是在何时被固化到人的视觉中枢呢?
 
        要回答这一问题,还可以先问另一个问题。有多少人去观察过儿童的发育,观察过儿童在不同年龄阶段对物体、概念的学习能力呢?
 
        本人曾对某儿童的成长进行过长时间的观察。从个人的经验来看,颜色是儿童在1岁以后才能学会和理解的。有别于有形物体的学习,颜色在早期发育中是比较难以学好的概念,因为它是触不到,摸不到的。
 
        在儿童最开始的物体学习阶段,触摸很重要,因为即使是同样的物体,如果不去触摸,人也会产生不同的视觉感知,如受观察角度的影响、受透视角的影响等等。通过触摸,可以完成消歧,得到唯一的概念标签。
 
        然而,颜色却是无法触摸的。在父母通过听觉系统向小孩传授这一概念的时候,小朋友只能依赖视觉获取的信息来推测。但听觉信息传授的概念具有很强的多义性,比如说一堵墙是红色的。小朋友在无法触摸颜色时,即使父母通过手势来辅助传授,他/她也并不会清楚红色是特指什么,尤其在他/她已经习惯了通过触摸来帮助学习物体的时候。通过这个观察,我发现颜色尽管是能看到的,却是相对抽象的、略为高级的语义信息。结果,这个抽象的颜色,需要花比学习实际物体更长的时间来学习,才能形成准确的抽象概念表征。同时,抽象的特点也使得颜色的认知往往会滞后于实体目标的学习。
 


图7  不同色盲的颜色感知
   
        不难看出,颜色尽管与生俱来,但最终还是通过传授完成标定,并形成认知上的统一的。然而,值得注意的是,这种认知上的统一,并不能解决因为基因或病理原因引起的色盲,甚至可能导致危险。比如我们常见的红色色盲患者,其在颜色的感知上对红色与绿色是没有区分的。但是,这并不意味着他在熟悉的场所区分不了这两种颜色。因为,在儿童期的颜色学习时,父母会通过听觉和手势来帮助区分颜色会处的位置。
 
        红绿灯尽管颜色感知相似,但在交通灯的位置往往是不同且相对固定的。所以,在熟悉地段,红色色盲患者是能正常生活的和遵守交通规则的;但危险来自于,去陌生地方的时候。如果红绿灯位置产生变化,那红/绿色盲患者就很难区分。除此以外,这类患者在理解艺术作品中的情绪、美感上也会产生严重的偏差。当然,如近视眼创造的印象派一样,也不排除色盲患者会画出不同常人、别具一格的杰作。
 
        从以上例子可以看出,人对颜色甚至知识的学习似乎是从具体到抽象逐渐过渡的,而不会一开始就接触非常抽象的概念。如果想建构一个拟人的智能体,是否也应该遵循这一规范呢?是否不应该从相对于视觉更为抽象的自然语言处理开始着手呢?
 
        而作为人工智能的研究者和爱好者,不妨也观察下,自己的小孩什么时候能学会判断颜色?  是否比学习实体的概念更困难? 观察新生儿的发育过程,尤其是0-3岁时期的,很可能能对人的智能发育形成更直接、一手的了解。如果多些人去尝试,也许能得到很多统计意义上的、关于智能的新的发现。 
 
参考文献:
https://www.dailymail.co.uk/sciencetech/article-473897/A-bees-eye-view-How-insects-flowers-differently-us.html
THROUGH INSECT EYES VISION SCIENCE: HOW BEES PERCEIVE THE WORLD
Sharla Riddle.  THROUGH INSECT EYES, VISION SCIENCE: HOW BEES PERCEIVE THE WORLD, May 20, 2016. 
 
 
张军平
2018年10月7日

关于我们
联系我们
  • 主管单位:广西壮族自治区科学技术协会
  • 登记单位:广西壮族自治区民政厅
中国(广西)自由贸易试验区南宁片区金龙路2号广西能源大厦C座A601室
          太平洋世纪广场A座
邮箱:gxrgznxh@163.com
网址:www.gxaai.com
电话:0771-5383552
Copyright © 2018 广西人工智能学会 版权所有 桂ICP备18007185号-1