认识js金沙3983总站的要点
人们可以识别js金沙3983总站的含义, 或“要点,”当他们第一次注视那个js金沙3983总站时; 例如, 他们可以认出这是海滩, 餐厅, 或一条街道. 我们自己的研究表明,观看者在短短 36 毫秒的不间断处理时间后就能以超过 80% 的准确度识别js金沙3983总站的要点 (点击上图查看示例). 这提出了几个问题:我们如何能够如此快速地识别图像, 我们使用哪些信息来识别他们? 回答这些问题对于我们理解js金沙3983总站感知非常重要, 因为研究表明,js金沙3983总站的要点使用了我们与js金沙3983总站类别相关的先验知识 (e.g., 海滩有水, 沙子, 棕榈树, 可能还有日光浴者). 这些知识强烈影响我们关注的地方, 可以帮助我们识别js金沙3983总站中的物体, 并且在决定我们从js金沙3983总站中记住哪些信息方面发挥着重要作用. 其核心, js金沙3983总站要点识别研究探索了感知和认知之间的接口——事实证明,这个问题对认知心理学和人工智能领域的工作者来说都极具挑战性. 此类研究可应用于设计能够识别js金沙3983总站类别的人工智能系统.
过去几年我们在js金沙3983总站要点识别方面进行了大量研究, 这些内容如下所述.
Central 与 的角色. js金沙3983总站要点识别中的周边视觉
一个有趣的问题是:视野的哪个区域对于识别js金沙3983总站的要点最有用, 中央视力(中央凹和旁中央凹), 基于其更高的视力和对物体识别的重要性, 或周边, 基于其较大的尺寸以及较低的空间频率对于js金沙3983总站要点识别的有用性? (以下是指向的链接 YouTube 视频 描述有关该主题的js金沙3983总站结果, 还有一个 报纸文章 合众国际社报道.)
我们已经进行了大量研究来调查这个问题. 在这些研究中, js金沙3983总站在两种实验条件下呈现:“窗口”条件,其中圆形区域显示js金沙3983总站的中心部分,但隐藏了外围信息, 或“暗点”条件,js金沙3983总站的中心部分被隐藏,只有外围信息可用 (洛斯基 &js金沙3983总站p; 拉森,2009). 结果表明,外围视觉比中央视觉更能发挥最佳性能(大约相当于看到整个图像!). 尽管如此, 在每个像素的基础上,中央视觉对于js金沙3983总站要点识别比外围视觉更有效. 临界半径为 7.在 Window 和 Scotoma 性能曲线交叉处发现 4°, 产生同等的性能. 该值与皮层放大函数预测的临界半径进行比较,假设相同的 V1 激活会产生相同的性能. 但是, 这些预测系统地小于经验临界半径, 表明 V1 皮质放大率较少预测中央视觉在要点识别方面的效用.
除了根据中央视觉和周边视觉而随空间变化的js金沙3983总站要点识别之外, 我们实验室的其他研究已经调查了如何 js金沙3983总站要点识别随时间而变化. 在一次注视中识别js金沙3983总站要点. 但是, 我们调查了在一次注视中主旨识别是否会随着时间的推移而变化. 一个相关的问题是注意力焦点是否会影响js金沙3983总站要点识别(Evans & 特里斯曼, 2005; 李, 等., 2001). 我们之前的研究表明,中心信息和外围信息都可以产生同等的js金沙3983总站要点识别, 前提是外围面积大约是两倍大. 但是, 这些研究没有改变处理时间(通过屏蔽)或操纵注意力. 因此, 我们使用临界半径提出了“窗口”或“盲点”条件, 使得窗口图像和暗点图像在未遮蔽时产生相同的要点准确性 (i.e., 无限处理时间). 我们简要地呈现了每张 24 毫秒的图像,并通过目标到掩模刺激开始异步 (SOA) 改变了处理时间. 我们的结果表明,在非常短的 SOA 中, 中心信息比外围信息产生更好的要点识别, 尽管单次注视处理时间不受限制 (i.e., 无面罩), 中央信息和外围信息的性能相同. 我们实验室的其他研究也支持了这个想法, 发现中央视觉更擅长尽早处理js金沙3983总站类别(在观看js金沙3983总站的前 100 毫秒期间), 在那之后余光变得越来越有用(拉森, 弗里曼, 铃声, &js金沙3983总站p; 洛什基,2013)。 这表明注意力的时空动态发挥着重要作用并影响要点识别, 设置理解现实世界js金沙3983总站的时空限制.
这些结果与隐性注意力的缩小假设一致,即注意力首先集中在视觉中心,然后迅速向外扩散, 这会影响js金沙3983总站要点识别.
首先感知js金沙3983总站要点的类别级别?
在js金沙3983总站要点处理中首先发生什么级别的分类, 基本级别(海滩与城市)或高级级别(“自然”js金沙3983总站与“人造”js金沙3983总站)? js金沙3983总站分类和人体要点识别的空间包络模型(Oliva & 托拉尔瓦, 2001) 假设高级区别先于基本级别区别. 此假设与分类发生在上级级别之前的基本级别的说法相矛盾(Rosch 等人., 1976). 我们进行了一项研究,通过让观看者对短暂闪现的内容进行分类来测试空间包络模型的这一假设, 不同处理时间后的蒙版js金沙3983总站. 结果表明,处理的早期阶段 (SOA <; 72ms) 对高级区别比基本级别区别产生更大的敏感性, 而且跨越上级自然/人造边界的基本级别区别被视为上级区别(洛斯基 &js金沙3983总站p; 拉森,2010). 两个结果都支持js金沙3983总站包络模型的假设, 并挑战基层至上的理念.
使用哪些信息来识别js金沙3983总站的要点?
人们使用哪些信息来快速将某个js金沙3983总站归类为“海滩,“一条”街道,”一座“山,”等.? js金沙3983总站要点识别的一些著名计算理论提出了反直觉和挑衅性的假设,即图像的非局部幅度谱(其空间频率和方向)提供了用于js金沙3983总站分类的大部分重要信息, 不管它们在图像中的位置. 简单来说, 这表明用于识别海滩js金沙3983总站, 知道有一条强水平线和一条强对角线比知道水平线(地平线)在对角线(水线)之上更重要. 但是, 我们对人类受试者的研究表明,虽然图像的空间频率和方向确实在识别图像方面发挥着一定的作用, 它们本身不足以对js金沙3983总站进行分类 - 为此需要本地化信息 (js金沙3983总站等人,2007 年; 洛斯基 &js金沙3983总站p; 拉森,2008). 因此,本地化的重要性表明js金沙3983总站的布局(js金沙3983总站的全局配置)对于认识其要点可能非常重要.
白噪声掩模 | js金沙3983总站随机掩模 | js金沙3983总站面具 |
我们研究的一个相关主题是js金沙3983总站要点的屏蔽. 视觉掩蔽是指一种刺激干扰另一种刺激的处理 (点击上面相应的缩略图即可js金沙3983总站演示). 掩蔽是研究视觉处理时间过程的重要工具, 在心理学领域已有100多年的历史. 但是, 我们对js金沙3983总站图像等复杂刺激的掩蔽知之甚少, 或相对较高级别的感知任务,例如js金沙3983总站要点识别. 我们比较了低级空间掩蔽 (i.e., 空间频率和方向的掩蔽)具有更高级别“概念掩蔽”的效果(i.e., 通过含义掩饰)(js金沙3983总站等人,2010). 之前的研究表明,js金沙3983总站的识别记忆会被可识别的js金沙3983总站更强地掩盖 (i.e., 一个js金沙3983总站掩盖了另一个js金沙3983总站)而不是无意义的噪音, 这已被用来论证概念掩盖的存在. 我们测试的一个关键假设是,概念掩蔽效应实际上是由于与随机噪声相比,任何给定js金沙3983总站对与任何给定js金沙3983总站之间的视觉相似性更大. 我们的结果并不排除js金沙3983总站要点的概念掩盖的存在, 因为纯粹的视觉相似性, 就空间频率和方向而言, 无法解释由可识别js金沙3983总站蒙版产生的所有蒙版. 但是, 我们的结果还表明,很大一部分所谓的概念掩盖(即, 与白噪声产生的掩蔽相比,可识别js金沙3983总站产生的掩蔽更大)实际上可以由与js金沙3983总站共享许多统计属性的不可识别的噪声图像产生. 其他研究表明,掩蔽对快速js金沙3983总站分类的影响因掩蔽的傅立叶光谱特性而异 (汉森 &js金沙3983总站p; 洛什基,2013). 此类研究有可能扩大我们对js金沙3983总站要点处理和复杂刺激掩蔽的理解.
js金沙3983总站和高度分化的物种如何相处, 鸽子, 比较?
我们最近的一些研究采用了新方法, 研究人类的js金沙3983总站要点分类技能与其他进化上高度分化的物种相比如何——在本例中, 鸽子 (柯克帕特里克, 比尔顿, 汉森, &js金沙3983总站p; 洛什基,2013).
一组实验使用圈养的信鸽来观察它们如何概括和区分js金沙3983总站, 以及这些过程发生的速度. 使用现实世界js金沙3983总站(海滩), 山, 和街道), 第一个实验发现鸽子可以区分自然js金沙3983总站和人造js金沙3983总站(海滩与. 街道)以及两个不同的自然js金沙3983总站之间(海滩与. 山)相对较快. 但是, 鸽子比人类慢, 需要更长的刺激持续时间-大约比人类长 10 倍. 当看到这些类别的新示例时, 他们也能够概括自己的经验来区分这些新js金沙3983总站, 表明他们能够识别类别,而不是简单地记住特定js金沙3983总站.
第二个实验着眼于如何根据图像统计数据来区分现实世界的js金沙3983总站, 并发现鸽子像人类一样使用图像统计数据对js金沙3983总站进行分类. 具有地面视点的js金沙3983总站的性能较差, 但通过训练有所改善. 这些实验表明,人类和鸽子都能够非常快速地区分js金沙3983总站类别(尽管鸽子需要更多时间来做到这一点),而且人类和鸽子都使用图像统计数据来对js金沙3983总站进行分类.
这一系列研究具有有趣的意义,因为这两个物种非常不同, 但表现出类似的快速js金沙3983总站分类能力 - 尽管存在一些明显的差异,可能表明这两个物种在过去的进化适应性特化(柯克帕特里克, 比尔顿, 汉森, &js金沙3983总站p; 洛什基,2013).
比较js金沙3983总站的空中和地面视图的快速分类:js金沙3983总站要点识别的新视角
我们经常在 Google 地球等网络应用中看到飞机js金沙3983总站的鸟瞰图和卫星图像, 但是我们识别这些鸟瞰图的要点的能力与地面视图(在日常生活中从地面看到的)有何相似和不同? js金沙3983总站要点, 观看者单眼注视时对js金沙3983总站的整体呈现, 已针对地面视图进行了广泛研究, 但不适用于鸟瞰图.在过去几年中,我们进行了大量实验来调查此问题. 在最近的一篇论文中 (洛斯基, 铃声, 埃利斯 &js金沙3983总站p; 汉森,2015), 我们在三个实验中比较了两种视图的快速js金沙3983总站分类,以确定诊断信息依赖于视图与独立于视图的程度. 我们发现观察者快速分类空中和地面js金沙3983总站视图的能力存在很大差异, 与js金沙3983总站要点识别依赖于视点的观点一致. 此外, 计算建模表明,在一个视图(空中或地面)上训练模型会导致在另一个视图上表现不佳, 从而提供视点依赖性作为可用信息的函数的进一步证据. 重要, 我们发现地面视图(但不是鸟瞰图)的快速分类受到图像旋转的强烈干扰, 进一步表明地面视图js金沙3983总站要点识别依赖于视点, 鸟瞰js金沙3983总站识别与视点无关. 此外, 从js金沙3983总站鸟瞰图合成的旋转不变纹理图像的可识别性是从js金沙3983总站地面视图合成的纹理图像(这是偶然的)的两倍, 提供进一步的证据证明鸟瞰图快速js金沙3983总站分类的诊断信息是视点不变的. 我们在区分配置处理和特征处理的感知专业框架内讨论结果, 地面视图由于其可预测的视图相关配置而得到更有效的处理,而鸟瞰图由于依赖视图无关的功能而处理效率较低.
js金沙3983总站出版物
js金沙3983总站会议演示
Rjs金沙3983总站kumar,P., 潘纳施, S., 不列颠哥伦比亚省js金沙3983总站, 拉森,js金沙3983总站 & 洛斯基, L.C. (2011, 十二月). 大脑如何表示视觉js金沙3983总站? 神经磁js金沙3983总站分类研究. 神经信息处理系统 - 神经影像机器学习和解释研讨会上展示的海报, 内华达山脉, 西班牙.
js金沙3983总站,K., 戈姆利, D., 格瓦拉, M., 加西亚, A., 西尔斯, T.,汉森,不列颠哥伦比亚省, & 洛斯基, L.C. (2010, 五月). 鸽子的js金沙3983总站要点分类. 在行为定量分析学会年会上发表的演讲, 圣安东尼奥, 德克萨斯州.
洛施基,js金沙3983总站, 塞西, A., 西蒙斯, D.J., 奥克斯, D., 科尔贝耶,J. &js金沙3983总站p; K 吉布 (2005, 十一月). 使用视觉掩蔽探索js金沙3983总站要点的本质. 心理经济学会第 46 届年会上展示的海报, 多伦多, 加拿大.