百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

两个黑箱问题——深度神经网络和脑神经网络

wptr33 2025-02-28 17:40 14 浏览

谷歌DeepMind 团队的研究将认知心理学(cognitive psychology)和深度神经网络(deep neural network,DNN)结合在一起,并发现两者在小样本词汇学习(从一个示例中猜出一个单词的意思,one-shot word learning)过程中具有相似之处——DNN 和脑神经网络都具有形状偏好(shapebias),相关研究论文《Cognitive psychology for deep neural networks: A shape bias case study》被国际机器学习学会(IMLS)收录[1]。深度学习和神经科学的学科交叉对未来的发展方向具有很强的指导意义,这项研究也为DNN 的机理以及脑神经网络的理论基础研究提供了一种可行的解决思路,而真正破解DNN 和脑神经科学的黑箱问题依然任重道远。

两个黑箱问题

DNN 在很多复杂任务上取得了前所未有的进展,如人脸识别、围棋以及Atari游戏,但是其解决方案也远远超出了我们的理解范围,成为了一个名副其实的黑箱。这种黑箱模型在很大程度上能够简单便捷地解决许多实际问题,但是从科学研究和实际应用的角度上看,我们需要理解并改变世界,只有破解DNN 的黑箱问题之后,才能更好地运用并改善该模型,同时提升实际应用中的可靠性。

在这种黑箱问题背景下,建立更加优秀而且可理解的神经网络系统成为一个热门的研究方向。许多研究者都认可:DNN 的图像处理模型与动物的视觉处理通路具有相似之处,动物的视觉处理通路存在感受野、方向选择性以及分级处理等特性,而模仿动物视觉信息处理的DNN 也具有类似的特性;此外,DNN的快速发展也促进了视觉神经科学方面的研究,形成了有效的正反馈;从更加宏观的角度来看,感受野、方向选择性、分级处理这些特性也会使DNN 和动物视觉信息处理在更高层次上具有一定的相似性。这种共同点以及两者相互促进的机制正是开展DNN 黑箱问题与认知心理学的交叉研究的基础。破解DNN 黑箱问题,首当其冲的是为该问题建立一套完整的问题描述方法及实验研究方法;由于DNN 与脑神经网络存在一定的共性,因此DNN 黑箱问题与脑神经科学的交叉研究正是一种行之有效的方法。尽管脑神经网络是一个更加庞大的黑箱,但是人们对于大脑的解码走在DNN黑箱问题的前面,对大脑的研究已经建立了一套系统的研究方法,这套研究方法也可以作为DNN 黑箱问题的基础。

DNN 与脑神经网络的异同点

认知心理学是研究脑神经网络的一门重要学科,认识心理学中一个经典的案例是考察儿童如何识别和标识物体,探索儿童如何从一个示例中猜出一个单词的意义;认知心理学的研究成果表明,儿童会通过采用归纳偏好来消除许多不正确的推理,而且形状偏好强于颜色偏好。在人工智能中,能够进行小样本学习的深度神经网络(matching network),凭借一个孤立样本,就取得了ImageNet 图像分类任务中目前最佳性能,而且该模型也更倾向于形状偏好。小样本学习的能力和形状偏好特性是DNN 与脑神经网络的共性,但是DNN和大脑终究就是两个差异很大的模型,一点小的共性难以弥补两者之间的鸿沟。

首先,DNN 和大脑的拓扑结构有很大的差别,DNN 往往具有非常规则的连接,而真实的脑神经网络之间的连接极其复杂,而且不同物种的脑神经网络连接也会有所不同;如大小鼠、猫和猴存在感受野以及视觉信息分级处理的机制,但是大小鼠没有功能柱,而猫和猴存在功能柱(具有相同感受野并具有相同功能的视皮层神经元,在垂直于皮层表面的方向上呈柱状分布);猫和狗的视锥细胞非常少,对颜色不敏感,猴和树鼩则具有丰富的颜色视觉;青蛙和兔子这类的低等动物的视觉信息处理系统对运动的物体非常敏感;每一类生物在漫长的进化过程中,都已经形成了最适应其生存环境的形态结构,而目前DNN 模型的拓扑结构与任何一种生物的神经网络结构都相去甚远。此外,DNN 的计算方式与大脑的信息处理方式也有很大不同,DNN 一般都是确定性的数学模型,给定输入之后,按照给定的计算流程,所有的中间变量以及最后的输出都是确定的;对于大脑来说,给定一个输入,会得到一个确定的输出,但是中间变量不是确定的(即每次看到一个苹果时,大脑会认出这是一个苹果,但是每次都只观察视觉信息处理过程中很小的一个神经环路时,这个环路的状态是变化的,而这种变化却不影响最终的输出)。从输入到输出,DNN 只有一条确定的路,而大脑每一次都走了一条不同的路,这就是DNN 的确定性与脑神经网络的不确定性之间的矛盾。

加强深度学习与脑科学交叉研究

DeepMind 团队认为这项形状偏好的研究表明:认知心理学工具具有揭示DNN 隐藏计算过程的能力,同时能够提供一个人类词汇学习的计算模型,对此我们持一定的怀疑态度。首先,DNN 和大脑的拓扑结构具有很大的差异,即使二者具有感受野、方向选择性、信息分级处理、以及形状偏好等形同特性,也并不能说明二者的计算过程有多少相似性;此外,学习和记忆也是认知心理学中亟待解决的黑箱问题,在得到透彻理解之前,并不能单方面地成为破解DNN 的黑箱问题的武器。值得肯定的是,深度学习与脑科学的交叉研究是未来必然的发展趋势;在2016 年,《Nature Neuroscience》上的一篇文章介绍了一种对更高层的视觉皮层的神经活动进行建模的目标驱动分层卷积神经网络(Goal-driven hierarchical convolutional neural networks,HCNNs),该研究表明目标驱动的HCNNs 能够揭示视觉皮层信息处理过程形成和发展的机理[2];神经科学和认识心理学并不是单纯的实验科学,只有基于DNN 这一类有效的理论分析方法,才能将二者推向更高的层次;从另一个角度看,随着对脑神经网络认识的深入,人们能够发掘出脑神经网络更多的特性,这些特性很有可能成为不断理解与完善DNN 模型的切入点,成为破解DNN黑箱问题的可行途径。

参考文献

[1] Ritter S, Barrett D G T, Santoro A, etal.Cognitive psychology for deep neural networks: A shape bias casestudy[C/OL]//Proceedings of the 34 th International Conference on Machine Learning. [2017-06-29].https://arxiv.org/pdf/1706.08606.pdf.

[2] Yamins D L K, Dicarlo J J. Usinggoal-driven deep learning models to understand sensory cortex[J]. Nature Neuroscience, 2016,19(3): 356-365.

(责任编辑 刘志远)


作者简介:袁培江,北京航空航天大学机械工程及自动化学院,副教授;苏峰,北京航空航天大学机械工程及自动化学院,硕士研究生。

本文发表在2017年第18期《科技导报》,欢迎关注。本文部分图片来自互联网,版权事宜未及落实,欢迎图片作者与我们联系稿酬事宜。

相关推荐

redis的八种使用场景

前言:redis是我们工作开发中,经常要打交道的,下面对redis的使用场景做总结介绍也是对redis举报的功能做梳理。缓存Redis最常见的用途是作为缓存,用于加速应用程序的响应速度。...

基于Redis的3种分布式ID生成策略

在分布式系统设计中,全局唯一ID是一个基础而关键的组件。随着业务规模扩大和系统架构向微服务演进,传统的单机自增ID已无法满足需求。高并发、高可用的分布式ID生成方案成为构建可靠分布式系统的必要条件。R...

基于OpenWrt系统路由器的模式切换与网页设计

摘要:目前商用WiFi路由器已应用到多个领域,商家通过给用户提供一个稳定免费WiFi热点达到吸引客户、提升服务的目标。传统路由器自带的Luci界面提供了工厂模式的Web界面,用户可通过该界面配置路...

这篇文章教你看明白 nginx-ingress 控制器

主机nginx一般nginx做主机反向代理(网关)有以下配置...

如何用redis实现注册中心

一句话总结使用Redis实现注册中心:服务注册...

爱可可老师24小时热门分享(2020.5.10)

No1.看自己以前写的代码是种什么体验?No2.DooM-chip!国外网友SylvainLefebvre自制的无CPU、无操作码、无指令计数器...No3.我认为CS学位可以更好,如...

Apportable:拯救程序员,IOS一秒变安卓

摘要:还在为了跨平台使用cocos2d-x吗,拯救objc程序员的奇葩来了,ApportableSDK:FreeAndroidsupportforcocos2d-iPhone。App...

JAVA实现超买超卖方案汇总,那个最适合你,一篇文章彻底讲透

以下是几种Java实现超买超卖问题的核心解决方案及代码示例,针对高并发场景下的库存扣减问题:方案一:Redis原子操作+Lua脚本(推荐)//使用Redis+Lua保证原子性publicbo...

3月26日更新 快速施法自动施法可独立设置

2016年3月26日DOTA2有一个79.6MB的更新主要是针对自动施法和快速施法的调整本来内容不多不少朋友都有自动施法和快速施法的困扰英文更新日志一些视觉BUG修复就不翻译了主要翻译自动施...

Redis 是如何提供服务的

在刚刚接触Redis的时候,最想要知道的是一个’setnameJhon’命令到达Redis服务器的时候,它是如何返回’OK’的?里面命令处理的流程如何,具体细节怎么样?你一定有问过自己...

lua _G、_VERSION使用

到这里我们已经把lua基础库中的函数介绍完了,除了函数外基础库中还有两个常量,一个是_G,另一个是_VERSION。_G是基础库本身,指向自己,这个变量很有意思,可以无限引用自己,最后得到的还是自己,...

China's top diplomat to chair third China-Pacific Island countries foreign ministers' meeting

BEIJING,May21(Xinhua)--ChineseForeignMinisterWangYi,alsoamemberofthePoliticalBureau...

移动工作交流工具Lua推出Insights数据分析产品

Lua是一个适用于各种职业人士的移动交流平台,它在今天推出了一项叫做Insights的全新功能。Insights是一个数据平台,客户可以在上面实时看到员工之间的交流情况,并分析这些情况对公司发展的影响...

Redis 7新武器:用Redis Stack实现向量搜索的极限压测

当传统关系型数据库还在为向量相似度搜索的性能挣扎时,Redis7的RedisStack...

Nginx/OpenResty详解,Nginx Lua编程,重定向与内部子请求

重定向与内部子请求Nginx的rewrite指令不仅可以在Nginx内部的server、location之间进行跳转,还可以进行外部链接的重定向。通过ngx_lua模块的Lua函数除了能实现Nginx...