Science:揭示大脑学习区分不同环境刺激机制

2016年3月11日/生物谷BIOON/–沙沙作响的树叶,摇摇欲坠的树枝:对一只小鼠而言,只要不是一只猫突然从矮树丛蹦出,这些感觉印象起初可能似乎是无害的,但是如果确实是猫出现的话,这些感觉印象就是掩盖威胁生命的危险的信号。如今,在一项新的研究中,来自德国哥廷根市马克斯-普朗克实验医学研究所(Max Planck Institute of Experimental Medicine)的Robert Gütig发现大脑如何能够将感官知觉与一段时间延迟后发生的事件相关联起来。在一种计算机模型中,他开发出一种学习程序,在这种程序中,虚拟神经元(model neuron,也译作模型神经元,即通过编程在计算机中模拟真实的神经元)能够学着通过调整它们对很多不同的环境刺激出现频率作出的反应来区分它们。当刺激信号和事件或结果之间存在时间延迟(或者说时间差)时,这种模型尤为管用。Gütig的学习程序不仅在每种活的生物中至关重要,因为这能够让它们过滤环境刺激,而且它也有助于解决许多技术学习难题。一种可能的应用就是开发语言识别程序。相关研究结果发表在2016年3月4日那期Science期刊上,论文标题为“Spiking neurons can discover predictive features by aggregate-label learning”。

在动物世界中,经常先于危险出现的是警告信号:泄露危险信息的声音、移动和气味可能就是攻击即将来临的征兆。如果一只小鼠在猫的攻击下存活下来,那么如果它从这次失败的攻击企图中学到经验从而在下次较早地识别出这些信号,那么它的未来将更加光明。然而,如果小鼠持续接触到大量的感觉印象,那么这些印象当中的大多数将不会与危险相关联。因此,它们如何知道来自环境中的哪些声音和气味会预示着猫攻击,而哪些不会?

这给小鼠的大脑带来问题。在大多数情形下,至关重要的环境刺激会与真实的攻击暂时地分离开,因此大脑必须将一种刺激信号与随后产生的事件(比如,声音和攻击)关联起来,即便是它们之间存在时间延迟。之前的理论并没有令人满意地解释大脑如何将一种信号与与之相关联的结果联系起来。Robert Gütig发现了大脑如何能够解决这个问题。在计算机上,他通过编程设计出一种神经网络,这种神经网络以与一群生物细胞相同的方式对环境刺激作出反应。这种神经网络能够学习过滤掉可以预测随后事件的刺激信号。

它依赖于频率

这种神经网络通过增强或削弱虚拟神经元之间的特异性突触连接进行学习。这种计算机模型的基础就是一种突触学习规则,在这种规则下,单个虚拟神经元能够增加或降低它们的活性来对简单的学习信号作出反应。Gütig已经利用这种学习规则开发出一种新的学习程序。Gütig解释道,“这种‘聚合-标签(aggregate-label)’学习程序根基于在细胞之间建立连接—建立方式为在一段时间内所形成的神经活性与刺激信号数量成正比—的概念。”通过这种方式,如果一种学习信号反映了小鼠环境中某些事件的发生和强度,那么虚拟神经元就学习对环境刺激作出反应,从而预测随后发生的事件。

然而,即便在环境中不能产生学习信号,Gütig的神经网络也能够学着对环境刺激作出反应。这是通过将网络中的平均神经活性理解为学习信号来实现的。单个虚拟神经元学着对环境刺激作出反应,而且网络中的其他虚拟神经元也对同样出现数量的环境刺激作出反应。这种“自我监督的”学习所遵从的原理不同于经常应用于人工神经网络的赫布理论(Hebbian theory)。赫布网络通过增强同时或者紧接着发出神经冲动的虚拟神经元之间的突触连接来进行学习。Gütig说,“在自我监督学习中,神经活性暂时保持一致不是必需的。在给定的时间内,神经冲动总数是突触变化的决定性因素。”这意味着即便在这些神经网络各自的神经表征(neural representation)之间存在显著的时间延迟,它们也能够关联不同类型的感官(如视觉、听觉和嗅觉)信息。

Gütig的学习过程不仅能够解释生物学过程,而且也为极大改进诸如自动化语言识别之类的技术应用奠定基础。这可能会促进大量简化对基于计算机的语言识别的培训需求,从而无需通过费力分割的语言数据库或者复杂的分割算法就可完成任务。(生物谷 Bioon.com)

 

Spiking neurons can discover predictive features by aggregate-label learning

doi:10.1126/science.aab4113

Robert Gütig

The brain routinely discovers sensory clues that predict opportunities or dangers. However, it is unclear how neural learning processes can bridge the typically long delays between sensory clues and behavioral outcomes. Here, I introduce a learning concept, aggregate-label learning, that enables biologically plausible model neurons to solve this temporal credit assignment problem. Aggregate-label learning matches a neuron’s number of output spikes to a feedback signal that is proportional to the number of clues but carries no information about their timing. Aggregate-label learning outperforms stochastic reinforcement learning at identifying predictive clues and is able to solve unsegmented speech-recognition tasks. Furthermore, it allows unsupervised neural networks to discover reoccurring constellations of sensory features even when they are widely dispersed across space and time.

(责任编辑:fangqi)

常见问题
  • 如何在体龙基因完成所需的检测项目 流程简述 :在线咨询 - 采样送检 - 付款检测 - 检测分析 - 报告结果
查看详情

相关内容

官方客服团队

为您解决烦忧 - 24小时在线 专业服务