Chrome Extension
WeChat Mini Program
Use on ChatGLM

基于STDP奖励调节的类脑面向目标导航

Navigation Positioning and Timing(2023)

Cited 0|Views1
No score
Abstract
动物具有优秀的空间自主定位导航能力,能够实现在无先验环境信息下的导航定位和导航决策过程.针对智能体在连续空间中面向目标导航问题,研究了一种基于生物学放电时间依赖可塑性学习规则的智能体面向目标导航算法.首先分析了动物面向目标导航决策过程中的生理学机理,在此基础上,构建了基于脉冲神经网络的位置细胞和动作细胞模型.动作细胞间权值采用横向竞争模型更新,通过环境奖励信号的更新,采用放电时间依赖可塑性学习规则对位置细胞前馈动作细胞模型的突触权重进行权值调节,利用动作细胞群的脉冲放电现象表征智能体运动方向和速度.最后,对所提算法进行了仿真实验验证.仿真结果表明,所提出的类脑面向 目标导航算法能够在单障碍环境中实现30 ms左右的规划速度,相比传统强化学习Q学习方法平均路径规划长度缩短了 15.9%.
More
Translated text
Key words
Brain-inspired navigation,Spiking-time-dependent plasticity,Agents,Spiking neural network,Place cell,Action cell
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined