摘要:为解决未知环境中移动机器人面向目标运行时最优路径获取问题,本文提出一种基于 Q 学习的生物启发式目标导向 导航路径规划模型。 该模型包括基于 Q 学习的空间探索、基于认知图运行控制和最优路径选择 3 部分。 首先,在空间探索中, 通过位置细胞的放电情况表征位置状态,采用 ε 动态取值方式进行状态-动作学习,生成认知图,并给出空间探索阶段最优路 径。 其次,在基于认知图的运行控制中,分别依据最大动作细胞放电率原则和群体动作细胞原则进行运行方向选择,采用多尺 度位置更新间距进行位置更新,得到不同认知图下最优路径。 最后,对比分析空间探索阶段和运行控制阶段路径规划结果,选 取最优路径。 仿真结果表明,所提模型可行,采用 ε 动态取值方式进行空间探索可得到较好的路径规划结果;运行体在充分的 空间探索后,可提供可行、有效的面向目标运行的路径。