一、中期答辩题目:面向机器人装配的时空多模态融合与三维场景重建
二、中期答辩人:张龙腾
三、中期答辩时间:2026年4月30日 下午14:00
四、中期答辩地点:友谊校区创新大厦B1901
五、中期答辩内容简介:
针对机器人装配任务中感知不完整、跨模态信息耦合复杂、长时序决策困难以及精细操作对位姿精度要求高等问题,通过深入分析视觉、语言、力觉、位姿等时空多模态数据,提出一种面向装配场景的 Vision-Language-Action(VLA) 多层次决策与重建方法。该方法旨在解决复杂装配过程中多模态语义对齐困难、长时程任务分解能力不足、接触状态难以精确建模,以及遮挡和稀疏视角条件下三维结构恢复不稳定等难点。计划通过引入基于 VLA 的高层任务理解与策略生成机制,结合大语言模型输出装配步骤、约束条件与操作意图,并利用因果强化学习作为底层控制策略,学习动作—状态—结果之间的因果关系,实现面向接触操作的精确轨迹规划与自适应动作修正。
六、中期答辩人简介

张龙腾,男,西北工业大学自动化学院控制科学与技术专业,2022级在读博士研究生,主要研究方向为具生主动感知。