您现在所在位置: 首页 >> 通知公告 >> 学生 >> 正文

西北工业大学自动化学院博士开题答辩(罗子扬)

2025年07月01日 17:25  点击:

一、开题答辩题目:多模态语音场景理解研究

二、开题答辩人:罗子扬

三、开题答辩时间:2025年7月4日 上午10:00

四、开题答辩地点:长安校区自动化学院505

五、开题答辩内容简介:

语音智能作为多模态人工智能感知的关键技术路径,在智能安防、军事应用、应急救援等关键领域展现出巨大应用潜力。本研究聚焦多模态语音场景理解这一前沿课题,旨在突破传统视听分析技术在数据规模、场景多样性和环境适应性方面的技术瓶颈。针对音频与视觉模态对齐困难、语言指导下的音视频定位复杂、基于语言的多模态决策机制缺失和3D音频导航中的音频质量受限与定位识别困难等四个核心难题,本研究提出了创新的技术解决方案。本研究将显著提升语音场景智能感知与理解水平,为构建更加准确、高效的多模态语音场景理解方法奠定坚实基础,推动人工智能技术在国防安全、智能安防等关键领域的深度应用。

六、开题答辩人简介

罗子扬,女,西北工业大学自动化学院控制科学与工程专业,2022级在读博士研究生,主要研究方向为多模态语音理解、显著性和伪装性检测。

上一条:西北工业大学自动化学院博士开题答辩(赵鋆赫) 下一条:西北工业大学自动化学院博士开题答辩(胥若愚)

版权所有Copyright © 2020 西北工业大学自动化学院