具身智能与 VLA 系统
关注双臂与人形机器人中的策略学习、VLA 框架复现、动作生成与真机部署,强调语言交互、感知建模与执行链路之间的系统化协同。
About
我的研究兴趣集中在具身智能、Vision-Language-Action 模型、潜在世界模型、多智能体系统,以及机器人智能体操作系统。当前工作中,我参与搭建机器人智能体操作系统,将语言理解、导航、动作生成、语音交互等能力组织为可复用的 skills,并推进它们在宇树 G1 等平台上的落地。同时,我也在结合潜在世界模型构建具有未来感知能力的 VLA 框架,以增强模型对未来状态演化的建模能力。
在智能交通系统方向,我也开展过多智能体轨迹预测、交通流与占用预测、遥感驱动的车道级路网提取,以及基于仿真与车辆动力学建模的能耗评估等研究工作。
Focus
关注双臂与人形机器人中的策略学习、VLA 框架复现、动作生成与真机部署,强调语言交互、感知建模与执行链路之间的系统化协同。
探索将潜在世界模型引入机器人操控框架,在多源异构数据上建模未来状态演化,以提升策略的泛化性、时序建模能力与物理一致性。
研究复杂交通场景中的轨迹预测、交通流建模、路网结构提取与协同仿真,将多主体交互、高精地图和时空依赖统一到可解释的学习框架中。
Timeline
拟于 2026 年 8 月入学,研究兴趣包括具身智能、双臂/人形 VLA 算法与具身多智能体系统。
研究智能交通系统、自动驾驶与协同仿真,导师为 Prof. Yunli Shao。
本科阶段主要关注时空数据挖掘与交通预测问题。
基于 Aggno 与 Qwen 系列模型设计具身大小脑协同策略系统,将 TTS、VLA、Navigation 等能力抽象成技能模块,并基于 Pipecat 搭建在线语音交互智能体,推动从自然语言输入到机器人动作执行的闭环部署。
负责 AIS 数据清洗、轨迹重建与船舶行为识别模型构建,并基于轨迹聚类和空间统计方法提取关键海事节点。
构建多源时序数据清洗与因果发现工作流,复现并评估 PC、GES、NOTEARS 等算法,用于复杂系统依赖关系分析。
Selected Work
针对 VLA 缺乏时序建模与物理先验的问题,探索将潜在世界模型引入机器人操控流程,并利用跨机器人、多源异构数据进行预训练,提升策略的泛化能力与未来状态推断能力。
提出面向交通数字孪生的车道级路网提取框架,并设计启发式路口拓扑连接推理算法,支持导出 OpenDRIVE 与 SUMO 等标准网络格式。
Guo, H., Shao, Y., Saroj, A., Xu, G., Yuan, J., Luo, X., Wang, C. (2026). Automatic lane-level road network extraction from aerial imagery for transportation digital twins. ICTD.
构建 XIL 协同仿真框架,集成 SUMO、互联车辆控制器与 Simulink 车辆动力学模型,分析动力学建模颗粒度与渗透率变化对系统能耗评估的影响。
Yuan, J., Guo, H., Shao, Y., Xu, G., Saroj, A., Wang, C. (2025). Impact of vehicle dynamics on the energy evaluation of connected and automated vehicles via anything-in-the-loop co-simulation. TRB Annual Meeting.
面向能耗优化与协同控制型互联车辆应用,提出交通流感知占用预测框架,显式建模相邻路段之间的时空耦合关系,以提升长时预测一致性。
Guo, H., Shao, Y. (2025). Traffic flow aware occupancy prediction for energy and mobility centric connected and automated vehicles. MECC.
构建端到端海事交通流预测框架,将交通流分解为趋势项与周期项,并联合建模时空与动静态依赖,兼顾预测精度与可解释性。
Yuan, Y., Guo, H., Fan, Z., Peng, Y., Zhang, J., Song, X., Shibasaki, R. (2024). A decomposable multi-fusion spatiotemporal marine traffic flow forecasting algorithm. Transportation Research Part E.
提出 HHGNN,通过异质超图刻画复杂交通场景中的高阶群体交互,设计类型感知的双层消息传递机制,并融合局部高精地图信息。
Guo, H., Peng, Y., Fan, Z., Zhu, H., Song, X. (2024). HHGNN: Heterogeneous hypergraph neural network for traffic agents trajectory prediction in complex scenarios. IEEE ICRA.
Capabilities
Contact
如果你对具身智能、机器人系统、VLA、智能交通系统或跨领域研究合作感兴趣,欢迎直接邮件联系我。