Personal Homepage

郭赫天 具身智能、机器人系统与智能交通研究

目前的工作重心是具身智能中的策略学习、双臂/人形 VLA 系统与机器人任务规划执行框架。同时,我也在智能交通系统方向积累了多智能体轨迹预测、交通流建模与协同仿真方面的研究经验。

About

研究兴趣与个人概述

我的研究兴趣集中在具身智能、Vision-Language-Action 模型、潜在世界模型、多智能体系统,以及机器人智能体操作系统。当前工作中,我参与搭建机器人智能体操作系统,将语言理解、导航、动作生成、语音交互等能力组织为可复用的 skills,并推进它们在宇树 G1 等平台上的落地。同时,我也在结合潜在世界模型构建具有未来感知能力的 VLA 框架,以增强模型对未来状态演化的建模能力。

在智能交通系统方向,我也开展过多智能体轨迹预测、交通流与占用预测、遥感驱动的车道级路网提取,以及基于仿真与车辆动力学建模的能耗评估等研究工作。

Focus

研究方向

01

具身智能与 VLA 系统

关注双臂与人形机器人中的策略学习、VLA 框架复现、动作生成与真机部署,强调语言交互、感知建模与执行链路之间的系统化协同。

02

潜在世界模型与机器人操控

探索将潜在世界模型引入机器人操控框架,在多源异构数据上建模未来状态演化,以提升策略的泛化性、时序建模能力与物理一致性。

03

智能交通与多智能体时空建模

研究复杂交通场景中的轨迹预测、交通流建模、路网结构提取与协同仿真,将多主体交互、高精地图和时空依赖统一到可解释的学习框架中。

Timeline

教育经历与实习经历

教育经历

吉林大学人工智能学院

拟于 2026 年 8 月入学,研究兴趣包括具身智能、双臂/人形 VLA 算法与具身多智能体系统。

佐治亚大学(University of Georgia)

研究智能交通系统、自动驾驶与协同仿真,导师为 Prof. Yunli Shao。

南方科技大学

本科阶段主要关注时空数据挖掘与交通预测问题。

实习经历

深圳市道和通泰机器人有限公司

基于 Aggno 与 Qwen 系列模型设计具身大小脑协同策略系统,将 TTS、VLA、Navigation 等能力抽象成技能模块,并基于 Pipecat 搭建在线语音交互智能体,推动从自然语言输入到机器人动作执行的闭环部署。

LocationMind Inc.

负责 AIS 数据清洗、轨迹重建与船舶行为识别模型构建,并基于轨迹聚类和空间统计方法提取关键海事节点。

深圳计算科学研究院

构建多源时序数据清洗与因果发现工作流,复现并评估 PC、GES、NOTEARS 等算法,用于复杂系统依赖关系分析。

Selected Work

项目经历与论文发表

ICTD 2026

基于高分辨率遥感影像的车道级路网自动提取

提出面向交通数字孪生的车道级路网提取框架,并设计启发式路口拓扑连接推理算法,支持导出 OpenDRIVE 与 SUMO 等标准网络格式。

Guo, H., Shao, Y., Saroj, A., Xu, G., Yuan, J., Luo, X., Wang, C. (2026). Automatic lane-level road network extraction from aerial imagery for transportation digital twins. ICTD.

TRB 2025

基于在环协同仿真的车辆动力学能耗评估

构建 XIL 协同仿真框架,集成 SUMO、互联车辆控制器与 Simulink 车辆动力学模型,分析动力学建模颗粒度与渗透率变化对系统能耗评估的影响。

Yuan, J., Guo, H., Shao, Y., Xu, G., Saroj, A., Wang, C. (2025). Impact of vehicle dynamics on the energy evaluation of connected and automated vehicles via anything-in-the-loop co-simulation. TRB Annual Meeting.

MECC 2025

交通流感知的占用预测

面向能耗优化与协同控制型互联车辆应用,提出交通流感知占用预测框架,显式建模相邻路段之间的时空耦合关系,以提升长时预测一致性。

Guo, H., Shao, Y. (2025). Traffic flow aware occupancy prediction for energy and mobility centric connected and automated vehicles. MECC.

TR Part E 2024

基于 AIS 数据的海事交通流预测

构建端到端海事交通流预测框架,将交通流分解为趋势项与周期项,并联合建模时空与动静态依赖,兼顾预测精度与可解释性。

Yuan, Y., Guo, H., Fan, Z., Peng, Y., Zhang, J., Song, X., Shibasaki, R. (2024). A decomposable multi-fusion spatiotemporal marine traffic flow forecasting algorithm. Transportation Research Part E.

ICRA 2024

基于异质超图的多智能体车辆轨迹预测

提出 HHGNN,通过异质超图刻画复杂交通场景中的高阶群体交互,设计类型感知的双层消息传递机制,并融合局部高精地图信息。

Guo, H., Peng, Y., Fan, Z., Zhu, H., Song, X. (2024). HHGNN: Heterogeneous hypergraph neural network for traffic agents trajectory prediction in complex scenarios. IEEE ICRA.

Capabilities

技术能力

编程与工程

  • Python, C++, MATLAB
  • PyTorch, PyTorch Lightning
  • Hugging Face Transformers / Diffusers / Accelerate

深度学习与机器人

  • ROS / ROS2
  • Vision-Language-Action Models
  • Policy Learning, Imitation Learning, Inference & Fine-tuning

具身智能经验

  • 复现 PI0 / PI0.5、F1-VLA、VLA-OS 等双臂 VLA baselines
  • 人形机器人策略部署、遥操作与真机执行经验
  • 完成宇树 G1 的策略接入与控制链路搭建

数据与系统能力

  • 处理 AgiBot、InternData、RobotWin、EgoDex 等数据集
  • 具备技能抽象、任务编排与多模态交互链路搭建经验
  • 面向机器人任务规划与执行的系统设计

仿真与交通系统

  • SUMO, CARLA, Vissim
  • Simulink, IPG-CarMaker
  • 交通流建模、轨迹预测与协同仿真

Contact

欢迎联系交流

如果你对具身智能、机器人系统、VLA、智能交通系统或跨领域研究合作感兴趣,欢迎直接邮件联系我。