具身智能入门学习笔记

本仓库是我学习具身智能/人形机器人方向的个人笔记与练习记录，内容涵盖仿真环境搭建、强化学习、模仿学习等方向。

入门基础

会用 ChatGPT/DeepSeek 和 Google
会用 Linux
- linux指令.txt：Linux 常用指令备忘录，包含文件操作、进程管理、GPU 监控、训练日志等
会用 Git 和 GitHub
- https://learngitbranching.js.org/
机器学习 / 深度学习基础
- ML/：机器学习基础练习与课程笔记
- CS231n/：计算机视觉与深度学习课程作业
机器人系统基础
- ROS2/：ROS2 节点、话题、服务、DDS 架构等入门笔记

当前仓库地图

目录 / 文件	内容定位
`ML/`	机器学习基础、神经网络、课程练习
`CS231n/`	计算机视觉 / 深度学习作业与实验
`Robotics_NTU/`	传统机器人学：坐标变换、正逆运动学、可视化
`EI_Mujoco/`	MuJoCo 入门与仿真起点
`RL_Basics/`	强化学习基础路线
`Gymnasium_Basics/`	Gymnasium 经典控制任务
`Gymnasium_Robotics/`	Fetch 系列机器人强化学习任务
`Robot_Grasping_RL/`	自定义机械臂抓取 RL 任务规划
`Diffusion_Policy/`	Diffusion Policy 复现、实验记录与研究想法
`Robot/Lerobot/`	Hugging Face LeRobot 框架总览
`ROS2/`	ROS2 通信与系统架构基础
`VLM/`	VLM / VLA 论文阅读与代码解读

任务一：基于传统运动学的机械臂物体抓取

学习传统机器人学中的基础知识，比如基础坐标变换、正逆运动学、动力学、控制理论等，在 PyBullet/Mujoco 仿真中实现基于传统运动控制的机械臂物体抓取。

参考资料：

Introduction to Robotics: Mechanics and Control — Stanford
Robotic Manipulation — MIT
PyBullet：https://github.com/bulletphysics/bullet3
MuJoCo：https://mujoco.org/
闯关游戏：https://rcfs.ch/

对应当前仓库内容

Robotics_NTU/
- 台大《机器人学》课堂笔记整理及配套可视化
EI_Mujoco/hello_mujoco.py
- MuJoCo 入门练习：创建简单场景、加载物理模型、运行仿真循环
ROS2/
- 后续接真实机器人或多节点系统时的通信基础

任务二：基于强化学习的机械臂物体抓取

学习强化学习基础，在 Gymnasium（OpenAI Gym 的后续维护版本）环境中按推荐顺序训练并测试；
在 PyBullet/Mujoco 中训练机械臂抓取策略，体会 Sim2Real 过程。

参考资料：

Introduction to Reinforcement Learning, 2nd & David Silver's UCL Course
UCB CS285 Deep Reinforcement Learning
Gymnasium：https://gymnasium.farama.org/index.html

对应当前仓库内容

RL_Basics/
- 强化学习基础学习路线与笔记入口：先理解 MDP、Bellman、MC/TD、Q-learning、Policy Gradient、Actor-Critic
Gymnasium_Basics/
- Gymnasium 入门任务路线，按推荐顺序推进：FrozenLake-v1 -> CartPole-v1 -> Pendulum-v1 -> LunarLander-v3
Gymnasium_Robotics/
- 机器人强化学习任务路线：FetchReach-v3 -> FetchPush-v3 -> FetchPickAndPlace-v3
Robot_Grasping_RL/
- 自定义机械臂抓取任务规划：观测设计、动作空间、奖励函数、训练阶段拆分、Sim2Real 检查项
EI_Mujoco/hello_mujoco.py
- MuJoCo 仿真起点，后续可扩展为自定义机械臂抓取环境

推荐完成顺序：

RL_Basics -> Gymnasium_Basics -> Gymnasium_Robotics -> Robot_Grasping_RL

任务三：基于模仿学习的机械臂物体抓取

已完成：复现模仿学习经典 baseline：Diffusion Policy
- https://diffusion-policy.cs.columbia.edu
- 本仓库记录：Diffusion_Policy/
学习 HuggingFace 机器人学习框架 LeRobot
- https://github.com/huggingface/lerobot
- 本仓库记录：Robot/Lerobot/

对应当前仓库内容

Diffusion_Policy/
- Diffusion Policy 复现、PushT baseline、预测难度重加权、世界模型一致性等实验记录
Robot/Lerobot/
- LeRobot 框架总览：数据格式、processor、policy、训练评估入口、和 SmolVLA 的关系

任务四：基于 VLA 大模型的机械臂物体抓取

学习并利用现有 VLA 大模型（OpenVLA / Pi / GR00T 等），探索用开源数据集训练专用 VLA 模型。

参考资料：

OpenVLA：https://github.com/openvla/openvla
Pi：https://github.com/Physical-Intelligence/openpi
GR00T：https://github.com/NVIDIA/Isaac-GR00T
Open-X Embodiment：https://robotics-transformer-x.github.io/
Large Models：https://stanford-cs336.github.io/spring2025/

对应当前仓库内容

VLM/OpenVLA/
- OpenVLA 论文阅读、双视觉编码器代码解读
VLM/pi0/
- pi0 论文阅读、flow action expert 代码解读
VLM/SmolVLA/
- SmolVLA 论文、LeRobot 生态下的复现评估与学习路线
VLM/OFT/
- VLA fine-tuning 相关论文与动作头代码解读
VLM/
- GR-1、GR-2、GR-3、RDT-1B、pi0.5 等 VLA / robot foundation model 论文资料

任务五：基于 LLM/VLM 大模型的任务规划

桌面级任务规划
- 参考论文 "Code as Policies" (ICRA 2023)：https://code-as-policies.github.io/
- 用 Prompt 驱动现有 LLM/VLM 完成任务；
- Finetune 现有 LLM/VLM 完成任务。

场景级任务规划
- 配置仿真环境，跑通 baseline；
- 设计 ICL 或 CoT 方法提升具身规划效果。

可选仿真环境/Benchmark：

EAI：https://github.com/embodied-agent-interface/embodied-agent-interface
EmbodiedBench：https://github.com/EmbodiedBench/EmbodiedBench

参考论文：

任务六：基于强化学习的人形机器人运动控制

复现 OmniH2O 的人形机器人运动控制方法，学习仿真训练与 Sim2Real 流程。

参考资料：

Unitree Robotics GitHub：https://github.com/unitreerobotics
HOVER：https://github.com/NVlabs/HOVER
Underactuated Robotics — MIT

前沿研究

如何做研究
- An Opinionated Guide to ML Research
- GAMES003-图形视觉科研基本素养
会议期刊
- 机器人：Science Robotics, RSS, CoRL, ICRA, IROS, RLC
- 机器学习：ICLR, NeurIPS, ICML
- 计算机视觉：CVPR, ICCV, ECCV
- 自然语言处理：ACL, EMNLP, COLM
在线研讨班

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

具身智能入门学习笔记

入门基础

当前仓库地图

任务一：基于传统运动学的机械臂物体抓取

对应当前仓库内容

任务二：基于强化学习的机械臂物体抓取

对应当前仓库内容

任务三：基于模仿学习的机械臂物体抓取

对应当前仓库内容

任务四：基于 VLA 大模型的机械臂物体抓取

对应当前仓库内容

任务五：基于 LLM/VLM 大模型的任务规划

任务六：基于强化学习的人形机器人运动控制

前沿研究

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
CS231n		CS231n
Diffusion_Policy		Diffusion_Policy
EI_Mujoco		EI_Mujoco
Gymnasium_Basics		Gymnasium_Basics
Gymnasium_Robotics		Gymnasium_Robotics
ML		ML
RL_Basics		RL_Basics
ROS2		ROS2
Robot/Lerobot		Robot/Lerobot
Robot_Grasping_RL		Robot_Grasping_RL
Robotics_NTU		Robotics_NTU
VLM		VLM
assets		assets
.gitignore		.gitignore
README.md		README.md
README_EN.md		README_EN.md
linux指令.txt		linux指令.txt

Folders and files

Latest commit

History

Repository files navigation

具身智能入门学习笔记

入门基础

当前仓库地图

任务一：基于传统运动学的机械臂物体抓取

对应当前仓库内容

任务二：基于强化学习的机械臂物体抓取

对应当前仓库内容

任务三：基于模仿学习的机械臂物体抓取

对应当前仓库内容

任务四：基于 VLA 大模型的机械臂物体抓取

对应当前仓库内容

任务五：基于 LLM/VLM 大模型的任务规划

任务六：基于强化学习的人形机器人运动控制

前沿研究

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages