Skip to content

Travor278/EI-Beginner

Repository files navigation

具身智能入门学习笔记

中文版本 | English Version

本仓库是我学习具身智能/人形机器人方向的个人笔记与练习记录,内容涵盖仿真环境搭建、强化学习、模仿学习等方向。

入门基础

  • 会用 ChatGPT/DeepSeek 和 Google
  • 会用 Linux
    • linux指令.txt:Linux 常用指令备忘录,包含文件操作、进程管理、GPU 监控、训练日志等
  • 会用 Git 和 GitHub
  • 机器学习 / 深度学习基础
    • ML/:机器学习基础练习与课程笔记
    • CS231n/:计算机视觉与深度学习课程作业
  • 机器人系统基础
    • ROS2/:ROS2 节点、话题、服务、DDS 架构等入门笔记

当前仓库地图

目录 / 文件 内容定位
ML/ 机器学习基础、神经网络、课程练习
CS231n/ 计算机视觉 / 深度学习作业与实验
Robotics_NTU/ 传统机器人学:坐标变换、正逆运动学、可视化
EI_Mujoco/ MuJoCo 入门与仿真起点
RL_Basics/ 强化学习基础路线
Gymnasium_Basics/ Gymnasium 经典控制任务
Gymnasium_Robotics/ Fetch 系列机器人强化学习任务
Robot_Grasping_RL/ 自定义机械臂抓取 RL 任务规划
Diffusion_Policy/ Diffusion Policy 复现、实验记录与研究想法
Robot/Lerobot/ Hugging Face LeRobot 框架总览
ROS2/ ROS2 通信与系统架构基础
VLM/ VLM / VLA 论文阅读与代码解读

任务一:基于传统运动学的机械臂物体抓取

任务一

学习传统机器人学中的基础知识,比如基础坐标变换、正逆运动学、动力学、控制理论等,在 PyBullet/Mujoco 仿真中实现基于传统运动控制的机械臂物体抓取。

参考资料:

对应当前仓库内容

  • Robotics_NTU/
    • 台大《机器人学》课堂笔记整理及配套可视化
  • EI_Mujoco/hello_mujoco.py
    • MuJoCo 入门练习:创建简单场景、加载物理模型、运行仿真循环
  • ROS2/
    • 后续接真实机器人或多节点系统时的通信基础

任务二:基于强化学习的机械臂物体抓取

任务二

  1. 学习强化学习基础,在 Gymnasium(OpenAI Gym 的后续维护版本)环境中按推荐顺序训练并测试;
  2. 在 PyBullet/Mujoco 中训练机械臂抓取策略,体会 Sim2Real 过程。

参考资料:

对应当前仓库内容

  • RL_Basics/
    • 强化学习基础学习路线与笔记入口:先理解 MDP、Bellman、MC/TD、Q-learning、Policy Gradient、Actor-Critic
  • Gymnasium_Basics/
    • Gymnasium 入门任务路线,按推荐顺序推进:FrozenLake-v1 -> CartPole-v1 -> Pendulum-v1 -> LunarLander-v3
  • Gymnasium_Robotics/
    • 机器人强化学习任务路线:FetchReach-v3 -> FetchPush-v3 -> FetchPickAndPlace-v3
  • Robot_Grasping_RL/
    • 自定义机械臂抓取任务规划:观测设计、动作空间、奖励函数、训练阶段拆分、Sim2Real 检查项
  • EI_Mujoco/hello_mujoco.py
    • MuJoCo 仿真起点,后续可扩展为自定义机械臂抓取环境

推荐完成顺序:

  • RL_Basics -> Gymnasium_Basics -> Gymnasium_Robotics -> Robot_Grasping_RL

任务三:基于模仿学习的机械臂物体抓取

任务三

  1. 已完成:复现模仿学习经典 baseline:Diffusion Policy
  2. 学习 HuggingFace 机器人学习框架 LeRobot

对应当前仓库内容

  • Diffusion_Policy/
    • Diffusion Policy 复现、PushT baseline、预测难度重加权、世界模型一致性等实验记录
  • Robot/Lerobot/
    • LeRobot 框架总览:数据格式、processor、policy、训练评估入口、和 SmolVLA 的关系

任务四:基于 VLA 大模型的机械臂物体抓取

任务四

学习并利用现有 VLA 大模型(OpenVLA / Pi / GR00T 等),探索用开源数据集训练专用 VLA 模型。

参考资料:

对应当前仓库内容

  • VLM/OpenVLA/
    • OpenVLA 论文阅读、双视觉编码器代码解读
  • VLM/pi0/
    • pi0 论文阅读、flow action expert 代码解读
  • VLM/SmolVLA/
    • SmolVLA 论文、LeRobot 生态下的复现评估与学习路线
  • VLM/OFT/
    • VLA fine-tuning 相关论文与动作头代码解读
  • VLM/
    • GR-1、GR-2、GR-3、RDT-1B、pi0.5 等 VLA / robot foundation model 论文资料

任务五:基于 LLM/VLM 大模型的任务规划

任务五a

  • 桌面级任务规划

任务五b

  • 场景级任务规划
    • 配置仿真环境,跑通 baseline;
    • 设计 ICL 或 CoT 方法提升具身规划效果。

可选仿真环境/Benchmark:

参考论文:

任务六:基于强化学习的人形机器人运动控制

任务六

复现 OmniH2O 的人形机器人运动控制方法,学习仿真训练与 Sim2Real 流程。

参考资料:

前沿研究

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors