在机器人视觉领域,手眼标定(Hand-Eye Calibration)是实现精准操作的核心技术之一。无论是工业机器人抓取零件、医疗机器人辅助手术,还是无人机作业,都需要让机器人精确掌握“眼睛”(如相机)与手(末端执行器)之间的空间关系。
本文将从工程实践出发,系统阐述手眼标定的基本原理、两种典型系统架构眼在手(Eye-in-Hand)与眼在外(Eye-to-Hand),并深入对比两种经典求解方法——解析解法与数值优化法,分析各自的适用场景与选择策略。
假设一下,机器人需要通过摄像头识别桌面上的一颗螺丝,然后用机械臂精准抓取它。若相机坐标系与机器人末端坐标系之间的变换关系未知,视觉定位的偏差将直接导致操作失败。

手眼标定的目标正是求解二者之间的刚性变换矩阵X(包含旋转R与平移t),使得机器人能够将视觉信息准确映射为末端执行器的运动指令。
类型 | 安装方式 | 特点 |
眼在手 | 相机固定于机器人末端,随机械臂运动 | 近距离、高精度局部观测,视角灵活 |
眼在外 | 相机独立固定于工作区域外 | 全局视野,标定后长期稳定 |
无论何种系统,核心数学模型均归结为求解矩阵方程:A X=X B
其中:
A:机器人本体(末端)的运动变换
B:相机观测到的目标物运动变换
X:待求的手眼矩阵
1.眼在手(Eye-in-Hand)系统
相机直接安装在机器人末端执行器上,与机械臂同步运动。相机视野随机械臂移动而动态变化。

典型应用场景:工业精密装配、抓取,医疗机器人(如手术导航内窥镜)、无人机自主抓取。
技术优势:可对操作对象进行近距离高精度观测、灵活调整视角以适应不同工序。
工程挑战:相机随机械臂高频运动,易受振动、光照变化干扰,频繁运动可能导致标定参数漂移。
2.眼在外(Eye-to-Hand)系统
相机固定安装在机器人工作区域外,独立于机械臂运动。相机的全局视角覆盖整个工作空间,机械臂运动被动呈现在视野中。
典型应用场景:工厂流水线质量监控(如汽车焊接检测)、AGV(自动导引车)导航、仓储机器人货架管理。
技术优势:全局视野,适合大范围或轨迹监控、标定后长期有效,无需频繁更新。
工程约束:对远距离测量精度有一定损失,存在视野遮挡风险。
3.两种系统的对比
对比维度 | 眼在手 | 眼在外 |
安装位置 | 机器人末端 | 固定外部 |
视角范围 | 局部、近距离 | 全局、广角 |
标定频率 | 高(随机械臂运动频繁变化) | 低(一次标定长期有效) |
适用场景 | 精密操作、动态目标 | 大范围监控、静态环境 |
标定复杂度 | 较高(需处理动态视角) | 较低(视角固定) |
1.手眼标定之解析法
原理:通过数学推导直接求解方程AX=XB,代表算法包括Tsai-Lenz和Park-Martin算法。
求解流程:
1.采集多组机器人运动数据(A₁,A₂,…)与相机观测数据(B₁,B₂,…)
2.分离旋转与平移:
R_A R_X=R_X R_B
(R_A-I)t_X=R_X t_B-t_A
3.构造线性方程组,使用SVD分解或四元数法求解旋转矩阵R_X
4.代入R_X求解平移向量t_X
5.输出手眼矩阵X=[R_X|t_X]
特点:
优点:计算速度快,无需初始值,适合无噪声的理想环境。
缺点:对数据噪声敏感,且要求至少两组非平行旋转轴的运动数据。
2.手眼标定之数值优化法
原理:将问题转化为非线性最小二乘优化,最小化运动变换的累积误差。
求解流程:
1.使用解析解法获取初始值X₀
2.将X参数化为李代数ξ(SE(3)→se(3))
3.构建目标函数:min∑‖A_i X-X B_i‖²
4.采用高斯-牛顿或Levenberg-Marquardt算法迭代优化,更新ξ
5.映射回李群:X=exp(ξ)
6.收敛后输出优化后的X
特点:
优点:抗噪性强,适合实际复杂环境。
缺点:依赖初始值(通常由解析解提供),计算耗时。
3.解析解法vs.数值优化
对比维度 | 解析解法 | 数值优化方法 |
数学本质 | 线性方程组的直接解 | 非线性优化的迭代逼近 |
数据需求 | 至少 2 组非共轴运动 | 数据越多,精度越高 |
抗噪能力 | 对噪声敏感 | 鲁棒性强,可处理噪声 |
计算效率 | 毫秒级,实时性强 | 秒级,需多次迭代 |
初始值依赖 | 无需初始值 | 需初始值(常用解析解提供) |
适用场景 | 实验室标定、快速验证 | 工业现场、复杂噪声环境 |
两种方法并非对立,而是互补——解析解为数值优化提供可靠的初始值,后者在此基础上进一步提升精度与鲁棒性。
4.实际应用中的选择建议
Eye-in-Hand场景(如机器人抓取):
挑战:相机随机械臂高频运动,易受振动和光照变化干扰。
解决方案:
若环境噪声小(如实验室),优先用解析解法快速标定。
若存在干扰(如工厂),结合解析解与数值优化,先用前者粗标定,再用后者精调。
Eye-to-Hand场景(如固定监控相机):
优势:标定后长期稳定,适合批量任务。
建议:直接使用数值优化保证精度,避免重复标定。
动态环境(如移动机器人):
策略:解析解法的高效性更适合频繁更新标定参数。
尽管传统手眼标定方法仍是当前工业主流,但多种新技术正在融入与构建:
1.深度学习辅助标定:用神经网络直接预测X,减少对运动数据量的依赖。
2.多传感器融合:联合相机、IMU、力传感器提升鲁棒性。
3.在线标定:实时更新手眼矩阵,适应环境动态变化。
手眼标定是机器人感知与执行之间的“精度桥梁”。眼在手如同“手持显微镜”,专为精密局部操作设计;眼在外则似“天空之眼”,掌控全局视野。解析解法以“快”见长,数值优化以“稳”取胜,二者结合可在复杂工程环境中实现高精度、高可靠性的手眼标定。
未来,随着AI技术的渗透,手眼标定将更加智能化、精准化,为工业4.0和智能医疗开辟更广阔的可能性。