Kinect手势识别 - Dollar One算法

Kinect 同时被 2 个专栏收录
2 篇文章 0 订阅
1 篇文章 0 订阅
首先上一个演示视频,这是一个我们课余时间调了一个月的交互系统,这个Demo是玩儿MC(手机拍的,不是很清楚)
http://v.youku.com/v_show/id_XMTQxMzIyOTM3Mg==.html?from=y1.7-1.2

上一篇文章里简单总结了一下Kinect的工作流程,接下来就写一下我们当前在做的应用好了。这个系统工作流程也很简单,通过Kinect获得肢体节点信息,然后进行识别,然后输出控制指令。这篇文章来说说我们用的手势识别。


我们用的算法是Dollar One算法,这个算法是老师介绍给我们的。这个算法本来是用来做鼠标手势识别的,但是鼠标手势也是一种手势,所以也是可以拿来用的。这个算法的基本思想是逐点比较标准化的模板和样本之间的标准差,然后根据阈值来决定是否和模板匹配,是一种简单而且易用的算法。由于是逐点比较,所以该算法对手势绘制顺序敏感。

Dollar One算法的第一步是重采样,该步骤将样本进行处理,重采样为指定的点的数目:
  1. Points resample(Points p,int n)
  2. {
  3. if (p.size()<=0) { while (1) puts("a o"); exit(0); }
  4. if (p.size()==1) return vector<VEC>(n,p[0]);
  5. double I=pathLength(p)/(n-1);
  6. double D=0;
  7. Points q; q.push_back(p[0]);
  8. for (int i=1;i<p.size();i++) {
  9. double d=(p[i]-p[i-1]).len();
  10. if (D+d>=I-EPS) {
  11. VEC newp=(I-D)/d*(p[i]-p[i-1])+p[i-1];
  12. q.push_back(newp);
  13. p.insert(p.begin()+i,newp);
  14. D=0;
  15. }
  16. else D+=d;
  17. }
  18. return q;
  19. }


这个重采样的方法是首先算出绘制图形总长度,然后每隔一定距离就采样一个点。


重采样之后要缩放到同一的大小,将样本重新映射进一个指定大小的正方形中:
  1. Points scaleTo(Points p, double size)
  2. {
  3. //把所有点给映射到一个正方形里
  4. VEC tmp=boundingBox(p);
  5. double width=tmp.x,height=tmp.y;
  6. Points newp;
  7. for (auto pp:p) newp.push_back(VEC(pp.x*size/width,pp.y*size/height));
  8. return newp;
  9. }




接下来是旋转,由于不知道目标角度,所以需要用二分的方法,不断尝试角度,然后取方差最小的角度:
  1. double distanecAtBestAngle(Points p,Points T,double Oa,double Ob,double delta)
  2. {
  3. const double fi=(sqrt(5)-1)/2;
  4. double x1=fi*Oa+(1-fi)*Ob;
  5. double f1=distanceAtAngle(p,T,x1);
  6. double x2=(1-fi)*Oa+fi*Ob;
  7. double f2=distanceAtAngle(p,T,x2);
  8. while (fabs(Ob-Oa)>delta) {
  9. if (f1<f2) {
  10. Ob=x2;
  11. x2=x1;
  12. f2=f1;
  13. x1=fi*Oa+(1-fi)*Ob;
  14. f1=distanceAtAngle(p,T,x1);
  15. }
  16. else {
  17. Oa=x1;
  18. x1=x2;
  19. f1=f2;
  20. x2=(1-fi)*Oa+fi*Ob;
  21. f2=distanceAtAngle(p,T,x2);
  22. }
  23. }
  24. return (f1 < f2) ? f1 : f2;
  25. }



接下来是计算旋转后的两条路径的方差:
  1. double pathDistance(const Points &a,const Points &b)
  2. {
  3. double d=0;
  4. for (int i=0;i<a.size();i++)
  5. d+=(b[i]-a[i]).len();
  6. return d/a.size(); //算的是平均值
  7. }