卡尔曼滤波目标跟踪

定位跟踪时，可以通过某种定位技术得到一个位置估计（观测位置），也可以根据经验由上一时刻的位置和速度来预测当前位置。把这个观测结果和预测结果做一个加权平均作为定位结果，权值的大小取决于观测位置和预测位置的不确定性程度

使用卡尔曼滤波来估计每个时刻目标状态的过程为：

对视频进行运动目标检测，通过简单的匹配方法来给出目标的第一个和第二个状态，从第三个状态开始，先使用卡尔曼滤波器预测出当前状态，再用当前帧图像的检测结果作为观测值输入给卡尔曼滤波其，得到的校正结果就被认为是目标在当前帧的真实状态

目标跟踪常用的数据集合 OTB50 OTB100 以及VOT竞赛数据库（http://t.cn/RYhZqT2）

相关资源 Opencv API （http://t.cn/RYhzun2）

benchmark_results http://t.cn/RV08A2h）：大量顶级方法在OTB库上的性能对比，各种论文代码应有尽有

目标跟踪，常用的是一种生成模型方法和判别模型方法

生成类方法：在当前帧对目标区域建模，下一帧寻找与模型相似的区域就是预测位置，典型算法 ASMS http://t.cn/RYhZoH3

判别类方法：图像特征+机器学习，当前帧以目标为正样本，背景区域为负样本，机器学习方法训练分类器，下一帧用训练好的分类器找最优区域，相关滤波

深度学习类方法：参考Winsty的几篇 Naiyan Wang - Home（http://t.cn/RYhZRKc），还有VOT2015的冠军MDNet Learning Multi-Domain Convolutional Neural Networks for Visual Tracking（http://t.cn/Rq626Dk），以及VOT2016的冠军TCNN （http://t.cn/RYhww93），速度方面比较突出的如80FPS的SiamFC SiameseFC tracker（http://t.cn/RcaRnrN）和100FPS的GOTURN davheld/GOTURN（http://t.cn/RYhwRRP），注意都是在GPU上。基于ResNet的SiamFC-R(ResNet)在VOT2016表现不错，很看好后续发展，有兴趣也可以去VALSE听作者自己讲解 http://t.cn/RYhwskg），至于GOTURN，效果比较差，但优势是跑的很快100FPS，如果以后效果也能上来就好了。

Nam H, Han B. Learning multi-domain convolutional neural networks for visual tracking [C]// CVPR, 2016.
Nam H, Baek M, Han B. Modeling and propagating cnns in a tree structure for visual tracking. arXiv preprint arXiv:1608.07242, 2016.
Bertinetto L, Valmadre J, Henriques J F, et al. Fully-convolutional siamese networks for object tracking [C]// ECCV, 2016.
Held D, Thrun S, Savarese S. Learning to track at 100 fps with deep regression networks [C]// ECCV, 2016