shaoshengsong
diff --git a/‎CMakeLists.txt
Lines changed: 10 additions & 1 deletion b/‎CMakeLists.txt
Lines changed: 10 additions & 1 deletion
diff --git a/‎README.md
Lines changed: 19 additions & 7 deletions b/‎README.md
Lines changed: 19 additions & 7 deletions
diff --git a/‎main.cpp
Lines changed: 87 additions & 45 deletions b/‎main.cpp
Lines changed: 87 additions & 45 deletions
diff --git a/‎tracker/bytetrack/include/BYTETracker.h
Lines changed: 44 additions & 0 deletions b/‎tracker/bytetrack/include/BYTETracker.h
Lines changed: 44 additions & 0 deletions
diff --git a/‎tracker/bytetrack/include/BytekalmanFilter.h
Lines changed: 31 additions & 0 deletions b/‎tracker/bytetrack/include/BytekalmanFilter.h
Lines changed: 31 additions & 0 deletions
diff --git a/‎tracker/bytetrack/include/STrack.h
Lines changed: 47 additions & 0 deletions b/‎tracker/bytetrack/include/STrack.h
Lines changed: 47 additions & 0 deletions
@@ -19,13 +19,15 @@ find_package(OpenCV 4 REQUIRED )
 include_directories(
     ${OpenCV_INCLUDE_DIRS}/include
     ${CMAKE_SOURCE_DIR}/tracker/deepsort/include
-     ${CMAKE_SOURCE_DIR}/detector/YOLOv5/include
+    ${CMAKE_SOURCE_DIR}/tracker/bytetrack/include
+    ${CMAKE_SOURCE_DIR}/detector/YOLOv5/include
 
     )
 
 
 add_executable(DeepSORT
     detector/YOLOv5/src/YOLOv5Detector.cpp
+
     tracker/deepsort/src/FeatureTensor.cpp
     tracker/deepsort/src/model.cpp
     tracker/deepsort/src/kalmanfilter.cpp
@@ -36,5 +38,12 @@ add_executable(DeepSORT
     tracker/deepsort/src/munkres.cpp
     tracker/deepsort/src/hungarianoper.cpp
 
+    tracker/bytetrack/src/BytekalmanFilter.cpp
+    tracker/bytetrack/src/BYTETracker.cpp
+    tracker/bytetrack/src/lapjv.cpp
+    tracker/bytetrack/src/STrack.cpp
+    tracker/bytetrack/src/utils.cpp
+
+
     main.cpp)
 target_link_libraries(DeepSORT PRIVATE "${ONNXRUNTIME_DIR}/lib/libonnxruntime.so" ${OpenCV_LIBS} Eigen3::Eigen)
@@ -1,30 +1,42 @@
 # DeepSORT
 
-MOT using deepsort yolo5 with C++
+# MOT(Multi-object tracking) using yolov5 with C++ support deepsort and bytetrack
 
-# 多目标跟踪论文 DeepSORT 实现
 
 flyfish
 
 ## 前言
-代码采用C++实现，支持YOLOv5 6.x。
+代码采用C++实现，目标检测支持YOLOv5 6.x,跟踪支持deepsort and bytetrack。
 检测模型可以直接从YOLOv5官网，导出onnx使用
 特征提取可以自己训练，导出onnx使用，onnxruntime cpu 推理，方便使用.
 特征支持自定义维度例如 128,256,512等
 
-原论文地址 
+本文源码地址
 
 ```c
-https://arxiv.org/pdf/1703.07402.pdf
+https://github.com/shaoshengsong/DeepSORT
 ```
 
-本文源码地址
+## deepsort v1.12
+新增bytetrack跟踪
 
+bytetrack论文
 ```c
-https://github.com/shaoshengsong/DeepSORT
+http://arxiv.org/abs/2110.06864
+```
+
+bytetrack代码
+```c
+https://github.com/ifzhang/ByteTrack
 ```
 
 ## deepsort v1.1
+deepsort原论文地址 
+
+```c
+https://arxiv.org/pdf/1703.07402.pdf
+```
+
 
 ```c
 MOT using deepsort yolo5 with C++
 
@@ -11,7 +11,8 @@
 #include "YOLOv5Detector.h"
 
 #include "FeatureTensor.h"
-#include "tracker.h"
+#include "BYTETracker.h" //bytetrack
+#include "tracker.h"//deepsort
 //Deep SORT parameter
 
 const int nn_budget=100;
@@ -27,12 +28,94 @@ void get_detections(DETECTBOX box,float confidence,DETECTIONS& d)
 }
 
 
+void test_deepsort(cv::Mat& frame, std::vector<detect_result>& results,tracker& mytracker)
+{
+    std::vector<detect_result> objects;
+
+    DETECTIONS detections;
+    for (detect_result dr : results)
+    {
+        //cv::putText(frame, classes[dr.classId], cv::Point(dr.box.tl().x+10, dr.box.tl().y - 10), cv::FONT_HERSHEY_SIMPLEX, .8, cv::Scalar(0, 255, 0));
+        if(dr.classId == 0) //person
+        {
+            objects.push_back(dr);
+            cv::rectangle(frame, dr.box, cv::Scalar(255, 0, 0), 2);
+            get_detections(DETECTBOX(dr.box.x, dr.box.y,dr.box.width,  dr.box.height),dr.confidence,  detections);
+        }
+    }
 
+    std::cout<<"begin track"<<std::endl;
+    if(FeatureTensor::getInstance()->getRectsFeature(frame, detections))
+    {
+        std::cout << "get feature succeed!"<<std::endl;
+        mytracker.predict();
+        mytracker.update(detections);
+        std::vector<RESULT_DATA> result;
+        for(Track& track : mytracker.tracks) {
+            if(!track.is_confirmed() || track.time_since_update > 1) continue;
+            result.push_back(std::make_pair(track.track_id, track.to_tlwh()));
+        }
+        for(unsigned int k = 0; k < detections.size(); k++)
+        {
+            DETECTBOX tmpbox = detections[k].tlwh;
+            cv::Rect rect(tmpbox(0), tmpbox(1), tmpbox(2), tmpbox(3));
+            cv::rectangle(frame, rect, cv::Scalar(0,0,255), 4);
+            // cvScalar的储存顺序是B-G-R，CV_RGB的储存顺序是R-G-B
 
+            for(unsigned int k = 0; k < result.size(); k++)
+            {
+                DETECTBOX tmp = result[k].second;
+                cv::Rect rect = cv::Rect(tmp(0), tmp(1), tmp(2), tmp(3));
+                rectangle(frame, rect, cv::Scalar(255, 255, 0), 2);
+
+                std::string label = cv::format("%d", result[k].first);
+                cv::putText(frame, label, cv::Point(rect.x, rect.y), cv::FONT_HERSHEY_SIMPLEX, 0.8, cv::Scalar(255, 255, 0), 2);
+            }
+        }
+    }
+    std::cout<<"end track"<<std::endl;
+}
+
+
+void test_bytetrack(cv::Mat& frame, std::vector<detect_result>& results,BYTETracker& tracker)
+{
+    std::vector<detect_result> objects;
+
+
+    for (detect_result dr : results)
+    {
+
+        if(dr.classId == 0) //person
+        {
+            objects.push_back(dr);
+        }
+    }
+
+
+    std::vector<STrack> output_stracks = tracker.update(objects);
+
+    for (unsigned long i = 0; i < output_stracks.size(); i++)
+    {
+        std::vector<float> tlwh = output_stracks[i].tlwh;
+        bool vertical = tlwh[2] / tlwh[3] > 1.6;
+        if (tlwh[2] * tlwh[3] > 20 && !vertical)
+        {
+            cv::Scalar s = tracker.get_color(output_stracks[i].track_id);
+            cv::putText(frame, cv::format("%d", output_stracks[i].track_id), cv::Point(tlwh[0], tlwh[1] - 5),
+                    0, 0.6, cv::Scalar(0, 0, 255), 2, cv::LINE_AA);
+            cv::rectangle(frame, cv::Rect(tlwh[0], tlwh[1], tlwh[2], tlwh[3]), s, 2);
+        }
+    }
+
+
+}
 int main(int argc, char *argv[])
 {
-    //deep SORT
+    //deepsort
     tracker mytracker(max_cosine_distance, nn_budget);
+    //bytetrack
+    int fps=20;
+    BYTETracker bytetracker(fps, 30);
     //-----------------------------------------------------------------------
     // 加载类别名称
     std::vector<std::string> classes;
@@ -85,50 +168,9 @@ int main(int argc, char *argv[])
         auto detect_time =std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count();//ms
         std::cout<<classes.size()<<":"<<results.size()<<":"<<num_frames<<std::endl;
 
-        std::vector<detect_result> objects;
-
-        DETECTIONS detections;
-        for (detect_result dr : results)
-        {
-            //cv::putText(frame, classes[dr.classId], cv::Point(dr.box.tl().x+10, dr.box.tl().y - 10), cv::FONT_HERSHEY_SIMPLEX, .8, cv::Scalar(0, 255, 0));
-            if(dr.classId == 0) //person
-            {
-                objects.push_back(dr);
-                cv::rectangle(frame, dr.box, cv::Scalar(255, 0, 0), 2);
-                get_detections(DETECTBOX(dr.box.x, dr.box.y,dr.box.width,  dr.box.height),dr.confidence,  detections);
-            }
-        }
 
-        std::cout<<"begin track"<<std::endl;
-        if(FeatureTensor::getInstance()->getRectsFeature(frame, detections))
-        {
-            std::cout << "get feature succeed!"<<std::endl;
-            mytracker.predict();
-            mytracker.update(detections);
-            std::vector<RESULT_DATA> result;
-            for(Track& track : mytracker.tracks) {
-                if(!track.is_confirmed() || track.time_since_update > 1) continue;
-                result.push_back(std::make_pair(track.track_id, track.to_tlwh()));
-            }
-            for(unsigned int k = 0; k < detections.size(); k++)
-            {
-                DETECTBOX tmpbox = detections[k].tlwh;
-                cv::Rect rect(tmpbox(0), tmpbox(1), tmpbox(2), tmpbox(3));
-                cv::rectangle(frame, rect, cv::Scalar(0,0,255), 4);
-                // cvScalar的储存顺序是B-G-R，CV_RGB的储存顺序是R-G-B
-
-                for(unsigned int k = 0; k < result.size(); k++)
-                {
-                    DETECTBOX tmp = result[k].second;
-                    cv::Rect rect = cv::Rect(tmp(0), tmp(1), tmp(2), tmp(3));
-                    rectangle(frame, rect, cv::Scalar(255, 255, 0), 2);
-
-                    std::string label = cv::format("%d", result[k].first);
-                    cv::putText(frame, label, cv::Point(rect.x, rect.y), cv::FONT_HERSHEY_SIMPLEX, 0.8, cv::Scalar(255, 255, 0), 2);
-                }
-            }
-        }
-        std::cout<<"end track"<<std::endl;
+        //test_deepsort(frame, results,mytracker);
+        test_bytetrack(frame, results,bytetracker);
 
         cv::imshow("YOLOv5-6.x", frame);
 
 
@@ -0,0 +1,44 @@
+#pragma once
+
+#include "STrack.h"
+#include "YOLOv5Detector.h"
+
+
+class BYTETracker
+{
+public:
+	BYTETracker(int frame_rate = 30, int track_buffer = 30);
+	~BYTETracker();
+
+	 std::vector<STrack> update(const  std::vector<detect_result>& objects);
+    cv::Scalar get_color(int idx);
+
+private:
+	 std::vector<STrack*> joint_stracks( std::vector<STrack*> &tlista,  std::vector<STrack> &tlistb);
+	 std::vector<STrack> joint_stracks( std::vector<STrack> &tlista,  std::vector<STrack> &tlistb);
+
+	 std::vector<STrack> sub_stracks( std::vector<STrack> &tlista,  std::vector<STrack> &tlistb);
+	void remove_duplicate_stracks( std::vector<STrack> &resa,  std::vector<STrack> &resb,  std::vector<STrack> &stracksa,  std::vector<STrack> &stracksb);
+
+	void linear_assignment( std::vector< std::vector<float> > &cost_matrix, int cost_matrix_size, int cost_matrix_size_size, float thresh,
+		 std::vector< std::vector<int> > &matches,  std::vector<int> &unmatched_a,  std::vector<int> &unmatched_b);
+	 std::vector< std::vector<float> > iou_distance( std::vector<STrack*> &atracks,  std::vector<STrack> &btracks, int &dist_size, int &dist_size_size);
+	 std::vector< std::vector<float> > iou_distance( std::vector<STrack> &atracks,  std::vector<STrack> &btracks);
+	 std::vector< std::vector<float> > ious( std::vector< std::vector<float> > &atlbrs,  std::vector< std::vector<float> > &btlbrs);
+
+	double lapjv(const  std::vector< std::vector<float> > &cost,  std::vector<int> &rowsol,  std::vector<int> &colsol, 
+		bool extend_cost = false, float cost_limit = LONG_MAX, bool return_cost = true);
+
+private:
+
+	float track_thresh;
+	float high_thresh;
+	float match_thresh;
+	int frame_id;
+	int max_time_lost;
+
+	 std::vector<STrack> tracked_stracks;
+	 std::vector<STrack> lost_stracks;
+	 std::vector<STrack> removed_stracks;
+	byte_kalman::ByteKalmanFilter kalman_filter;
+};
@@ -0,0 +1,31 @@
+#pragma once
+
+#include "dataType.h"
+
+namespace byte_kalman
+{
+	class ByteKalmanFilter
+	{
+	public:
+		static const double chi2inv95[10];
+		ByteKalmanFilter();
+		KAL_DATA initiate(const DETECTBOX& measurement);
+		void predict(KAL_MEAN& mean, KAL_COVA& covariance);
+		KAL_HDATA project(const KAL_MEAN& mean, const KAL_COVA& covariance);
+		KAL_DATA update(const KAL_MEAN& mean,
+			const KAL_COVA& covariance,
+			const DETECTBOX& measurement);
+
+		Eigen::Matrix<float, 1, -1> gating_distance(
+			const KAL_MEAN& mean,
+			const KAL_COVA& covariance,
+			const std::vector<DETECTBOX>& measurements,
+			bool only_position = false);
+
+	private:
+		Eigen::Matrix<float, 8, 8, Eigen::RowMajor> _motion_mat;
+		Eigen::Matrix<float, 4, 8, Eigen::RowMajor> _update_mat;
+		float _std_weight_position;
+		float _std_weight_velocity;
+	};
+}
@@ -0,0 +1,47 @@
+#pragma once
+
+#include <opencv2/opencv.hpp>
+#include "BytekalmanFilter.h"
+
+enum TrackState { New = 0, Tracked, Lost, Removed };
+
+class STrack
+{
+public:
+	STrack( std::vector<float> tlwh_, float score);
+	~STrack();
+
+	 std::vector<float> static tlbr_to_tlwh( std::vector<float> &tlbr);
+	void static multi_predict( std::vector<STrack*> &stracks, byte_kalman::ByteKalmanFilter &kalman_filter);
+	void static_tlwh();
+	void static_tlbr();
+	 std::vector<float> tlwh_to_xyah( std::vector<float> tlwh_tmp);
+	 std::vector<float> to_xyah();
+	void mark_lost();
+	void mark_removed();
+	int next_id();
+	int end_frame();
+	
+	void activate(byte_kalman::ByteKalmanFilter &kalman_filter, int frame_id);
+	void re_activate(STrack &new_track, int frame_id, bool new_id = false);
+	void update(STrack &new_track, int frame_id);
+
+public:
+	bool is_activated;
+	int track_id;
+	int state;
+
+	 std::vector<float> _tlwh;
+	 std::vector<float> tlwh;
+	 std::vector<float> tlbr;
+	int frame_id;
+	int tracklet_len;
+	int start_frame;
+
+	KAL_MEAN mean;
+	KAL_COVA covariance;
+	float score;
+
+private:
+	byte_kalman::ByteKalmanFilter kalman_filter;
+};