Multi-target detection & tracking using machine learning methodologies
Künye
Muhammad, Junaid. (2024). Makine Öğrenme Yöntemleri ile Çok Hedefli Tespit ve Takip. Yüksek Lisans Tezi, İstanbul Atlas Üniversitesi, Lisansüstü Enstitüsü, Bilgisayar Mühendisliği Bölümü, Bilgisayar Mühendisliği Yüksek Lisans Programı, İstanbul.Özet
Bu tez, çok hedefli insan tespiti ve takibi konusunda makine öğrenme yöntemlerini kullanarak kapsamlı bir çalışma sunmakta olup, birden fazla kamera kaynağından elde edilen verilerin entegrasyonuna odaklanmaktadır. Gelişmiş gözetim sistemleri ve otomatik izleme ihtiyacının artmasıyla, dinamik ortamlarda bireylerin etkili bir şekilde tespit edilmesi ve takibi büyük önem kazanmaktadır. Bu araştırma, çeşitli ortamlarda gerçek zamanlı insan tespiti için YOLO (You Only Look Once) ve Faster R-CNN gibi en son derin öğrenme modellerinin uygulanmasını incelemektedir. Mevcut yöntemler üzerine kurulan bu çalışma, yalnızca ana kişileri tespit edip takip etmekle kalmayıp, aynı zamanda yeni tespit edilen bilinmeyen kişileri "ilgi altındaki kişiler" olarak sınıflandıran yenilikçi bir çerçeve sunmaktadır. Bu hiyerarşik yaklaşım, bireyler arasındaki ilişki yönetimini geliştirirken, özellikle kalabalık veya gizlenmiş senaryolarda kimlik sürekliliğinin doğruluğunu artırmaktadır. Önerilen sistem, çoklu kameradan elde edilen çerçevelerde tespitlerin bağlantısını kesintisiz bir şekilde sağlamak ve kimlik değiştirmeleri etkin bir şekilde yönetmek için Macar algoritması ve Deep SORT gibi ileri düzey veri ilişkilendirme tekniklerini kullanmaktadır. Çeşitli veri setleri üzerinde yapılan değerlendirmeler, önerilen yöntemin gerçek dünya uygulamalarında sağlamlığını ve ölçeklenebilirliğini göstererek, çoklu kamera girişlerinin tespit ve takip performansını önemli ölçüde artırdığını ve durumsal farkındalığı geliştirdiğini ortaya koymaktadır. Bu araştırma, insan tespiti ve takip sistemlerindeki mevcut sınırlamaları ele alarak, bilgisayarlı görü alanında büyüyen bir katkı sağlamakta olup, gelecekteki davranış analizi ve etkileşim tanıma araştırmalarına temel oluşturmakta, karmaşık ortamlarda bireyler arasındaki ilişkileri daha iyi bağlamsallaştırmaktadır. Anahtar Kelimeler: Çok hedefli takip, Makine öğrenimi, Gözetim sistemi This thesis presents a comprehensive study on multi-target human detection and tracking using machine learning methodologies, with a focus on integrating data from multiple camera sources. As the demand for advanced surveillance systems and automated monitoring increases, effective detection and tracking of individuals in dynamic environments become paramount. This research explores the implementation of state-of-the-art deep learning models, such as YOLO (You Only Look Once) and Faster R-CNN, for real-time human detection across varied environments. Building on existing methodologies, we introduce an innovative framework that not only detects and tracks primary individuals but also identifies and categorizes newly detected unknown individuals as "sub persons of interest." This hierarchical approach allows for enhanced relationship management between individuals and improves the accuracy of identity retention over time, especially in crowded or occluded scenarios. The proposed system employs advanced data association techniques, such as the Hungarian algorithm and Deep SORT, to seamlessly link detections across frames from multiple cameras while managing identity switches effectively. Evaluations conducted on diverse datasets highlight the effectiveness of the proposed method, demonstrating its robustness and scalability in real-world applications. Our findings indicate that leveraging multi-camera inputs significantly enhances detection and tracking performance, providing improved situational awareness. This research contributes to the growing field of computer vision by addressing current limitations in human detection and tracking systems, paving the way for future advancements in surveillance technologies and intelligent monitoring solutions. This work lays foundational concepts for future research into behavioral analysis and interaction recognition, further contextualizing the relationships between individuals in complex environments. Keywords: Multi-target tracking, Machine learning, Surveillance system