Abstract:
Beim Tracking von ausgedehnten Objekten (auf Englisch ‚extended object tracking‘, kurz EOT) geht es darum, die Form und Lage eines Zielobjekts anhand von verrauschten Punktmessungen zu schätzen. EOT wird traditionell zur Verfolgung von Großobjekten wie Flugzeugen, Schiffen, oder Autos verwendet. Allerdings ermöglichen Technologiefortschritte bei Tiefenkameras wie Microsoft Kinects mittlerweile sogar Laien, Punktwolken aus ihrer Umgebung aufzunehmen. Das stellt eine neue Herausforderung für EOT-Ansätze dar, die in modernen Anwendungen, wie z.B. Objektmanipulation in Augmented Reality oder in der Robotik, Zielobjekte mit vielen möglichen Formen anhand von Messungen unterschiedlicher Qualität verfolgen müssen. ... mehrIn diesem Kontext ist die Auswahl der Formmodelle ausschlaggebend, denn sie bestimmen, wie robust und leistungsfähig der Schätzer sein wird, was wiederum eine sorgfältige Betrachtung der Modalitäten und Qualität der verfügbaren Informationen erfordert.
Solch ein Informationsparadigma kann als ein Spektrum visualisiert werden: auf der einen Seite, eine große Anzahl an genauen Messungen, und auf der anderen Seite, nur wenige verrauschte Beobachtungen. Allerdings haben sich die Verfahren in der Literatur traditionell auf einen schmalen Teil dieses Spektrums konzentriert. Einerseits assoziieren ‚gierige‘ Verfahren, die auf der Methode der kleinsten Quadrate basieren, Messungen mit der nächsten Quelle auf der Form. Diese Verfahren sind effizient und liefern sogar für komplizierte Formen akkurate Ergebnisse, allerdings nur solange das Messrauschen niedrig bliebt. Ansonsten kann nicht gewährleistet werden, dass der nächste Punkt immer noch eine passende Approximation der wahren Quelle ist, was zu verzerrten Ergebnissen führt. Andererseits sind probabilistische Modelle wie Raumverteilungen präzise für einfache Formen, sogar bei extrem hohem Messrauschen, allerdings werden sie schon für wenig komplexe Formen unlösbar oder numerisch instabil. Die Schwierigkeit besteht darin, dass in vielen modernen Trackingszenarien die Menge an verfügbarer Information sich drastisch mit der Zeit ändern kann. Das unterstreicht den Bedarf an Ansätzen, die nicht nur die Stärken beider Modelle kombinieren, sondern auch alle Bereiche des Spektrums und nicht nur dessen Grenzfälle abdecken können.
Das Ziel dieser Arbeit ist es, diese Lücke zu füllen und somit die oben angesprochenen Herausforderungen zu lösen. Dazu schlagen wir vier Beiträge vor, die den aktuellen Stand der Technik signifikant erweitern. Zuerst schlagen wir Level-set Partial Information Models vor, einen probabilistischen Ansatz zur erwartungstreuen Formschätzung für Szenarien mit Verdeckungen und hohem Messrauschen. Zusätzlich führen wir Level-set Active Random Hypersurface Models ein, die von Konzepten aus EOT und Computervision inspiriert sind, eine flexible Formparametrisierung für konvexe und nicht-konvexe Formen ermöglichen, und die auch mit wenig Information umgehen können. Darüber hinaus machen Negative Information Models sogenannte ‚negative‘ Information nutzbar, indem Messungen verarbeitet werden, die uns sagen, wo das Zielobjekt nicht sein kann. Schließlich zeigen wir eine einfach zu implementierende Erweiterung von diesen Beiträgen, Extrusion Models, um dreidimensionale Objekte mit realen Sensordaten zu verfolgen.
Abstract (englisch):
Extended object tracking (EOT) deals with estimating the shape and pose of an object based on noisy point measurements. Traditionally, EOT has concerned itself with large objects such as planes, ships, or cars, but with modern advances in depth cameras such as Microsoft Kinect sensors, even laymen can capture point clouds of their daily-life surroundings. This raises new challenges for EOT approaches, as modern applications in fields ranging from robotics to augmented reality are now required to track targets with many different possible shapes, while incorporating measurements whose quality may change in time. ... mehrIn this context, the selection of appropriate shape models is crucial, as it determines how robust and performant the estimator can be, and requires a careful consideration of the amount of information available.
This paradigm can be visualized as a spectrum, with a high amount of accurate measurements on one side, and few noisy observations on the other. State-of-the-art approaches, however, have traditionally focused narrowly on a single part of this spectrum. On the one hand, 'greedy' algorithms, such as those based on least squares methods, associate measurements to the nearest source on the shape. These approaches work efficiently even with very complex shapes, but only as long as the measurement noise remains low, otherwise they yield biased estimates as the nearest point ceases to be an appropriate approximation of the true source. On the other hand, probabilistic techniques such as Spatial Distribution Models are accurate for simple shapes, even with extremely high noise, but become intractable or numerically unstable as soon as the shape becomes moderately complex. The problem is that, in many modern practical tracking scenarios, the amount and the quality of available information may change drastically over time. This raises the need for new approaches that combine the strengths of these models, but can work suitably in any part of the information spectrum, not just on the edges.
This thesis aims to bridge this gap, and presents four contributions to the state-of-the-art that address these challenges. First, Level-set Partial Information Models present a probabilistic mechanism for unbiased shape fitting that can handle situations with occlusions and high measurement noise. Second, Level-set Active Random Hypersurface Models provide a flexible shape representation for convex and non-convex shapes, capable of dealing with scenarios with little a priori knowledge by combining ideas from EOT and computer vision. Third, Negative Information Models aim to increase the amount of available information by incorporating knowledge about where the target cannot be, exploiting measurements usually discarded as clutter. Finally, we develop a straightforward extension of these contributions, called Extrusion Models, that allows them to estimate three-dimensional targets in real-world scenarios.