University of Konstanz
Graduiertenkolleg / PhD Program
Computer and Information Science

Publications

Back to Publications

Author(s) Quintana, J.
Title Kompression menschlicher Bewegungsdaten: Eine Übersicht
Abstract Bewegungserfassungstechnologien verzeichnen in den letzten Jahren erhebliche Fortschritte, die im Bereich der Erzeugung spezieller 3D Effekte in Videos, der Analyse und Modellierung von menschlichen Bewegungen, sowie der Bewegungssimulation und des Biofeedbacks zur Verbesserung der Leistung in Sport angewendet werden. Die Kosten der Bewegungserfassungsgeräte sinken und das Methodenspektrum zur Verarbeitung von Bewegungsdaten wird immer größer. Außerdem sind Datenbanken menschlicher Bewegungssequenzen im Internet zugänglich.

Bewegungsdaten werden von Bewegungserfassungsgeräten durch Marker erfasst, die an einer sich bewegenden Person befestigt werden. Bewegungsdaten sind in konstanten Zeitintervallen abgetastete Signale, die 3D Informationen der Position und bei manchen Geräten die globale Orientierung jedes Markers enthalten. Jede Koordinate der so genannten Bewegungskurve besteht aus einem eindimensionalen Signal. Diese Information kann mit Hilfe eines virtuellen Skelettes abgespielt werden, um eine unmittelbare oder spätere Analyse und Wiedergabe durchzuführen.

Eine direkte Nutzung der Messdaten ist unpraktisch und aufwändig. Insbesondere bei hoher Abtastrate und großer Anzahl der Marker ist der Bedarf an Speicher und Bandbreite sehr groß. Um die relevante Information kompakt und schnell zugänglich zu machen, ist Kompression notwendig. Dafür nutzt man die räumliche und zeitliche Kohärenz der Bewegungsdaten aus. Dabei muss man darauf achten, dass bei Interaktionen mit der Umgebung, z.B. bei dem Aufsetzen von den Füßen auf dem Boden, Hochfrequenzanteile auftreten, die von der Kompressionstechnik erhalten werden müssen,(Arikan).

Kompressionstechniken werden auch bei der Bewegungsanalyse, Bewegungsklassifikation und Retrieval von Bewegungen angewendet, (Faloutsos, Hodgins und Pollard), um räumliche und zeitliche Strukturen der Bewegung zu extrahieren.

Die entwickelten Kompressionstechniken für menschliche Bewegungsdaten können in drei Kategorien klassifiziert werden: Raum-basierte Kompression, Zeit-basierte Kompression und Semantik-basierte Kompression.

Räumliche Kompressionsverfahren reduzieren die Dimension der Daten durch die Projektion der Datenpunkte in einen kleinen Unterraum, der einen möglichst großen Anteil der Information enthalten soll. Diese Verfahren basieren auf statistischen Analysemethoden, zu denen u.a. PCA ("Principal Component Analysis"), CPCA ("Cluster PCA"), KPCA ("Kernel PCA") und ICA ("Independent Component Analysis"), gehören.

Zeitliche Kompressionsverfahren können in fünf Subkategorien unterteilt werden: Kompression im Frequenzbereich durch Koeffizientenauswahl nach einer Transformation z.B. durch Wavelets oder DCT ("Discrete Cosine Transform"), Kompression durch Kurvenbeschreibung wie z.B. Bezierkurven, Kompression durch Abtastung an so genannten "Key-frames" und Interpolation dazwischen, Kompression mit Hilfe eines Wörterbuches aus Bewegungsmustern und Kompression durch Hidden Markov Modelle.

Semantische Kompressionsverfahren benutzen die Klassifikation der segmentierten Bewegungskurven in primitive Abschnitte, die anschließend in semantisch relevante Gruppen zusammengefasst werden. Für die Bewegungsgruppen werden die charakteristischen Variablen genauer, sowie unwichtige Variablen gröber quantisiert. Die Semantik lässt sich nicht direkt von menschlichen Bewegungsdaten ablesen. Aus diesem Grund müssen Verfahren der künstlichen Intelligenz wie selbst-organisierende Netze angewendet werden,(Gu, Peng, Deng), um die Klassifikation durchzuführen.

Um eine hohe Kompressionsrate zu erreichen, wird eine geeignete Vorverarbeitung der Daten eingesetzt (Eliminierung von Ausreißern, merkmalserhaltende Rauschunterdrückung, Interpolation zum Auffüllen von Messlücken, u.s.w.). Ferner kann man die zu komprimierende bekannte Struktur des menschlichen Körpers ausnutzen, z.B. dass die Körpergröße und die Längen der Extremitäten bekannt und konstant sind. Weiterhin wird am Ende der Kompressionspipeline eine verlustfreie Kompression (Huffman-Kodierung, arithmetische Kodierung) angeschlossen.

Ein aktuelles Forschungsthema ist die Entwicklung adäquater Bewertungsmaße der Kompressionsverfahren für Bewegungsdaten, (Liu). Vorgeschlagene Bewertungsmaße basieren auf objektiven Kriterien (u.a. Kompressionsrate und mittlerer quadratischer Fehler) und subjektiven Beurteilungen (u.a. Natürlichkeit und visuelle Qualität).

Dieser Beitrag liefert eine Zusammenfassung und Taxonomie der aktuellen Kompressionstechniken von menschlichen Bewegungsdaten.

Literatur

Arikan, O. (2006). "Compression of motion capture databases". ACM SIGGRAPH 2006 Papers, 890-897. New York: ACM.

Faloutsos, C., Hodgins, J. und Pollard, N. (2007). "Database techniques with motion capture". In ACM SIGGRAPH 2007 Courses 21(1). New York: ACM.

Gu, Q., Peng, J. und Deng, Z. (2009). "Compression of Human Motion Capture Data Using Motion Pattern Indexing". Comput. Graph. Forum 28, 1-12. Oxford : Blackwell.

Liu, R. (2006). "Statistical analysis of natural human motion for animation". Ph.D. Thesis. Pittsburgh: Carnegie Mellon University.
Download Quintana10.pdf

Back to Publications