Das Tracking von Bewegungen und Posen ist für die Zukunft ein zentrales Einsatzgebiet der künstlichen Intelligenz. Mit dem Makrotrend Gestensteuerung auf dem Vormarsch und der zunehmenden Bedeutung von Machine Learning in der Interpretation von menschlichem Verhalten braucht es neue Anwendungsgebiete der Interpretation von Posen.
Die Einsatzgebiete sind dabei vielfältig: von Mixed Reality, der Erkennung von Gebärdensprache, der Steuerung durch Ganzkörpergesten und sogar die Quantifizierung von Übungen im Sport ist alles denkbar. In ihrem neuesten Blog-Eintrag, hat Google nun ihre aktuellen Forschungserfolge dargestellt.
BlazePose, so der Name der neuen Methode, wird eingesetzt, um Körperposen zu interpretieren und mittels maschinellem Lernen die verschiedenen Bewegungen zu dokumentieren und zu bewerten. Anders als aktuelle Posenmodelle, die in der KI bereits Anwendung finden, lokalisiert BlazePose viel genauere Schlüsselpunkte am menschlichen Körper. Damit eignet es sich perfekt für Fitnessanwendungen und deren Interpretation. Ein potenzielles Einsatzgebiet findet sich beispielsweise in Smart Mirrors. Diese, installiert im eigenen Home Gym oder im Fitnessstudio, können die erfolgreiche Durchführung von Übungen und Posen automatisiert und genau erfassen und individuelle Verbesserungsvorschläge liefern.
Um die Nutzung von BlazePose zu optimieren, braucht es in der Machine Learning Pipeline jedoch eine extrem hohe Reaktionsgeschwindigkeit zwischen Posenerkennung und –verfolgung. Diese sollte bei wenigen Millisekunden pro Frame liegen. Um dies zu ermöglichen, hat Google nach dem besten Identifikationspunkt für die künstliche Intelligenz gesucht. Als das stärkste Identifizierungsmerkmal für die KI haben sie schließlich das Gesicht des Nutzers identifiziert. Dieses hat kontrastreiche Merkmale und variiert gleichzeitig vergleichsweise wenig im Aussehen. Mit dem Gesicht als Anker kann sich Google an der Gesichtserkennungssoftware orientieren, welche bereits innerhalb von Millisekunden Daten analysieren kann. Mit Facial Recognition als Proxy für den neuen Posendetektor, konnte eine ganz neue Art des Tracking ermöglicht werden.
Google sieht verschiedene Anwendungen für BlazePose. So wollen sie beispielsweise Fitness- oder Yoga-Tracker bauen, welche die Qualität der durchgeführten Übungen in Echtzeit überprüfen können.
Mehr Details über die Funktionsweise der neuen ML-Software gibt es hier im Google Blog.