Biometrics Evaluation Centre (BEZ)
Innovative Ansätze in der Biometrie: Generierung synthetischer Daten
Das Forschungsprojekt „Synthetische Charaktere“ widmet sich der Entwicklung und Evaluierung biometrischer Systeme, für die große, vielfältige und realitätsnahe Datensätze unerlässlich sind. Traditionell basieren solche Systeme auf echten biometrischen Daten, doch deren Verfügbarkeit ist aufgrund von Kosten-, Zeit- und Datenschutzaspekten oft begrenzt. Zudem weisen sie häufig Verzerrungen (Bias) in Bezug auf Geschlecht oder ethnische Zugehörigkeit auf und enthalten meist keine detaillierten „Ground-Truth“-Informationen zu Merkmalen wie Pose oder Lichtverhältnissen.
Das Projekt „Synthetische Charaktere“ verfolgt einen innovativen Ansatz: Anstatt auf reale Daten zu setzen, werden synthetisch generierte Datensätze verwendet. Diese erlauben eine flexible und kontrollierte Generierung biometrischer Merkmale und bieten damit ein vielversprechendes Potenzial für die Forschung. Dabei stehen zentrale Fragen im Vordergrund: Wie können große synthetische Datenbanken effizient erstellt werden? Können synthetische Daten echte biometrische Daten gleichwertig ersetzen? Und wie kann die Qualität synthetischer Daten zuverlässig gemessen werden?
Zwei Hauptansätze werden hierbei untersucht: Zum einen neuronale Netzwerke, wie etwa StyleGAN2, die eine schnelle und realitätsnahe Datengenerierung ermöglichen, jedoch wenig Spielraum für die gezielte Anpassung von Parametern bieten. Zum anderen Charakter-Generatoren aus dem Bereich der Computerspiele, wie der „Meta Human Creator“ oder der „Character Creator 4.0“. Diese Tools bieten eine hohe Parametrisierbarkeit und ermöglichen die gezielte Manipulation einzelner Parameter, beispielsweise für Bias-Analysen. Allerdings ist die Generierung zeitaufwändig und erreicht bisher noch nicht die Detailtreue von neuronalen Netzwerken.
Das Projekt steht noch am Anfang, birgt jedoch großes Potenzial, biometrische Systeme durch die Nutzung synthetischer Daten auf eine neue Ebene zu heben. Es bietet eine Lösung für die Verknappung realer Daten und eröffnet gleichzeitig neue Wege zur Verbesserung der Fairness und Genauigkeit biometrischer Technologien.