Fachbereich Informatik
Urheberschaft im Dark Web: Best Paper Award für Alumna
Britta Sennewald ist Absolventin des Dual Degree Programms der Hochschule Bonn-Rhein-Sieg mit der kanadischen Partneruniversität University of New Brunswick (UNB): Sie studierte Informatik an der H-BRS und wählte im Master den Schwerpunkt Cybersicherheit, insbesondere Kryptographie. Sennewald schrieb bereits ihre Masterarbeit über das Dark Web und wurde dafür 2020 mit dem Best Thesis Award der Hochschulgesellschaft ausgezeichnet. Anschließend setzte sie ihre Forschung an der UNB in Kanada fort. Als Absolventin des Dual Degree-Programms erwarb sie zwei Master-Abschlüsse, einen in Deutschland und einen an der UNB.
Nun veröfffentlichte sie ihr erstes Paper "Voting for Authorship Attribution Applied to Dark Web Data" gemeinsam mit ihrem Betreuer Prof. Dr. Kenneth Kent (UNB, Honorary Professor an der H-BRS), Prof. Dr. Rainer Herpers und Dr. Marco Hülsmann (beide H-BRS).
Sennewald und ihr deutsch-kanadisches Forscherteam wurden auf der 30th Annual International Conference on Computer Science and Software Engineering (CASCON'20) für ihre Arbeit mit dem Best Paper Award des IBM Centre for Advanced Studies in Computer Science ausgezeichnet.
Forschungthema: Urheberschaft im Dark Web
Der Teil des Internets, der von normalen Suchmaschinen nicht indiziert oder durchsuchbar ist, wird als Deep Web bezeichnet. Innerhalb des Deep Web ist das Dark Web eine weniger zugängliche Untermenge von Bereichen, die spezielle Software, Tools oder Verbindungen für den Zugriff erfordern. In den letzten Jahren hat das Dark Web in bestimmten Communities an Popularität gewonnen, da es ein höheres Maß an Privatsphäre und Anonymität bietet. Wie das Surface Web wird auch das Dark Web nicht nur von Organisationen und Journalisten genutzt, sondern auch von anderen Personen, die ihre Meinungsfreiheit anonym ausüben wollen.
Um Texte im Dark Web Autoren zuordnen zu können, experimentierte Britta Sennewald mit der Verwendung verschiedener Methoden der künstlichen Intelligenz, wie etwa Algorithmen des maschinellen Lernens und natürliche Sprachverarbeitung.
Datensammeln im Dark Web ist keine einfache Aufgabe
"Britta musste ein ziemliches Katz-und-Maus-Spiel durchmachen, um diese Daten zu crawlen und zu extrahieren, da es sich um das Dark Web handelt", sagt Dr. Kent, der Frau Sennewald betreut. "Wenn sie [die dark web user] entdecken, dass man versucht, all diese Daten zu kopieren, versuchen sie einen mit allen Mitteln davon abzuhalten. Deshalb musste Britta einige gute Techniken entwickeln, um diese Daten zu sammeln."
Sennewald betrachtete vier Kategorien, um die Daten zu untersuchen: Wort-für-Wort-Text, Schreibstil des Autors, Zeitpunkt des Beitrags und ein Sprachmodell, das den Text mit Hilfe verschiedener Algorithmen analysiert. Sie verwendete einen Klassifikator, der für jede Kategorie am besten funktionierte, und einen abschließenden Voting-Klassifikator, um die Ergebnisse zu kombinieren.
"Wir konnten mit einer Genauigkeit von 80 % den Beitrag korrekt seinem Autor zuordnen und mit einer Wahrscheinlichkeit von 94 % einen Text zumindest den drei wahrscheinlichsten Urhebern zuordnen", berichtet Sennewald. "Daher ist die Attribution der Urheberschaft ein Risiko für die Anonymität im Dark Web."
Frau Sennewalds Beiträge haben dank der einzigartigen Datentechniken, die sie entwickelt hat, Möglichkeiten für zukünftige Forschung zur Erkundung des Dark Web eröffnet.
Die Nachwuchsforscherin selbst war überrascht von ihrem Erfolg: "Dies war mein allererstes Paper und ich möchte mich für die Chance bedanken, es veröffentlichen zu können. Es ist ziemlich erstaunlich, dass ich gewonnen habe. Diese Auszeichnung ist einfach unglaublich."
Das Projekt wurde durch den Natural Sciences and Engineering Research Council of Canada (NSERC) und den Deutschen Akademischen Austauschdienst (DAAD) gefördert.
Die News erschien im Original auf der Homepage der UNB. Autor: Kesang Deker.
Übersetzung und Redaktion: Miriam Lüdtke-Handjery
Kontakt
B. Kenneth Kent
Honorary Professor, IBM Center for Advanced Studies - Atlantic
Standort
Sankt Augustin
Raum
C 253
Adresse
Grantham-Allee 20
53757, Sankt Augustin
Rainer Herpers
Wissenschaftlicher Direktor des Graduierteninstituts, Direktor des Institute of Visual Computing, Professor im Fachbereich Informatik, Direktor der Abteilung Informatik und Data Science im PK NRW
Forschungsfelder
Standort
Sankt Augustin
Raum
F 427
Adresse
Grantham-Allee 20
53757, Sankt Augustin
Telefon
+49 2241 865 217Standort
Sankt Augustin
Raum
C 275
Adresse
Grantham-Allee 20
53757, Sankt Augustin
Telefon
+49 2241 865 217Marco Hülsmann
Lehrkraft für besondere Aufgaben (Dozent für Mathematik für die Informatik)
Standort
Sankt Augustin
Raum
C 180 / B 112
Adresse
Grantham-Allee 20
53757, Sankt Augustin
Telefon
+49 2241 865 391