Zum Inhalt
Fakultät Physik

Methodenentwicklung

Maschinelles Lernen und die automatische Erkennung von inhärenten Mustern spielen, wie in vielen anderen Bereichen des täglichen Lebens, auch in der experimentellen Astroteilchenphysik eine wichtige Rolle.

Interpretation des Campus durch ein neuronales Netz © Richard Wiemann ​/​ TU Dortmund

Nur mit Hilfe geeigneter Lernalgorithmen können die großen Datenmengen (Big Data) effizient auf kosmische Botenteilchen wie hochenergetische Photonen oder Neutrinos untersucht und diese in geeigneter Weise aus dem überwältigenden Untergrund atmosphärischer Myonen selektiert werden.

Zu diesem Zweck müssen die Lernalgorithmen nicht nur an simulierten Datensätzen mit bekannten Eigenschaften angemessen trainiert, sondern auch deren Performanz muss in geeigneter Weise validiert werden. Die Arbeit an der automatisierten Selektion astrophysikalischer Botenteilchen haben wir unter anderem im Rahmen des Teilprojekts C3 des Sonderforschungsbereiches SFB 876 erforscht. Die Arbeitsgebiete im Bereich des maschinellen Lernens umfassen unter anderem folgende Schwerpunkte:

  • Schätzen von Primärteilcheneigenschaften mithilfe des Maschinellen Lernens, vor allem mit Ensemble-Methoden und Deep Learning
  • Spektralrekonstruktion durch Lernalgorithmen
  • Effizienzsteigerung von Luftschauersimulationen durch Maschinelles Lernen

Der Sonderforschungsbereich SFB 876 ist mittlerweile ausgelaufen. Eines der prominentesten Resultate des SFBs ist die Buchtrilogie „Machine Learning under Resource Constraints“ (Buch 1: Fundamentals, Buch 2:  Discovery in Physics, Buch 3: Applications).

© Lamarr-Institut

Aus dem SFB hat sich die Initative zur Gründung des Lamarr-Instituts entwickelt. Das Lamarr-Institut ist das Dortmunder Kompetenzzentrum zur Entwicklung innovativer Anwendungen in den Bereichen Künstliche Intelligenz und Maschinelles Lernen. Dort arbeiten Forscherinnen und Forscher aus verschiedenen Bereichen der Wissenschaft wie der Physik und der Informatik zusammen.

Unter ki-zentren.net ist das Netzwerk der deutschen Kompetenzzentren für Künstliche Intelligenz dargestellt. Zu diesen Kompetenzzentren gehören neben dem Lamarr-Institut beispielsweise auch das Tuebinngen Al Center in Tübingen und das Deutsche Forschungszentrum für Künstliche Intelligenz. 

Mehr über die End-to-End-Analyse mit maschinellem Lernen ist diesem Artikel zu entnehmen.

Entfaltungsprojekte

Wenn die Auflösung und die Effizienz eines Detektors begrenzt sind, wenn also z. B. nicht alle Teilchen, die ihn durchqueren, perfekt rekonstruiert werden können, stellt sich die Frage, wie man von den ungenauen Signaturen auf Datenpunkte in physikalischen Einheiten mit einer bekannten Präzision schließen kann. Diese Problemklasse wird in der Mathematik als „Inverses Problem“ und in der Physik als „Entfaltungsproblem“ bezeichnet.

Zur generellen Lösung dieser Problemklasse haben wir (im SFB 876) methodisch unterschiedlich operierende Algorithmen entwickelt:

DSEA

Der Dortmund Spectrum Estimation Algorithm ist ein Verfahren zur Rekonstruktion von Spektren, bei dem die Entfaltung als multinominales Klassifikationsproblem aufgefasst wird.

Funfolding

Funfolding ist speziell für die Entfaltung von IceCube-Daten entwickelt worden. Funfolding ist eine Python-Bibliothek in der mehrere Algorithmen, unter anderem der RUN-Likelihood-Unfolding-Algorithmus, implementiert sind. Hauptmerkmale sind „Likelihood-basierte Entfaltungstechniken“ und „Entscheidungsbaum-basiertes Binning“. Sie finden dieses Projekt bei GitHub.

TRUEE

TRUEE (Time-dependent Regularized Unfolding for Economics and Engineering problems) ist ein Software-Paket zur numerischen Lösung von inversen Problemen (Entfaltung). Der Algorithmus basiert auf der ursprünglich in FORTRAN 77 geschriebenen Applikation RUN (Regularized UNfolding). Dieser Entfaltungs-Algorithmus wurde bei der Analyse in Experimenten der Teilchen- und Astroteilchenphysik verwendet und zeichnete sich durch besonders stabile Ergebnisse und verlässliche Berechnung der Unsicherheiten aus. Nach FORTRAN hat sich heute die Programmiersprache C++ bei Analyseprogrammen in den verschiedensten Forschungsbereichen durchgesetzt. Daher wurde das C++-Enfaltungsprogramm TRUEE entwickelt, welches den RUN-Algorithmus und zusätzliche Erweiterungen beinhaltet, die ein komfortables und benutzerfreundliches Anwenden ermöglichen. Die Ergebnisse von TRUEE und RUN sind identisch.