Zum Inhalt
Fakultät Physik

Methodenentwicklung

Maschinelles Lernen und die automatische Erkennung von inhärenten Mustern spielen, wie in vielen anderen Bereichen des täglichen Lebens, auch in der experimentellen Astroteilchenphysik eine wichtige Rolle.

Interpretation des Campus durch ein neuronales Netz © Richard Wiemann ​/​ TU Dortmund

Nur mit Hilfe geeigneter Lernalgorithmen können die großen Datenmengen (Big Data) effizient auf kosmische Botenteilchen wie hochenergetische Photonen oder Neutrinos untersucht und diese in geeigneter Weise aus dem überwältigenden Untergrund atmosphärischer Myonen selektiert werden.

Zu diesem Zweck müssen die Lernalgorithmen nicht nur an simulierten Datensätzen mit bekannten Eigenschaften angemessen trainiert, sondern auch deren Performanz muss in geeigneter Weise validiert werden. Die Arbeit an der automatisierten Selektion astrophysikalischer Botenteilchen haben wir unter anderem im Rahmen des Teilprojekts C3 des Sonderforschungsbereiches SFB 876 erforscht. Die Arbeitsgebiete im Bereich des maschinellen Lernens umfassen unter anderem folgende Schwerpunkte:

  • Schätzen von Primärteilcheneigenschaften mithilfe des Maschinellen Lernens, vor allem mit Ensemble-Methoden und Deep Learning
  • Spektralrekonstruktion durch Lernalgorithmen
  • Effizienzsteigerung von Luftschauersimulationen durch Maschinelles Lernen

Auf den Seiten des Sonderforschungsbereiches SFB 876 sind weitere Informationen zu Entfaltungsalgorithmen und Inversen Problemen in der Astroteilchenphysik zu finden!

Mehr über die End-to-End-Analyse mit maschinellem Lernen ist diesem Artikel zu entnehmen.

Entfaltungsprojekte

Wenn die Auflösung und die Effizienz eines Detektors begrenzt sind, wenn also z. B. nicht alle Teilchen, die ihn durchqueren, perfekt rekonstruiert werden können, stellt sich die Frage, wie man von den ungenauen Signaturen auf Datenpunkte in physikalischen Einheiten mit einer bekannten Präzision schließen kann. Diese Problemklasse wird in der Mathematik als „Inverses Problem“ und in der Physik als „Entfaltungsproblem“ bezeichnet.

Zur generellen Lösung dieser Problemklasse haben wir (im SFB 876) methodisch unterschiedlich operierende Algorithmen entwickelt:

DSEA

Der Dortmund Spectrum Estimation Algorithm ist ein Verfahren zur Rekonstruktion von Spektren, bei dem die Entfaltung als multinominales Klassifikationsproblem aufgefasst wird.

Funfolding

Funfolding ist speziell für die Entfaltung von IceCube-Daten entwickelt worden. Funfolding ist eine Python-Bibliothek in der mehrere Algorithmen, unter anderem der RUN-Likelihood-Unfolding-Algorithmus, implementiert sind. Hauptmerkmale sind „Likelihood-basierte Entfaltungstechniken“ und „Entscheidungsbaum-basiertes Binning“. Sie finden dieses Projekt bei GitHub.

TRUEE

TRUEE (Time-dependent Regularized Unfolding for Economics and Engineering problems) ist ein Software-Paket zur numerischen Lösung von inversen Problemen (Entfaltung). Der Algorithmus basiert auf der ursprünglich in FORTRAN 77 geschriebenen Applikation RUN (Regularized UNfolding). Dieser Entfaltungs-Algorithmus wurde bei der Analyse in Experimenten der Teilchen- und Astroteilchenphysik verwendet und zeichnete sich durch besonders stabile Ergebnisse und verlässliche Berechnung der Unsicherheiten aus. Nach FORTRAN hat sich heute die Programmiersprache C++ bei Analyseprogrammen in den verschiedensten Forschungsbereichen durchgesetzt. Daher wurde das C++ Enfaltungsprogramm TRUEE entwickelt, welches den RUN-Algorithmus und zusätzliche Erweiterungen beinhaltet, die ein komfortables und benutzerfreundliches Anwenden ermöglichen. Die Ergebnisse von TRUEE und RUN sind identisch.