« Projekte
Sie verwenden einen sehr veralteten Browser und können Funktionen dieser Seite nur sehr eingeschränkt nutzen. Bitte aktualisieren Sie Ihren Browser. http://www.browser-update.org/de/update.html
Probabilistic Active Learning
Projektbearbeiter:
M.Sc. Daniel Kottke
Finanzierung:
Land (Sachsen-Anhalt) ;
In Zeiten des Big Data stehen Datenanalysten vor der Herausforderung die schnell wachsenden Datenmengen zu verarbeiten. In den meisten Fällen sind die aufgenommenen Daten nicht direkt verwertbar, da sie durch interessante Zielgrößen (Label) ergänzt werden müssen. Diese Annotation der Daten ist meistens sehr zeit- und kostenaufwendig, da Experten oder sehr rechenintensive Algorithmen benötigt werden.

Methoden des aktiven Lernen versuchen solche ungelabelten (ohne Zielattribut) Datensätze in möglichst effektiver Art und Weise annotieren zu lassen, sodass Klassifikationsalgorithmen anhand dieser Annotationen Modelle über die Struktur der Datensätze lernen können. In diesem Projekt werden neue, probabilistische Methoden entwickelt, um den Annotationsprozess zu optimieren und bewerten zu können. Im Fokus steht dabei die Formalisierung des Problems als Optimierungsaufgabe von verschiedenen Kosten, sodass ein automatisierter Prozess stattfinden kann.

Schlagworte

Active Learning, Data Mining, Klassifikation
Kontakt

weitere Projekte

Die Daten werden geladen ...