Das Ziel von Data Mining ist die Analyse von großen Datenmengen mittels verschiedener, oft statistisch geprägter Verfahren. Als Resultat des Data Mining entsteht ein "Modell" der Daten welches beispielsweise die Form einer Zusammenfassung oder einer Datenselektion annehmen kann. Prominente Beispiel für Data Mining Techniken sind Googles Pagerank Verfahren zur Beurteilung der Relevanz von Webseiten für ein gegebenes Suchthema und Amazons Artikelvorschlagssystem, das auf Basis von angesehenen Artikeln weitere relevante Artikel empfehlen kann. Im Kontext von großen Datenmengen, wie sie in unserer modernen Welt zunehmend verfügbar sind (Stichwort "Big Data"), spielt Data Mining heute in vielen Anwendungen der Informatik eine zentrale Rolle. Das Seminar beschäftigt sich mit dem Mining großer Datenmengen und basiert auf dem Buch "Mining of Massive Datasets" von Jure Leskovec, Anand Rajaraman und Jeffrey D. Ullman.

Semester: WT 2022/23