Daten aus der realen Welt sind in der Regel unsauber, verteilt und heterogen. In diesem Kurs werden Kernkonzepte der Datenbereinigung und -standardisierung sowie der Datenintegration vorgestellt, die darauf abzielen, Rohdaten in andere Formate zu konvertieren und abzubilden, die eine effizientere Nutzung und Analyse von Daten ermöglichen. Der Kurs behandelt auch Fragen der Datenqualität, -verwaltung und -speicherung, die für die Datenanalyse relevant sind.

Semester: SoSe 2023