Allgemeine Informationen
Der Kurs findet als semesterbegleitende Veranstaltung im Sommersemester statt.
Das Modul wird mit 5 LP kreditiert.
Die Veranstaltung gehört zur Spezialisierung DataScienceMATSE .
Unterrichtsdauer
3 WSW (V2, Ü1)
Voraussetzungen
Lineare Algebra, Stochastik
Inhalte
Data Analysis ist ein grundlegender Schritt, um strukturierte Informationen aus einer unstrukturierten Datenbasis zu gewinnen. Ziel ist die Destillation einer Datenbasis, die für weitere Anwendungen geeignet ist, z.B. als Datenbasis für Machine Learning. Das Modul stellt Basisinhalte sowie gängige Techniken des Themenbereiches Data Analysis vor. Einzelne Themenfelder sind dabei:
- Pre-Processing von Datensätzen
- Natural Language Processing, Image Processing
- Fourier Analyse, Regularisierung
- Datenreduktion
- Visualisierung
Die Vorlesung umfasst die praktische Nutzung der vorgestellten Techniken und bereitet die Studierenden auf die eigene Implementierung einer realen Anwendung aus dem Bereich Data Analysis vor.
Veranstaltungsunterlagen
Folgt
Prüfung
75% Schriftliche Klausur im Umfang von 2 Stunden, 25% Projekt
Literatur
(DSP) Tamal Bose: Digital Signal and Image Processing, ISBN 9780471327271
(ISL) James, G., Witten, D., Hastie, T., Tibshirani: An Introduction to Statistical Learning (with Applications in R), ISBN 9781461471370, http://www-bcf.usc.edu/~gareth/ISL/index.html
(DIP) Rafael C. Gonzalez, Richard E. Woods: Digital Image Processing, ISBN 9780131687288, http://www.imageprocessingplace.com/DIP-3E/dip3e_main_page.htm
(DAAG) J. Maindonald, W. John Braun: Data Analysis and Graphics Using R, Cambridge, ISBN 9780521762939, http://www.cambridge.org/catalogue/catalogue.asp?isbn=9780521762939
(DM) C. Aggarwal: Data Mining: The Textbook, ISBN 9783319141411, http://www.springer.com/gp/book/9783319141411
Praktikum
This class is supported by DataCamp , the most intuitive learning platform for data science. Learn R, Python and SQL the way you learn best through a combination of short expert videos and hands-on-the-keyboard exercises. Take over 100+ courses by expert instructors on topics such as importing data, data visualization or machine learning and learn faster through immediate and personalised feedback on every exercise