Παρουσίαση/Προβολή
Εξόρυξη Γνώσης και Μηχανική Μάθηση (2021-2022)
(ΨΣ026) - ΣΤΕΦΑΝΟΣ ΟΥΓΙΑΡΟΓΛΟΥ
Περιγραφή Μαθήματος
Σκοπός του μαθήματος είναι η γνωριμία των φοιτητών και των φοιτητριών με έννοιες που αφορούν την εξόρυξη γνώσης από δεδομένων και τη μηχανική μάθηση. Πιο συγκεκριμένα, στόχοι του μαθήματος αποτελούν το να βοηθήσει τους φοιτητές και τις φοιτήτριες:
- Να γνωρίσουν τις εφαρμογές Εξόρυξης Γνώσης και Μηχανικής Μάθησης καθώς και τα στάδια της Εξόρυξης Γνώσης από Δεδομένα (Knowledge Discovery in Databases)
- Να εφαρμόζουν τις κατάλληλες τεχνικές προ-επεξεργασίας δεδομένων με στόχο την προετοιμασία των δεδομένων για Εξόορυξη Γνώσης και την εφαρμογή αλγορίθμων Μηχανικής Μάθησης
- Να κατανοήσουν τον τρόπο λειτουργίας διάφορων αλγορίθμων κατηγοριοποίησης (εποπτευμένη μάθηση), συσταδοποίησης (μη εποπτευμένης μάθησης) και εξαγωγής κανόνων συσχέτισης
- Να εκτιμούν την απόδοση των αλγορίθμων Εξόρυξης Γνώσης και Μηχανικής Μάθησης χρησιμοποιώντας τις κατάλληλες τεχνικές επικύρωσης και να αξιολογούν την παραγόμενα αποτελέσματα με στόχο τη λήψη αποφάσεων
- Να σχεδιάζουν και να υλοποιούν Αποθήκες Δεδομένων και να εφαρμόζουν αναλυτική επεξεργασία τύπου OLAP και αλγορίθμους εξόρυξης γνώσης σε αυτές
Περιεχόμενα μαθήματος:
- Εισαγωγή στην εξόρυξη γνώσης και τη μηχανικής μάθηση.
- Προετοιμασία δεδομένων (Καθαρισμός δεδομένων, διαχείριση απούσων τιμών, επιλογή χαρακτηριστικών, διακριτοποίηση, διαχείριση ανισοκατανομών σε προβλήματα κατηγοριοποίησης κ.α.)
- Εισαγωγή στην κατηγοριοποίηση/εποπτευμένη μάθηση, Κατηγορίες αλγορίθμων κατηγοριοποίησης, Αλγρόριθμοι που βασίζονται σε πιθανότητες (π.χ. naive bayes), Αλγόριθμοι που βασίζονται στον διαχωρισμό του χώρου (π.χ. Δένδρα αποφάσεων), Αλγόριθμοι που βασίζονται στην ομοιότητα/απόσταση (κ εγγύτεροι γείτονες), αποτελεσματική αναζήτηση εγγύτερων γειτόνων μέσω δεικτοδότησης δεδομένων (π.χ. kdtree), τεχνικές μείωσης δεδομένων εκπαίδευσης.
Εισαγωγή στην συσταδοποίησης/μη εποπτευμένη μάθηση, Αλγόριθμοι Συσταδοποίησης: Ο αλγόριθμος κ μέσων (k-means) και οι παραλλαγές του, Ιεαραρχική συσταδοποίηση, συσταδοποίηση βάσει πυκνότητας (DBSCAN), τεχνικές προσδιορισμου παραμέτρων στον Αλγόριθμο k-Means και στον DBSCAN- Μέτρηση της απόδοσης αλγορίθμων κατηγοριοποίησης και συσταδοποίησης
- Κανόνες συσχέτισης, Ο αλγόριθμος Apriori για την ανακάλυψη κανώνων συσχέτισης, μέτρα αξιολόγησης των κανόνων συσχέτισης
- Επεξεργασία τύπου OLTP και OLAP, σχεδίαση και υλοποίηση Αποθήκης Δεδομένων, σχήμα αστέρα και χιονονιφάδας, διαδικασίες Extract-Transform-Load (ETL), πολυδιάστατοι κύβοι δεδομένων, αίτηματα OLAP και αλγόριθμοι εξόρυξης γνώσης σε κύβους δεδομένων.
Ημερομηνία δημιουργίας
Κυριακή 6 Μαρτίου 2022
-
Δεν υπάρχει περίγραμμα