ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ | ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ | ΕΠΙΣΤΗΜΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ

Διαχείριση Δεδομένων Μεγάλης Κλίμακας

Περιγραφή

Κατανεμημένες βάσεις δεδομένων και αποθήκες δεδομένων. Βάσεις NoSQL, Κατανεμημένο σύστημα αρχείων Google File System, Οι βάσεις BigTable, Dynamo και Cassandra. Συστήματα διαχείρισης ροών δεδομένων. Συστήματα Γράφων. Κατανεμημένη διαχείριση δεδομένων με τον αλγόριθμο MapReduce, αλγόριθμοι συνένωσης με την εκτέλεση MapReduce, κατανεμημένη ευρετηρίαση. Τα συστήματα επεξεργασίας HIVE, Spark, Hadoop. Αρχεία και τύποι δεδομένων RDD, Parquet και ORC. Θεώρημα CAP και BASE. Κατανεμημένες δοσοληψίες. Μεγάλα δεδομένα και υπολογιστικά νέφη.

Διδάσκοντες
Εξάμηνο
Εαρινό Εξάμηνο
Κατηγορία
Υποχρεωτικό
Ώρες Θεωρίας
1 ώρα
Ώρες Εργαστηρίου
2 ώρες
Credits
5