Περίληψη:
Η εφαρμογή που υλοποιήθηκε στα πλαίσια της παρούσας πτυχιακής εργασίας αλλά και η μελέτη που θα ακολουθήσει ασχολούνται με το αντικείμενο της συσταδοποίησης και ειδικότερα με τους ιεραρχικούς αλγορίθμους απλού, πλήρους και μέσου δεσμού αλλά και επεκτείνεται σε θέματα που αφορούν τη συσταδοποίηση, όπως τα μέτρα απόστασης και τύπους δεδομένων που συναντώνται. Η εφαρμογή συγκεκριμένα αποτελείται από δύο φόρμες, η μία είναι υπεύθυνη για το φόρτωμα και την επιλογή των δεδομένων από μία βάση και η άλλη ασχολείται με την συσταδοποίηση, την ανάλυση των διαφόρων πτυχών της και την αποθήκευση των επεξεργασμένων δεδομένων στη βάση. Οι βάσεις δεδομένων έχουν καθοριστικό ρόλο στην διαχείριση δεδομένων αφού έχουν σχεδιαστεί για να προσφέρουν ένα οργανωμένο μηχανισμό για την αποθήκευση, διαχείριση και ανάκτηση πληροφοριών. Από τις πληροφορίες που υπάρχουν λοιπόν στη βάση μπορούμε να εξάγουμε διάφορες “κρυφές” πληροφορίες, η διαδικασία αυτή λέγεται εξόρυξη δεδομένων (Data Mining) . Η εξόρυξη δεδομένων χρησιμοποιείται ευρέως σε τομείς όπως στην έρευνα της αγοράς και των καταναλωτών, στην ανάλυση προϊόντων, στην ανάλυση προσφοράς και ζήτησης, το ηλεκτρονικό εμπόριο και άλλα. Με την συσταδοποίηση μπορούμε να επεξεργαστούμε τα δεδομένα που έχουμε και να ανακαλύψουμε τις ομοιότητες και τις μεταξύ τους σχέσεις. Συσταδοποίηση είναι ο διαχωρισμός ενός συνόλου αντικειμένων σε μικρότερα υποσύνολα που έχουν νόημα, ακόμα μπορεί να κατανοηθεί ως η ομαδοποίηση των διαφόρων αντικειμένων. Τα δεδομένα που ανήκουν στην ίδια ομάδα θα είναι πιο όμοια μεταξύ τους από ότι με τα υπόλοιπα αντικείμενα. Έτσι μπορούμε να πούμε ότι θυσιάζουμε την κατανόηση του κάθε επιμέρους αντικειμένου για χάριν της απλότητας και της καλύτερης κατανόησης. Η μελέτη που ακολουθεί αρχικά πραγματεύεται την έννοια της συσταδοποίησης,τις εφαρμογές της, υπάρχουσες έρευνες πάνω στο αντικείμενο και έπειτα επεκτείνεται σε διάφορα μέτρα απόστασης που χρησιμοποιούνται στη συσταδοποίηση, τύπους δεδομένων που συναντώνται αλλά και αναλυτική ή αναφορική ανάλυση των διαφόρων ιεραρχικών μεθόδων συσταδοποίησης. Έπειτα ακολουθεί μία αναφορά στο πρόγραμμα Matlab, τις βάσεις δεδομένων και το ODBC αλλά και των βασικών συναρτήσεων που προσφέρει το Matlab για την επίτευξη της συσταδοποίησης. Τέλος γίνεται ανάλυση της λειτουργίας της εφαρμογής που υλοποιήθηκε στα πλαίσια της πτυχιακής εργασίας και του κώδικα.