Γραφο-θεωρητικές μέθοδοι συσταδοποίησης και ο αλγόριθμος Jarvis-Patrick σε βάσεις δεδομένων Oracle

Απόθεσις

 

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Κόκκινος, Ιωάννης
dc.contributor.author Βρυώνης, Ευάγγελος
dc.contributor.author Τσούτσας, Δημήτριος
dc.date.accessioned 2015-05-04T13:40:08Z
dc.date.available 2015-05-04T13:40:08Z
dc.date.issued 2011-06
dc.identifier.uri http://apothesis.teicm.gr/xmlui/handle/123456789/830
dc.description.abstract Συσταδοποίηση ή ομαδοποίηση σε βάσεις δεδομένων είναι η τεχνική εξόρυξης γνώσης από δεδομένα (data mining) που οργανώνονται σε συστάδες (ομάδες ή κλάσεις ή συγκροτήματα) για περαιτέρω κατάταξη. Ενώ πολλοί αλγόριθμοι που βασίζονται σε αποστάσεις όπως οι DBSCAN και CURE χρησιμοποιήθηκαν για την επίλυση προβλημάτων σε δεδομένα λίγων διαστάσεων, η ύπαρξη πολλών διαστάσεων φέρνει πρόσθετες προκλήσεις που περιέχουν το κύριο πρόβλημα της διαστασιμότητας, καθώς οι συναρτήσεις απόστασης μεταξύ των σημείων που καθορίζουν την ομοιότητά τους, γίνονται σχεδόν ομοιόμορφες δυσκολεύοντας το διαχωρισμό τους σε ομάδες. Οι ιδέες και έννοιες της θεωρίας γράφων διευκολύνουν την περιγραφή των προβλημάτων ανίχνευσης ομάδων δεδομένων μέσω γράφων. Οι κορυφές (κόμβοι) V ενός ζυγισμένου γράφου G αντιστοιχούν σε σημεία δεδομένων στο χώρο των προτύπων και οι ακμές Ε απεικονίζουν τη γειτνίαση μεταξύ ζευγών σημείων. Μία προσέγγιση ομοιότητας βασισμένη σε γράφο κοινών κοντινών γειτόνων όπως προτάθηκε από τους Jarvis-Patrick και μετέπειτα στον αλγόριθμο ROCK, είναι μία προτεινόμενη μέθοδος λύσης και για το παραπάνω πρόβλημα, καθώς επίσης και για την συσταδοποίηση μη-αριθμητικών δεδομένων κατηγοριών. Η ομοιότητα δύο σημείων καθορίζεται όχι σύμφωνα με κάποια απόσταση αλλά με τον αριθμό των κοντινών γειτόνων που μοιράζονται. Έτσι ο αλγόριθμος Jarvis-Patrick εισήγαγε τον γράφο γειτνίασης k-πλησιέστερων κορυφών και τον γράφο κοινών κοντινών γειτόνων (shared nearest neighbour graph). Ο αλγόριθμος Jarvis- Patrick μοιάζει έπειτα ως προς τα αποτελέσματα με την τεχνική της ιεραρχικής συσωρευτικής συσταδοποίησης απλού συνδέσμου και ο ROCK με αυτή του μέσου συνδέσμου. Ο αλγόριθμος Jarvis-Patrick είναι ο πρώτος μη ιεραρχικός αλγόριθμος που εισήγαγε τον γράφο κοινών κοντινών γειτόνων. Ομοίως ο αλγόριθμος ROCK μετασχηματίζει τις αρχικές ομοιότητες μεταξύ δύο αντικειμένων, που υπολογίζονται με συντελεστές Jaccard, σε ομοιότητες που αντανακλούν τον αριθμό των κοινών γειτόνων τους. Οι αλγόριθμοι που ακολούθησαν όπως οι Chameleon, Min-cut, HCS (highly connected subgraphs), CLICK (clustering identification via connectivity kernels), CAST (cluster affinity search technique), AMOEBA, SNN, C2P αποδεικνύουν την δημοφιλία της χρήσης των γράφων γειτνίασης k-πλησιέστερων κορυφών και των γράφων κοινών κοντινών γειτόνων σε παρόμοιες εφαρμογές. Οι δύο τελευταίοι αλγόριθμοι SNN και C2P που είναι και πρόσφατοι εμπεριέχουν στα βήματά τους τον αρχικό αλγόριθμο Jarvis-Patrick, και έπειτα συνεχίζουν ο πρώτος με τον DBSCAN και ο δεύτερος με τον MST. el
dc.format.extent 89 el
dc.language.iso el el
dc.publisher Τ.Ε.Ι. Κεντρικής Μακεδονίας el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/4.0/deed.el
dc.subject TEICM::ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ::ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ el
dc.subject TEICM::ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ el
dc.subject ΑΛΓΟΡΙΘΜΟΙ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ el
dc.subject.ddc 006.3 el
dc.title Γραφο-θεωρητικές μέθοδοι συσταδοποίησης και ο αλγόριθμος Jarvis-Patrick σε βάσεις δεδομένων Oracle el
dc.type Πτυχιακή εργασία
dc.contributor.department Σχολή Τεχνολογικών Εφαρμογών, Τμήμα Μηχανικών Πληροφορικής Τ.Ε. el
dc.heal.publisherID teiser
dc.subject.keyword Εξόρυξη δεδομένων el
dc.subject.keyword Συσταδοποίηση el
dc.subject.keyword Βάσεις δεδομένων el
dc.subject.keyword Αλγόριθμος Jarvis-Patrick el
dc.subject.keyword Oracle el


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές Except where otherwise noted, this item's license is described as Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές