Κανόνες συσχετίσεων και Εύρεση συχνών στοιχειοσυνόλων από βάσεις δεδομένων συναλλαγών με τον αλγόριθμο Apriori για εφαρμογές data mining

Απόθεσις

 

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Κόκκινος, Ιωάννης
dc.contributor.author Παπαϊορδάνου, Άννα
dc.date.accessioned 2015-06-11T08:08:44Z
dc.date.available 2015-06-11T08:08:44Z
dc.date.issued 2010
dc.identifier.uri http://apothesis.teicm.gr/xmlui/handle/123456789/1214
dc.description Το πλήρες κείμενο της εργασίας ΔΕΝ είναι διαθέσιμο el
dc.description.abstract Ο όρος data mining χρησιμοποιείται για να περιγράψει την εξόρυξη γνώσης από μεγάλες βάσεις δεδομένων, δηλαδή τις διαδικασίες ανακάλυψης χρήσιμων προτύπων και καλά κρυμμένων πληροφοριών από τα δεδομένα με χρήση αλγορίθμων. Η ανάλυση κανόνων συσχετίσεων (association rules), αναφέρεται στην διαδικασία εκείνη της εξαγωγής γνώσης από βάσεις δεδομένων που αποκαλύπτει συγκεκριμένο τρόπο με τον οποίο τα δεδομένα είναι δυνατόν να συνδέονται. Το ευρύτερα γνωστό παράδειγμα αυτού του είδους τις εφαρμογής είναι ο προσδιορισμός κανόνων συσχέτισης από την ανάλυση του καλαθιού αγοράς (market basket analysis) ή δεδομένων συναλλαγών. Για παράδειγμα ο κανόνας Α⇒{Β, Γ} δηλαδή οι πελάτες που αγοράζουν το προϊόν Α, αγοράζουν ταυτόχρονα και τα προϊόντα Β και Γ είναι ένας κανόνας συσχέτισης. Εδώ τα δεδομένα που αναλύονται αποτελούνται από πληροφορίες σχετικές με τα προϊόντα που αγοράζουν οι πελάτες, δηλαδή τις συναλλαγές τους. Η ανάλυση κανόνων συσχετίσεων είναι ένα ενεργό πεδίο έρευνας και εκτός από το market basket analysis, χρησιμοποιείται σε πληθώρα άλλων εφαρμογών, από το Web usage mining, τη συσχέτιση υπόπτων εγκληματικών ενεργειών, την πρόβλεψη αποτυχίας της λειτουργίας τηλεπικοινωνιακών διακόπτων, το intrusion detection καθώς και σε άλλες τεχνικές όπως graph mining, clustering with links, και bioinformatics. Η κύρια προσέγγιση για την ανάλυση κανόνων συσχέτισης είναι η διάσπαση του προβλήματος σε δύο μέρη: πρώτον την εύρεση συχνών στοιχειοσυνόλων (frequent itemsets) ο αριθμός συχνότητας εμφάνισης των οποίων είναι πάνω από ένα κατώφλι και δεύτερον τη δημιουργία κανόνων συσχέτισης από αυτά. Ο αλγόριθμος Apriori είναι ο γνωστότερος αλγόριθμος εύρεσης συχνών στοιχειοσυνόλων και εξαγωγής συσχετίσεων από αυτά. Σε κάθε σάρωση των δεδομένων δημιουργεί τα υποψήφια στοιχειοσύνολα και εξετάζει τη συχνότητά τους. Επιλέγοντας τα συχνότερα, όπως τα {A,C,D} και {A,B} υπολογίζει την εμπιστοσύνη και παράγει τους κανόνες συσχετίσεων A ⇒{C,D} και Α⇒Β. Η παρούσα μελέτη αποσκοπεί στην κατανόηση του αλγόριθμου apriori και την υλοποίηση του σε περιβάλλον προγραμματισμού Borland C++ Builder. Ως εφαρμογή του αλγορίθμου αυτού θα γίνει προσδιορισμός κανόνων συσχέτισης από την ανάλυση του καλαθιού αγοράς. el
dc.format.extent 70 el
dc.language.iso el el
dc.publisher Τ.Ε.Ι. Κεντρικής Μακεδονίας el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/4.0/deed.el
dc.subject TEICM::ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ::ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ el
dc.subject.ddc 006.3 el
dc.title Κανόνες συσχετίσεων και Εύρεση συχνών στοιχειοσυνόλων από βάσεις δεδομένων συναλλαγών με τον αλγόριθμο Apriori για εφαρμογές data mining el
dc.type Πτυχιακή εργασία
dc.contributor.department Σχολή Τεχνολογικών Εφαρμογών, Τμήμα Μηχανικών Πληροφορικής Τ.Ε. el
dc.heal.publisherID teiser
dc.subject.keyword Εξόρυξη πληροφορίας el
dc.subject.keyword Εξόρυξη γνώσης el
dc.subject.keyword Κανόνες συσχέτισης el
dc.subject.keyword Βάσεις δεδομένων συναλλαγών el
dc.subject.keyword Αλγόριθμος Apriori el
dc.subject.keyword Data mining el


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές Except where otherwise noted, this item's license is described as Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές