Περίληψη:
Το παρόν έγγραφο πραγματεύεται την έννοια της εξόρυξης κειμένων ( Text Mining) και συγκεκριμένα εξετάζεται η μελέτη και ανάλυση δεδομένων υπό το πρίσμα του αλγορίθμου Apriori. Ο όρος Text Mining αναφέρεται σε ένα νεοσύστατο επιστημονικό πεδίο έρευνας που αντιμετωπίζει τη διαχείριση, ανάλυση και μελέτη μεγάλου όγκου πληροφοριών εγγράφων. Πιο συγκεκριμένα, βασικός στόχος είναι η συγγραφή προγράμματος που θα υλοποιεί τον αλγόριθμο Apriori με τελικό σκοπό την εκτέλεσή του πάνω στα δεδομένα μιας βάσης δεδομένων στην οποία κρατούνται τα στοιχεία συναλλαγών. Θα ασχοληθούμε, μέσω του αλγορίθμου Apriori, με την παραγωγή συσχετίσεων μεταξύ πεδίων των εγγραφών της βάσης, εξετάζοντας την ύπαρξη μοτίβων και συμπεριφορών που χαρακτηρίζουν την κινητικότητα στη βάση. Αυτού του τύπου ανάλυση και επεξεργασία των δεδομένων αποτελεί αρκετά χρήσιμο εργαλείο στον εμπορικό τομέα και συγκεκριμένα στην ανάλυση της συμπεριφοράς και των αγοραστικών τάσεων των καταναλωτών (market basket analysis).