Περίληψη:
Η εξόρυξη γνώσης από δεδομένα (Data Mining) συχνά ορίζεται σαν η εύρεση πληροφοριών που είναι κρυμμένες σε μία βάση δεδομένων. Αφορά την εξερευνητική ανάλυση δεδομένων, την ανακάλυψη καθοδηγούμενη από δεδομένα ή συμπερασματική μάθηση. Οι εργασίες εξόρυξης απαιτούν την κατάταξη παρόμοιων αντικειμένων σε προκαθορισμένες κατηγορίες (κλάσεις), την πρόβλεψη μελλοντικής συμπεριφοράς σύμφωνα με κάποια τρέχουσα συμπεριφορά (π.χ. δύο προϊόντα αγοράζονται μαζί) και την ομαδοποίηση, με βάση κάποιες ομοιότητες που προκύπτουν, των ανομοιογενών δεδομένων σε μη προκαθορισμένες υποομάδες. Τα δένδρα αποφάσεων είναι μία τεχνική που διαιρεί στοιχεία ενός συνόλου που έχει καταταγεί εκ των προτέρων σε προκαθορισμένες κατηγορίες (ή ομάδες ή κλάσεις). Κάθε ομάδα περιγράφεται χρησιμοποιώντας έναν κανόνα. Έτσι ένα δένδρο αποφάσεων παριστά μία σειρά ερωτήσεων, όπου η απάντηση σε κάθε ερώτηση καθορίζει ποια διαδρομή θα ακολουθηθεί (δηλαδή ποια ερώτηση θα γίνει στη συνέχεια). Τα δένδρα αποφάσεων παράγουν και κανόνες οι οποίοι μπορούν να μεταφραστούν σε άλλα δένδρα αποφάσεων. Χρησιμοποιούνται επίσης αλγόριθμοι κατασκευής ή βελτιστοποίησης δένδρων αποφάσεων όπως οι ID3, C4.5, CART, J48. Στην πτυχιακή εργασία υλοποιήθηκε δικτυακή εφαρμογή σε Java που κατασκευάζει δένδρα αποφάσεων από δείγματα δεδομένων του SQL Server με σκοπό την κατάταξή τους σε κατηγορίες. Υλοποιήθηκε ο αλγόριθμος δένδρων αποφάσεων ID3 ο οποίος δημιουργεί δένδρα από σύνολα δεδομένων εκπαίδευσης βασιζόμενος στο κέρδος της πληροφορίας.