Στην παρούσα εργασία εφαρμόσαμε συνελικτικά νευρωνικά δίκτυα βαθιάς μηχανικής μάθησης για κατηγοριοποίηση εικόνων σε ζωγραφιές παιδιών από νηπιαγωγεία με σκοπό την κατηγοριοποίηση των εικόνων σε 6 κλάσεις. Η πρώτη είναι η χαμηλότερη ικανότητα λεπτής κινητικότητας ενώ 6 η βέλτιστη. Τα διαφορετικά νευρωνικά δίκτυα που δοκιμάστηκαν ακολουθούν διαφορετικές αρχιτεκτονικές Συνελικτικών Νευρωνικών Δικτύων (Convolutional Neural Networks - CNN). Το Σύνολο δεδομένων αυτό αποτελείται από ζωγραφιές παιδιών που αναπαριστούν τη φιγούρα ενός άνδρα και μίας γυναίκας. Σκοπός μας είναι να μελετήσουμε την απόδοση των διαφορετικών μοντέλων κάτω από τις ίδιες συνθήκες στο συγκεκριμένο σύνολο δεδομένων. Θα εξηγήσουμε τους τρόπους με τους οποίους υπολογίζουμε την ακρίβεια του μοντέλου, τι είναι η ακρίβεια και οι άλλες μετρικές. Θα δούμε πως κάναμε την έρευνα προκειμένου να φτάσουμε στην αρχιτεκτονική του μοντέλου μας (MotorSkilllsCNN) έτσι ώστε να έχει την καλύτερη απόδοση για το συγκεκριμένο σύνολο δεδομένων. Μετά τη διαδικασία της εκπαίδευσης είδαμε ότι το πιο αποδοτικό μοντέλο είναι το InceptionV3 της Google με ακρίβεια 100% κατά τη διάρκεια εκπαίδευσης και 50% ακρίβεια κατά τη διάρκεια επαλήθευσης. Στην δεύτερη θέση βρίσκεται το δικής μας κατασκευής, MotorSkillsCNN με 95% ακρίβεια κατά την εκπαίδευση και 40% ακρίβεια κατά την επαλήθευση. Έπειτα ακολουθεί το ResNetV2 με 95% ακρίβεια κατά τη διάρκεια εκπαίδευσης και 30% κατά τη διάρκεια επαλήθευσης και στην τέταρτη θέση έχουμε το MobileNetV2 με 92% ακρίβεια κατά τη διάρκεια εκπαίδευσης και 20% ακρίβεια κατά τη διάρκεια επαλήθευσης.
In this thesis we applied convolutional neural networks to classify images of kindergarten kids’ drawings in 6 classes depending on their motor skills. The first class is the weaker skill and the sixth is the best. The different architectures of Convolutional Neural Networks (CNN) have different accuracies and results. This dataset represents the drawing figure of a man and a woman from children at a certain age. Our aim is to study the accuracy of these different models under the same circumstances in the specific dataset. We will explain the ways that we calculated the accuracy and the other metrics and what these metrics are. We will also see how we studied to reach to the architecture of our model (MotorSkilllsCNN) in order to have the best results for this specific dataset. After the training phase we reach to the conclusion that the InceptionV3 model made by Google gave us the best results with 100% of training accuracy and 50% of evaluation accuracy. The following one was the MotorSkillsCNN with 95% of training accuracy and 40% of evaluation accuracy. In the third place we have ResNetV2 with 95% training accuracy and 30% evaluation accuracy and in the fourth place we have MobileNetV2 with 92% training accuracy and 20% of evaluation accuracy.