Περίληψη:
Η αναγνώριση του περιεχόμενου μίας εικόνας και η ταξινόμηση της εικόνας σε κατηγορίες είναι ένα σημαντικό πρόβλημα στους κλάδους της Αναγνώρισης Προτύπων και Τεχνητής Νοημοσύνης. Η επίλυση του προβλήματος αυτού μπορεί να φέρει σημαντικά αποτελέσματα και να χρησιμοποιηθεί σε πολλές εφαρμογές.
Κατά καιρούς έχουν αναπτυχθεί διάφορες μέθοδοι ταξινόμησης εικόνας, όπως είναι ο σάκος οπτικών λέξεων-BoVW(bags of visual word) η οποία είναι μία μέθοδος που βασίζεται στην αναπαράσταση μιας εικόνας με τη χρήση τοπικών χαρακτηριστικών, Η ταξινόμηση των εικόνων γίνεται σύμφωνα με αυτά τα χαρακτηριστικά. Μια άλλη μέθοδος είναι η χωρική ταξινόμηση πυραμίδας- SPM(spatial pyramid matching),κατά την οποία η εικόνα χωρίζεται σε υποπεριοχές, κάθε διάνυσμα που προκύπτει από μια υποπεριοχή είναι ένα κομμάτι της τελικής αναπαράστασης της εικόνας, και ευθυγραμμίζοντας τις υποπεριοχές αυτές με τον ίδιο τρόπο θα πρέπει να πάρουμε δυο παρόμοια διανύσματα εάν οι δύο εικόνες μοιάζουν.
Στη παρούσα πτυχιακή εργασία μελετάται και υλοποιείται η μέθοδος σημασιολογικής-χωρικής ταξινόμησης-SSM(semantic-spatial-matching), η οποία λαμβάνει υπόψη όχι μόνο τη χωρική αλλά και την σημασιολογική απεικόνιση. Για την σημασιολογική απεικόνιση εξάγονται τα χαρακτηριστικά της κάθε εικόνας όπως αυτή χρησιμοποιήθηκε στη μέθοδο BoVW, και για την χωρική ταξινόμηση υιοθετούμε την τεχνική που αναπτύχθηκε στη μέθοδο SPM. Το τελικό αποτέλεσμα προκύπτει συνδυάζοντας αυτές τις δύο μεθόδους.