Περίληψη:
Η εργασία αυτή εμβαθύνει στον τομέα της τρισδιάστατης ανακατασκευής, αξιοποιώντας ένα οπλοστάσιο από ανιχνευτές και περιγραφείς τελευταίας τεχνολογίας, συμπεριλαμβανομένων των Difference of Gaussians (DoG), KeyNet, Corner Harris with Good Features to Track (CornerGFTT), HardNet, SosNet και SIFT. Χρησιμοποιούνται αυτοί οι αλγόριθμοι για την εξαγωγή σημαντικών χαρακτηριστικών από μια συλλογή εικόνων 2D, θέτοντας τις βάσεις για την ακριβή ανακατασκευή τρισδιάστατης σκηνής. Δύο διαφορετικοί αλγόριθμοι απόρριψης ακραίων στοιχείων, ο DISC και ο AdaLAM, διερευνώνται και αξιολογούνται στο πλαίσιο της βιβλιοθήκης COLMAP, διευκολύνοντας μια ολοκληρωμένη σύγκριση. Οι ανιχνευτές και οι περιγραφείς παίζουν καθοριστικό ρόλο στον εντοπισμό και την περιγραφή διακριτών βασικών σημείων στις εικόνες εισόδου. Οι ανιχνευτές DoG, KeyNet και CornerGFTT παρέχουν ποικίλες επιλογές για την ανίχνευση χαρακτηριστικών, ο καθένας με τα μοναδικά του πλεονεκτήματα. Ομοίως, οι περιγραφείς HardNet, SosNet και SIFT προσφέρουν διαφορετικά επίπεδα ευρωστίας και διακριτικής ικανότητας, ανταποκρινόμενοι σε διαφορετικές σκηνές και προκλήσεις. Η καρδιά αυτής της μελέτης έγκειται στη σύγκριση και αξιολόγηση αυτών των ανιχνευτών και των περιγραφέων καθώς γίνονται πειράματα για την εξαγωγή συμπερασμάτων με όλους τους δυνατούς συνδυασμούς αυτών. Τα πειράματα διεξάγωνται με 2000 και με 8000 χαρακτηριστικά σημεία. Ο DISΚ, μια καινοτόμος προσέγγιση που βασίζεται στην ελαχιστοποίηση της ενέργειας, επιδιώκει την ευθυγράμμιση των εικόνων απευθείας στον τρισδιάστατο χώρο, ενώ ο AdaLAM αξιοποιεί τους περιορισμούς τοπικής συνέπειας για την ισχυρή απόρριψη ακραίων τιμών με παραλληλισμένο τρόπο φιλικό προς τις GPU. Αντιπαραβάλλοντας αυτούς τους δύο αλγορίθμους μεταξύ τους, το παρόν έργο ρίχνει φως στα αντίστοιχα πλεονεκτήματα και μειονεκτήματά τους στο πλαίσιο της τρισδιάστατης ανακατασκευής. Η βιβλιοθήκη COLMAP χρησιμεύει ως πεδίο δοκιμών, επιτρέποντας την αυστηρή αξιολόγηση σε διάφορα σύνολα δεδομένων και σενάρια. Τα αποτελέσματα αυτής της μελέτης προσφέρουν πολύτιμες πληροφορίες σχετικά με την απόδοση, την αποδοτικότητα και την καταλληλότητα αυτών των αλγορίθμων για εργασίες τρισδιάστατης ανακατασκευής. Εν τέλει, το έργο αυτό συμβάλλει στην πρόοδο του τομέα της όρασης υπολογιστών, παρέχοντας μια αποχρωματισμένη κατανόηση της αλληλεπίδρασης μεταξύ ανιχνευτών, περιγραφών και μεθόδων απόρριψης ακραίων τιμών.