Ανάπτυξη μηχανής αναζήτησης για συλλογή και ανάλυση μεγάλου όγκου δεδομένων με χρήση ερπετών ιστού ανοιχτού κώδικα

Απόθεσις

 

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Τσιμπίρης, Αλκιβιάδης
dc.contributor.author Ράτης, Παύλος
dc.date.accessioned 2016-09-08T08:32:12Z
dc.date.available 2016-09-08T08:32:12Z
dc.date.issued 2016-07
dc.identifier.uri http://apothesis.teicm.gr/xmlui/handle/123456789/2595
dc.description Το πλήρες κείμενο της εργασίας ΔΕΝ είναι διαθέσιμο el
dc.description.abstract Ο Παγκόσμιος Ιστός είναι μια απέραντη θάλασσα με τεράστιο όγκο πληροφορίας. Καθημερινά, εκατομμύρια άνθρωποι δημιουργούν αλλά και γίνονται αποδέκτες πληροφοριών στο Διαδίκτυο. Επιπλέον, χιλιάδες ιστοσελίδες διαφορετικής μορφής και περιεχόμενου δημιουργούνται ημερησίως και συσσωρεύονται στον Παγκόσμιο Ιστό. Οι αυξανόμενες απαιτήσεις λόγω της πολυπλοκότητας και ποικιλίας των δεδομένων, δημιούργησαν νέες προκλήσεις στις εφαρμογές λογισμικού καθώς πρέπει να συνδυάζουν έξυπνες τεχνικές ανίχνευσης, επεξεργασίας και ταξινόμησης πληροφορίας αλλά και αξιόπιστες κλιμακωτές μεθόδους αποθήκευσης δεδομένων. Για την ανάπτυξη μιας σύγχρονης μηχανής αναζήτησης είναι απαραίτητο εκτός από την κλασσική αναζήτηση λέξεων, να συνδυάσουμε τεχνολογίες ευρετηρίου που να επιτρέπουν αποδοτική αναζήτηση σε μεγάλο σύνολο δεδομένων αλλά και ανιχνευτές Ιστού που χρησιμοποιούν έξυπνους αλγόριθμους ανίχνευσης και ταξινόμησης των δεδομένων. Ο ρόλος της μηχανής αναζήτησης είναι να δίνουν στον χρήστη άμεσα όσο πιο σχετικά αποτελέσματα γίνεται με γνώμονα το ερώτημα του. Για να επιτευχθεί αυτό χρειάζεται μια σειρά από βήματα που σε συνδυασμό με πολλούς παράγοντες θα επιστρέφουν το επιθυμητό αποτέλεσμα. Παραδοσιακά, τα συστήματα ήταν μονολιθικά και χρησιμοποιούσαν σειριακούς αλγόριθμους επεξεργασίας. Ωστόσο, όσο μεγάλωνε ο όγκος του Παγκόσμιου Ιστού η ανίχνευση γινόταν όλο πιο απαιτητική και κοστοβόρα καθώς χρειαζόταν μηχανήματα με δυνατά χαρακτηριστικά. Τα νέα συστήματα ξεφεύγουν από τις κλασσικές προσεγγίσεις και πλέον χρησιμοποιούν παράλληλη επεξεργασία αλλά και το κατανεμημένο μοντέλο για να διαμοιράσουν τον φόρτο εργασίας μεταξύ πολλών υπολογιστών. Στα πλαίσια της πτυχιακής εργασίας σχεδιάστηκε και υλοποιήθηκε η διαδικτυακή εφαρμογή με ονομασία owlsearch, η οποία λειτουργεί ως μηχανή αναζήτησης. Για της υλοποίηση της εναρμονίστηκαν εφαρμογές λογισμικού ανοιχτού κώδικα όπως το Elastcisearch για λογισμικό ευρετηρίου και το Apache Nutch για ανιχνευτή Ιστού. el
dc.format.extent 93 el
dc.language.iso el el
dc.publisher Τ.Ε.Ι. Κεντρικής Μακεδονίας el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/4.0/deed.el
dc.subject TEICM::ΛΟΓΙΣΜΙΚΟ ΕΦΑΡΜΟΓΩΝ::ΛΟΓΙΣΜΙΚΟ ΕΦΑΡΜΟΓΩΝ -- ΑΝΑΠΤΥΞΗ el
dc.subject TEICM::ΔΙΑΔΙΚΤΥΟ::ΔΙΚΤΥΑΚΕΣ ΤΟΠΟΘΕΣΙΕΣ::ΔΙΚΤΥΑΚΕΣ ΤΟΠΟΘΕΣΙΕΣ -- ΣΧΕΔΙΑΣΗ el
dc.subject.ddc 005.1 el
dc.title Ανάπτυξη μηχανής αναζήτησης για συλλογή και ανάλυση μεγάλου όγκου δεδομένων με χρήση ερπετών ιστού ανοιχτού κώδικα el
dc.type Πτυχιακή εργασία
dc.contributor.department Σχολή Τεχνολογικών Εφαρμογών, Τμήμα Μηχανικών Πληροφορικής Τ.Ε. el
dc.heal.publisherID teiser
dc.subject.keyword Παγκόσμιος ιστός el
dc.subject.keyword Μηχανές αναζήτησης el
dc.subject.keyword Αλγόριθμοι el
dc.subject.keyword Ανάπτυξη εφαρμογής el


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές Except where otherwise noted, this item's license is described as Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές