Named Entity Recognition in Scientific Texts

dc.contributor.advisorTryfonopoulos, Christos
dc.contributor.authorFragkopoulos, Kosmas
dc.contributor.committeeAkasiadis, Charilaos
dc.contributor.committeeChatzopoulos, Serafeim
dc.contributor.committeeKolokotronis, Nicholas
dc.contributor.committeeTryfonopoulos, Christos
dc.contributor.departmentΤμήμα Πληροφορικής και Τηλεπικοινωνιώνel
dc.contributor.facultyΣχολή Οικονομίας και Τεχνολογίαςel
dc.contributor.masterΕπιστήμη Δεδομένωνel
dc.date.accessioned2025-01-29T08:49:05Z
dc.date.available2025-01-29T08:49:05Z
dc.date.issued2024-12-19
dc.description.abstractThe automatic extraction of crucial information from text documents has been a fundamental pursuit since the early stages of natural language processing. With the exponential growth of digital content such as news, social media, and blogs, the need for effective information extraction has become increasingly vital. This thesis presents a comprehensive study on Named Entity Recognition (NER) in scientific texts, with a specific focus on the domain of computer science. The research involved the collection and analysis of 2000 sample abstract texts from scientific literature, which were processed using an advanced algorithm to identify and extract all terms relevant to the field of computer science. The study aimed to address the challenges of accurately identifying and categorising named entities within the context of scientific literature, particularly in the specialised domain of computer science. The findings and insights from this research contribute to the advancement of NER techniques in scientific texts and have implications for various applications in information retrieval, knowledge extraction, and natural language processing within the domain of computer science.el
dc.description.abstracttranslatedΗ αυτόματη εξαγωγή κρίσιμων πληροφοριών από έγγραφα κειμένου αποτελεί βασικό στόχο της επεξεργασίας φυσικής γλώσσας. Με την ραγδαία αύξηση του ψηφιακού περιεχομένου, η ανάγκη για αποτελεσματικές τεχνικές εξαγωγής πληροφοριών γίνεται όλο και πιο επιτακτική. Η παρούσα διατριβή επικεντρώνεται στην αναγνώριση ονομαστικών οντοτήτων σε επιστημονικά κείμενα, με έμφαση στον τομέα της επιστήμης των υπολογιστών. Στόχος είναι να αναπτυχθεί ένας αποτελεσματικός αλγόριθμος για τον εντοπισμό και την κατηγοριοποίηση σημαντικών όρων σε επιστημονικά κείμενα, αντιμετωπίζοντας τις προκλήσεις που ενυπάρχουν σε αυτό το εξειδικευμένο πεδίο. Για την επίτευξη του στόχου αυτού, συλλέχθηκαν και αναλύθηκαν 2000 δείγματα κειμένων από επιστημονική βιβλιογραφία. Τα δεδομένα αυτά υποβλήθηκαν σε επεξεργασία με τη χρήση ενός προηγμένου αλγορίθμου αναγνωρισης ονομαστικών οντοτήτων, ο οποίος σχεδιάστηκε ειδικά για τον εντοπισμό όρων που σχετίζονται με την επιστήμη των υπολογιστών. Τα αποτελέσματα της έρευνας συμβάλλουν στην περαιτέρω ανάπτυξη των σχετικών τεχνικών σε επιστημονικά κείμενα. Οι γνώσεις που αποκτήθηκαν μπορούν να εφαρμοστούν σε διάφορες εφαρμογές, όπως η ανάκτηση πληροφοριών, η εξαγωγή γνώσης και η επεξεργασία φυσικής γλώσσας στον τομέα της επιστήμης των υπολογιστών.el
dc.format.extent125el
dc.identifier.urihttps://amitos.library.uop.gr/xmlui/handle/123456789/8575
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πελοποννήσουel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.subjectInformation retrievalel
dc.subjectArtificial Intelligenceel
dc.subjectText Miningel
dc.subjectMachine Learningel
dc.subjectData Miningel
dc.subject.keywordNamed entity recognitionel
dc.subject.keywordInformation extractionel
dc.titleNamed Entity Recognition in Scientific Textsel
dc.typeΜεταπτυχιακή διπλωματική εργασίαel

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Fragkopoulos_04021.pdf
Size:
1.71 MB
Format:
Adobe Portable Document Format
Description:
Μεταπτυχιακή διπλωματική εργασία

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
933 B
Format:
Item-specific license agreed upon to submission
Description: