Monitoring the Evolution of Scientific Topics and their Impact

dc.contributor.advisorVergoulis, Thanasis
dc.contributor.authorΔεληγιάννης, Παναγιώτης
dc.contributor.committeeTryfonopoulos, Christos
dc.contributor.committeeGiannakopoulos, Theodoros
dc.contributor.committeeVergoulis, Thanasis
dc.contributor.departmentΤμήμα Πληροφορικής και Τηλεπικοινωνιώνel
dc.contributor.facultyΣχολή Οικονομίας και Τεχνολογίαςel
dc.contributor.masterΕπιστήμη Δεδομένωνel
dc.date.accessioned2025-05-21T11:10:45Z
dc.date.available2025-05-21T11:10:45Z
dc.date.issued2024-11
dc.descriptionΜ.Δ.Ε 134el
dc.description.abstractThe aim of this thesis is the training of topic models and the estimation of the topic evolution over time. For this purpose we employ LDA topic models. The LDAs inferred in the context of this thesis are trained in scientific publications related to cancer research. Initially, we limit the corpus to texts published in four consecutive years. These texts are passed through preprocessing and vectorization processes and then are split to training, validation and test partitions. The trained models are evaluated and for each year the best performing model is elected as representative. After training, we encode topic evolution as the similarity between two successive topic models. Finally, for each inferred topic we compute aggregated impact metrics. Through a developed Web application, we explore the trained models and the computed topic evolution. The interface offers a customized diagram visualization, as well as the ability to overview learnt topics, thus facilitating in the qualitative evaluation of the training procedure. The final results indicate shortcomings in the training process, since models fail to capture sensible topics. By extension, the calculated evolution is also affected. Nevertheless, the developed application sufficiently satisfies the purpose for visualization and evaluation of inferred topics and their evolution.el
dc.description.abstracttranslatedΣκοπός αυτής της εργασίας είναι η εκπαίδευση μοντέλων θεματικών και ο υπολογισμός της εξέλιξης θεματικών μέσα στο χρόνο. Για το σκοπό αυτό χρησιμοποιούμε LDA μοντέλα θεματικών. Τα LDA μοντέλα που παράγονται στο πλαίσιο αυτής της διπλωματικής εκπαιδεύονται πάνω σε ερευνητικές δημοσιεύσεις σχετικές με την έρευνα στον καρκίνο. Σε αρχικό στάδιο κρατάμε τα κείμενα που εκδόθηκαν σε τέσσερα διαδοχικά έτη. Τα κείμενα αυτά στη συνέχεια περνάνε μέσα από διαδικασίες προεπεξεργασίας, διανυσματοποίησης και στο τέλος χωρίζονται σε διαμερίσεις εκπαίδευσης, επικύρωσης και δοκιμών. Τα εκπαιδευμένα μοντέλα αξιολογούνται και για κάθε χρονιά και εκλέγονται τα καλύτερα μοντέλα ως αντιπροσωπευτικά. Μετά την εκπαίδευση υπολογίζουμε την εξέλιξη ως την ομοιότητα θεματικών μεταξύ δύο διαδοχικών μοντέλων θεματικών. Τέλος, για κάθε θεματική υπολογίζουμε συγκεντρωτικές μετρικές επιρροής. Μέσω μίας ανεπτυγμένης Web εφαρμογή, εξερευνούμε τα μοντέλα και την υπολογισμένη εξέλιξη των θεματικών. Η διεπαφή προσφέρει μια προσμοσμένη οπτικοποίηση διαγράμματος, καθώς και τη δυνατότητα επισκόπησης των θεματικών, τα οποία ενισχύουν τη δυνατότητα ποιοτικής αξιολόγησης της εκπαίδευσης. Τα τελικά αποτελέσματα υποδεικνύουν αδυναμίες στη διαδικασία της εκπαίδευσης καθώς τα μοντέλα αδυνατούν να μαθούν κατανοητές θεματικές. Κατ' επέκταση, επηρεάζεται και η ποιότητα της υπολογισμένης εξέλιξης. Ωστόσο, η ανεπτυγμένη διεπαφή καλύπτει επαρκώς τις ανάγκες για την οπτικοποίηση και αξιολόγηση των θεματικών και της εξέλιξής τους.el
dc.format.extent56el
dc.identifier.urihttps://amitos.library.uop.gr/xmlui/handle/123456789/8859
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πελοποννήσουel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.subjectEducationel
dc.subjectCancerel
dc.subjectWeb applicationsel
dc.subjectComputer softwareel
dc.subjectΕκπαίδευσηel
dc.subjectΚαρκίνοςel
dc.subjectΔιαδικτυακές εφαρμογέςel
dc.subjectΛογισμικό υπολογιστήel
dc.subject.keywordtopic modelel
dc.subject.keywordtopic evolutionel
dc.subject.keywordμοντέλα θεματικώνel
dc.subject.keywordεξέλιξη θεματικώνel
dc.titleMonitoring the Evolution of Scientific Topics and their Impactel
dc.typeΜεταπτυχιακή διπλωματική εργασίαel

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Deligiannis_2022202004004.pdf
Size:
581.24 KB
Format:
Adobe Portable Document Format
Description:
Μεταπτυχιακή διπλωματική εργασία

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
933 B
Format:
Item-specific license agreed upon to submission
Description: