Monitoring the Evolution of Scientific Topics and their Impact
| dc.contributor.advisor | Vergoulis, Thanasis | |
| dc.contributor.author | Δεληγιάννης, Παναγιώτης | |
| dc.contributor.committee | Tryfonopoulos, Christos | |
| dc.contributor.committee | Giannakopoulos, Theodoros | |
| dc.contributor.committee | Vergoulis, Thanasis | |
| dc.contributor.department | Τμήμα Πληροφορικής και Τηλεπικοινωνιών | el |
| dc.contributor.faculty | Σχολή Οικονομίας και Τεχνολογίας | el |
| dc.contributor.master | Επιστήμη Δεδομένων | el |
| dc.date.accessioned | 2025-05-21T11:10:45Z | |
| dc.date.available | 2025-05-21T11:10:45Z | |
| dc.date.issued | 2024-11 | |
| dc.description | Μ.Δ.Ε 134 | el |
| dc.description.abstract | The aim of this thesis is the training of topic models and the estimation of the topic evolution over time. For this purpose we employ LDA topic models. The LDAs inferred in the context of this thesis are trained in scientific publications related to cancer research. Initially, we limit the corpus to texts published in four consecutive years. These texts are passed through preprocessing and vectorization processes and then are split to training, validation and test partitions. The trained models are evaluated and for each year the best performing model is elected as representative. After training, we encode topic evolution as the similarity between two successive topic models. Finally, for each inferred topic we compute aggregated impact metrics. Through a developed Web application, we explore the trained models and the computed topic evolution. The interface offers a customized diagram visualization, as well as the ability to overview learnt topics, thus facilitating in the qualitative evaluation of the training procedure. The final results indicate shortcomings in the training process, since models fail to capture sensible topics. By extension, the calculated evolution is also affected. Nevertheless, the developed application sufficiently satisfies the purpose for visualization and evaluation of inferred topics and their evolution. | el |
| dc.description.abstracttranslated | Σκοπός αυτής της εργασίας είναι η εκπαίδευση μοντέλων θεματικών και ο υπολογισμός της εξέλιξης θεματικών μέσα στο χρόνο. Για το σκοπό αυτό χρησιμοποιούμε LDA μοντέλα θεματικών. Τα LDA μοντέλα που παράγονται στο πλαίσιο αυτής της διπλωματικής εκπαιδεύονται πάνω σε ερευνητικές δημοσιεύσεις σχετικές με την έρευνα στον καρκίνο. Σε αρχικό στάδιο κρατάμε τα κείμενα που εκδόθηκαν σε τέσσερα διαδοχικά έτη. Τα κείμενα αυτά στη συνέχεια περνάνε μέσα από διαδικασίες προεπεξεργασίας, διανυσματοποίησης και στο τέλος χωρίζονται σε διαμερίσεις εκπαίδευσης, επικύρωσης και δοκιμών. Τα εκπαιδευμένα μοντέλα αξιολογούνται και για κάθε χρονιά και εκλέγονται τα καλύτερα μοντέλα ως αντιπροσωπευτικά. Μετά την εκπαίδευση υπολογίζουμε την εξέλιξη ως την ομοιότητα θεματικών μεταξύ δύο διαδοχικών μοντέλων θεματικών. Τέλος, για κάθε θεματική υπολογίζουμε συγκεντρωτικές μετρικές επιρροής. Μέσω μίας ανεπτυγμένης Web εφαρμογή, εξερευνούμε τα μοντέλα και την υπολογισμένη εξέλιξη των θεματικών. Η διεπαφή προσφέρει μια προσμοσμένη οπτικοποίηση διαγράμματος, καθώς και τη δυνατότητα επισκόπησης των θεματικών, τα οποία ενισχύουν τη δυνατότητα ποιοτικής αξιολόγησης της εκπαίδευσης. Τα τελικά αποτελέσματα υποδεικνύουν αδυναμίες στη διαδικασία της εκπαίδευσης καθώς τα μοντέλα αδυνατούν να μαθούν κατανοητές θεματικές. Κατ' επέκταση, επηρεάζεται και η ποιότητα της υπολογισμένης εξέλιξης. Ωστόσο, η ανεπτυγμένη διεπαφή καλύπτει επαρκώς τις ανάγκες για την οπτικοποίηση και αξιολόγηση των θεματικών και της εξέλιξής τους. | el |
| dc.format.extent | 56 | el |
| dc.identifier.uri | https://amitos.library.uop.gr/xmlui/handle/123456789/8859 | |
| dc.language.iso | en | el |
| dc.publisher | Πανεπιστήμιο Πελοποννήσου | el |
| dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
| dc.subject | Education | el |
| dc.subject | Cancer | el |
| dc.subject | Web applications | el |
| dc.subject | Computer software | el |
| dc.subject | Εκπαίδευση | el |
| dc.subject | Καρκίνος | el |
| dc.subject | Διαδικτυακές εφαρμογές | el |
| dc.subject | Λογισμικό υπολογιστή | el |
| dc.subject.keyword | topic model | el |
| dc.subject.keyword | topic evolution | el |
| dc.subject.keyword | μοντέλα θεματικών | el |
| dc.subject.keyword | εξέλιξη θεματικών | el |
| dc.title | Monitoring the Evolution of Scientific Topics and their Impact | el |
| dc.type | Μεταπτυχιακή διπλωματική εργασία | el |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Deligiannis_2022202004004.pdf
- Size:
- 581.24 KB
- Format:
- Adobe Portable Document Format
- Description:
- Μεταπτυχιακή διπλωματική εργασία
License bundle
1 - 1 of 1
Loading...
- Name:
- license.txt
- Size:
- 933 B
- Format:
- Item-specific license agreed upon to submission
- Description:
