Financial narrative summarization

dc.contributor.advisorΖαβιτσάνος, Ηλίας
dc.contributor.authorΠαναγιωτόπουλος, Μιχάλης
dc.contributor.committeeΔαγιόγλου, Μαρία
dc.contributor.committeeΚολοκοτρώνης, Νικόλας
dc.contributor.departmentΤμήμα Πληροφορικής και Τηλεπικοινωνιώνel
dc.contributor.facultyΣχολή Οικονομίας και Τεχνολογίαςel
dc.contributor.masterΕπιστήμη Δεδομένωνel
dc.date.accessioned2025-05-21T12:16:11Z
dc.date.available2025-05-21T12:16:11Z
dc.date.issued2025-01
dc.descriptionΜ.Δ.Ε. 137el
dc.description.abstractThe aim of this thesis is to introduce and evaluate different techniques for the summarization of Financial Documents. These techniques included the use of Kmeans and DBSCAN algorithms for the selection of the most important sentences while ensuring that the developed pipeline produces summaries that are representative of the whole document, is Domain - agnostic and can generalize also on documents that do not have a Table of Contents. The produced summaries were evaluated using the Rouge 2 F1 score and compared with the submissions of the FNS 2023 challenge. The approach using Kmenas algorithm achieved a higher Rouge 2 F1 score compared to three out of seven submissions having an equal score with the fourth-best submission while the one using the DBSCAN achieved a higher Rouge 2 F1 score compared to three out of the seven submissions.el
dc.description.abstracttranslatedΣκοπός αυτής της εργασίας είναι εισάγει και να αξιολογήσει διαφορετικές τεχνικές για την δημιουργία περιλήψεων από Οικονομικές καταστάσεις. Αυτές οι τεχνικές περιλαμβάνουν τη χρήση των αλγορίθμων Kmeans και DBSCAN για την επιλογή των πιο σημαντικών προτάσεων, διασφαλίζοντας παράλληλα ότι η παρούσα υλοποίηση παράγει περιλήψεις που είναι αντιπροσωπευτικές του συνόλου του εγγράφου,δεν περιορίζεται μόνο στον οικονομικό τομέα και μπορεί να γενικευτείκαι σε έγγραφα που δεν έχουν πίνακα περιεχομένων. Οι περιλήψεις που παρηχθησαν αξιολογήθηκαν χρησιμοποιώντας το μετρικό Rouge 2 F1 και συγκρίθηκαν με τις αντίστοιχες υποβολές της πρόκλησης FNS 2023. Η προσέγγιση που χρησιμοποιεί τον αλγόριθμο Kmeans πέτυχε υψηλότερη βαθμολογία σε σύγκριση με τρεις από τις επτά υποβολές καθώς και ισοβάθμησε με την τέταρτη, ενώ αυτή που χρησιμοποιεί το DBSCAN πέτυχε υψηλότερη βαθμολογία σε σύγκριση με τρεις από τις επτά υποβολές.el
dc.format.extent48el
dc.identifier.urihttps://amitos.library.uop.gr/xmlui/handle/123456789/8862
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πελοποννήσουel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.subjectEconomics el
dc.subjectAlgorithmsel
dc.subjectΟικονομίαel
dc.subjectΑλγόριθμοιel
dc.subject.keywordFinancial narrative summarizationel
dc.subject.keywordsummarizationel
dc.subject.keywordKmeansel
dc.subject.keywordextractive summarizationel
dc.subject.keywordDBSCANel
dc.subject.keywordNLPel
dc.titleFinancial narrative summarizationel
dc.typeΜεταπτυχιακή διπλωματική εργασίαel

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Thesis.pdf
Size:
293.28 KB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
933 B
Format:
Item-specific license agreed upon to submission
Description: