Text-Driven Data Exploration And Reporting Template Generation

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Πανεπιστήμιο Πελοποννήσου

Abstract

Στη σημερινή εποχή των δεδομένων, οι χρηματοοικονομικοί οργανισμοί αντιμετω- πίζουν σημαντικές προκλήσεις στην αυτοματοποίηση της δημιουργίας αναφορών από περιγραφές σε ελεύθερο κείμενο. Αυτή η διπλωματική εργασία αντιμετωπίζει αυ- τές τις προκλήσεις, προτείνοντας ένα νέο πλαίσιο για τη μετατροπή μη δομημένων φυσικών γλωσσικών εισόδων σε δομημένα πρότυπα χρηματοοικονομικών αναφορών. Η μεθοδολογία ενσωματώνει ένα προσαρμοσμένο μοντέλο Αναγνώρισης Ονομαστικών Οντοτήτων (NER), αναζήτηση βάσει σημασιολογίας για την ταυτοποίηση στηλών και εξαγωγή σειρών με κανόνες. Χρησιμοποιώντας προηγμένες τεχνικές αναπαράστασης κειμένου, όπως Bag-of-Words (BoW), Term Frequency-Inverse Document Frequency (TF-IDF) και προκαταρτισμένα ενσωματωμένα μοντέλα, το σύστημα εξασφαλίζει ακριβή αντιστοίχιση των κειμενικών εισόδων σε δομημένα αποτελέσματα. Τα πειραματικά αποτελέσματα δείχνουν μέση ακρίβεια (precision) 54% και ανάκλη- ση (recall) 57%, υπογραμμίζοντας την αποτελεσματικότητα του συστήματος στην ανα- γνώριση σχετικών μετρικών παρά τους περιορισμούς που επιβάλλονται από το μέγεθος των δεδομένων και την πολυπλοκότητα του πεδίου. Οι κύριες συνεισφορές περιλαμ- βάνουν ένα σύστημα αυτοματοποιημένης δημιουργίας αναφορών, τη χρήση Μεγάλων Γλωσσικών Μοντέλων (LLMs) για την ενίσχυση των δεδομένων και μια στρατηγική σημασιολογικής αναζήτησης βελτιστοποιημένη για τις χρηματοοικονομικές αναφορές. Παρόλο που τα αποτελέσματα καταδεικνύουν σημαντική πρόοδο, οι προκλήσεις που σχετίζονται με το μέγεθος των δεδομένων και την πολυπλοκότητα του πεδίου αναδει- κνύουν ευκαιρίες για μελλοντική έρευνα. Βελτιώσεις όπως η επέκταση των συνόλων δεδομένων, οι προηγμένες μέθοδοι ανάκτησης και τα προσαρμοσμένα LLMs μπορούν να ενισχύσουν περαιτέρω την κλιμάκωση και την ακρίβεια του συστήματος. Αυτή η έρευνα παρέχει τη βάση για την αυτοματοποίηση της δημιουργίας χρημα- τοοικονομικών αναφορών, προσφέροντας μια ευέλικτη, αποδοτική και προσαρμόσιμη λύση για την απλοποίηση της εξερεύνησης δεδομένων και της δημιουργίας αναφορών στον χρηματοοικονομικό τομέα.

Description

Μ.Δ.Ε. 120

Citation

Endorsement

Review

Supplemented By

Referenced By

Creative Commons license