An Ensemble Method for Early Time Series Classification

dc.contributor.advisorΑκασιάδης, Χαρίλαος
dc.contributor.authorΣοφός, Δημήτριος
dc.contributor.committeeΚριθαρά, Νατάσσα
dc.contributor.committeeΣκιαδόπουλος, Σπυρίδων
dc.contributor.committeeΚριθαρά, Αναστασία
dc.contributor.departmentΤμήμα Πληροφορικής και Τηλεπικοινωνιώνel
dc.contributor.facultyΣχολή Οικονομίας και Τεχνολογίαςel
dc.contributor.masterΕπιστήμη Δεδομένωνel
dc.date.accessioned2025-10-31T10:40:19Z
dc.date.available2025-10-31T10:40:19Z
dc.date.issued2025-06-25
dc.descriptionΜ.Δ.Ε. 145el
dc.description.abstractThe purpose of this work is to propose a novel combination of ensemble learning techniques with Early Time Series Classification (ETSC) to improve prediction accuracy and minimize the decision-making time in situations and applications that require fast and accurate results, such as fault detection, medical diagnosis, and financial forecasting. The central idea combines the Stacking ensemble technique with two Early Time Series Classification (ETSC) models, TEASER and ECEC and two standard Time Series Classification (TSC) models the MLSTM and XCM. Each model is trained separately to leverage the unique strengths of each algorithm, aiming to build a robust base model that delivers the best possible results. These results are then passed to a meta-model for the final prediction. The methodology integrates four established models as base learners, two explicitly designed for Early Time Series Classification (TEASER and ECEC), and two for general Time Series Classification (MLSTM and XCM). Each model contributes to extracting informative patterns from partial time series, supporting timely and accurate classification decisions. TEASER is used for its capability in logistic regression and for predicting class probabilities at each snapshot. MLSTM extracts local features and is effective with multivariate time series. ECEC, on the other hand, trains multiple classifiers at different time points, and XCM supports parallel 1D and 2D convolutional layers, providing feature extraction per variable and across variables over time and offering model feature attribution. The predictions from all base models at each time point are collected and passed into a single meta-model, which can be implemented either as a Random Forest, capable of learning complex output combinations, or as a simpler Logistic Regression model. The meta-model is trained at different time points to learn which base model is more reliable at each stage. All the above are evaluated using benchmark datasets from UEA and UCR, as well as biological and maritime datasets, in order to assess the performance of the new model through experiments. The evaluation criteria are the Accuracy, F1-score, Earliness and the Harmonic Mean of Earliness and Accuracy. As will be shown, the proposed method performed better than the individual models in several cases, particularly on multivariate, noisy, and class-imbalanced datasets, thus fulfilling the primary objectives of this study.el
dc.description.abstracttranslatedΣκοπός αυτής της εργασίας είναι η πρόταση ενός νέου συνδυασμού τεχνικών ensemble learning με την Early Time Series Classification (ETSC) με στόχο τη βελτίωση της ακρίβειας πρόβλεψης και την ελαχιστοποίηση του χρόνου λήψης απόφασης σε καταστάσεις και εφαρμογές που απαιτούν γρήγορα και ακριβή αποτελέσματα, όπως η ανίχνευση βλαβών, η ιατρική διάγνωση και η χρηματοοικονομική πρόβλεψη. Η κεντρική ιδέα συνδυάζει την τεχνική Stacking ensemble με δύο μοντέλα ETSC (TEASER και ECEC) και δύο τυπικά μοντέλα Time Series Classification (TSC), τον MLSTM και XCM. Κάθε μοντέλο εκπαιδεύεται ξεχωριστά ώστε να αξιοποιεί τα μοναδικά πλεονεκτήματα κάθε αλγορίθμου, με στόχο την κατασκευή ενός ισχυρού βασικού μοντέλου που να παρέχει τα βέλτιστα δυνατά αποτελέσματα. Τα αποτελέσματα αυτά δίνονται στη συνέχεια σε ένα μετα-μοντέλο για την τελική πρόβλεψη. Η μεθοδολογία ενσωματώνει τέσσερα καθιερωμένα μοντέλα ως βασικούς ταξινομητές, δύο εκ των οποίων είναι ειδικά σχεδιασμένα για Early Time Series Classification (TEASER και ECEC), και δύο για γενική Time Series Classification (MLSTM και XCM). Κάθε μοντέλο συμβάλλει στην εξαγωγή πληροφοριακών προτύπων από μερικές χρονικές ακολουθίες, υποστηρίζοντας έγκαιρες και ακριβείς ταξινομητικές αποφάσεις. Ο TEASER χρησιμοποιείται για την ικανότητά του στη λογιστική παλινδρόμηση και στην πρόβλεψη πιθανοτήτων κλάσης σε κάθε χρονική στιγμή. Ο MLSTM εξάγει τοπικά χαρακτηριστικά και είναι αποτελεσματικό στις πολυμεταβλητές χρονοσειρές. Αντίθετα, ο ECEC εκπαιδεύει πολλαπλούς ταξινομητές σε διαφορετικά χρονικά σημεία, ενώ ο XCM υποστηρίζει παράλληλα 1D και 2D συνελικτικά στρώματα, προσφέροντας εξαγωγή χαρακτηριστικών ανά μεταβλητή και διαχρονικά, καθώς και δυνατότητα απόδοσης χαρακτηριστικών του μοντέλου. Οι προβλέψεις από όλα τα βασικά μοντέλα σε κάθε χρονική στιγμή συλλέγονται και εισάγονται σε ένα μετα-μοντέλο, το οποίο μπορεί να υλοποιηθεί είτε ως Random Forest, ικανό να μάθει σύνθετους συνδυασμούς εξόδων, είτε ως ένα απλούστερο μοντέλο Logistic Regression. Το μετα-μοντέλο εκπαιδεύεται σε διαφορετικές χρονικές στιγμές με σκοπό να εντοπίζει ποιο βασικό μοντέλο είναι πιο αξιόπιστο κάθε φορά. ΄Ολα τα παραπάνω αξιολογούνται χρησιμοποιώντας σύνολα δεδομένων αναφοράς από τις συλλογές UEA και UCR, καθώς και βιολογικά και ναυτιλιακά σύνολα δεδομένων, προκειμένου να αξιολογηθεί η απόδοση του νέου μοντέλου μέσω πειραμάτων. Τα κριτήρια αξιολόγησης είναι η Ακρίβεια ((Accuracy), το F1-score, η Εγκαιρότητα (Earliness) και ο Αρμονικός Μέσος(Harmonic Mean) της Εγκαιρότητας και της Ακρίβειας. ΄Οπως θα παρουσιαστεί, η προτεινόμενη μέθοδος απέδωσε καλύτερα από τα μεμονωμένα μοντέλα σε αρκετές περιπτώσεις, ειδικά σε πολυμεταβλητά, θορυβώδη και μη ισορροπημένα ως προς τις κλάσεις σύνολα δεδομένων, εκπληρώνοντας έτσι τους κύριους στόχους της παρούσας μελέτης.el
dc.format.extent104el
dc.identifier.urihttps://amitos.library.uop.gr/xmlui/handle/123456789/9277
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πελοποννήσουel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.subjectTime-series analysisel
dc.subjectClassification--Computersel
dc.subjectEnsemble learning(Machine Learning)el
dc.subjectData Miningel
dc.subjectAlgorithmsel
dc.subjectΑνάλυση χρονοσειρώνel
dc.subjectΤαξινόμηση--Υπολογιστέςel
dc.subjectΣυνδυαστικές μέθοδοι μάθησηςel
dc.subjectΕξόρυξη δεδομένωνel
dc.subjectΑλγόριθμοιel
dc.titleAn Ensemble Method for Early Time Series Classificationel
dc.typeΜεταπτυχιακή διπλωματική εργασίαel

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
An_Ensemble_Method_for_Early_Time_Series_Classification (22).pdf
Size:
665.28 KB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
933 B
Format:
Item-specific license agreed upon to submission
Description: