Representational learning on biological data - A study on polypharmacy side-effects and graph embeddings

dc.contributor.advisorKrithara, Anastasia
dc.contributor.advisorBougiatiotis, Konstantinos
dc.contributor.authorPanagiotoglou, Symeon
dc.contributor.committeeMoscholios, Ioannis
dc.contributor.committeeKlampanos, Iraklis
dc.contributor.departmentΤμήμα Πληροφορικής και Τηλεπικοινωνιώνel
dc.contributor.facultyΣχολή Οικονομίας και Τεχνολογίαςel
dc.contributor.masterΕπιστήμη Δεδομένωνel
dc.date.accessioned2024-09-06T06:20:31Z
dc.date.available2024-09-06T06:20:31Z
dc.date.issued2022-09
dc.descriptionΜ.Δ.Ε. 109el
dc.description.abstractIn recent years graphs, graph neural networks and graph embedding techniques are getting more attention in the area of machine learning in general, with biological applications being a major drive. Using Decagon, a graph neural network that predicts polypharmacy side-effects, as our starting point, we ιmplement a number of baseline models in order to identify the aspects that play the bigger part in predicting side-effects among pairs of drugs. Later, we focus on a subset of the initial dataset containing only the rarest side-effects and experiment with well known models from the graph embeddings area. We examine whether a normalization of the feature vectors in a tf-idf fashion helps a message passing network improve its performance. Finally, we use AnyBURL, a rule based model, to identify patterns in our data.el
dc.description.abstracttranslatedΤα τελευταία χρόνια, οι γράφοι και τα νευρωνικά δίκτυα γράφων έχουν προσελκύσει το ενδιαφέρον στο χώρο της μηχανικής μάθησης και ειδικότερα σε βιολογικές εφαρμογές. Χρησιμοποιώντας ως αφετηρία το Decagon, ένα νευρωνικό δίκτυο γράφων, μελετάμε το πρόβλημα της πρόβλεψης παρενεργειών που προκύπτουν από την ταυτόχρονη χρήση πολλαπλών φαρμάκων, υλοποιώντας μια σειρά από baseline μοντέλα με σκοπό να εντοπίσουμε την κύρια πηγή της επιτυχίας του μοντέλου. Στη συνέχεια επικεντρωνόμαστε σε ενα υποσύνολο των αρχικών δεδομένων που αφορούν τις πιο σπάνιες παρενέργειες και δοκιμάζουμε γνωστά μοντέλα από τον χώρο των graph embeddings. Επιπλέον, εξετάζουμε αν η κανονικοποίηση των διανυσμάτων με βάση μια λογική tf-idf βελτιώνει την απόδοση. Τέλος, παραθέτουμε μια σειρά από patterns που προκύπτουν από τη χρήση του AnyBURL, ενός rule based μοντέλου στα δεδομένα μας.el
dc.format.extentσελ. 59el
dc.identifier.urihttps://amitos.library.uop.gr/xmlui/handle/123456789/8235
dc.identifier.urihttp://dx.doi.org/10.26263/amitos-1737
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πελοποννήσουel
dc.subject.keywordgraphel
dc.subject.keywordmachine learningel
dc.subject.keywordembeddingsel
dc.subject.keyworddecagonel
dc.subject.keywordgraph neural networksel
dc.subject.keywordrule basedel
dc.titleRepresentational learning on biological data - A study on polypharmacy side-effects and graph embeddingsel
dc.typeΜεταπτυχιακή διπλωματική εργασίαel

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
PanagiotoglouSymeonThesisReport.pdf
Size:
1.41 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
933 B
Format:
Item-specific license agreed upon to submission
Description: