Prediction of miRNAs Involved During Viral Infections Using Gene-Set Tests and Machine Learning Models on Expression Data of mRNA Targets
Zoonosen machen etwa 75 % aller neu auftretenden Krankheiten beim Menschen aus und haben einen erheblichen Einfluss auf Gesundheit und Wirtschaft. In der Krankheitsprävention ist die Bioinformatik seit vielen Jahren ein wichtiges Werkzeug. Moderne systembiologische Forschungsansätze und die damit verbundene Multi-Omics Forschung haben es ermöglicht, komplett neue Einblicke in die Komplexität biologischer Mechanismen und Krankheiten zu bekommen. So auch, wie Viren evolvieren und den Wirt wechseln. Es ist nach wie vor herausfordernd, ausreichende Informationen von einer Omics-Ebene auf eine andere zu übertragen. Obwohl der Fluss der Information von der DNA-Ebene über messengerRNA zur Protein-Ebene bekannt ist, sind die Korrelationen zwischen diesen einzelnen Omics-Ebenen eher gering. MicroRNAs, die eine entscheidende Rolle bei der posttranskriptionalen Regulation der Genexpression spielen, erhöhen die Komplexität weiter. Es ist von entscheidender Bedeutung zu verstehen, wie microRNAs die Expression von messengerRNA beeinflussen und wie diese Interaktionen mit biologischen Wegen und Krankheitsmechanismen zusammenhängen. Diese Dissertation demonstriert die Vorhersage von microRNA-Expressionsmustern basierend auf messengerRNA-Expressionsdaten am Beispiel zweier viraler Zoonosen, hervorgerufen durch das Humane-Immundefizienz-Virus und das West-Nil-Virus. Zunächst wurde eine Meta-Analyse öffentlich zugänglicher microRNA Expressionsdaten aus mehreren unabhängigen Studien zum West-Nil-Virus durchgeführt, die entsprechende parallele messengerRNA-Daten aufwiesen. Im ersten Manuskript wurde die Aussagekraft der Studie durch eine harmonisierte Analyse gesteigert. Zusätzlich wurden Gen-Set-Tests an den messengerRNA-Daten durchgeführt, um Rückschlüsse auf weitere differenziell exprimierte microRNAs zu finden. Unter den so identifizierten microRNAs war die Mehrheit in anderen Studien mit nah verwandten Viren oder generell mit Neuroinflammation assoziiert. Im zweiten Manuskript wurde die Leistungsfähigkeit von tiefen neuronalen Netzwerken zunutze gemacht. Es wurde ein tiefes neuronales Netzwerk entwickelt, um direkt microRNA-Expressionsprofile von messengerRNA-Daten vorherzusagen. Selbst bei Cross-Study-Evaluierungen konnten starke Korrelationen zwischen tatsächlichen und vorhergesagten microRNA-Datensätzen gefunden werden. Neuronale Netzwerke haben bei einer ausreichenden Datenmenge eine bessere Leistung als Gen-Set-Tests, wobei Gen-Set-Tests bei mangelnder Datenmenge eine Alternative bieten. Des Weiteren, um die Vorhersagefähigkeiten von neuronalen Netzen zu verbessern, wären größere Datenmengen und ausgefeiltere Architekturen, wie etwa Autoencoder, ratsam. Trotz der Schwierigkeiten, Korrelationen zwischen den einzelnen Omics-Ebenen zu finden, ermöglicht es wichtige Einblicke in die molekularen Mechanismen einer Zelle. Die starken Korrelationen zwischen messengerRNA und microRNA in viralen Expressions Datensätzen sind ein wichtiger Schritt in der systembiologischen Forschung.
Zoonoses make up about 75% of all emerging diseases in humans and have a significant influence on health and economy. For many years, bioinformatics has been a powerful tool for researching the mechanisms by which viruses evolve and jump between species, serving as a very important line of defence for disease prevention. Systems biology, with its more holistic view on infections, has been a major part of this effort. The advent of multi-omics further unlocked unprecedented insights into complex biological interactions and diseases. However, it remains a challenge to infer sufficient information from any omics layer to another. Despite the known flow of information between omics layers from DNA via messenger RNA to protein, the correlations between these individual omics layers are modest. MicroRNAs, which play a critical role in post-transcriptional regulation of gene expression, add another layer of complexity. Understanding how microRNAs influence messenger RNA expression and how these interactions affect biological pathways and disease mechanisms is vital. Thus, this thesis explores the feasibility of cross-omics predictions, particularly the prediction of microRNA expression changes based on messenger RNA expression data, in the context of viral infections such as Human Immunodeficiency Virus, a well-researched zoonosis, and West Nile Virus, a rapidly emerging zoonosis. In the first manuscript, we conducted a meta-analysis of publicly available microRNA expression data from multiple independent West Nile Virus studies, targeting those that had corresponding messenger RNA data. By analysing them in a harmonized manner, we increased comparability. Additionally, we used gene-set tests on messenger RNA target expression data to further gain evidence on differentially expressed microRNAs. This research synthesis approach improved the detection of microRNAs involved in West Nile Virus. Among the microRNAs identified, multiple were linked to either related viruses or neuroinflammation, suggesting them as targets for further therapeutic research. In the second manuscript, we identified, by harnessing the power of deep neural networks, even subtle correlations in large, complex, and non-linear data structures. We designed and trained a deep neural network to predict miRNA expression profiles based on messenger RNA data. We found strong correlations between predicted and real microRNA datasets, even in cross-study evaluations, to the extent that even the fold changes correlated considerably. Given enough data, deep neural networks clearly outperform gene-set tests. To advance cross-omics predictions using deep neural networks, it is essential to have larger amounts of publicly available parallel datasets. Deep neural networks would benefit from more sophisticated architectures, such as autoencoders. Additionally, further investigation into other cross-omics relationships would significantly enhance the field of systems biology. In summary, finding correlations between different omics layers is a difficult yet insightful endeavour, and strong messenger RNA-microRNA correlations in viral expression datasets serve as a major stepping-stone on the path of integrating vast datasets from different omics layers.
Preview
Cite
Access Statistic
