Abstract:
Die überwiegende Mehrheit des mikrobiellen Lebens ist unentdeckt und wenig erforscht, da sie bisher noch nicht erfolgreich kultiviert werden konnten. Wir bezeichnen sie daher als mikrobielle dunkle Materie (microbial dark matter, MDM). MDM hat hohes biotechnologisches Potential, z.B. für die Nutzung nachhaltiger Energiequellen, zur biologischen Sanierung kontaminierter Böden, oder für medizinische Anwendungen. Der Einsatz kulturunabhängiger Methoden zur Untersuchung von Mikroorganismen in der Natur, die Metagenomik und Metatranskriptomik, hat unser Verständnis von MDM erheblich verbessert. ... mehrAllerdings ist es mit diesen Methoden immer noch schwierig, einzelne Spezies bioinformatisch zu analysieren, insbesondere von Organismen mit geringer Häufigkeit in komplexen Habitaten. Stammvariationen, die falsche Zuordnung von Sequenzen, insbesondere mobiler genetische Elemente sowie sich stark wiederholende Sequenzregionen sind nur einige der Probleme, mit denen z.B. die Metagenomik konfrontiert ist. Auch bei der Metatranskriptomik führen die phänotypische Heterogenität der Zellen und die Diversität der mikrobiellen Gemeinschaften zu komplexen Transkriptionsprofilen, die nicht vollständig zugeordnet werden können. Daher wurden die Einzelzellgenomik (single cell genomics, SCG) und die Einzelzelltranskriptomik (single cell transcriptomics, SCT), die zusammen als Einzelzell-'omics (SC 'omics) bezeichnet werden, entwickelt, um die Nachteile der Metagenomik und Metatranskriptomik zu überwinden.
Die Anwendung von SCG hat sich zu einem wichtigen Instrument für die Erweiterung unseres Wissens über MDM entwickelt, beispielsweise durch die jüngste Entdeckung mehrerer neuer Phyla, von denen es derzeit nur sogenannte single amplified genomes (SAGs) gibt. Vollständige SAGs von vielen Mikroorganismen, insbesondere von solchen mit geringer Abundanz, sind jedoch aufgrund der vielen technischen Herausforderungen und der hohen Kosten selten. Auch die SCT ist mit den vielen Herausforderungen der Arbeit mit RNA konfrontiert, wie z. B. der kurzen Halbwertszeit von mRNA und geringen Genexpression, weshalb sie in der Mikrobiologie noch nicht häufig angewendet wird. Daher haben sich die hohen Erwartungen an mikrobielle SC 'omics noch nicht vollständig erfüllen können.
In einem typischen SCG-Arbeitsablauf können die Zellen nach der Probenentnahme vor der Einzelzellisolierung mit Fluoreszenzfarbstoffen markiert werden. Nach der Isolierung werden die Zellen lysiert und das Genom anschließend amplifiziert, gefolgt von der Sequenzierung und bioinformatischen Datenanalyse. In dieser Arbeit wurden die Schritte der Zellmarkierung, Isolierung, Lyse und Ganzgenom-Amplifikation (whole genome amplifikation, WGA) verbessert, um die Methodik zu verbessern. Zunächst wurde ein Ansatz zur gezielten Zellmarkierung entwickelt, der die Anreicherung von Mikroorganismen mit geringer Häufigkeit aus Umweltproben ermöglichte. Dieser Ansatz half bei der Entdeckung neuer Phylogenien und Stoffwechseln von Mikroorganismen die in geringer Abundanz vorkommen und die andernfalls durch konventionelle Metagenomik übersehen worden wären. Darüber hinaus trägt dieser Ansatz dazu bei, die Kosten für SCG zu senken, da nun nicht mehr Zehntausende von Einzelzellen sequenziert werden müssen, um seltene Mikroorganismen zu analysieren. Als nächstes wurden die Schritte der Zellisolierung und Zelllyse verbessert, um sowohl physische Zellschäden als auch den DNA-Abbau zu minimieren, was den Erfolg des nachgeschalteten Genom-Amplifikationsschritts erhöht. Für den WGA-Schritt wurde ein Ansatz zur Volumenreduzierung systematisch getestet und etabliert, um die Homogenität und Vollständigkeit der Genomabdeckung deutlich zu verbessern. Dies Ergebnisse der Versuche zeigen, dass eine weitere Volumenreduzierung in den nL oder pL Bereich nicht erforderlich. Die Kosten der WGA konnten um 97,5 % gesenkt werden konnten, was den Durchsatz von SCG erhöhen und die Verwendung dieses Ansatzes in weiteren Forschungsgruppen positiv beeinflussen dürfte.
Da SCG allein nur Informationen über die Phylogenie, genetische Struktur und das Stoffwechselpotenzial, nicht aber über die tatsächliche Aktivität einer Zelle liefert, wurde in dieser Arbeit eine mikrobielle SCT-Pipeline entwickelt, um die individuellen Funktionen der Zelle in einer Gemeinschaft besser zu verstehen. Derzeit gibt es nur sehr wenige Methoden für mikrobielle SCT, und die, die es gibt, bleiben aufgrund ihrer schwierigen Anwendung und geringen Zugänglichkeit außerhalb ihrer jeweiligen Arbeitsgruppen weitgehend ungenutzt. Daher wurden in dieser Studie Änderungen und Verbesserungen an einer eukaryotischen Einzelzell-RNA-Sequenzierungsmethode (RNA-seq) vorgenommen, um ihre Anwendung bei Prokaryoten zu ermöglichen. Es wurde festgestellt, dass der Zusatz von Dithiothreitol (DTT) im Lysepuffer wahrscheinlich die DNase I hemmt, was zu einer DNA Kontamination führt. Die hier vorgestellten Einzelzell-RNA-seq-Ergebnisse zeigten zuverlässige Transkriptionsprofile im Vergleich zu RNA-seq-Ergebnissen aus der gesamten Probe. Dies wurde auch durch ein Proof-of-Principle-Experiment bestätigt, bei dem hitzeschockbehandelte und unbehandelte Escherichia coli Zellen verglichen wurden. Darüber hinaus wurden in den Einzelzelldaten im Vergleich zur Populations-Analyse Hinweise auf einzigartige Reaktionen bei der Synthese von Sekundärmetaboliten und der CRISPR-Cas-Editierung gefunden, was die Bedeutung der Untersuchung der Heterogenität seltener funktioneller Subpopulationen auf Einzelzellebene unterstreicht. Insgesamt wird erwartet, dass die verbesserten SCG- und SCT-Methoden, die in dieser Arbeit etabliert wurden, eine breitere Anwendung für ein besseres Verständnis der MDM-Diversität und -Funktion in der Umwelt ermöglichen.
Abstract (englisch):
The vast majority of microbial life still remains undiscovered and understudied. We refer to these microorganisms as microbial dark matter (MDM) because they have not yet been successfully cultured. Within MDM hide potentially novel and important solutions for sustainable energy, bioremediation of contaminated environments, and the war against rising antibiotic resistance. The use of culture-independent methods to study microorganisms at the community-level, such as metagenomics and metatranscriptomics, have significantly advanced our understanding of MDM. However, these methods still struggle to reliably assemble individual genomes and transcriptomes, especially from low abundant organisms in highly diverse communities. ... mehrStrain variation, the misattribution of sequences, highly repetitive sequence regions, and mobile genetic elements are a few of the problems that metagenomics faces. Likewise, in metatranscriptomics, the natural phenotypic heterogeneity of cells and diversity of microbial communities, results in complex transcriptional profiles that cannot be fully captured. Therefore, single-cell genomics (SCG) and transcriptomics (SCT), which together are referred to as single-cell ‘omics (SC ‘omics), were developed to overcome the disadvantages of metagenomics and metatranscriptomics by enabling the analysis of an individual cell.
The application of SCG has become an important tool for expanding our knowledge of MDM, for example, by enabling the recent discovery of several novel candidate phyla, which are currently only represented by single-amplified genomes (SAGs). However, complete SAGs from many organisms, especially minority members, are statistically hard to capture due to the high costs and many technical challenges throughout the workflows. On the other hand, microbial SCT is faced with the many challenges of working with RNA, such as the short half-life of mRNA and low levels of gene expressions, which is why SCT has not yet been widely applied in microbiology. Thus, the anticipated effects of SC ‘omics have not yet been fulfilled.
In a typical SCG workflow, after samples are collected, cells can be labeled with fluorescent dyes prior to single-cell isolation. After isolation, the cells are lysed and the genome has to be amplified for subsequent library preparation, which is followed by sequencing and data analysis. In this thesis, difficulties in the cell labelling, isolation, lysis, and whole genome amplification (WGA) steps were improved upon to overcome remaining challenges in SCG. First, a targeted-cell labeling approach was established, which enabled the enrichment of low abundant microorganisms from environmental samples. This approach aided in the discovery of novel phylogenies and metabolisms from rare members of the microbial community, which would have otherwise been overlooked by conventional metagenomics. Additionally, by targeting organisms of interest, this approach helped to reduce the costs of SCG by preventing the need to sequence tens of thousands of single-cells in order to access low abundant minority members. Next, improvements were made to the cell isolation and cell lysis steps to minimize both physical cell damage and DNA degradation, respectively, which helped to increase the success of the downstream genome amplification step. As for the WGA, a volume reduction approach was applied to significantly improve genome coverage uniformity and completeness. These findings highlighted the unnecessary need for further volume reduction down to nL or pL and costs could be reduced by 97.5%. It is anticipated that these advancements will increase the throughput of SCG and encourage the use of this approach in more research groups.
Since SCG alone only provides information on phylogeny, genetic structure and metabolic potentials, but not on the actual activity of a cell, a microbial SCT pipeline was developed in this thesis, to help understand the cell’s individual functions in a community. Currently, very few methods for microbial SCT exist and the ones that do, remain widely unused outside of their respective groups due to their difficult handling and low accessibility. Therefore, in this study, modifications and improvements to a eukaryotic single-cell RNA sequencing (RNA-seq) method were made to enable its use in prokaryotes. Importantly, the addition of DTT in the lysis buffer was found to likely inhibit DNase I, leading to DNA contamination. The single-cell RNA-seq results herein revealed reliable transcriptional profiles when compared to bulk RNA-seq samples. This was also confirmed through a proof of principle experiment comparing heat-shock and non-treated Escherichia coli cells. Furthermore, evidence for unique responses involved in secondary metabolite synthesis and CRISPR-Cas editing were found upregulated in the single cell versus the bulk data, highlighting the importance for studying heterogeneity of functional subpopulations at the single-cell level. Overall, the improved SCG and SCT methods established in this work are anticipated to allow for more widespread use for further understanding of MDM diversity and function in the environment.