Stiftung Tierärztliche Hochschule Hannover (TiHo)

Genomsequenzierung von L. welshimeri und L. seeligeri, zwei apathogenen spezies des Genus Listeria

Steinweg, Christiane

During this work the genomes of two apathogenic Species of the genus Listeria, L. welshimeri and L. seeligeri were sequenced, assembled and closed. The completed genome of L. welshimeri comprise 2814124 bp and of L. seeligeri 2797634 bp, respectively. In order to sequence the genomes of L. welshimeri and L. seeligeri, we constructed small (1,5-3 Kb) and medium (5 Kb) insert plasmid libraries for a shotgun sequencing approach as well as Fosmid and BAC libraries with large fragments of around 40 and 50 Kb for filling gaps and contig ordering. Clones from all libraries were sequenced from both ends. For L. welshimeri 57326 sequences from the two plasmid and the BAC and the Fosmid libraries were evaluated and then assembled into 129 Contigs using the Phred/Phrap/Consed software. For L. seeligeri the assembly of the 37979 sequences which were obtained from the four shotgun and the Fosmid library resulted in 150 Contigs. In this initial sequencing phase a 5,8 fold and a ~5 fold sequence coverage was achieved for the L. welshimeri and the L. seeligeri genome, respectively. Sequence gaps in both genomes were first closed by primer walking on plasmid, BAC and Fosmid clones using the program Autofinish. With this method 93 gaps in the L. welshimeri genome and 105 gaps in the L. seeligeri Genome could be closed. The remaining physical gaps were closed by PCR followed by sequencing of the PCR product. For ordering the contigs we aligned the contigs of L. welshimeri and L. seeligeri with the L. monocytogenes EGDe genome as a reference by using the program Nucmer. Repetetive elements like rrn-operons which occured in both genomes where independently assembled. After closing all gaps a polishing for regions in the genomes with a phred-value lower than 40 was performed. During this polishing we applied primer walking, resequencing of reads and constructing followed by sequencing of PCR products. At the end of the polishing phase the whole sequence of both genomes had a phred value of 40. During the finishing phase a total of 611 and 525 sequences were produced and during the polishing phase 884 and 811 sequences were produced for the L. welshimeri and the L. seeligeri genome, respectively. The GenDB 2.0 annotation system was used for a preliminary automatic annotation of the two genomes. All orthologs between the L. welshimeri and the L. seeligeri genome and the genomes of L. monocytogenes EGDe, L. innocua CLIP 11262 and L. monocytogenes F2365 were predicted. The annotation based on the annotation of the L. monocytogenes F2365 genome. The remaining 402 and 609 genes for the L. welshimeri and the L. seeligeri Genome, respectively, were manually annotated. To make a first genome comparison we compared the genomes of L. welshimeri and L. seeligeri to the genomes of L. monocytogenes EGDe, L. monocytogenes F2365, L. innocua CLIP 11262 and L. ivanovii PAM 55. We identified 2075 ortholog genes between the six Listeria genomes. Furthermore we predicted 245 L. welshimeri-specific, 230 L. seeligeri-specific, 123 L. monocytogenes EGDe-specific, 121 L. monocytogenes F2365-specific, 229 L. innocua-specific and 298 L. ivanovii-specific genes. We aligned the genomes of L. welshimeri, L. seeligeri, L. monocytogenes F2365, L. innocua CLIP 11262 and L. ivanovii PAM 55 with the L. monocytogenes EGDe genome as a reference by using the program MUMmer. The comparison of the sequences showed a conservative synteny of these Listeria species versus the genome of L. monocytogenes EGDe. Comparative analysis using the program Mauve also revealed a conserved, co-linear organisation of the six Listeria genomes except for small rearrangements, indicating that the overall structure of these genomes are highly conserved. Together with the previously determined genome sequences available for L. monocytogenes EGDe (serotye 1/2a), L. monocytogenes F2365 (serotype 4b), L. innocua CLIP 11262 (serotype 6a) and L. ivanovii PAM 55 the completion of the genome sequence of L. welshimeri and L. seeligeri in this study adds toward the comprehensive coverage of all genome sequences within the genus Listeria. Data derived from these comparisons will provide a rich source of information to examine the evolution of speciation, virulence and adaption of these species and will be relevant for the development of vaccines and markers for the detection of different Listeria spp. in food production.

Im Rahmen dieser Arbeit wurden die Genomsequenzen von L. welshimeri und L. seeligeri, zwei apathogenen Vertretern der Gattung Listeria, erstellt. Das zirkuläre Chromosom von L. welshimeri ist 2814124 bp und das von L. seeligeri 2797634 bp groß. Bei dem L. welshimeri-Genomprojekt wurden zwei Shotgun-, eine BAC- und eine Fosmid Klonbibliothek und bei dem L. seeligeri-Genomprojekt vier Shotgun- und eine Fosmid-Klonbibliothek eingesetzt. Die Sequenzierung der Shotgun-Klone des L. welshimeri-Genoms fand mit dem MegaBACE 1000-Sequenziersystem und die des L. seeligeri-Genoms mit dem Applied Biosystems 3730 DNA Analyzer statt. Die Sequenzen der BAC- und Fosmidklone beider Genomprojekte wurden mit dem ABI PRISM 3700 DNA Analyzer erstellt. Die Assemblierung und Vervollständigung der genomischen Sequenzen geschah mit dem Phred/Phrap/Consed/Autofinish-Programmpaket, welches schon bei vielen Genomprojekten Anwendung fand. So wurden mit Hilfe dieses Programms nach der Beendigung der Whole Genome Shotgun-Phase die insgesamt 57326 Sequenzen für das L. welshimeri-Genomprojekt  und die 37979 Sequenzen für das L. seeligeri-Genomprojekt assembliert. Nach Assemblierung mit dem Programm Phrap lag das L. welshimeri-Genom in 129 Contigs und das L. seeligeri-Genom in 150 Contigs vor. Diese bildeten die Grundlage für die sich anschließende Vervollständigungs-Phase. Die ersten drei Runden dieser Vervollständigunsphase wurden mit dem Programm Autofinish durchgeführt. Durch diese automatisierte Vervollständigung konnten so für das L. welshimeri-Genomprojekt 93 Lücken und für das L. seeligeri-Genomprojekt 105 Lücken geschlossen werden. Anschließend wurden die verbleibenden Lücken in den genomischen Sequenzen von  L. welshimeri und L. seeligeri manuell mit dem Programm Consed weiterbearbeitet und durch das Erstellen von PCR-Produkten, welche nachfolgend ansequenziert wurden, geschlossen. Hierbei wurde die  Reihenfolge der Contigs bestimmt, indem diese an dem  L. monocytogenes EGDe-Genom unter Verwendung des Programms NUCmer ausgerichtet wurden. Die in beiden Genomen vorkommenden repetetiven Elemente, wie rrn-Operons, wurden in eigenen Miniprojekten einzeln behandelt. Nach der Vervollständigung von beiden Genomsequenzen wurden an Stellen im Genom, deren Phred-Wert kleiner als 40 war, Qualitätsverbesserungen durchgeführt, sodass am Ende dieser Phase beide genomischen Sequenzen mit einem Phred-40-Wert vorlagen, welches eine hohe Sequenzqualiät ist. Insgesamt wurden für das L. welshimeri-Genom 611 Sequenzen in der Vervollständigungs-Phase und 884 Sequenzen in der Qualitätsverbesserungs-Phase erstellt. Für das L. seeligeri-Genom wurden entsprechend 525 und 811 Sequenzierungen durchgeführt. Die automatische Annotierung der Genome erfolgte mit dem Annotationssystem GenDB (Version 2.0). Nachfolgend wurde eine halbautomtische Annotation durchgeführt. Hierbei wurden zunächst alle orthologen Gene des L. welshimeri- bzw. L. seeligeri-Genoms zu den Genomen von L. monocytogenes EGDe, L. innocua CLIP 11262 und L. monocytogenes F2365 ermittelt und anschließend die L. monocytogenes F2365-Annotierung für die entsprechenden orthologen Gene des L. welshimeri- bzw. L. seeligeri-Genoms übernommen. So wurden anschließend für das L. welshimeri-Genom noch 402 und für das L. seeligeri-Genom noch 609 Gene mit dem Annotationssystem GenDB manuell annotiert. Nach erfolgter Annotation wurden die allgemeinen Charakteristika des L. welshimeri- bzw. des L. seeligeri-Genoms ermittelt und Vergleiche zu den Genomsequenzen von L. monocytogenes EGDe, L. monocytogenes F2365, L. innocua CLIP 11262 und L. ivanovii PAM 55 durchgeführt. Hierbei konnten erste Aussagen gemacht werden. So wurden 2075 orthologe Gene unter den sechs Listeriengenomen bestimmt. Des Weiteren konnten 245 L. welshimeri-spezifische, 230 L. seeligeri-spezifische, 123 L. monocytogenes EGDe-spezifische, 121 L. monocytogenes F2365-spezifische, 229 L. innocua- spezifische und 298 L. ivanovii-spezifische Gene identifiziert werden. Durch eine vergleichende Darstellung der Genomsequenzen der sechs Listerien mit den Programmen GenomeViz, Mummer und Mauve wurde außerdem bis auf zwei Translokationen eine Synteny und somit eine große Stabilität in der Genomorganisation von Listeria festgestellt. Die innerhalb dieser Arbeit erstellten genomischen Sequenzen von L. welshimeri und L. seeligeri tragen zusammen mit den bereits sequenzierten Genomen von L. monocytogenes EGDe, (Serotyp 1/2a), L. monocytogenes F2365 (Serotyp 4b), L. innocua CLIP 11262 (Serotyp 6a) und L. ivanovii PAM 55 dazu bei, eine vergleichende Genomanalyse aller Spezies des Genus Listeria durchzuführen. Die hierdurch gewonnenen Erkenntnisse werden wichtige Einblicke in die Evolution der Spezialisierung, Virulenz und Adaptation von Listeria-Spezies geben. Des Weiteren werden diese Erkenntnisse Relevanz für die Entwicklung von Impfstoffen und die Erstellung von Sonden zum Nachweis von unterschiedlichen Listeria-Spezies und –Stämmen im Lebensmittelbereich haben.

Quote

Citation style:

Steinweg, Christiane: Genomsequenzierung von L. welshimeri und L. seeligeri, zwei apathogenen spezies des Genus Listeria. Hannover 2005. Tierärztliche Hochschule.

Rights

Use and reproduction:
All rights reserved

Export