KIT | KIT-Bibliothek | Impressum | Datenschutz

Swarm v3: towards tera-scale amplicon clustering

Mahé, Frédéric ; Czech, Lucas; Stamatakis, Alexandros ORCID iD icon 1; Quince, Christopher; de Vargas, Colomban; Dunthorn, Micah; Rognes, Torbjørn; Birol, Inanc [Hrsg.]
1 Institut für Theoretische Informatik (ITI), Karlsruher Institut für Technologie (KIT)

Abstract:

Motivation: Previously we presented swarm, an open-source amplicon clustering programme that produces fine-scale molecular operational taxonomic units (OTUs) that are free of arbitrary global clustering thresholds. Here, we present swarm v3 to address issues of contemporary datasets that are growing towards tera-byte sizes.
Results: When compared with previous swarm versions, swarm v3 has modernized C++ source code, reduced memory footprint by up to 50%, optimized CPU-usage and multithreading (more than 7 times faster with default parameters), and it has been extensively tested for its robustness and logic.


Verlagsausgabe §
DOI: 10.5445/IR/1000153795
Veröffentlicht am 16.12.2022
Originalveröffentlichung
DOI: 10.1093/bioinformatics/btab493
Scopus
Zitationen: 47
Web of Science
Zitationen: 40
Dimensions
Zitationen: 64
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Theoretische Informatik (ITI)
Publikationstyp Zeitschriftenaufsatz
Publikationsdatum 01.01.2022
Sprache Englisch
Identifikator ISSN: 1367-4803, 0266-7061, 1367-4811, 1460-2059
KITopen-ID: 1000153795
Erschienen in Bioinformatics
Verlag Oxford University Press (OUP)
Band 38
Heft 1
Seiten 267–269
Vorab online veröffentlicht am 09.07.2021
Nachgewiesen in Dimensions
Web of Science
Scopus
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page