Nature Communications volume 14, Número do artigo: 2676 (2023) Citar este artigo
1390 Acessos
4 Altmétrica
Detalhes das métricas
Os vírus em ambientes construídos (BEs) levantam preocupações de saúde pública, mas geralmente são menos estudados do que as bactérias. Para entender melhor a dinâmica viral em BEs, este estudo avalia viromas de 11 habitats em quatro tipos de BEs com ocupação baixa a alta. A diversidade, composição, funções metabólicas e estilos de vida dos viromas são dependentes do habitat. Espécies de Caudoviricetes são ubíquas em habitats de superfície nas BEs, e algumas delas são distintas daquelas presentes em outros ambientes. Genes de resistência antimicrobiana são identificados em vírus que habitam superfícies freqüentemente tocadas por ocupantes e em vírus que habitam a pele dos ocupantes. Diversos sistemas de imunidade CRISPR/Cas e proteínas anti-CRISPR são encontrados em hospedeiros bacterianos e vírus, respectivamente, consistentes com as ligações vírus-hospedeiro fortemente acopladas. Evidências de vírus potencialmente auxiliando na adaptação do hospedeiro em um habitat específico são identificadas por meio de uma inserção única de gene. Este trabalho ilustra que as interações vírus-hospedeiro ocorrem com frequência em BEs e que os vírus são membros integrantes dos microbiomas BE.
Os vírus merecem nossa atenção porque têm impactos potencialmente prejudiciais à saúde humana1, mas também desempenham papéis cruciais em muitos ecossistemas2,3,4. Ambientes construídos (BEs), onde as pessoas normalmente passam a maior parte de suas vidas, abrigam uma rica diversidade de microorganismos5, mas a maioria dos estudos de BEs tem se concentrado amplamente em bactérias e fungos, ignorando os vírus6,7. A concentração total dos vírus em BEs é estimada em ~105 partículas/metro cúbico8. Embora as condições ambientais da maioria dos BEs sejam oligotróficas e consideradas pouco adequadas para a vida microbiana9, uma diversidade notável de vírus, incluindo vírus associados a epidemias (por exemplo, SARS-CoV-210 e vírus da febre amarela11), foi encontrada em comunidades microbianas no ar e em superfícies em BEs. Alguns estudos sobre viromas em edifícios públicos (por exemplo, creches e banheiros) focaram principalmente em uma pequena escala espacial e tipos de amostra limitados e não investigaram os hospedeiros bacterianos dos vírus12,13,14. Um estudo recente em escala global que aplicou sequenciamento metagenômico em massa sem enriquecimento de vírus forneceu evidências de que os vírus são onipresentes em superfícies públicas em BEs15.
As interações vírus-hospedeiro são fundamentais para a ecologia e evolução dos microbiomas em diversos ecossistemas4,16,17. Avanços recentes em ferramentas de bioinformática permitiram a previsão precisa da associação entre vírus derivados de metagenoma e seus potenciais hospedeiros bacterianos, incluindo correspondências exatas de sinais moleculares (ou seja, espaçador de repetição palindrômica curta agrupada regularmente interespaçada [CRISPR], genoma integrado e tRNA) e consistente frequência k-mer18. Os fagos desenvolveram diversas estratégias de estilo de vida e transmissão, como troca de ciclo de vida temperado-lítico, transdução e interrupção do gene do hospedeiro, para explorar a maquinaria celular dos hospedeiros para reprodução19. Na maioria dos ambientes marinhos e terrestres, os fagos são frequentemente altamente diversos e abundantes, infectando rotineiramente uma fração significativa de seus hospedeiros microbianos, que, juntamente com a expressão de genes metabólicos auxiliares (AMGs) codificados por vírus em genomas hospedeiros, desempenha um papel fundamental na ciclagem global de nutrientes4,20,21. Do ponto de vista ecológico, os fagos em uma comunidade microbiana podem mediar a competição entre espécies bacterianas estabelecendo infecções líticas por meio de vários modelos ecológicos bem estabelecidos, incluindo os modelos "matar o vencedor" e "pegar carona no vencedor"22.
Embora os fagos possam conduzir mudanças genéticas e fenotípicas rápidas em bactérias, os hospedeiros bacterianos também podem desenvolver prontamente mecanismos de defesa para combater ataques de fagos por meio de mutação de novo e outros mecanismos moleculares23. Recentemente, vários sistemas funcionais CRISPR/CRISPR associados (Cas) em bactérias foram identificados em um estudo metagenômico humano em todo o corpo24. No entanto, para antagonizar o sistema imunológico do hospedeiro, os fagos desenvolveram proteínas anti-CRISPR (Acr) para inativar as Cas nucleases bacterianas durante a infecção25. A inativação a longo prazo de CRISPR/Cas por fagos inibidores pode levar à perda e até ausência de CRISPR/Cas em algumas linhagens bacterianas26.
1 kb, as determined by Virsorter2 (Vs2) and DeepVirFinder (DVF) and assessed by CheckV. The number of contigs (n) is indicated. Boxplots represent the median, the first quartiles and third quartiles with whiskers drawn within the 1.5 interquartile range value. Points outside the whiskers are outliers. b Accumulation curves of the viral genomes in the combined, pier, public facility, residence, and subway datasets. c Metadata and taxonomy of 1174 viral genomes with >50% completeness. d Principal coordinate analysis of the Bray–Curtis dissimilarity matrix for all of the samples. The color and shape of the symbols indicate the built environments and surface materials, respectively./p> 0.85 (Fig. S2d), suggesting that no habitat had dominant vOTUs./p>50 genes mostly encoded proteins with functions in membrane transport (i.e., ABC transporter) and direct/indirect transcriptional regulation to control gene expression, genome replication, and transmission to other host cells (i.e., response regulator) (Fig. 3e). Other common viral functions, such as packaging, assembly, and lysis, were also found in the largest clusters (Fig. 3e)./p>50 genes. The protein-coding gene cluster that encodes beta-lactamase is highlighted in red. f The number of viral genes with putative beta-lactamase domains based on the Pfam and Kyoto Encyclopedia of Genes and Genomes (KEGG) databases. g The number of antimicrobial resistance genes (ARGs) encoding beta-lactamases based on the Resistance Gene Identifier (RGI) and Resfams databases. The Venn diagram summarizes the number of identified ARGs in the two databases, and the bar plot indicates the distribution of ARGs across BE habitats./p> 80) based on the AlphaFold2 tool. d Comparison of the high-confidence structures (plDDT > 80) of the four novel predicted Acr proteins with their closest reference./p> 80]) (Fig. S9). Comparison of the high-confidence structures of the four novel predicted Acr proteins with their closest references revealed differences, which may be responsible for the variations in their functions (Fig. 5d). Several predicted Acr proteins were located in complete circular vOTUs (with lysogenic and lytic cycles) of unknown families (Fig. S10a-b), suggesting that these proteins play roles in the evolution of poorly characterized Caudoviricetes viruses. Some Acr proteins were located between the integrase and terminase subunits in viruses with lysogenic cycles (Fig. S10a), while others were close to the terminase subunits in viruses that make lytic cycles (Fig. S10b), indicating that the Acr-encoding genes are expressed not only upon initial entry and during lysogeny but also upon transition to the lytic cycle to prevent the cleavage of progeny phage genomes by CRISPR/Cas systems, as previously demonstrated in Listeria phages50. Additionally, a set of lytic genes, including those encoding endolysins, the Rz lysis protein, holin, and holin–antiholin, were carried by specific complete circular vOTUs with lysogenic cycles (Fig. S10a). Conversely, one complete circular vOTU (SL336690_c_82__full) that makes lytic cycles still harbored an integrase (Fig. S10b), suggesting that this virus undergoes a transition from a lysogenic to a lytic cycle if the environmental condition changes51./p>90% completeness), and medium-quality (50–90% completeness) genomes were retained30 (Supplementary Data 2). For genomes that contained predicted proviruses, only the proviral regions were retained. PHASTER) (https://phaster.ca/)80 and VIBRANT (v.1.2.1)81 were separately applied to identify proviral sequences according to the following two criteria, as previously proposed21: (i) the viral contigs were from contigs with non-viral (host) flanking sequences or (ii) the viral contigs harbored lysogenic marker proteins (i.e., integrase and serine recombinase). In total, 332 unique proviruses were identified using the two aforementioned tools and CheckV, and only those (127) that were integrated into a bacterial genome had high confidence (the prophage region's total score was >90 in PHASTER) and were included in the downstream analysis./p>50% completeness were clustered into species-level vOTUs on the basis of 95% average nucleotide identity (ANI) of >85% alignment fraction relative to the shorter sequence based on centroid-based clustering30. Genus- and family-level vOTUs were generated using a combination of gene sharing and amino acid identity (AAI) based on Markov clustering82 as described previously30. Briefly, viral genomes with <20% AAI or <10% gene sharing and an inflation factor of 1.2 were clustered into family-level vOTUs, while those with <50% AAI or <20% gene sharing and an inflation factor of 2.0 were clustered into genus-level vOTUs./p>70% of the annotated proteins. At the family and genus ranks, a genome must have a minimum of two annotated proteins with >30% average AAI or three annotated proteins with >40% average AAI, respectively, aligned to a reference genome from the IMG/VR database30./p>5% amino acid representation in the total alignment length were retained. A concatenated protein phylogenetic tree was inferred from the multiple sequence alignment using FastTreeMP (v.2.1.11) with the auto model87. The tree was midpoint-rooted and visualized using iToL (v.6; https://itol.embl.de/)./p>60% to the reference sequences in the CARD database (v.3.0.9)90, and using the NCBI AMRFinderPlus (v.3.8.4) tool41, with the default options of 60% coverage and 80% identity, to the reference sequences in the Resfams database (v.1.2)40. The search was performed using the hmmsearch utility in the HMMER tool (v.3.1b2), with an E-value ≤ 1e−5 and a gathering threshold score ≥40. The Resfams annotation with the best score was adopted when an ARG received different annotations from the databases./p>1000 bp were binned into MAGs using MetaWRAP (v.1.2.1)78. The resulting MAGs were further refined using the "bin_refinement" function of MetaWRAP78 and dereplicated using the "dRep dereplicate" function of dRep (v.3.2.2)97. In total, 860 bacterial rMAGs with contamination ≤10% and completeness ≥50% were generated. The ORFs in the contigs of rMAGs were predicted using Prokka (v.1.14.6)98, and the functions were annotated using EggNOG-mapper (v.2.0.1)99./p>