Nouveaux domaines de liaison aux glucides identifiés par des écrans métagénomiques fonctionnels basés sur la présentation sur phages du microbiote intestinal humain

Blog

MaisonMaison / Blog / Nouveaux domaines de liaison aux glucides identifiés par des écrans métagénomiques fonctionnels basés sur la présentation sur phages du microbiote intestinal humain

Oct 31, 2023

Nouveaux domaines de liaison aux glucides identifiés par des écrans métagénomiques fonctionnels basés sur la présentation sur phages du microbiote intestinal humain

Communications Biology volume 6, Numéro d'article : 371 (2023) Citer cet article 2698 Accès 1 Citations 10 Détails d'Altmetric Metrics Les microbes non cultivés représentent une énorme ressource biologique inexploitée

Biologie des communications volume 6, Numéro d'article : 371 (2023) Citer cet article

2698 Accès

1 Citation

dixAltmétrique

Détails des métriques

Les microbes non cultivés représentent une énorme ressource biologique inexploitée de nouveaux gènes et produits génétiques. Bien que les récents efforts de séquençage génomique et métagénomique aient conduit à l'identification de nombreux gènes homologues aux gènes annotés existants, il reste néanmoins un énorme pool de gènes non annotés qui ne trouvent pas d'homologie de séquence significative avec les gènes annotés existants. La métagénomique fonctionnelle offre un moyen d'identifier et d'annoter de nouveaux produits génétiques. Ici, nous utilisons la métagénomique fonctionnelle pour exploiter de nouveaux domaines de liaison aux glucides qui pourraient aider les commensaux intestinaux humains à adhérer, à la colonisation intestinale et au métabolisme des glucides complexes. Nous rapportons la construction et le criblage fonctionnel d'une bibliothèque de présentation de phages métagénomiques à partir d'échantillons fécaux humains sains contre des polysaccharides/glycoconjugués alimentaires, microbiens et hôtes. Nous identifions plusieurs séquences protéiques qui ne correspondent à aucun domaine protéique connu, mais qui devraient contenir des replis de type module de liaison aux glucides. Nous exprimons, purifions et caractérisons biochimiquement certains de ces domaines protéiques de manière hétérologue et démontrons leur fonction de liaison aux glucides. Notre étude révèle plusieurs domaines de liaison aux glucides non annotés auparavant, notamment un domaine de liaison au lévane et quatre domaines complexes de liaison aux N-glycanes qui pourraient être utiles pour le marquage, la visualisation et l'isolement de ces glycanes.

La Terre abrite des communautés microbiennes d’environ 4 à 6 × 1 030 cellules1 appartenant à plus d’un billion d’espèces2, dont la grande majorité n’a pas été cultivée par des techniques de laboratoire standard3 ni étudiée. Les communautés microbiennes représentent un réservoir potentiel pour l’extraction de nouvelles enzymes et biomolécules4. La métagénomique fonctionnelle et basée sur le séquençage, l'application de méthodes indépendantes de la culture, ont constitué un moyen puissant de comprendre et d'exploiter la complexité des communautés microbiennes pour la découverte de nouvelles biomolécules5. La métagénomique fonctionnelle, qui implique la construction de bibliothèques d'ADN métagénomique (en utilisant des vecteurs appropriés tels que des cosmides, des fosmides6 ou des phages7) et leur criblage pour un phénotype souhaité8, permet l'identification de gènes codant pour des produits géniques dotés de fonctions souhaitées sans aucune information préalable sur leur nature. propriétés basées sur la similarité de séquence dans les bases de données publiques. Par conséquent, cette stratégie, en plus de fournir de nouveaux gènes/protéines pour des applications biotechnologiques8, facilite également l'affectation fonctionnelle de protéines désignées comme protéines hypothétiques dans les bases de données9.

L'intestin humain est un paysage riche en glycanes avec une énorme complexité structurelle10 résultant de l'énorme diversité de monosaccharides et de liaisons glycosidiques dans les glycanes endogènes de la mucine11,12 dans le mucus de l'hôte13 ainsi que dans les polysaccharides végétaux alimentaires tels que l'amidon, l'hémicellulose et pectine10. Contrairement aux génomes humains, qui codent pour seulement 97 glycosides hydrolases, dont seulement 17 décomposent un petit sous-ensemble de liaisons glycosidiques présentes dans les nutriments glucidiques comme le saccharose, le lactose et l'amidon, un mini-microbiome construit avec 177 génomes de référence du microbiote intestinal humain a été créé. s'est avéré posséder 15 882 gènes différents d'enzymes actives dans les glucides (CAZyme) responsables du métabolisme des glycanes14. Il est évident que le métabolisme des glucides complexes dans l’intestin est assuré par les CAZymes des quelque mille milliards de microbes d’environ 160 espèces qui composent le microbiote intestinal humain15,16,17. Les CAZymes ont souvent une architecture modulaire, avec un ou plusieurs domaines catalytiques en tandem avec des modules auxiliaires non catalytiques ou des modules de liaison aux glucides (CBM)18 qui rapprochent le module catalytique de substrats inaccessibles et augmentent ainsi la concentration efficace du substrat et efficacité enzymatique19. Outre les CBM, d’autres protéines telles que les lectines bactériennes se lient également aux molécules de glucides présentes dans l’intestin20. Ainsi, le métagénome microbien de l’intestin humain constitue un immense trésor de gènes codant pour des protéines de liaison aux glucides qui peuvent être exploitées pour diverses applications21, comme le groupage sanguin22, la purification par affinité biospécifique23 et le ciblage d’applications pour la thérapie antitumorale et antivirale24. peut également approfondir notre compréhension des interactions hôte-commensal.

144 bp, indicating enrichment. A high degree of selection was also evident from the high frequency of occurrence of PCR amplicons of the same size among randomly picked phage clones for a given selection condition and sometimes, even for phage clones from different elution conditions (e.g. Fig. 2a–f). We confirmed this by sequencing a few amplicons of the same size and verifying that they had the same sequence. Sequences of all recombinant phage clones identified are listed in Supplementary Data 1, Table S4./p>90% sequence identity amongst Ap-Ap2, Ap-Ap5 and St-Glc2, and amongst Am-Glc2, St-Glc1, and St-Glc5, with the clone Am-Glc2 (197 amino acids long, amylose binder eluted with glucose) mapping almost completely within St-Glc1 (370 amino acids long, starch binder eluted with glucose) (Supplementary Data 1, Tables S4 and S9)./p>50% of their molecular mass12 and a rich oligosaccharide repertoire of ~100 different O-glycan structures that are differentially present along the length of the gut, thereby creating unique niches and potential binding sites along the gut for the colonization of bacteria11,53, perhaps contributing to the varying microbiota composition in different regions of the gut54,55. The ability to bind to or utilize mucin provides a competitive edge in colonization of the gut56,57,58,59, and gut symbionts like Akkermansia muciniphila60, Bifidobacterium61, Bacteroides species58, and Lactobacillus fermentum62 indulge in mucosal glycan foraging, secreting glycoside hydrolases (GHs) for mucin glycan degradation59,63./p>

Based on our biochemical evidence of glycan binding (and the high sequence similarity between MU1 and MU3), we suggest that MG1, MN3 and MU1/MU3 domains be annotated as new CBMs in the CAZy database. Future studies can focus on how these glycan binding domains compare with existing LacNAc binding galectins21,64 and Siaα2-6 binding proteins such as the human influenza A and B virus lectin haemagglutinin65, Pseudomonas aeruginosa pili66, the surface protein antigen (PAc) of Streptococcus mutans67, mushroom Polyporus squamosus agglutinin (PSA)68, and the plant lectins, Sambucus nigra agglutinin (SNA), Sambucus canadensis agglutinin (SCA), Sambucus sieboldiana agglutinin (SSA), Wheat-germ agglutinin (WGA), Trichosanthes japonica (TJA-I), and ML-I of Viscum album69,70,71,72,6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)." href="/articles/s42003-023-04718-0#ref-CR73" id="ref-link-section-d78971106e2617"73./p>144 bp (which is the size of the amplicon expected for a non-recombinant phage amplified by the T7UP and T7DOWN primers) were considered to be recombinant. Enriched recombinant phages were further subjected to Sanger sequencing in-house (at IMTECH, using 16-capillary 3130xl Genetic Analyzer, Applied Biosystems). DNA sequences obtained were translated using ExPASy80 and visualized using FinchTV version 1.4.0. Sequences with more than 30 continuous amino acids (without any stop codon) were considered for further analysis. These metagenomic sequences were subjected to searches against both the protein sequence database, ‘UniRef100’81, and the profile databases, ‘pfamA-full’ and ‘pfamB’31, and ‘dbCAN2’33 using mmseqs282 at a very high sensitivity (-s 8.5). In addition, an all-against-all sequence search of the initial 33 query proteins was also performed. The general command run for these searches was ‘mmseqs easy-search input_protein_seqs search_database output.result_file tmp_directory -s 8.5 --format-mode 2‘. In the search against UniRef100, for each query protein sequence, the top five returned hits were retained and were then further searched for pfamA-full domains as above using mmseqs2. The fields ‘representativeMember_organismName‘ and ‘cluster_representative_name‘ (in Table S5) were obtained using uniprot API81. In the search result against pfamA-full, the field ‘pfam-family_description‘ (in Table S7) was obtained using https://github.com/AlbertoBoldrini/python-pfam (a python interface for pfamA). Three-dimensional structure predictions were performed for all amino acid sequences using a local server installed AlphaFold2, and structures were visualized using reverse rainbow coloring based on pLDDT scores in PyMOL (Schrodinger) (Supplementary Data 2)./p>6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)./p>