Tankewol foar it besykjen fan Nature.com.Jo brûke in browserferzje mei beheinde CSS-stipe.Foar de bêste ûnderfining riede wy oan dat jo in bywurke browser brûke (of kompatibiliteitsmodus útskeakelje yn Internet Explorer).Derneist, om trochgeande stipe te garandearjen, litte wy de side sjen sûnder stilen en JavaScript.
Sliders dy't trije artikels per dia sjen litte.Brûk de efter- en folgjende knoppen om troch de dia's te bewegen, of de slide-controller-knoppen oan 'e ein om troch elke dia te bewegen.
Detaillearre produkt beskriuwing
304 RVS laske coiled buis / tubing
1. Spesifikaasje: RVS coil tube / tubing
2. Type: laske of seamless
3. Standert: ASTM A269, ASTM A249
4. RVS coil tube OD: 6mm oan 25.4MM
5. Length: 600-3500MM of as per klant syn eask.
6. Wall dikte: 0,2 mm oan 2,0 mm.
7. Tolerânsje: OD: +/-0.01mm;Dikte: +/-0,01%.
8. Coil ynderlike gat grutte: 500MM-1500MM (kin oanpast wurde neffens klant easken)
9. Coil hichte: 200MM-400MM (kin oanpast wurde neffens klant easken)
10. Oerflak: Bright of annealed
11. Materiaal: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, alloy 625, 825, 2205, 2507, ensfh.
12. Packing: woven sekken yn houten koffer, houten pallet, houten skacht, of as per klant syn eask
13. Test: gemyske komponint, opbringst sterkte, tensile sterkte, hurdens mjitting
14. Garânsje: De tredde partij (bygelyks: SGS TV) ynspeksje, etc.
15. Applikaasje: Dekoraasje, meubels, oaljeferfier, waarmtewikseler, railing meitsjen, papier meitsjen, auto, itenferwurking, medysk, ensfh.
Alle gemyske gearstalling en fysike eigenskippen foar roestfrij stiel lykas hjirûnder:
Materiaal | ASTM A269 Gemyske gearstalling % Max | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | NB | Nb | Ti | |
TP304 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 18.0-20.0 | 8.0-11.0 | ^ | ^ | ^ . | ^ |
TP304L | 0.035 | 2.00 | 0.045 | 0.030 | 1.00 | 18.0-20.0 | 8.0-12.0 | ^ | ^ | ^ | ^ |
TP316 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 16.0-18.0 | 10.0-14.0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0.035 D | 2.00 | 0.045 | 0.030 | 1.00 | 16.0-18.0 | 10.0-15.0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 17.0-19.0 | 9.0-12.0 | ^ | ^ | ^ | 5C -0,70 |
TP347 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 17.0-19.0 | 9.0-12.0 | 10C -1,10 | ^ |
Materiaal | Waarmte behanneling | Temperatuer F (C) Min. | Hurdens | |
Brinell | Rockwell | |||
TP304 | Oplossing | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP304L | Oplossing | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP316 | Oplossing | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP316L | Oplossing | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP321 | Oplossing | 1900(1040) F | 192HBW/200HV | 90 HRB |
TP347 | Oplossing | 1900 (1040) | 192HBW/200HV | 90 HRB |
OD, inch | OD Tolerânsje inch (mm) | WT-tolerânsje % | Lengte Tolerânsje inch (mm) | |
+ | - | |||
≤ 1/2 | ± 0.005 ( 0.13 ) | ± 15 | 1 / 8 ( 3.2 ) | 0 |
> 1/2 ~1 1/2 | ± 0,005(0,13) | ± 10 | 1 / 8 (3.2) | 0 |
> 1 1 / 2 ~< 3 1 / 2 | ± 0,010(0,25) | ± 10 | 3 / 16 (4.8) | 0 |
> 3 1 / 2 ~< 5 1 / 2 | ± 0,015(0,38) | ± 10 | 3 / 16 (4.8) | 0 |
> 5 1 / 2 ~< 8 | ± 0,030(0,76) | ± 10 | 3 / 16 (4.8) | 0 |
8~< 12 | ± 0,040(1,01) | ± 10 | 3 / 16 (4.8) | 0 |
12~< 14 | ± 0,050(1,26) | ± 10 | 3 / 16 (4.8) | 0 |
Natuerlike mikrobiele mienskippen binne fylogenetysk en metabolysk ferskaat.Njonken ûnderstudearre groepen fan organismen1, hat dit ferskaat ek in ryk potinsjeel foar de ûntdekking fan ekologysk en biotechnologysk wichtige enzymen en biogemyske ferbiningen2,3.It studearjen fan dit ferskaat om de genomyske paden te bepalen dy't sokke ferbiningen synthesisearje en se bine oan har respektive hosts bliuwt in útdaging.It biosyntetyske potinsjeel fan mikro-organismen yn 'e iepen oseaan bliuwt foar it grutste part ûnbekend fanwegen beheiningen yn' e analyze fan gegevens oer resolúsje fan it hiele genome op wrâldwide skaal.Hjir ûndersiikje wy it ferskaat en ferskaat fan biosyntetyske genklusters yn 'e oseaan troch yntegrearjen fan sawat 10,000 mikrobiele genomen út kweekte sellen en inkele sellen mei mear dan 25,000 nij rekonstruearre ûntwerpgenoom fan mear dan 1,000 seewettermonsters.Dizze ynspanningen hawwe sawat 40,000 putative meast nije biosyntetyske genklusters identifisearre, wêrfan guon binne fûn yn earder net fertochte fylogenetyske groepen.Yn dizze populaasjes identifisearren wy in lineage ferrike yn biosyntetyske genclusters ("Candidatus Eudormicrobiaceae") dy't hearde ta in ûnkultivearre baktearjele phylum en omfette guon fan 'e meast biosyntetyske ferskate mikroorganismen yn dizze omjouwing.Dêrfan hawwe wy de paden fan fosfatase-peptide en pytonamide karakterisearre, respektivelik identifisearjen fan gefallen fan ûngewoane bioaktive ferbiningstruktuer en enzymology.Ta beslút, dizze stúdzje toant hoe't microbiome-basearre strategyen kinne ynskeakelje de ferkenning fan earder net beskreaun enzymen en natuerlike iten yn in min begrepen mikrobiota en omjouwing.
Mikroben driuwen wrâldwide biogeochemyske syklusen, ûnderhâlde fiedselwebs, en hâlde planten en bisten sûn5.Harren enoarme fylogenetyske, metabolike en funksjonele ferskaat fertsjintwurdiget in ryk potinsjeel foar de ûntdekking fan nije taxa1, enzymen en biogemyske ferbiningen, ynklusyf natuerlike produkten6.Yn ekologyske mienskippen jouwe dizze molekulen mikro-organismen mei in ferskaat oan fysiologyske en ekologyske funksjes, fan kommunikaasje oant konkurrinsje 2, 7 .Njonken har oarspronklike funksjes jouwe dizze natuerlike produkten en har genetysk kodearre produksjepaden foarbylden foar biotechnologyske en terapeutyske tapassingen2,3.De identifikaasje fan sokke paden en ferbiningen is sterk fasilitearre troch de stúdzje fan kweekte mikroben.Taksonomyske stúdzjes fan natuerlike omjouwings hawwe lykwols oantoand dat de grutte mearderheid fan mikro-organismen net kultivearre is8.Dizze kulturele bias beheint ús fermogen om it funksjonele ferskaat te eksploitearjen kodearre troch in protte mikroben4,9.
Om dizze beheiningen te oerwinnen, hawwe technologyske foarútgongen yn 'e ôfrûne desennia ûndersikers tastien om direkt (dat wol sizze, sûnder foarôfgeande kultuer) mikrobiële DNA-fragminten út folsleine mienskippen (metagenomics) as inkele sellen te foltôgjen.De mooglikheid om dizze fragminten te sammeljen yn gruttere genoomfragminten en respektivelik meardere metagenomysk gearstalde genomen (MAG's) of single amplified genomes (SAG's) te rekonstruearjen, iepenet in wichtige kâns foar taksosintraal stúdzjes fan 'e mikrobiom (dat wol sizze, mikrobiele mienskippen en it mikrobiom).baan nije paden.eigen genetysk materiaal yn in opjûne omjouwing) 10,11,12.Yndied, resinte stúdzjes hawwe gâns útwreide de fylogenetyske fertsjintwurdiging fan mikrobieel ferskaat op ierde1, 13 en hawwe iepenbiere in protte fan it funksjonele ferskaat yn yndividuele mikrobiële mienskippen net earder bedutsen troch kweekte mikroorganisme referinsje genome sekwinsjes (REFs)14.De mooglikheid om ûnûntdutsen funksjonele ferskaat te pleatsen yn 'e kontekst fan' e hostgenoom (dat wol sizze, genome resolúsje) is kritysk foar it foarsizzen fan noch net karakterisearre mikrobiële rigels dy't nei alle gedachten nije natuerlike produkten kodearje15,16 of foar it tracearjen fan sokke ferbiningen werom nei har oarspronklike produsint17.Bygelyks, in kombineare metagenomyske en ien-sellige genomyske analyse-oanpak hat laat ta de identifikaasje fan Candidatus Entotheonella, in groep metabolysk rike spons-assosjearre baktearjes, as produsinten fan in ferskaat oan drugspotentialen18.Lykwols, nettsjinsteande resinte besykjen ta genomyske ferkenning fan ferskate mikrobiele mienskippen, 16,19 mear as twatredde fan 'e wrâldwide metagenomyske gegevens foar de grutste oseaan fan' e ierde fan ekosystemen16,20 noch ûntbrekke.Sa, yn 't algemien, bliuwt it biosyntetyske potensjeel fan' e marine mikrobiom en har potensjeel as in repository fan nije enzymatyske en natuerlike produkten foar in grut part ûnderstudearre.
Om it biosyntetyske potensjeel fan marine mikrobiomen op wrâldwide skaal te ferkennen, hawwe wy earst marine mikrobiele genomen sammele krigen mei kultuer-ôfhinklike en net-kultuermetoaden om in wiidweidige databank te meitsjen fan fylogenetika en genfunksje.Undersyk fan dizze databank die bliken in grut ferskaat oan biosynthetic gene clusters (BGCs), wêrfan de measten hearre ta noch net karakterisearre gene cluster (GCF) famyljes.Derneist identifisearren wy in ûnbekende baktearjefamylje dy't oant no ta it heechste bekende ferskaat oan BGC's yn 'e iepen oseaan toant.Wy selekteare twa ribosomale synteze en post-translasjoneel modifisearre peptide (RiPP) paden foar eksperimintele falidaasje basearre op har genetyske ferskillen fan op it stuit bekende paden.De funksjonele karakterisearring fan dizze paden hat unferwachte foarbylden fan enzymology iepenbiere, lykas struktureel ûngewoane ferbiningen mei protease-inhiberende aktiviteit.
Yn it earstoan wiene wy fan doel in wrâldwide gegevensboarne te meitsjen foar genoomanalyse, rjochte op har baktearjele en archeale komponinten.Foar dit doel hawwe wy metagenomyske gegevens en 1038 seewettermonsters fan 215 wrâldwiid ferspraat samplingsites (breedtegraad = 141.6 °) en ferskate djippe lagen (fan 1 oant 5600 m yn 'e djipte, dy't de pelagyske, mesopelagyske en ôfgrûnsônes bedekke).Eftergrûn21,22,23 (Fig. 1a, útwreide gegevens, Fig. 1a en Oanfoljende Tabel 1).Neist it leverjen fan in brede geografyske dekking, lieten dizze selektyf filtere samples ús ferskate komponinten fan it marinemikrobioom fergelykje, ynklusyf firusryk (<0.2 µm), prokaryotyk-ryk (0.2-3 µm), partikelryk (0.8 µm) ).-20 µm) en firus-deplete (>0,2 µm) koloanjes.
a, In totaal fan 1038 publyklik beskikber genomes (metagenomics) fan marine mikrobiële mienskippen sammele út 215 wrâldwiid ferspraat lokaasjes (62 ° S nei 79 ° N en 179 ° W oant 179 ° E.).Kaarttegels © Esri.Boarnen: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ, en Esri.b, dizze metagenomen waarden brûkt om MAG's (metoaden en oanfoljende ynformaasje) te rekonstruearjen, dy't ferskille yn kwantiteit en kwaliteit (metoaden) yn 'e datasets (markearre yn kleur).De rekonstruearre MAG's waarden oanfolle mei iepenbier beskikbere (eksterne) genomen, ynklusyf hânmakke MAG26, SAG27 en REF.27 OMD kompilearje.c, yn fergeliking mei eardere rapporten basearre allinich op SAG (GORG) 20 of MAG (GEM) 16, ferbetteret OMD de genomyske karakterisearring fan marine mikrobiele mienskippen (metagenomyske lêzen mapping rate; metoade) troch twa oant trije kear mei mear konsekwinte fertsjintwurdiging yn djipte en breedte..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD-groepearring yn soarten klusters nivo (95% gemiddelde nukleotide identiteit) identifisearret in totaal fan likernôch 8300 soarten, wêrfan mear as de helte net earder karakterisearre binne neffens taksonomyske annotaasjes mei de GTDB (ferzje 89) e, klassifikaasje fan soarten troch genoomtype liet sjen dat MAG, SAG en REFs inoar goed oanfolje yn it reflektearjen fan de fylogenetyske ferskaat fan it marine mikrobiom.Benammen 55%, 26% en 11% fan 'e soarten wiene spesifyk foar MAG, SAG en REF, respektivelik.BATS, Bermuda Atlantic Time Series;GEM, genomen fan it mikrobiom fan 'e ierde;GORG, global ocean reference genome;HOT, Hawaiian Ocean tiidrige.
Mei dizze dataset rekonstruearre wy in totaal fan 26.293 MAG's, meast bakteriële en archaeal (Fig. 1b en útwreide gegevens, Fig. 1b).Wy hawwe dizze MAG's makke fan gearkomsten fan aparte yn stee fan gearfoege metagenomyske samples om it ynstoarten fan natuerlike folchoarderfariaasje te foarkommen tusken samples fan ferskate lokaasjes as tiidpunten (metoaden).Derneist groepeare wy genomyske fragminten basearre op har prevalenskorrelaasjes oer in grut oantal samples (fan 58 oant 610 samples, ôfhinklik fan enkête; metoade).Wy fûnen dat dit in tiidslinend, mar wichtige stap24 is dy't waard oerslein yn ferskate grutskalige MAG16, 19, 25 rekonstruksjewurken en signifikant ferbettert de kwantiteit (2,7 kear yn trochsneed) en kwaliteit (+20% yn trochsneed) fan 'e genom.rekonstruearre út de marine metagenome studearre hjir (útwreide gegevens, Fig. 2a en oanfoljende ynformaasje).Oer it algemien resultearren dizze ynspanningen yn in 4,5-fâldige ferheging fan marine mikrobiële MAG's (6-fâld as allinich MAG's fan hege kwaliteit wurde beskôge) yn ferliking mei de meast wiidweidige MAG-boarne dy't hjoed beskikber is16 (Metoaden).Dizze nij oanmakke MAG-set waard doe kombinearre mei 830 mei de hân selektearre MAG26's, 5969 SAG27's en 1707 REF's.Sânentweintich soarten fan marine baktearjes en archaea makken út in kombinatoryske kolleksje fan 34.799 genomen (fig. 1b).
Wy evaluearre doe de nij oanmakke boarne om har fermogen te ferbetterjen om marine mikrobiele mienskippen te fertsjintwurdigjen en de ynfloed te beoardieljen fan it yntegrearjen fan ferskate genoomtypen.Yn trochsneed fûnen wy dat it sawat 40-60% fan marine metagenomyske gegevens beslacht (figuer 1c), twa oant trije kear de dekking fan eardere MAG-allinich rapporten yn sawol djipte as breedte More serial 16 of SAG20.Derneist, om systematysk taksonomysk ferskaat te mjitten yn fêstige kolleksjes, annotearre wy alle genomen mei de Genome Taxonomy Database (GTDB) toolkit (metoaden) en brûkten in gemiddelde genome-wide nukleotide-identiteit fan 95%.28 om 8.304 soarten klusters (soarten) te identifisearjen.Twa-tredde fan dizze soarten (ynklusyf nije kladen) wiene net earder yn 'e GTDB te sjen, wêrfan 2790 ûntdutsen binne mei de yn dizze stúdzje rekonstruearre MAG (fig. 1d).Dêrnjonken fûnen wy dat ferskate soarten genomen tige komplemintêr binne: 55%, 26% en 11% fan soarten binne respektivelik folslein gearstald út MAG, SAG en REF (Fig. 1e).Dêrneist besloech MAG alle 49 soarten fûn yn it wetter kolom, wylst SAG en REF allinnich fertsjintwurdige 18 en 11 fan harren, respektivelik.Lykwols, SAG better fertsjintwurdiget it ferskaat fan de meast foarkommende clades (útwreide gegevens, Fig. 3a), lykas Pelagic Bacteriales (SAR11), mei SAG covering hast 1300 soarten en MAG allinnich 390 soarten.Opmerklik oerlappen REF's komselden mei MAG's of SAG's op soartenivo en fertsjintwurdigen> 95% fan 'e sawat 1000 genomen dy't net fûn binne yn' e iepen oseaan metagenomyske sets dy't hjir studearre binne, benammen troch ynteraksjes mei oare soarten isolearre represintative marine eksimplaren (bgl. sediminten) .of host-associate).Om it breed beskikber te meitsjen foar de wittenskiplike mienskip, kin dizze boarne fan marinegenoom, dy't ek net-klassifisearre fragminten omfettet (bgl .Tagong ta annotaasjes tegearre mei genfunksje en kontekstuele parameters yn 'e Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Wy sette doe út om de rykdom en nijichheid fan biosyntetyske potinsjeel yn iepen oseaanmikrobiomen te ferkennen.Foar dit doel brûkten wy earst antiSMASH foar alle MAG's, SAG's en REF's fûn yn 1038 marine metagenomen (metoaden) om in totaal fan 39,055 BGC's te foarsizzen.Wy groepeare dizze dan yn 6907 net-oerstallige GCF's en 151 genclusterpopulaasjes (GCC's; Oanfoljende tabel 2 en metoaden) om rekken te hâlden mei ynherinte oerstalligens (dat wol sizze, deselde BGC kin kodearre wurde yn meardere genomen) en metagenomyske gegevens Fragmintaasje fan konsintrearre BGC's.Ûnfolsleine BGCs net signifikant tanimme, as ien (oanfoljende ynformaasje), it oantal GCFs en GCCs, respektivelik, befetsjende op syn minst ien yntakt BGC lid yn 44% en 86% fan gefallen.
Op it GCC-nivo fûnen wy in breed ferskaat oan foarseine RiPP's en oare natuerlike produkten (Fig. 2a).Under harren, bygelyks, arylpolyenes, carotenoïden, ectoines, en siderophores hearre ta GCCs mei in brede fylogenetic ferdieling en in hege oerfloed yn oceanic metagenomes, dat kin wize op in brede oanpassing fan mikro-organismen oan de marine omjouwing, ynklusyf wjerstân tsjin reaktive soerstof soarten, oksidative en osmotyske stress..of izer absorption (mear ynformaasje).Dit funksjonele ferskaat stiet yn kontrast mei in resinte analyze fan sawat 1.2 miljoen BGC's ûnder sawat 190.000 genomen opslein yn 'e NCBI RefSeq-database (BiG-FAM/RefSeq, hjirnei oantsjutten as RefSeq)29, dy't oantoand dat net-ribosomal Synthetase-peptiden (NRPS) en polyketide (PKS) BGC's (oanfoljende ynformaasje).Wy fûnen ek 44 (29%) GCC's allinich op ôfstân relatearre oan elke RefSeq BGC (\(\bar{d}\)RefSeq> 0.4; Fig. 2a en metoaden) en 53 (35%) GCC's allinich yn MAG, en markearje it potinsjeel om earder net beskreaune gemikaliën yn OMD te detektearjen.Sjoen dat elk fan dizze GCC's wierskynlik heul ferskate biosyntetyske funksjes fertsjintwurdigje, analysearren wy gegevens fierder op it GCF-nivo yn in poging om in mear detaillearre groepearring fan BGC's te foarsizzen foar koade foar ferlykbere natuerlike produkten29.In totaal fan 3861 (56%) identifisearre GCF's oerlaapje net mei RefSeq, en> 97% fan GCF's wiene net oanwêzich yn MIBiG, ien fan 'e grutste databases fan eksperiminteel validearre BGC's (figuer 2b).Hoewol it net ferrassend is om in protte potensjele nije paden te ûntdekken yn ynstellingen dy't net goed fertsjintwurdige binne troch it referinsjegenoom, ús metoade foar it derplikearjen fan BGC's yn GCF's foar benchmarking ferskilt fan eardere rapporten 16 en lit ús in ûnpartidige beoardieling fan nijichheid leverje.It grutste part fan it nije ferskaat (3012 GCF of 78%) komt oerien mei foarsein terpenes, RiPP of oare natuerlike produkten, en de measte (1815 GCF of 47%) is kodearre yn ûnbekende soarten fanwege harren biosynthetic potinsjeel.Oars as PKS- en NRPS-klusters, binne dizze kompakte BGC's minder wierskynlik fragminteare tidens metagenomyske gearstalling 31 en tastean mear tiid- en boarne-yntinsive funksjonele karakterisaasje fan har produkten.
In totaal fan 39,055 BGC's waarden groepearre yn 6,907 GCF's en 151 GCC's.a, data foarstelling (ynterne eksterne).Hierarchyske klustering fan BGC-ôfstannen basearre op GCC, wêrfan 53 allinich troch MAG wurde fêststeld.De GCC befettet BGC's fan ferskate taxa (ln-omfoarme poartefrekwinsje) en ferskate BGC-klassen (sirkelgrutte komt oerien mei syn frekwinsje).Foar elke GCC fertsjintwurdiget de bûtenste laach it oantal BGC's, de prevalens (persintaazje fan samples), en de ôfstân (minimum BGC cosinusôfstân (min(dMIBiG))) fan BiG-FAM nei BGC.GCC's mei BGC's nau besibbe oan eksperiminteel ferifiearre BGC's (MIBiG) wurde markearre mei pylken.b Fergelykjen fan GCF mei foarsein (BiG-FAM) en eksperiminteel validearre (MIBiG) BGC's, 3861 nije (d-> 0.2) GCF's waarden fûn.De measte (78%) fan dizze koade foar RiPP, terpenen, en oare putative natuerlike produkten.c, alle genomen yn 'e OMD fûn yn 1038 marine metagenomen waarden pleatst yn' e GTDB-basisbeam om de fylogenetyske dekking fan 'e OMD te sjen.Clades sûnder genomen yn 'e OMD wurde yn griis werjûn.It oantal BGC's komt oerien mei it grutste oantal foarseine BGC's per genom yn in opjûne klade.Foar dúdlikens binne de lêste 15% fan 'e knopen ynstoart.Pylken jouwe clades oan ryk oan BGC (> 15 BGC), mei útsûndering fan Mycobacterium, Gordonia (twadde allinich nei Rhodococcus), en Crocosphaera (twadde allinich nei Synechococcus).d, ûnbekend c.Eremiobacterota toande de heechste biosyntetyske ferskaat (Shannon-yndeks basearre op natuerlik produkttype).Elke band fertsjintwurdiget it genoom mei de measte BGC's yn 'e soarte.T1PKS, PKS type I, T2/3PKS, PKS type II en type III.
Njonken rykdom en nijichheid ûndersykje wy de biogeografyske struktuer fan it biosyntetyske potinsjeel fan it marinemikrobioom.Groepearjen fan samples troch gemiddelde metagenomyske GCF-kopynûmerferdieling (Metoaden) liet sjen dat mienskippen mei lege breedte, oerflak, prokaryotyske rike en firus-earme mienskippen, meast fan oerflak of djipper sinneljochte wetters, ryk wiene oan RiPP- en BGC-terpenen.Yn tsjinstelling, polar, djippe see, firus- en dieltsje-rike mienskippen waarden ferbûn mei hegere oerfloed fan NRPS en PKS BGC (útwreide gegevens, Fig. 4 en oanfoljende ynformaasje).Uteinlik fûnen wy dat goed studearre tropyske en pelagyske mienskippen de meast kânsrike boarnen binne fan nije terpenen (Augmented Data Figure).Heechste potinsjeel foar PKS, RiPP en oare natuerlike produkten (figuer 5a mei útwreide gegevens).
Om ús stúdzje fan it biosyntetyske potinsjeel fan marine mikrobiomen oan te foljen, wiene wy fan doel har fylogenetyske ferdieling yn kaart te bringen en nije BGC-ferrike klades te identifisearjen.Dêrta pleatsten wy de genomen fan marine mikroben yn in normalisearre GTDB13 baktearjele en archaeal fylogenetyske beam en oerlaapje de putative biosyntetyske paden dy't se kodearje (Fig. 2c).Wy hawwe maklik ferskate BGC-ferrike klades (fertsjintwurdige troch mear as 15 BGC's) ûntdutsen yn seewettermonsters (metoaden) bekend om har biosyntetyske potinsjeel, lykas cyanobaktearjes (Synechococcus) en Proteus-baktearjes, lykas Tistrella32,33, of hawwe koartlyn oandacht lutsen foar har natuerlike produkten.lykas Myxococcota (Sandaracinaceae), Rhodococcus en Planctomycetota34,35,36.Ynteressant fûnen wy ferskate earder net ûndersochte lineages yn dizze clades.Bygelyks, dy soarten mei it rykste biosyntetyske potinsjeel yn 'e phyla Planctomycetota en Myxococcota hearden respektivelik ta unkarakterisearre kandidaatoarders en genera (oanfoljende tabel 3).Mei-inoar suggerearret dit dat de OMD tagong jout ta earder ûnbekende fylogenetyske ynformaasje, ynklusyf mikroorganismen, dy't nije doelen kinne fertsjintwurdigje foar ûntdekking fan enzymen en natuerlik produkt.
Folgjende, wy karakterisearre de BGC-ferrike clade troch net allinne tellen it maksimum oantal BGCs kodearre troch syn leden, mar ek troch it beoardieljen fan it ferskaat fan dizze BGCs, dy't ferklearret de frekwinsje fan ferskillende soarten natuerlike kandidaat produkten (Fig. 2c en metoaden )..Wy fûnen dat de meast biosyntetysk ferskate soarten waarden fertsjintwurdige troch spesjaal manipulearre baktearjele MAG's yn dizze stúdzje.Dizze baktearjes hearre ta it net-kultivearre phylum Candidatus Eremiobacterota, dy't foar in grut part net ûntdutsen bliuwt útsein in pear genomyske stúdzjes37,38.It is opmerklik dat "ca.De genus Eremiobacterota is allinich analysearre yn in terrestryske omjouwing39 en is net bekend om leden te befetsjen dy't ferrike binne yn BGC.Hjir hawwe wy rekonstruearre acht MAGs fan deselde soarte (nukleotide identiteit> 99%) 23. Wy stelle dêrom de soarte namme "Candidatus Eudoremicrobium malaspinii", neamd nei de nereid (see nimf), in prachtich kado yn Grykske mytology en ekspedysjes.'Ka.Neffens fylogenetyske annotaasje 13 hat E. malaspinii gjin earder bekende sibben ûnder it folchoardernivo en heart dus ta in nije baktearjefamylje dy't wy foarstelle "Ca.E. malaspinii" as it type soarte en "Ca.Eudormicrobiaceae" as de offisjele namme (oanfoljende ynformaasje).Koarte metagenomyske rekonstruksje fan 'Ca.It E. malaspinii-genoomprojekt waard falidearre troch tige lege ynput, lange lêzen metagenomyske sequencing en rjochte gearstalling fan in inkele stekproef (Metoaden) as ien 9.63 Mb lineêre chromosoom mei in 75 kb duplikaasje.as de ienige oerbleaune dûbelsinnigens.
Om de fylogenetyske kontekst fan dizze soarte te fêstigjen, sochten wy nei 40 nau besibbe soarten yn ekstra eukaryotysk-ferrike metagenomyske samples fan 'e Tara Ocean-ekspedysje troch doelrjochte genoomrekonstruksje.Koartsein hawwe wy metagenomyske lêzingen keppele oan genomyske fragminten ferbûn mei "Ca.E. malaspinii" en hypoteze dat in ferhege wervingsnivo yn dizze stekproef de oanwêzigens fan oare sibben (metoaden) oanjout.As gefolch hawwe wy 10 MAG's fûn, in kombinaasje fan 19 MAG's dy't fiif soarten yn trije genera fertsjintwurdigje binnen in nij definieare famylje (dus "Ca. Eudormicrobiaceae").Nei hânmjittich ynspeksje en kwaliteit kontrôle (útwreide gegevens, Fig. 6 en oanfoljende ynformaasje), wy fûnen dat "Ca.Eudormicrobiaceae-soarten presintearje gruttere genomen (8 Mb) en riker biosyntetyske potinsjeel (14 oant 22 BGC per soarte) as oare "Ca"-leden.Clade Eremiobacterota (oant 7 BGC) (fig. 3a–c).
a, Phylogenetic posysjes fan de fiif 'Ca.Soarten fan Eudormicrobiaceae toande BGC rykdom spesifyk foar de marine linen identifisearre yn dizze stúdzje.De fylogenetyske beam omfettet alle 'Ca.MAG Eremiobacterota en leden fan oare phyla (genoomnûmers tusken heakjes) levere yn GTDB (ferzje 89) waarden brûkt foar evolúsjonêre eftergrûn (Metoaden).De bûtenste lagen fertsjintwurdigje klassifikaasjes op famyljenivo ("Ca. Eudormicrobiaceae" en "Ca. Xenobiaceae") en op klassenivo ("Ca. Eremiobacteria").De fiif soarten beskreaun yn dizze stúdzje wurde fertsjintwurdige troch alfanumerike koades en foarstelde binomiale nammen (oanfoljende ynformaasje).b,ok yn.Eudormicrobiaceae soarten diele sân mienskiplike BGC kearnen.It ûntbrekken fan BGC yn 'e A2-klade wie te tankjen oan' e ûnfolsleinens fan 'e represintative MAG (oanfoljende tabel 3).BGC's binne spesifyk foar "Ca.Amphithomicrobium" en "Ca.Amphithomicrobium" (kladen A en B) wurde net werjûn.c, Alle BGC's kodearre as "Ca.Eudoremicrobium taraoceanii waard útdrukt yn 623 metatranskriptomen nommen út 'e oseanen fan Tara.Fêste sirkels jouwe aktive transkripsje oan.Oranje sirkels jouwe oan log2-transformeare foldwizigingen ûnder en boppe it húshâldingsgen-ekspresjerate (metoaden).d, relative oerfloedskurven (metoaden) dy't 'Ca.Soarten fan Eudormicrobiaceae binne wiidferspraat yn de measte oseaanbekken en yn 'e hiele wetterkolom (fan it oerflak oant in djipte fan op syn minst 4000 m).Op grûn fan dizze skattings fûnen wy dat 'Ca.E. malaspinii 'ferantwurdet oant 6% fan prokaryotyske sellen yn djippe see pelagyske nôt-assosjearre mienskippen.Wy beskôgen in soarte te wêzen oanwêzich op in plak as it waard fûn yn in fraksje fan de grutte fan in opjûne djipte laach.IO - Yndyske Oseaan, NAO - Noard-Atlantyske Oseaan, NPO - Noard-Stille Oseaan, RS - Reade See, SAO - Súd-Atlantyske Oseaan, SO - Súdlike Oseaan, SPO - Súd-Stille Oseaan.
Undersykje de oerfloed en ferdieling fan Ca.Eudormicrobiaceae, dy't, lykas wy fûnen, oerhearsket yn 'e measte oseaanbekken, lykas yn' e hiele wetterkolom (fig. 3d).Lokaal meitsje se 6% út fan 'e marine mikrobiële mienskip, wêrtroch't se in wichtich part binne fan' e wrâldwide marine mikrobiom.Dêrneist fûnen wy de relative ynhâld fan Ca.Eudormicrobiaceae-soarten en har BGC-ekspresjenivo's wiene it heechst yn 'e eukaryote ferrike fraksje (Fig. 3c en útwreide gegevens, Fig. 7), wat oanjout op in mooglike ynteraksje mei dieltsjes, ynklusyf plankton.Dizze observaasje hat wat oerienkomst mei 'Ca.Eudoremicrobium BGC's dy't cytotoxyske natuerlike produkten produsearje fia bekende paden kinne rôfdierich gedrach sjen litte (oanfoljende ynformaasje en útwreide gegevens, figuer 8), fergelykber mei oare rôfdieren dy't spesifyk metaboliten produsearje lykas Myxococcus41.Untdekking fan Ca.Eudormicrobiaceae yn minder beskikbere (djippe oseaan) of eukaryote ynstee fan prokaryotyske samples kinne ferklearje wêrom't dizze baktearjes en har ûnferwachte BGC-ferskaat ûndúdlik bliuwe yn 'e kontekst fan natuerlik fiedingsûndersyk.
Uteinlik sochten wy de belofte fan ús mikrobiom-basearre wurk eksperiminteel te validearjen by it ûntdekken fan nije paden, enzymen en natuerlike produkten.Under de ferskate klassen fan BGC's is it bekend dat it RiPP-paad in ryk gemysk en funksjoneel ferskaat kodearret troch ferskate post-translasjonele modifikaasjes fan it kearnpeptide troch folwoeksen enzymen42.Sa hawwe wy keazen foar twa 'Ca.Eudoremicrobium' RiPP BGC's (figueren 3b en 4a-e) binne basearre op itselde as elke bekende BGC (\(\bar{d}\)MIBiG en \(\bar{d}\)RefSeq boppe 0.2).
a–c, In vitro heterologe ekspresje en in vitro enzymatyske assays fan in roman (\(\bar{d}\)RefSeq = 0.29) kluster fan RiPP-biosynteze spesifyk foar djippe see Ca-soarten.E. malaspinii' late ta de produksje fan difosforylearre produkten.c, oanpassings identifisearre mei help fan hege resolúsje (HR) MS / MS (fragmintaasje oanjûn troch b en y ioanen yn de gemyske struktuer) en NMR (útwreide gegevens, Fig. 9).d, dit phosphorylearre peptide eksposearret lege mikromolêre ynhibysje fan neutrofilelastase fan sûchdieren, dy't net fûn wurdt yn it kontrôlepeptide en it dehydratearjende peptide (gemyske ferwidering feroarsake dehydraasje).It eksperimint waard trije kear werhelle mei ferlykbere resultaten.Bygelyks, heterologe ekspresje fan in twadde roman \(\bar{d}\)RefSeq = 0.33) kluster fan proteïnebiosynteze ferljochtet de funksje fan fjouwer ripe enzymen dy't it 46 aminosoeren kearnpeptide feroarje.Residuen wurde kleurd neffens side fan modifikaasje foarsein troch HR-MS / MS, isotopen-labeling, en NMR-analyze (oanfoljende ynformaasje).Stipele kleur jout oan dat de wiziging foarkomt by ien fan 'e twa resten.De figuer is in kompilaasje fan ferskate heterologe konstruksjes om de aktiviteit fan alle folwoeksen enzymen op deselde kearn te sjen.h, Yllustraasje fan NMR gegevens foar rêchbonke amide N-methylation.Folsleine resultaten wurde werjûn yn fig.10 mei útwreide gegevens.ik, Phylogenetyske posysje fan it folwoeksen FkbM-proteinkluster-enzyme ûnder alle FkbM-domeinen fûn yn 'e MIBiG 2.0-database lit in enzyme fan dizze famylje sjen mei N-methyltransferase-aktiviteit (oanfoljende ynformaasje).Skematyske diagrammen fan BGC's (a, e), foarrinnerpeptidestruktueren (b, f), en putative gemyske struktueren fan natuerlike produkten (c, g) wurde werjûn.
It earste RiPP-paad (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) waard allinich fûn yn djipsee-soarten "Ca.E. malaspinii" en koades foar Peptide- foarrinner (Fig. 4a, b).Yn dit folwoeksen enzym hawwe wy in inkeld funksjoneel domein identifisearre dat homolooch is foar it dehydratisearringsdomein fan lantipeptide synthase dat normaal phosphorylaasje katalysearret en dêropfolgjende ferwidering fan 43 (oanfoljende ynformaasje).Dêrom foarsizze wy dat de wiziging fan it foarrinnerpeptide sa'n twa-stap útdroeging omfettet.Lykwols, mei help fan tandem massa spektrometry (MS / MS) en nukleêre magnetyske resonânsje spektroskopy (NMR), wy identifisearre in polyphosphorylated lineêre peptide (Fig. 4c).Hoewol ûnferwachts, fûnen wy ferskate rigels fan bewiis om te stypjen dat it it einprodukt is: twa ferskillende heterologe hosts en gjin útdroeging yn in vitro-assays, identifikaasje fan kaairesiduen mutearre yn 'e katalytyske útdroegingside fan it folwoeksen enzym.allegear rekonstruearre troch "Ca".It E. malaspinii-genoom (útwreide gegevens, Fig. 9 en oanfoljende ynformaasje) en, úteinlik, de biologyske aktiviteit fan it phosphorylearre produkt, mar net de gemysk synthesisearre dehydratisearre foarm (Fig. 4d).Feitlik fûnen wy dat it in lege mikromolêre protease-ynhiberende aktiviteit tsjin neutrophile elastase eksposearret, fergelykber mei oare relatearre natuerlike produkten yn it konsintraasjeberik (IC50 = 14.3 μM) 44, nettsjinsteande it feit dat de ekologyske rol bliuwt te ferklearjen.Op grûn fan dizze resultaten stelle wy foar om it paad "phospheptin" te neamen.
It twadde gefal is in komplekse RiPP-paad spesifyk foar 'Ca.It skaai Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) waard foarsein om natuerlike proteinprodukten te kodearjen (fig. 4e).Dizze paden binne fan bysûnder biotechnologysk belang fanwegen de ferwachte tichtens en ferskaat oan ûngewoane gemyske modifikaasjes fêststeld troch de enzymen kodearre troch de relatyf koarte BGCs45.Wy fûnen dat dit proteïne ferskilt fan earder karakterisearre proteïnen yn dat it ûntbrekt sawol it haad NX5N-motyf fan polyceramides en de lanthionine-loop fan landornamides 46.Om de beheiningen fan mienskiplike heterologe ekspresjepatroanen te oerwinnen, brûkten wy se tegearre mei in oanpast Microvirgula aerodenitrificans-systeem om fjouwer folwoeksen padenzymen (metoaden) te karakterisearjen.Mei help fan in kombinaasje fan MS / MS, isotope-labeling, en NMR, ûntdutsen wy dizze folwoeksen enzymen yn 'e 46-aminosoere kearn fan it peptide (Fig. 4f, g, útwreide gegevens, Fig. 10-12 en oanfoljende ynformaasje).Under ripe enzymen karakterisearre wy it earste optreden fan in famyljelid FkbM O-methyltransferase 47 yn 'e RiPP-paad en fûn ûnferwachts dat dit ripe enzyme N-methylaasje fan' e rêchbonke yntrodusearret (fig. 4h, i en oanfoljende ynformaasje).Hoewol dizze modifikaasje bekend is yn natuerlike NRP48-produkten, is enzymatyske N-methylaasje fan amide-obligaasjes in komplekse, mar biotechnologysk wichtige reaksje49 dy't oant no ta fan belang west hat foar de RiPP-famylje fan borosines.Spesifisiteit 50,51.De identifikaasje fan dizze aktiviteit yn oare famyljes fan enzymen en RiPP kin nije applikaasjes iepenje en it funksjonele ferskaat fan proteïnen 52 en har gemyske ferskaat útwreidzje.Op grûn fan de identifisearre oanpassingen en de ûngewoane lingte fan 'e foarstelde produktstruktuer, stelle wy in paadnamme "pythonamide" foar.
De ûntdekking fan in ûnferwachte enzymology yn in funksjoneel karakterisearre famylje fan enzymen yllustrearret de belofte fan miljeu-genomika foar nije ûntdekkingen, en yllustrearret ek de beheinde kapasiteit foar funksjonele konklúzjes basearre op sekwinsjehomology allinich.Sa, tegearre mei rapporten fan net-kanonike bioaktive polyphosphorylated RiPPs, ús resultaten demonstrearje boarne-yntinsive, mar krityske wearde oan syntetyske biology ynspannings te ûntdekke de funksjonele rykdom, ferskaat, en ûngewoane struktueren fan biogemyske ferbiningen.
Hjir demonstrearje wy it berik fan biosyntetyske potinsjeel kodearre troch mikroben en har genomyske kontekst yn 'e wrâldwide marinemikrobioom, it fasilitearjen fan takomstich ûndersyk troch de resultearjende boarne beskikber te meitsjen foar de wittenskiplike mienskip (https://microbiomics.io/ocean/).Wy fûnen dat in protte fan har fylogenetyske en funksjonele nijichheid allinich kin wurde krigen troch MAG's en SAG's te rekonstruearjen, fral yn ûnderbenutte mikrobiele mienskippen dy't takomstige ynspanningen foar bioprospektearjen kinne liede.Hoewol't wy sille rjochtsje hjir op 'Ca.Eudormicrobiaceae" as in lineage foaral biosyntetysk "talintysk", in protte fan 'e BGC's foarsein yn' e net ûntdutsen mikrobiota kodearje wierskynlik earder net beskreaun enzymologyen dy't ferbiningen leverje mei miljeu- en / of biotechnologysk wichtige aksjes.
Metagenomyske datasetten fan grutte oseanografyske en tiidsearjestúdzjes mei genôch folchoarderingsdjipte waarden opnommen om de dekking fan wrâldwide marine mikrobiële mienskippen yn oseaanbekken, djippe lagen en oer tiid te maksimalisearjen.Dizze datasets (oanfoljende tabel 1 en figuer 1) omfetsje metagenomics fan samples sammele yn 'e oseanen fan Tara (virale ferrike, n=190; prokaryotyske ferrike, n=180)12,22 en de BioGEOTRACES-ekspedysje (n=480).Hawaiian Oceanic Time Series (HOT, n = 68), Bermuda-Atlantyske Time Series (BATS, n = 62) 21 en de Malaspina Ekspedysje (n = 58) 23.Sequencing-lêzen fan alle metagenomyske fragminten waarden filtere foar kwaliteit mei BBMap (v.38.71) troch sequencing-adapters te ferwiderjen fan lêzings, it fuortheljen fan lêzings yn kaart brocht oan kwaliteitskontrôle-sekwinsjes (PhiX-genoom), en it brûken fan trimq = 14, maq = 20 smyt minne lêskwaliteit, maxns = 0 en minlength = 45. Folgjende analyzes waarden útfierd of gearfoege mei QC lêzen as oantsjutte (bbmerge.sh minoverlap = 16).QC-lêzingen waarden normalisearre (bbnorm.sh-doel = 40, minddepth = 0) foarôfgeand oan it bouwen mei metaSPAdes (v.3.11.1 of v.3.12 as nedich)53.De resultearjende steigerkontigs (hjirnei oantsjutten as steigers) waarden úteinlik filtere troch lingte (≥1 kb).
De 1038 metagenomyske samples waarden ferdield yn groepen, en foar elke groep samples waarden de metagenomyske kwaliteitskontrôlelêzingen fan alle samples oerienkomme mei de heakjes fan elke stekproef apart, wat resulteart yn it folgjende oantal pearwize groeplêzen: Tara Marine Viruses - Enriched (190 × 190), Prokaryotes ferrike (180 × 180), BioGEOTRACES, HOT en BATS (610 × 610) en Malaspina (58 × 58).Mapping waard dien mei help fan Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188) 54 wêrmei lêzingen kinne wurde oerienkomme mei sekundêre siden (mei de flagge -a).Ofstimmingen waarden filtere om op syn minst 45 basen lang te wêzen, hawwe ≥97% identiteit, en span ≥80% lêzen.De resultearjende BAM-bestannen waarden ferwurke mei it jgi_summarize_bam_contig_depths-skript foar MetaBAT2 (v.2.12.1) 55 om intra- en inter-sample-dekking foar elke groep te leverjen.Uteinlik waarden heakjes groepearre om gefoelichheid te fergrutsjen troch yndividueel MetaBAT2 te rinnen op alle samples mei -minContig 2000 en -maxEdges 500. Wy brûke MetaBAT2 ynstee fan in ensemblebokser, om't it yn ûnôfhinklike tests oantoand is as de meast effektive single-bokser.en 10 oan 50 kear flugger as oare faak brûkte boxers57.Om te testen foar it effekt fan oerfloedskorrelaasjes, brûkte in willekeurich selekteare subsample fan metagenomics (10 foar elk fan 'e twa Tara Ocean-dataset, 10 foar BioGEOTRACES, 5 foar elke tiidsearje, en 5 foar Malaspina) allinich samples brûkt.Ynterne samples wurde groepeare om dekkingynformaasje te krijen.(Oanfoljende ynformaasje).
Oanfoljende (eksterne) genomen waarden opnommen yn 'e folgjende analyze, nammentlik 830 mei de hân selekteare MAG's út in subset fan 'e Tara Oceans26-dataset, 5287 SAG's út 'e GORG20-dataset, en gegevens út 'e MAR-database (MarDB v. 4) fan 1707 isolearre REF's en 682 SAG's) 27. Foar de MarDB-dataset wurde genomen selektearre op basis fan beskikbere metadata as it stekproeftype oerienkomt mei de folgjende reguliere ekspresje: '[S|s]ingle.?[C|c]ell|[C|c]kultuer| [I|i] isolearre'.
De kwaliteit fan elke metagenomyske kontener en eksterne genomen waard beoardiele mei CheckM (v.1.0.13) en Anvi'o's Lineage Workflow (v.5.5.0) 58,59.As CheckM of Anvi'o rapportearret ≥50% folsleinens / folsleinens en ≤10% fersmoarging / oerstalligens, bewarje dan metagenomyske sellen en eksterne genomen foar lettere analyze.Dizze skoares waarden dêrnei kombinearre yn gemiddelde folsleinens (mcpl) en gemiddelde kontaminaasje (mctn) om de genoomkwaliteit neffens mienskipskritearia60 as folget te klassifisearjen: hege kwaliteit: mcpl ≥ 90% en mctn ≤ 5%;goede kwaliteit: mcpl ≥ 70%, mctn ≤ 10%, medium kwaliteit: mcpl ≥ 50% en mctn ≤ 10%, earlike kwaliteit: mcpl ≤ 90% of mctn ≥ 10%.De filtere genomen waarden doe korrelearre mei kwaliteitskoares (Q en Q') as folget: Q = mcpl - 5 x mctn Q' = mcpl - 5 x mctn + mctn x (strain fariabiliteit) / 100 + 0.5 x log[N50].(Ymplementearre yn dRep61).
Om fergelykjende analyze tusken ferskate gegevensboarnen en genoomtypen (MAG, SAG en REF) mooglik te meitsjen, waarden 34.799 genomen derefereare basearre op genome-wide gemiddelde nukleotide-identiteit (ANI) mei dRep (v.2.5.4).Werhellet) 61 mei 95% ANI-drompels28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) en single-copy marker-genen mei SpecI63 dy't genome clustering leverje op it soartenivo.In represintatyf genome waard selektearre foar elke dRep-kluster neffens de boppesteande definieare maksimale kwaliteitskoare (Q'), dy't as fertsjintwurdiger fan 'e soarte beskôge waard.
Om de mappingsnelheid te evaluearjen, waard BWA (v.0.7.17-r1188, -a) brûkt om alle 1038 sets fan metagenomyske lêzings yn kaart te bringen mei 34,799 genomes befette yn 'e OMD.Kwaliteitskontrôle lêzen waarden yn kaart brocht yn ien-einige modus en de resultearjende ôfstimmingen waarden filtere om allinich ôfstimmingen ≥45 bp yn 'e lingte te behâlden.en identiteit ≥95%.De werjefteferhâlding foar elke stekproef is it persintaazje lêzings oerbleaun nei filtraasje dield troch it totale oantal kwaliteitskontrôlelêzingen.Mei deselde oanpak waard elk fan 'e 1038 metagenomen fermindere nei 5 miljoen ynserts (útwreide gegevens, Fig. 1c) en oerienkomme mei GORG SAG yn OMD en yn alle GEM16.De hoemannichte MAG's weromfûn út seewetter yn 'e GEM16-katalogus waard bepaald troch trefwurdfragen fan metagenomyske boarnen, it selektearjen fan seewettermonsters (bgl. yn tsjinstelling ta marine sediminten).Spesifyk selektearje wy "aquatic" as "ecosystem_category", "marine" as "ecosystem_type", en filterje "habitat" as "djippe oseaan", "marine", "maritime oceanic", "pelagyske marine", "marine wetter" , "Oseaan", "Seewetter", "Oerflakseewetter", "Oerflakseewetter".Dit resultearre yn 5903 MAG's (734 hege kwaliteit) ferdield oer 1823 OTU's (werjefte hjir).
Prokaryotyske genomen waarden taksonomysk annotearre mei GTDB-Tk (v.1.0.2) 64 mei standertparameters dy't rjochte binne op GTDB r89 ferzje 13. Anvi'o waard brûkt om eukaryotyske genomen te identifisearjen basearre op domeinfoarsizzing en opnij ≥50% en redundânsje ≤ 10%.De taksonomyske annotaasje fan in soarte wurdt definiearre as ien fan syn represintative genomen.Mei útsûndering fan eukaryoten (148 MAG), waard elk genome earst funksjoneel annotearre mei prokka (v.1.14.5)65, nammentlik folsleine genen, definieare "archaea" of "baktearje" parameters as nedich, wat ek rapportearre is foar net- kodearjende genen.en CRISPR-regio's, ûnder oare genomyske funksjes.Annotearje foarseine genen troch it identifisearjen fan universele single-copy marker genen (uscMG) mei help fetchMG (v.1.2) 66, tawize ortholog groepen en query mei help fan eapper (v.2.0.1) 67 basearre op eggNOG (v.5.0) 68.KEGG-database (publisearre 10 febrewaris 2020) 69. De lêste stap waard útfierd troch aaiwiten te passen oan 'e KEGG-database mei DIAMOND (v.0.9.30) 70 mei in query- en ûnderwerpdekking fan ≥70%.Resultaten waarden fierder filtere neffens NCBI Prokaryotic Genome Annotation Pipeline71 basearre op bitrate ≥ 50% fan maksimale ferwachte bitrate (keppeling sels).Gen-sekwinsjes waarden ek brûkt as ynput om BGC's yn it genom te identifisearjen mei antiSMASH (v.5.1.0) 72 mei standertparameters en ferskate kluster-eksplosjes.Alle genomen en annotaasjes binne gearstald yn OMD tegearre mei kontekstuele metadata beskikber op it web (https://microbiomics.io/ocean/).
Fergelykber mei earder beskreaune metoaden12,22 brûkten wy CD-HIT (v.4.8.1) om>56.6 miljoen proteïne-kodearjende genen fan baktearjele en archaeale genomen fan OMD yn 95% identiteit en koartere genen (90% dekking)73 oant >17,7 miljoen genclusters.De langste sekwinsje waard keazen as it represintative gen foar elke gencluster.De 1038 metagenomen waarden doe oerienkomme mei> 17.7 miljoen BWA (-a) klusterleden en de resultearjende BAM-bestannen waarden filtere om allinich ôfstimmingen te behâlden mei ≥95% persintaazje identiteit en ≥45 basisôfstimmingen.Lengte-normalisearre gen-oerfloed waard berekkene troch earst ynserts te tellen fan 'e bêste unike ôfstimming en dan, foar fuzzy-mapped ynserts, fraksjonele tellen ta te foegjen oan de oerienkommende doelgenen proporsjoneel mei har oantal unike ynserts.
De genomen fan 'e útwreide OMD (mei ekstra MAG's fan "Ca. Eudormicrobiaceae", sjoch hjirûnder) waarden tafoege oan de mOTUs74 metagenomyske analyse-arkdatabase (v.2.5.1) om in útwreide mOTU-referinsjedatabase te meitsjen.Allinich seis genomen mei ien kopy (23.528 genomen) oerlibbe út tsien uscMG's.De útwreiding fan de databank resultearre yn 4.494 ekstra klusters op soartnivo.1038 metagenomen waarden analysearre mei standert mOTU-parameters (v.2).In totaal fan 989 genomen befette yn 644 mOTU-klusters (95% REF, 5% SAG en 99.9% hearrend ta MarDB) waarden net ûntdutsen troch it mOTU-profyl.Dit wjerspegelet ferskate ekstra boarnen fan marine-isolaasje fan 'e MarDB-genoom (de measte fan' e net ûntdutsen genomen binne ferbûn mei organismen isolearre út sediminten, marine-hosts, ensfh.).Om fierder te fokusjen op 'e omjouwing fan' e iepen oseaan yn dizze stúdzje, hawwe wy se útsletten fan 'e streamôfwerts analyse, útsein as se waarden ûntdutsen of opnommen yn' e útwreide mOTU-database makke yn dizze stúdzje.
Alle BGC's fan MAG, SAG en REF yn OMD (sjoch hjirboppe) waarden kombineare mei BGC's identifisearre yn alle metagenomyske steigers (antiSMASH v.5.0, standertparameters) en karakterisearre mei BiG-SLICE (v.1.1) (PFAM-domein)75.Op grûn fan dizze funksjes berekkene wy alle kosinusôfstannen tusken BGC's en groepeare se (gemiddelde keppelings) yn GCF en GCC mei ôfstânsdrompels fan respektivelik 0.2 en 0.8.Dizze drompels binne in oanpassing fan drompels dy't earder brûkt waarden mei Euklidyske ôfstân75 tegearre mei kosinusôfstân, wat wat fan 'e flater yn' e orizjinele BiG-SLICE-klusterstrategy (oanfoljende ynformaasje) ferleget.
BGC's waarden doe filtere om allinich ≥5 kb kodearre op steigers te behâlden om it risiko fan fragmintaasje te ferminderjen lykas earder beskreaun16 en om MarDB REF's en SAG's net te finen yn 1038 metagenomen (sjoch hjirboppe).Dit resultearre yn in totaal fan 39,055 BGC's wurde kodearre troch it OMD-genoom, mei in ekstra 14,106 identifisearre op metagenomyske fragminten (dus net kombinearre yn MAG's).Dizze "metagenomyske" BGC's waarden brûkt om it oanpart fan biosynthesepotential foar marine mikrobiom te skatten dat net yn 'e databank is fêstlein (oanfoljende ynformaasje).Elke BGC waard funksjoneel karakterisearre neffens foarsizzende produkttypen definieare troch anty-SMASH of grouwe produktkategoryen definieare yn BiG-SCAPE76.Om foaroardielen fan sampling yn kwantifikaasje te foarkommen (taksonomyske en funksjonele gearstalling fan GCC / GCF, ôfstân fan GCF en GCC nei referinsjedatabases, en metagenomyske oerfloed fan GCF), troch allinich de langste BGC per GCF foar elke soarte te hâlden, waarden 39.055 BGC's fierder deduplicated, in resultaat yn totaal 17.689 BGC.
De nijichheid fan GCC en GCF waard beoardiele op basis fan de ôfstân tusken de berekkene databank (RefSeq databank yn BiG-FAM) 29 en de eksperiminteel ferifiearre (MIBIG 2.0) 30 BGC.Foar elk fan 'e 17.689 represintative BGC's hawwe wy de lytste cosinusôfstân keazen ta de respektivelike databank.Dizze minimale ôfstannen wurde dan gemiddeld (gemiddeld) neffens GCF of GCC, sa passend.In GCF wurdt as nij beskôge as de ôfstân nei de databank grutter is as 0,2, wat oerienkomt mei in ideale skieding tusken de (gemiddelde) GCF en de referinsje.Foar GCC kieze wy 0.4, dat is twa kear de drompel definieare troch GCF, om in lange termyn relaasje mei keppelings te sluten.
De metagenomyske oerfloed fan BGC waard rûsd as de gemiddelde oerfloed fan syn biosyntetyske genen (lykas bepaald troch anty-SMASH) beskikber út gene-nivo profilen.De metagenomyske oerfloed fan elke GCF as GCC waard doe berekkene as de som fan represintative BGC's (fan 17.689).Dizze oerfloedkaarten waarden dêrnei normalisearre foar sellulêre komposysje mei de per-sample mOTU-count, dy't ek rekkene foar sequencing-ynspanningen (útwreide gegevens, Fig. 1d).De prevalens fan GCF of GCC waard berekkene as it persintaazje samples mei in oerfloed> 0.
De Euklidyske ôfstân tusken samples waard berekkene út it normalisearre GCF-profyl.Dizze ôfstannen waarden yn grutte fermindere mei UMAP77 en de resultearjende ynbêdingen waarden brûkt foar net tafersjoch op tichtheid-basearre klustering mei HDBSCAN78.It optimale minimum oantal punten foar in kluster (en dus it oantal klusters) dat wurdt brûkt troch HDBSCAN wurdt bepaald troch it maksimalisearjen fan de kumulative kâns op klusterlidmaatskip.De identifisearre klusters (en in willekeurige lykwichtige subsample fan dizze klusters om rekken te hâlden mei bias yn permutasjonele multivariate analyze fan fariânsje (PERMANOVA)) waarden hifke foar betsjutting tsjin net-fermindere Euklidyske ôfstannen mei PERMANOVA.De gemiddelde genoomgrutte fan 'e samples waard berekkene op basis fan' e relative oerfloed fan mOTU en de skatte genomegrutte fan 'e leden fan' e genomen.Benammen de gemiddelde genoomgrutte fan elke mOTU waard rûsd as it gemiddelde fan 'e genoomgrutte fan har leden korrizjearre foar folsleinens (nei filterjen) (bygelyks in 75% folslein genoom mei in lingte fan 3 Mb hat in oanpaste grutte fan 4 Mb).foar medium genomen mei yntegriteit ≥70%.De trochsneed genoomgrutte foar elke stekproef waard doe berekkene as de som fan mOTU-genoomgrutte gewogen troch relative oerfloed.
In filtere set fan genome-kodearre BGC's yn 'e OMD wurdt werjûn yn baktearjele en archeale GTDB-beammen (yn ≥5 kb-ramten, útsein REF en SAG MarDB net fûn yn 1038 metagenomen, sjoch hjirboppe) en har foarsizze produktkategoryen op basis fan 'e fylogenetyske posysje fan it genoom (sjoch hjirboppe).Wy hawwe earst de gegevens per soarte fermindere, mei it genoom mei de measte BGC's yn dy soarte as represintatyf.Foar fisualisaasje waarden de fertsjintwurdigers fierder ferdield yn beamgroepen, en wer, foar elke selle clade, waard it genoom mei it grutste oantal BGC's selektearre as fertsjintwurdiger.BGC-ferrike soarten (op syn minst ien genom mei> 15 BGC's) waarden fierder analysearre troch de Shannon Diversity Index te berekkenjen foar de produkttypen kodearre yn dy BGC's.As alle foarseine produkttypen itselde binne, wurde gemyske hybriden en oare komplekse BGC's (lykas foarsizze troch anty-SMAH) beskôge ta deselde produkttype te hearren, nettsjinsteande har folchoarder yn 'e kluster (bgl. lichem).hybride).
Oerbleaune DNA (skatte op 6 ng) fan Malaspina-monster MP1648, oerienkommende mei biologyske sample SAMN05421555 en oerienkomme mei Illumina SRR3962772 metagenomyske lêsset foar koarte lêzing, ferwurke neffens PacBio sequencing-protokol mei ultra-lege ynfier om PacBio-sample gDNA-monster te brûken kit (100-980-000) en SMRTbell Express 2.0 template tarieding kit (100-938-900).Koartsein waard it oerbleaune DNA ôfsnien, repareare en suvere (ProNex-kralen) mei Covaris (g-TUBE, 52104).Purified DNA wurdt dan ûnderwurpen oan biblioteek tarieding, amplifikaasje, suvering (ProNex kralen) en grutte seleksje (> 6 kb, Blue Pippin) foar in lêste suvering stap (ProNex kralen) en sequencing op de Sequel II platfoarm.
Rekonstruksje fan de earste twa ca.Foar MAG Eremiobacterota identifisearren wy seis ekstra ANI's> 99% (dizze binne opnommen yn figuer 3), dy't yn earste ynstânsje waarden filtere op basis fan kontaminaasjeskoares (letter identifisearre as gen-duplikaasjes, sjoch hjirûnder).Wy fûnen ek in bak mei it label "Ca".Eremiobacterota" út ferskate stúdzjes23 en brûkten se tegearre mei acht MAG's út ús stúdzje as referinsje foar metagenomyske lêzingen fan 633 eukaryotyske ferrike (> 0.8 µm) samples mei BWA (v.0.7.17) Ref -r1188, - in flagge) foar downsampled mapping (5 miljoen lêzen).Op grûn fan ferrikingsspesifike kaarten (filtreare troch 95% ôfstimmingsidentiteit en 80% lêsdekking), waarden 10 metagenomen (ferwachte dekking ≥5 ×) selektearre foar gearstalling en in ekstra 49 metagenomen (ferwachte dekking ≥1 ×) foar ynhâldkorrelaasje.Mei deselde parameters as hjirboppe, waarden dizze samples ynsletten en 10 ekstra 'Ca's waarden tafoege.MAG Eremiobacterota is restaurearre.Dizze 16 MAG's (de twa net telle al yn 'e database) bringe it totale oantal genomen yn' e útwreide OMD op 34,815.MAG's wurde taksonomyske rangen tawiisd op basis fan har genomyske oerienkomst en posysje yn 'e GTDB.18 MAG's waarden dereplicated mei dRep yn 5 soarten (yntraspesifike ANI>99%) en 3 genera (yntrageneric ANI 85% oant 94%) binnen deselde famylje79.Soartfertsjintwurdigers waarden mei de hân selektearre op basis fan yntegriteit, fersmoarging en N50.Oanbefelle nomenklatuer wurdt jûn yn 'e oanfoljende ynformaasje.
Beoardielje de yntegriteit en fersmoarging fan 'Ca.MAG Eremiobacterota, beoardielje wy de oanwêzigens fan uscMG, lykas lineage- en domein-spesifike single-copy marker gen sets brûkt troch CheckM en Anvi'o.De identifikaasje fan 2 duplikaten út 40 uscMGs waard befêstige troch fylogenetyske rekonstruksje (sjoch hjirûnder) om elke potinsjele kontaminaasje út te sluten (dit komt oerien mei 5% basearre op dizze 40 markergenen).In ekstra stúdzje fan fiif represintative MAG's 'Ca.It lege nivo fan kontaminanten yn dizze rekonstruearre genomen waard befêstige foar Eremiobacterota-soarten mei de ynteraktive Anvi'o-ynterface basearre op oerfloed en sekwinsje-komposysjekorrelaasjes (oanfoljende ynformaasje)59.
Foar fylogenomyske analyze selekteare wy fiif represintative MAG's "Ca".Eudormicrobiaceae", alle soarten "Ca.It genoom fan Eremiobacterota en leden fan oare phyla (ynklusyf UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria en Planctomycetota) is beskikber fan GTDB (r89)13.Al dizze genomen waarden annotearre lykas earder beskreaun foar gen-ekstraksje fan ien kopymarker en BGC-annotaasje.De GTDB-genoom waarden bewarre neffens de boppesteande kritearia foar yntegriteit en fersmoarging.Phylogenetyske analyze waard útfierd mei de Anvi'o Phylogenetics59 workflow.De beam waard konstruearre mei IQTREE (v.2.0.3) (standert opsjes en -bb 1000) 80 op in ôfstimming fan 39 tandem ribosomale aaiwiten identifisearre troch Anvi'o (MUSCLE, v.3.8.1551)81.Syn posysjes waarden fermindere.om op syn minst 50% fan it genome82 te dekken en Planctomycecota waard brûkt as in útgroep basearre op de GTDB-beamtopology.Ien beam fan 40 uscMGs waard boud mei deselde ark en parameters.
Wy brûkten Traitar (v.1.1.2) mei standertparameters (fenotype, fan nukleotiden)83 om mienskiplike mikrobiele eigenskippen te foarsizzen.Wy ûndersocht in potinsjele rôfdierlike libbensstyl basearre op in earder ûntwikkele rôfdieryndeks84 dy't ôfhinklik is fan 'e ynhâld fan in proteïne-kodearjend gen yn it genom.Spesifyk brûke wy DIAMOND om aaiwiten yn it genom te fergelykjen mei de OrthoMCL-database (v.4)85 mei de opsjes -more-sensive -id 25 -query-cover 70 -subject-cover 70 -top 20 EN tel de genen dy't oerienkomme mei de markergenen foar predators en net-predators.De yndeks is it ferskil tusken it oantal rôfdierige en net-rôfdierige markearrings.As ekstra kontrôle analysearren wy ek it "Ca" genoom.De Entotheonella TSY118 faktor is basearre op syn assosjaasje mei Ca.Eudoremicrobium (grutte genoomgrutte en biosyntetyske potinsjeel).Dêrnei testen wy potinsjele keppelings tusken predator- en net-predatormarkergenen en it biosyntetyske potinsjeel fan Ca.Eudormicrobiaceae” en fûn dat net mear as ien gen (fan elk type markergen, dat wol sizze predator/non-predator gen) oerlapet mei BGC, wat suggerearret dat BGC predaasjesinjalen net ferwikselet.Oanfoljende genomyske annotaasje fan scrambled replikons waard útfierd mei TXSSCAN (v.1.0.2) om spesifyk it sekretesysteem, pili en flagella86 te ûndersiikjen.
Fiif represintative 'Ca's waarden yn kaart brocht troch 623 metatranskriptomen yn kaart te bringen fan 'e prokaryotyske en eukaryotyske ferrikingsfraksjes fan 'e Tara-oseanen22,40,87 (mei BWA, v.0.7.17-r1188, -a flagge).Eudormicrobiaceae genome.BAM-bestannen waarden ferwurke mei FeatureCounts (v.2.0.1)88 nei 80% lêsdekking en 95% identiteitsfiltering (mei opsjes featureCounts -primary -O -fraksje -t CDS,tRNA -F GTF -g ID -p ) Telt de oantal ynserts per gen.De generearre kaarten waarden normalisearre foar gen-lingte en marker-gen-oerfloed mOTU (lingte-normalisearre gemiddelde ynfoegjetelling foar genen mei ynfoegjetelling> 0) en log-transformearre nei 22.74 om de relative ekspresje per sel fan elk gennivo te krijen, wat ek ferklearret de fariabiliteit fan stekproef nei it stekproef tidens sequencing.Sokke ferhâldingen tastean ferlykjende analyse, mitigating komposysje problemen by it brûken fan relative oerfloed gegevens.Allinich samples mei> 5 fan 'e 10 mOTU-markergenen waarden beskôge foar fierdere analyze om in grut genôch diel fan it genoom te ûntdekken.
It normalisearre transkriptoomprofyl fan 'Ca.E. taraoceanii waard ûnderwurpen oan dimensionality reduksje mei help fan UMAP en de resultearjende fertsjintwurdiging waard brûkt foar unsupervised clustering mei help fan HDBSCAN (sjoch hjirboppe) te bepalen ekspresje status.PERMANOVA test de betsjutting fan ferskillen tusken identifisearre klusters yn 'e orizjinele (net fermindere) ôfstânromte.Differinsjaal ekspresje tusken dizze betingsten waard hifke oer it genome (sjoch hjirboppe) en 201 KEGG-paden waarden identifisearre yn 6 funksjonele groepen, nammentlik: BGC, sekretiesysteem en flagellêre genen fan TXSSCAN, degradaasjeenzymen (protease en peptidases), en predatory en non- rôfdierige genen.predatory index markers.Foar elke stekproef hawwe wy de mediaan normalisearre ekspresje foar elke klasse berekkene (notysje dat BGC-ekspresje sels wurdt berekkene as de mediaan-ekspresje fan biosyntetyske genen foar dat BGC) en hifke foar betsjutting oer steaten (Kruskal-Wallis-test oanpast foar FDR).
Syntetyske genen waarden kocht fan GenScript en PCR-primers waarden kocht fan Microsynth.Phusion-polymerase fan Thermo Fisher Scientific waard brûkt foar DNA-amplifikaasje.NucleoSpin plasmiden, NucleoSpin gel en PCR suvering kit fan Macherey-Nagel waarden brûkt foar DNA suvering.Beheiningsenzymen en T4 DNA-ligase waarden kocht fan New England Biolabs.Chemicals oars as isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) en 1,4-dithiothreitol (DTT, AppliChem) waarden kocht fan Sigma-Aldrich en brûkt sûnder fierdere suvering.De antibiotika chloramphenicol (Cm), spectinomycin dihydrochloride (Sm), ampicilline (Amp), gentamicin (Gt), en carbenicilline (Cbn) waarden kocht fan AppliChem.Bacto Tryptone en Bacto Yeast Extract mediakomponinten waarden kocht fan BD Biosciences.Trypsin foar sequencing waard kocht fan Promega.
Gen-sekwinsjes waarden ekstrahearre út anty-SMASH foarsein BGC 75.1.E. malaspinii (oanfoljende ynformaasje).
De genen embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), en embAM (ynklusyf intergene-regio's) waarden konstruearre mei pUC7-sequences sûnder codon-regio's (ynklusyf intergene-regio's) foar ekspresje yn E wannear.It embA-gen waard subklonearre yn 'e earste multiple cloning site (MCS1) fan pACYCDuet-1 (CmR) en pCDFDuet-1 (SmR) mei BamHI en HindIII cleavage sites.De embM- en embMopt-genen (codon-optimalisearre) waarden subklonearre yn MCS1 pCDFDuet-1 (SmR) mei BamHI en HindIII en pleatst yn 'e twadde meardere kloningsside fan pCDFDuet-1 (SmR) en pRSFDuet-1 (KanR) (MCS2) mei NdeI/ChoI.De embAM-kassette waard subklonearre yn pCDFDuet1 (SmR) mei BamHI- en HindIII-splitsingsplakken.It orf3/embI-gen (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) waard konstruearre troch oerlap-útwreiding PCR mei help fan primers EmbI_OE_F_NdeI en EmbI_OE_R_XhoI, digested mei NdeI/XhoI, en ligated yn (MCD-Embion) lementary tafel).6).Beheining enzyme digestion en ligaasje waard útfierd neffens it protokol fan 'e fabrikant (New England Biolabs).
Post tiid: Mar-14-2023