Gli esperti dicono che è probabile che una qualche versione della malattia indugi per anni. Ma come sarà in futuro è meno chiaro.
Il coronavirus, che ha già ucciso più di 2 milioni di persone in tutto il mondo, alla fine sarà eliminato da una campagna di vaccinazione globale, come il vaiolo?
Le nuove varianti pericolose eludono i vaccini? O il virus rimarrà in giro per molto tempo, trasformandosi in un lieve fastidio, come il comune raffreddore?
Alla fine, il virus noto come SARS-CoV-2 diventerà ancora “un altro animale nello zoo”, unendosi alle molte altre malattie infettive con cui l’umanità ha imparato a convivere, ha previsto il Dr. T. Jacob John, che studia i virus ed è stato al timone degli sforzi dell’India per affrontare la poliomielite e l’HIV / AIDS.
Ma nessuno lo sa con certezza. Il virus si sta evolvendo rapidamente e nuove varianti stanno spuntando in diversi paesi. Il rischio di queste nuove varianti è stato sottolineato quando Novavax Inc. Più il virus si diffonde, dicono gli esperti, più è probabile che una nuova variante diventi in grado di eludere i test, i trattamenti e i vaccini attuali.
Per ora, gli scienziati concordano sulla priorità immediata: vaccinare quante più persone possibile. Il prossimo passo è meno certo e dipende in gran parte dalla forza dell’immunità offerta dai vaccini e dalle infezioni naturali e da quanto dura.
“Le persone saranno spesso soggette a infezioni ripetute? Non abbiamo ancora abbastanza dati da sapere”, ha detto Jeffrey Shaman, che studia virus alla Columbia University. Come molti ricercatori, ritiene che le probabilità siano scarse che i vaccini conferiranno l’immunità per tutta la vita.
Se gli esseri umani devono imparare a convivere con covid-19, la natura di tale coesistenza dipende non solo dalla durata dell’immunità, ma anche da come si evolve il virus.
Muta in modo significativo ogni anno, richiedendo scatti annuali, come l’influenza?
Questa domanda su ciò che accadrà dopo ha attirato Jennie Lavine, una virologa dell’Università di Emory, che è co-autrice di un recente articolo su Science che ha proiettato uno scenario relativamente ottimista: dopo che la maggior parte delle persone è stata esposta al virus – attraverso la vaccinazione o le infezioni sopravvissute – l’agente patogeno “continuerà a circolare, ma causerà principalmente solo malattie lievi”, come un raffreddore di routine.
Mentre l’immunità acquisita da altri coronavirus – come quelli che causano il raffreddore comune o la SARS o il MERS – diminuisce nel tempo, i sintomi sulla reinfezione tendono ad essere più lievi della prima malattia, ha detto Ottar Bjornstad, co-autore del documento Science che studia virus alla Pennsylvania State University.
“Gli adulti tendono a non avere sintomi molto cattivi se sono già stati esposti”, ha detto.
La previsione nel documento Science si basa su un’analisi di come altri coronavirus si sono comportati nel tempo e presuppone che SAR-CoV-2 continui ad evolversi, ma non rapidamente o radicalmente.
La pandemia influenzale del 1918 potrebbe offrire indizi sul corso del COVID-19. Quell’agente patogeno era un virus H1N1 con geni originati dagli uccelli, non un coronavirus. All’epoca non erano disponibili vaccini.
I Centri statunitensi per il controllo e la prevenzione delle malattie stimano che un terzo della popolazione mondiale sia stato infettato. Alla fine, dopo che le persone infette sono morte o hanno sviluppato l’immunità, il virus ha smesso di diffondersi rapidamente. In seguito è mutato in una forma meno virulento, che secondo gli esperti continua a circolare stagionalmente.
“Molto comunemente i discendenti delle pandemie influenzali diventano i virus influenzali stagionali più lievi che sperimentiamo da molti anni”, ha detto Stephen Morse, che studia virus alla Columbia University.
Man mano che emergono nuove varianti – alcune più contagiose, alcune più virulenti e alcune forse meno reattive ai vaccini – agli scienziati viene ricordato quanto non sappiano ancora del futuro del virus, ha detto Mark Jit, che studia i virus alla London School of Hygiene and Tropical Medicine.
“Conosciamo questo virus solo da circa un anno, quindi non abbiamo ancora dati per mostrare il suo comportamento in cinque anni o 10 anni”, ha detto.
Degli oltre 12 miliardi di colpi di vaccino contro il coronavirus realizzati nel 2021, i paesi ricchi hanno acquistato circa 9 miliardi e molti hanno opzioni per acquistarne di più. Questa disuguaglianza è una minaccia poiché comporterà che i paesi più poveri dovranno aspettare più a lungo per il vaccino, durante il quale la malattia continuerà a diffondersi e uccidere le persone, ha detto Ian MacKay, che studia virus presso l’Università del Queensland.
Che alcuni vaccini sembrino meno efficaci contro i nuovi ceppi è preoccupante, ma poiché gli scatti forniscono una certa protezione, i vaccini potrebbero ancora essere usati per rallentare o impedire la diffusione del virus, ha detto Ashley St. John, che studia il sistema immunitario alla Duke-NUS Medical School di Singapore.
Il Dr. Gagandeep Kang, un esperto di malattie infettive al Christian Medical College di Vellore, nel sud dell’India, ha affermato che l’evoluzione del virus solleva nuove domande: a che punto il virus diventa un nuovo ceppo? I paesi dovranno vaccinarsi da zero? O si potrebbe dare una dose di richiamo?
“Queste sono domande che dovrai affrontare in futuro”, ha detto Kang.
Il futuro del coronavirus può essere in contrasto con altre malattie altamente contagiose che sono state in gran parte battute da vaccini che forniscono l’immunità per tutta la vita, come il morbillo. La diffusione del morbillo diminuisce dopo che molte persone sono state vaccinate.
Ma la dinamica cambia nel tempo con nuove nascite, quindi i focolai tendono ad arrivare in cicli, ha spiegato il Dr. Jayaprakash Muliyil, che studia le epidemie e consiglia l’India sulla sorveglianza dei virus.
A differenza del morbillo, i bambini infetti da COVID-19 non sempre mostrano sintomi chiari e potrebbero ancora trasmettere la malattia agli adulti vulnerabili. Ciò significa che i paesi non possono distorne la guardia, ha affermato.
Un’altra incognita è l’impatto a lungo termine del COVID-19 sui pazienti che sopravvivono ma sono incapaci da mesi, ha detto Kang.
La “quantificazione di questo danno” – quante persone non possono fare lavoro manuale o sono così esauste che non possono concentrarsi – è la chiave per comprendere tutte le conseguenze della malattia.
“Non abbiamo avuto molte malattie che hanno colpito persone di dimensioni come questa”, ha detto.
Nel dicembre 2019, la Cina ha notificato all’Organizzazione Mondiale della Sanità (OMS) che diverse persone con grave polmonite erano state ricoverate in un’unità di terapia intensiva presso l’ospedale Jin-Yin- Tan nella città di Wuhan nella provincia cinese di Hubei [1-3]. È stato presto stabilito che questi pazienti sono stati infettati da un virus mai osservato negli esseri umani prima.
Questo nuovo coronavirus, grave sindrome respiratoria acuta coronavirus 2 (SARS-CoV-2), che appartiene alla famiglia Coronaviridae, genere Betacoronavirus e sottogenere Sarbecovirus, ha un genoma lineare RNA a singolo filamento positivo di 29,9 kb [1-6]. Insieme alla SARS- CoV e alla MERS-CoV, la SARS-CoV-2 è uno dei COV che può causare gravi malattie nella popolazione umana [7].
I betacoronavirus, come SARS-CoV o MERS-CoV, hanno una propensione per ospitare il salto da varie specie di mammiferi all’uomo. Simile a questi altri coronavirus, SARS-CoV-2 ha certamente un’origine zoonotica, condividendo l’identità del 96,2% con un ceppo di pipistrelli CoV, RaTG13, che è stato trovato nei pipistrelli a ferro di cavallo [1].
Data la situazione attuale, è essenziale monitorare la diversità di questo nuovo agente patogeno umano e le sue potenziali implicazioni per la patogenicità e l’infettività. La diversità della SARS-CoV-2 è il risultato della combinazione di modelli di variabilità a livello di popolazione e di intra-ospite, che sono prodotti di processi selettivi, stocastico e spazio-temporale [8].
L’analisi filogenetica delle sequenze genomiche consensuali di SARS-CoV-2 ottenute da tutto il mondo rivela una struttura determinata da modelli geografici e temporali di trasmissione. Il clade più grande della filogenesi SARS-CoV-2 è definito dalla presenza della mutazione 614G nella glicoproteina spike (S) [9].
La proteina SARS-CoV-2 S si lega all’enzima 2 (ACE2) che converte l’angiotensina sulla superficie della membrana cellulare umana mediando la fusione e l’ingresso del virus. Lo studio dell’evoluzione di questa proteina nei focolai di altri coronavirus suggerisce che svolge un ruolo importante nel salto interspecie e nell’adattamento al recettore ACE2, determinando l’infettività del virus [10,11].
In vari paesi, le sequenze virali che portano la mutazione D614G sono diventate predominanti dopo l’introduzione, suggerendo un vantaggio adattivo legato all’infettività [12-14]. Tuttavia, queste conclusioni sono state contestate in altri studi [15,16]. Un altro gene responsabile dell’attuale strutturazione filogenetica della SARS-CoV-2 è ORF1.
Questo gene è composto da due frame di lettura aperti (ORF) (a e b) che codificano per 16 proteine non strutturali (nsps) che compongono il complesso di replicazione-trascrizione virale, inclusa l’RNA polimerasi dipendente dall’RNA (nsp12), [17]. ORF1 mostra il maggior numero di mutazioni di missense nella SARS-CoV-2 [9], principalmente nel gene nsp3, un modello che è stato osservato anche in MERS-CoV [17].
Una delle principali mutazioni identificate nel gene ORF1b SARS-CoV-2 è P314L, che si verifica contemporaneamente alla mutazione D614G del gene S [9]. Si prevede che il gene ORF1 abbia acquisito le mutazioni adattive necessarie per adattare il meccanismo di replicazione virale al nuovo ospite, come mostrato nell’adattamento del virus dell’influenza aviaria agli ospiti di mammiferi [18,19].
Pertanto, la mutazione P314L può accelerare la replicazione virale [9]. Tuttavia, per quanto ne so, nessun studio ha affrontato questa ipotesi.
La proteina nucleocapside (N) è una proteina strutturale coinvolta nel confezionamento dell’RNA virale [20]. Il nucleocapside della SARS-CoV-2, insieme alla proteina S, modula la risposta anticorpale [21]. Due importanti mutazioni in questo gene, R203K e G204R, si trovano in sequenze che portano la mutazione D614G nel gene S e la mutazione P314L nel gene ORF1b.
Pertanto, queste mutazioni possono essere correlate all’interazione della proteina N con la proteina di membrana della SARS-CoV-2 [22].
La diversità intra-ospite dei virus dell’RNA è associata al concetto di quasispecie. Una quasispecie è una nuvola di diverse varianti che sono geneticamente collegate attraverso la mutazione, che interagiscono in modo cooperativo a livello funzionale e che contribuiscono collettivamente alla caratteristiche della popolazione [23].
Il sequenziamento profondo ha rivelato prove di quasispecie in SARS-CoV [24-27] e MERS-CoV [28-31]. Questa diversità intra-ospite contribuisce all’adattamento di questi virus all’ospite umano. L’analisi della sequenza MERS-CoV mostra una cancellazione fuori dal frame, che porta alla perdita di gran parte della subunità S2 della proteina S e con conseguente produzione di una proteina accorciata che porta solo 801 amminoacidi.
Sebbene si prevede che questa cancellazione porti alla produzione di virus difettosi, in alternativa, questa mutazione può bloccare anticorpi neutralizzanti MERS-CoV specifici del picco [32]. Durante l’out-break di MERS-CoV nella Repubblica di Corea nel 2015, il virus che presenta le mutazioni D510G e I529T a diverse frequenze intra-ospiti nel dominio di legame recettore (RBD) della proteina S ha mostrato una maggiore resistenza contro gli anticorpi monoclonali neutralizzanti e una ridotta sensibilità alla neutralizzazione mediata dagli anticorpi [29].
Una questione importante nell’attuale pandemia è determinare la diversità della quasispecie SARS-CoV-2 e i suoi potenziali contributi alla diversità della popolazione e all’adattamento ai virus. Abbiamo quindi studiato la dinamica della diversità delle varianti intra-host in un periodo di sei settimane utilizzando sequenze pubbliche di sequenziamento di nuova generazione (NGS) SARS-CoV-2 dallo Stato di Victoria (Australia).
La diversità della SARS-CoV-2 a Victoria è un’istantanea della diversità globale, perché (i) la maggior parte dei pazienti infetti ha acquisito il virus all’estero e lo ha importato in Australia e (ii) l’analisi epidemiologica mostra che la trasmissione successiva del contagio è stata limitata [33].
Abbiamo analizzato la diversità intra-ospite dei geni S, N e ORF1 di 210 campioni dello Stato di Victoria raccolti tra febbraio e aprile 2020. In primo luogo, abbiamo descritto la frequenza e la presenza di varianti mono nucleotidiche intra-ospiti (iSNV) sinonimi e non sinonymosi nei geni SARS-CoV-2. Quindi, abbiamo studiato i cambiamenti nella diversità degli iSGV condivisi nel tempo. Infine, abbiamo analizzato la distribuzione della diversità degli iSGV nei diversi cladi dell’albero filogenetico delle sequenze di consenso. I nostri risultati mostrano prove della trasmissione di iSNV e della modifica nel tempo in questa diversità.
Materiali e metodi
Campioni
In totale, 217 campioni di PRJNA613958 BioProject e metadati correlati sono stati recuperati dal sito Web NCBI utilizzando lo SRA-Toolkit (http://ncbi.github.io/sra-tools/). Questo BioProject coinvolge più di 1000 campioni NGS australiani dello Stato di Victoria. Il nostro set di dati rappresenta un sottocampione di questo BioProject ottenuto tra il 31 gennaio 2020 e l’8 aprile 2020. I nostri criteri di selezione riguardavano sequenze ottenute utilizzando solo la tecnologia NextSeq 550.
Identificazione degli iSGV
Gli iSNV sono stati identificati nei geni ORF1a, ORF1b, S e N del genoma SARS-CoV-2 in ciascuno dei campioni. La Commissione ha ritenuto che gli iSGV siano quelli con una frequenza alternativa mediana (AAF) compresa tra il 5% e il 50%. La pipeline di bioinformatica ha comportato i seguenti passaggi: taglio di lettura di bassa qualità con Trimmomatic [34]; allineamento delle letture mediante Bowtie2 [35] con la sequenza di riferimento SARS-CoV-2 [3]; conversione degli stessi allineamenti di file in file BAM mediante samtool [36]; ordinamento dei file bam e rilevamento di sequenze duplicate con MarkDuplicate (http://broadinstitute.github.io/picard/). Gli script ViVarSeq [37] hanno derivato una sequenza di consenso dagli allineamenti ottenuti nell’ultimo passaggio.
Le letture rifilate sono state riallineate alla sequenza di consenso usando Bowtie2. VirVarSeq ha identificato le varianti e le relative frequenze. Questa pipeline era semi-automatizzata con Snakemake [38].
In ciascuno dei geni, gli iSGV sono stati identificati solo in campioni con una copertura minima di 30 letture per il 90% delle posizioni analizzate. Le posizioni genomiche con meno di 30 letture e/o un punteggio Phred inferiore a 20 sono state scartate per l’identificazione delle varianti. Abbiamo considerato solo varianti supportate da almeno 5 letture. Parallelamente, abbiamo identificato gli iSGV nel genoma SARS-CoV-2 con il V-Phaser2 [39]. Nell’analisi sono stati inclusi solo i SUV che soddisfano i suddetti criteri di qualità e identificati anche da V-Phaser2.
Complessivamente, 210 di questi campioni corrispondevano ai nostri criteri per almeno uno dei geni SARS-CoV-2 in esame, 5 campioni sono stati eliminati per non aver presentato una copertura sufficiente e 2 per presentare più di 100 varianti (outlier). La figura S1 presenta la copertura e la profondità dei quattro geni SARS-CoV-2 nei 210 campioni. La mediana delle letture per ciascuna delle posizioni variava tra 92 e 3100 per il gene S, 76 e 4160 per ORF1a, 392 e 4324 per ORF1b e dal 318 al 2987 per il gene N. Il punteggio phred mediano nelle posizioni con iSGV era 34 (IQR (33-35)) e il numero medio di letture che rappresentavano uno specifico iSNV era 40 (IQR (23–120)).
Dinamiche temporali della diversità iSNV
I modelli di variazione temporale nella diversità degli iSGV sinonimi e non sinony-mous erano rappresentati utilizzando i pacchetti ggplot2 [40] ed EvoFreq [41].
Identificazione degli aplotipi iSNV
Per determinare se gli iSGV non sinoniosi cosegregate nelle stesse sequenze (tipi aplo), tutte le letture che coprono la regione specifica del genoma SARS-CoV-2 contenente queste varianti sono state identificate utilizzando il modulo pysam (https://pysam.readthedocs.io/en/latest/faq.html) di Python dall’allineamento delle letture alla sequenza di riferimento di questo virus. In ogni posizione della regione di interesse, sono state identificate le letture e i rispettivi nucleotidi. Con queste informazioni, abbiamo determinato la proporzione delle letture che portava la combinazione di varianti di interesse.
Convalida degli aplotipi iSNV con altri set di dati di sequenza
L’esistenza degli aplotipi virali nel gene S è stata verificata in due sottoinsiemi di campioni aggiuntivi disponibili presso NCBI: 232 campioni da PRJNA625551 BioProject e 120 campioni da PRJNA610428 BioProject.
Analisi filogenetica
Per questa analisi, 863 sequenze di SARS-CoV-2 da Victoria sono state recuperate il 29 giugno 2020 da GISAID [42] utilizzando i criteri di sequenza completa ed esclusione della bassa copertura. Per migliorare il segnale temporale dell’analisi filogenetica, sono state recuperate anche 14 sequenze dalla regione di Wuhan raccolte durante il mese di gennaio 2020 e la sequenza di riferimento da SARS-CoV-2 dal sito web di GISAID.
Le sequenze dei geni ORF1, S e N sono state concatenate e allineate usando MAFFT [43]. Questi allineamenti sono stati ispezionati visivamente con Unipro UGENE [44]. Il segnale filogenetico e temporale di questo allineamento è stato analizzato secondo le linee guida suggerite in Mavian et al.
Il segnale filogenetico è stato valutato utilizzando iqtree [46] con l’analisi di mappatura della verosimiglianza. Per esplorare la presenza di un segnale temporale, è stata applicata una ricostruzione filogenetica utilizzando il software iqtree [47,48] con l’opzione -m raggruppata in TEST, consentendo l’identificazione del miglior modello per le partizioni che rappresentano i quattro geni e un’analisi bootstrap di 1000 repliche.
Gli outlier sono stati identificati in questo albero filogenetico con il software TempEst [49], utilizzando l’analisi di regressione della distanza filogenetica delle punte alla radice e il tempo di raccolta. Questo albero potato è stato scalato con un software treedater [50] utilizzando un rigoroso orologio molecolare. I cluster filogenetici sono stati annotati utilizzando il software Pangolin (https://github.com/cov-lineages/pangolin).
Identificazione SNV
Varianti mono nucleotidiche (SGV) nelle sequenze di consenso GISAID e NGS sono state identificate dall’allineamento multiplo con il pacchetto QSutils [51] in R. Mutazioni presenti in almeno l’1% dei campioni sono stati inclusi nello studio.
Discussione
Diversità degli iSGV SARS-CoV-2
La nostra analisi ha dimostrato che una percentuale significativa delle sequenze SARS-CoV-2 dei geni S, N e ORF1 ha evidenziato la diversità delle quasispecie. Questo risultato conferma studi precedenti che hanno mostrato variabilità intra-ospite durante epidemie di SARS- CoV [24-27], MERS-CoV [28-31] e più recentemente SARS-CoV-2 [52-55]. Il numero medio di iSGV per paziente stimato nel nostro studio era basso rispetto agli studi precedenti in cui è stato stimato un elevato numero di varianti minoritarie per campione [52-55].
Tuttavia, i nostri risultati sono stati coerenti con un’analisi approfondita dei dati NGS disponibili per sars-CoV-2 della NBCI [53]. Riteniamo che queste differenze siano dovute a strategie di sequenziamento, pipeline bioinformatiche e criteri di filtraggio che possono portare a questo tipo di discrepanza [56]. Qui, abbiamo optato per un approccio conservativo in cui sono stati selezionati solo i SUV identificati utilizzando due diverse strategie.
Abbiamo scoperto che le sostituzioni intra-host più frequenti in Victoria sono G > T, C
T, T > C e A > G. Studi precedenti hanno dimostrato l’importante ruolo che le mutazioni C > T e T > C svolgono nella dinamica dei SUV nelle sequenze di consenso della SARS-CoV-
Le sostituzioni C > T possono essere il prodotto di un meccanismo di difesa ospite mediato da enzimi della famiglia APOBEC3 [57,58]. Un confronto dei modelli di sostituzione intra- e inter-host in campioni provenienti da due diverse città degli Stati Uniti ha rilevato un’elevata prevalenza di sostituzioni di C > T (ad eccezione della diversità intra-host in una città) [54].
La trasversione G > T è il terzo tipo più comune di sostituzione nelle sequenze di consenso della SARS-CoV-2 in tutto il mondo, ma in Asia e Oceania è il secondo tipo più comune [59]. Allo stesso modo, i nostri risultati indicano che le sostituzioni nucleotidiche più frequenti erano G > T e C > T, suggerendo differenze locali nei modelli di sostituzione. L’alta frequenza della trasversione G > T nelle sequenze SARS-CoV-2 è sorprendente, perché le transizioni sono più probabili delle trasversioni [60]. Questa trasversione è probabilmente iniziata da 8-ossoguanina derivata da una specie reattiva di ossigeno [61], il che implica il ruolo attivo dello stress ossidativo nell’emergere di questa variazione, un’ipotesi che necessita di ulteriori indagini.
Abbiamo concentrato la nostra analisi sui geni che hanno giocato un ruolo importante nell’adattamento di SARS-CoV [24] e MERS-CoV [28-30] all’ospite umano, e quelli in SARS-CoV-2 che modulano la risposta anticorpale [21]. La maggior parte degli iSGV in questi geni non erano sinonimi. Questa predominanza di sostituzioni non sinonymosi è già stata documentata per la SARS-CoV-2, sia a livello di sequenza di consenso [57,58], sia a livello intra-host [53,54]. Come accennato in precedenza, le sostituzioni C > T e G > T erano predominanti nel set di dati. Poiché almeno C > T può essere il prodotto dell’azione del sistema di difesa enzimatica dell’ospite, la maggior parte delle mutazioni non sinonymose nella SARS-CoV-2 probabilmente non comportano un vantaggio selettivo.
Sebbene una percentuale significativa della diversità delle quasispecie SARS-CoV-2 possa non rappresentare una variazione adattiva, il virus è probabilmente sotto pressione selettiva a causa del salto dell’interspecie verso un nuovo ospite. Questo processo adattivo dovrebbe essere particolarmente evidente nelle proteine coinvolte nella patogenicità del virus e nelle proteine non strutturali che interagiscono con il sistema immunitario dell’ospite. I nostri dati hanno mostrato che il gene S ha la più alta densità di varianti non sinonymose dei quattro geni analizzati.
La sostituzione amminoacido G446V è stata identificata nel dominio RBD della proteina S coinvolta nel legame con il recettore ACE2 umano. Inoltre, la mutazione del G999C è stata osservata nelle regioni HR coinvolte nella fusione della membrana durante l’ingresso del virus nella cellula ospite. suggeriscono che il dominio RBD e le regioni HR hanno svolto un ruolo determinante nell’adattamento della SARS-CoV all’ospite umano [10].
Questi autori hanno identificato due gruppi di siti di amminoacidi sotto selezione positiva in sequenze di consenso: uno relativo al salto interspecie, presente principalmente nel dominio RBD, e l’altro, coinvolto nell’adattamento al nuovo ospite e abbondante nella regione HR. Poiché i nostri campioni derivano dalla fase iniziale dell’adattamento della SARS-CoV-2 all’ospite umano, è difficile affermare il valore adattivo degli iSGV identificati nelle importanti regioni funzionali del gene S. Tuttavia, l’emergere di questa variabilità in regioni critiche per la patogenicità del virus richiede il tracciamento spaziale e temporale.
Il gene ORF1a ha mostrato un numero significativo di iSGV non sinonimi nel gruppo late, e alcune di queste sostituzioni avevano AAF superiori al 20%. Vi sono prove di un’ampia selezione positiva che agisce sul MERS-CoV ORF1a [17]. Questa pressione selettiva su un gene che codifica per proteine non strutturali può essere correlata all’interazione di queste proteine con il sistema immunitario umano. In alternativa, il meccanismo di replicazione codificato dal gene ORF1a può essere un elemento essenziale per l’adattamento del virus al suo nuovo ospite, come stabilito per l’adattamento dei virus dell’influenza aviaria A agli ospiti dei mammiferi [18].
Il gene N aveva pochi iSGV non sinonimi. Abbiamo identificato la variante A29039T che ha portato alla sostituzione della lisina con un codone di stop nella posizione 256. Una precedente analisi che ha caratterizzato l’evoluzione dei lignaggi virali e la trasmissione in SARS-CoV-2, considerando sia le informazioni di consenso che gli iSGV, ha trovato anche la variante A29039T in una proporzione significativa dei campioni analizzati. Questa concordanza dei risultati alza una bandiera rossa per quanto riguarda l’efficacia di un vaccino SARS-CoV-2 diretto contro la proteina N, perché il codone stop prodotto da A29039T colpisce la regione del linker sopprimendo il dominio immunogenico di questa proteina [62].
Aplotipi virali e quasispecie
Studi recenti hanno dimostrato la presenza di diversi aplotipi quando si confronta la diversità tra l’apparato respiratorio e il tratto intestinale [63,64]. Qui, abbiamo identificato quattro potenziali aplotipi virali nei geni SARS-CoV-2 studiati. Poiché non siamo stati in grado di confermare sperimentalmente la presenza di questi aplotipi, ad esempio con PCR digitale [65], abbiamo verificato la presenza di quello più inaspettato, l’aplotipo N30G/S31Stop/F32Stop/R34P/G35R del gene S, in un sottoinsieme di campioni di una coorte nordamericana.
Questo aplotipo è stato trovato in 10 dei 232 campioni analizzati che sono stati raccolti nello stesso periodo di tempo di quelli australiani, con una frequenza che va dal 3% al 32% (tabella S5). Sia le sequenze americane che australiane sono state ottenute con la strategia ARTIC PCR-tiling, che coinvolge un alto numero di ampliconi sovrapposti di ~ 400bp [66].
Abbiamo osservato che questo aplotipo rientrava nella regione target di uno dei 218 primer ARTIC. È stato suggerito che la mancata rimozione dei primer dalle letture di sequenziamento potrebbe portare a una sottovalutazione della frequenza degli iSGV [67]. Il taglio dei primer ARTIC dalle letture non ha influito sull’identificazione e sulla frequenza dell’aplotipo N30G/S31Stop/F32Stop/R34P/G35R nel gene S (Tabella S6).
Al fine di valutare un potenziale pregiudizio relativo alla procedura ARTIC, abbiamo analizzato 120 campioni aggiuntivi da un altro set di dati ottenuto dalla metagenomica. In questo set di dati, non siamo stati in grado di recuperare nessuna delle mutazioni che fanno parte dell’aplotipo proposto nel gene S. Tuttavia, la profondità di sequenziamento era molto più bassa in questi dati e abbiamo notato un numero significativo di iSGV per campione in questa coorte, suggerendo una scarsa qualità dei dati di sequenziamento.
Una profondità di sequenziamento così bassa lo rende inadatto all’identificazione di varianti minoritarie, spiegando eventualmente la mancata identificazione dell’aplotipo (dati non mostrati). Abbiamo anche verificato che l’aplotipo non rientrava in una regione nota per essere soggetta a artefatti di sequenziamento illumina [68], poiché la procedura ARTIC è stata applicata su tutti i campioni della coorte australiana. Pertanto, se non si può escludere che questo potenziale aplotipo sia il risultato del sequenziamento di artefatti legati alla strategia dell’amplicon ARTIC, la sua distribuzione asimmetrica tra i gruppi di varianti Early e Late rimane difficile da spiegare, poiché la strategia ARTIC è stata applicata su tutti i campioni della coorte australiana.
(2020) ha identificato diverse depurazione a monte del sito di scissione S1/S2 della proteina S, in uno studio che includeva pazienti con sintomi lievi e gravi di COVID-19. Queste cancellazioni erano presenti alle basse frequenze e portarono a codoni in-frame stop. La presenza di codoni stop vicino al sito di scissione di S1/S2 ha portato alla perdita della traduzione S2.
Gli autori hanno proposto che la subunità S1 prodotta da questo aplotipo difettoso sia rilasciata come proteina libera nello spazio extracellulare. Questa proteina S1 libera potrebbe legarsi al recettore delle cellule ACE2 umano, competendo così con particelle virali complete e riducendo la gravità dell’infezione.
In questo scenario, la trasmissione degli aplotipi che portano eliminazioni rappresenta un vantaggio selettivo poiché l’attenuazione dell’infezione aumenta la trasmissione virale [69]. Tuttavia, questo studio non propone uno scenario molecolare per capire come vengono trasmessi questi aplotipi con solo subunità S1. La nostra analisi ha identificato diversi altri aplotipi con alte frequenze, come 853Stop/854A/856H nel gene ORF1a (~27%), sostenendo i risultati precedenti e sollevando la questione del ruolo di questi potenziali aplotipi virali difettosi all’interno della quasispecie. Ulteriori ricerche sperimentali sono necessarie per valutare queste ipotesi.
Cambiamenti nella diversità degli iSGV SARS-CoV-2 nel tempo
Abbiamo osservato che la diversità degli iSNV SARS-CoV-2 è cambiata nel tempo, tra i pazienti. Questo cambiamento implicava l’emergere di un modello più eterogeneo di diversità (gruppo tardo) che occasionalmente influenzava importanti regioni antigeniche delle proteine del virus. L’avvento di questo cosiddetto gruppo tardo è stato concomitante al picco epidemico nello Stato di Victoria e alle relative azioni di salute pubblica, come la chiusura del confine australiano e la dichiarazione dello stato di emergenza [33].
La popolazione del gruppo tardo è stata arricchita in pazienti che avevano acquisito il virus attraverso trasmissioni locali. Questa relazione non implica causalità e occorre prestare attenzione date le limitate informazioni epidemiologiche e cliniche incluse nella nostra analisi. Altre variabili epidemiologiche e informazioni provenienti dai cluster di trasmissione possono contribuire a chiarire l’emergere della diversità osservato nel gruppo Late.
È stato dimostrato che i pazienti con gravi sintomi di COVID-19 presentano una diversità intra-ospite più importante rispetto ai pazienti con sintomi lievi [70]. Inoltre, Kuipers et al. Vale la pena esplorare l’identificazione di questi fattori che inducono una nuova diversità in un’analisi approfondita dei dati genomici esistenti integrati con ampie informazioni epidemiologiche e cliniche.
Trasmissione e collo di bottiglia di iSNV SARS-CoV-2
Quasi un terzo della quasispecie di SARS-CoV-2 in Victoria è stato condiviso tra i pazienti, suggerendo la trasmissione da ospite a ospite. Se i potenziali artefatti sono esclusi, ogni iSNV sarebbe condiviso da una mediana di tre pazienti. Diversi studi suggeriscono un collo di bottiglia genetico relativamente importante nella SARS-CoV-2 [55,64,72,73].
Analizzando la diversità intra-ospite del gene S in due ammassi di trasmissione, Sun et al. Tale collo di bottiglia così stretto è stato dimostrato anche nell’analisi della trasmissione domestica, che ha anche suggerito che questa trasmissione è governata da processi stocastica [73].
I nostri risultati suggeriscono che sebbene la trasmissione possa essere limitata, questo processo non sembra essere casuale. Meno di un terzo delle varianti non sinonymo sono state condivise tra i campioni; tuttavia, rappresentavano il 70% del numero totale di occorrenze. Questa trasmissione non casuale della diversità delle quasispecie è stata osservata in altri virus dell’RNA [74,75], e ci si potrebbe aspettare che alcune di queste varianti abbiano avuto un ruolo nella risposta del virus al sistema immunitario.
Altri fattori possono- almeno parzialmente – spiegare i modelli di diversità condivisa della SARS- CoV-2 nel Victoria. Come suggerito sopra, l’azione degli enzimi APOBEC3 può portare a caratteristici profili di sostituzione dei nucleotidi neutri o deleteri nel SARS-CoV-2. Questi enzimi agiscono in contesti di sequenza specifici, che causano la ricorrenza delle sostituzioni, come suggerito nelle sequenze genomiche SARS-CoV-2 [16]. È possibile che una parte della diversità degli iSGV condivisa tra i pazienti sia il prodotto di questa ricorrenza mediata dal sistema di difesa dell’ospite.
Questa ipotesi potrebbe spiegare la presenza degli stessi iSGV in diversi cladi filogenetici. Al contrario, alcuni dei SUV identificati nello studio attuale sono stati condivisi esclusivamente da pazienti con lo stesso o uno stretto lignaggio Pangolin. Quindi, è necessario determinare in che misura la diversità degli iSGV è dovuta alla trasmissione tra pazienti o ai meccanismi intra-ospiti de novo nella SARS-CoV-2.
Studiare se gli iSGV vengono trasmessi, generati de novo o entrambi, richiede un’analisi longitudinale su larga scala dell’evoluzione della variabilità intra e inter-host. È probabile che sia la trasmissione che la generazione de novo contribuiscano alla diversità delle quasispecie SARS-CoV-2.
Qui, abbiamo trovato prove della diversità delle quasispecie intra-ospiti nelle sequenze NGS di SARS-CoV-2 campioate nel Victoria. Questa diversità era dinamica nel tempo e forse parte di questa variazione è stata trasmessa durante il primo episodio epidemico in questo stato australiano.
Materiali supplementari: Sono disponibili online al numero https://www.mdpi.com/1999-491 13/05/1/133/s1, Figura S1: Copertura e profondità di 210 campioni SARS-CoV-2, Figura S2: Compar- ison delle distribuzioni di densità di iSNV sinonimi e non sinonimi in quattro geni SARS-CoV-2, Figura S3: Distribuzione genomica di iSNV non sinonymosi nel gene ORF1a, Figura S4: Distribuzione genomica di iSNV non sinonymosi nel gene ORF1b, Figura S5. iSGV con distribuzione limitata a specifici lignaggi Pangolin, Tabella S1: iSGV di 210 campioni australiani, Tabella S2: Sostituzioni nucleotidiche osservate in quattro geni SARS-CoV-2 da campioni australiani, Tabella S3: Gruppi temporanei di iSGV non sinoniosi condivisi, Tabella S4: Correlazione tra la frequenza dell’aplotipo e la frequenza allele alternativa, Tabella S5: Campioni di PRJNA625551 BioProject che presentano l’aplotipo N30G/S31Stop/F32Stop/R34P/G35R nel gene S; Tabella S6: Identificazione dell’aplotipo N30G/S31Stop/F32Stop/R34P/G35R con e senza tagliare i primer ARTIC.
Contributi dell’autore: Concettualizzazione, A.A., J.-C.A. e N.B.; metodologia, A.A.; convalida, A.A., J.-C.A. e N.B.; analisi formale, A.A.; indagine, A.A., J.-C.A. e N.B.; scrittura ( writing) – preparazione originale della bozza, A.A.; writing – revisione e modifica, A.A., J.-C.A. e N.B. Tutti gli autori hanno letto e accettato la versione pubblicata del manoscritto.
Finanziamento: questa ricerca non ha ricevuto finanziamenti esterni. Dichiarazione del comitato di revisione istituzionale: non applicabile. Dichiarazione di consenso informato: non applicabile.
Dichiarazione di disponibilità dei dati: la pipeline per l’identificazione iSNV è disponibile in https://github. com/alexarmerov/SARS-CoV-2.
Riconoscimenti: Siamo grati al team di risposta genomica COVID-19 di Melbourne per aver generato i dati utilizzati nell’analisi attuale. Questo lavoro è stato supportato dal Shanghai Mu- nicipal Science and Technology Major Project (Grant n. 2019SHZDZX02) e questo ha beneficiato della piattaforma Montpellier Bioinformatics Biodiversity supportata dal LabEx CeMEB, un programma ANR “Investissements d’avenir” (ANR-10-LABX-04-01).
link di riferimento: https://doi.org/10.3390/v13010133