I ricercatori hanno scoperto la madre di tutti i genomi di SARS-CoV-2

0
96

Nel campo dell’epidemiologia molecolare, la comunità scientifica mondiale ha indagato per risolvere l’enigma della storia antica della SARS-CoV-2.

Da quando la prima infezione da virus SARS-CoV-2 è stata rilevata nel dicembre 2019, decine di migliaia dei suoi genomi sono stati sequenziati in tutto il mondo, rivelando che il coronavirus sta mutando, anche se lentamente, a un tasso di 25 mutazioni per genoma all’anno.

Ma nonostante i grandi sforzi, nessuno fino ad oggi ha identificato il primo caso di trasmissione umana, o “paziente zero” nella pandemia COVID-19.

Trovare un caso del genere è necessario per capire meglio come il virus possa essere saltato dal suo ospite animale prima di infettare gli esseri umani, nonché la storia di come il genoma virale SARS-CoV-2 sia mutato nel tempo e si sia diffuso a livello globale.

“Il virus SARS-CoV-2 trasporta un genoma di RNA che ha già infettato più di 35 milioni di persone in tutto il mondo “, ha detto Sudhir Kumar, direttore dell’Istituto di genomica e medicina evolutiva, Temple University. “Dobbiamo trovare questo antenato comune, che chiamiamo genoma progenitore”.

Questo genoma progenitore è la madre di tutti i coronavirus SARS-CoV-2 che infettano le persone oggi.

In assenza del paziente zero, Kumar e il suo team di ricerca della Temple University ora potrebbero aver trovato la cosa migliore per aiutare il lavoro investigativo di epidemiologia molecolare mondiale.

“Abbiamo deciso di ricostruire il genoma del progenitore utilizzando un grande set di dati di genomi del coronavirus ottenuti da individui infetti”, ha detto Sayaka Miura, autore senior dello studio.

Hanno scoperto che la “madre” di tutti i genomi della SARS-CoV-2 ei suoi primi ceppi della prole sono successivamente mutati e si sono diffusi per dominare la pandemia mondiale. “Ora abbiamo ricostruito il genoma progenitore e mappato dove e quando si sono verificate le prime mutazioni”, ha detto Kumar, l’autore corrispondente di uno studio di preprint, che può essere trovato sul server bioRxiv.

In tal modo, il loro lavoro ha fornito nuove informazioni sulla prima storia mutazionale di SARS-CoV-2.

Ad esempio, il loro studio riporta che una mutazione della proteina spike SARS-CoV-2 (D416G), spesso implicata in una maggiore infettività e diffusione, si è verificata dopo molte altre mutazioni, settimane dopo l’inizio di COVID-19.

“Si trova quasi sempre insieme a molte altre mutazioni proteiche, quindi il suo ruolo nell’aumento dell’infettività rimane difficile da stabilire”, ha affermato Sergei Pond, coautore senior dello studio.

Oltre alle loro scoperte sulla storia iniziale di SARS-CoV-2, il gruppo di Kumar ha sviluppato impronte digitali mutazionali per riconoscere rapidamente ceppi e sub-ceppi che infettano un individuo o colonizzano una regione globale.

Ordine a una pandemia

Per identificare il genoma progenitore, hanno utilizzato una tecnica di analisi dell’ordine mutazionale, che si basa su un’analisi clonale dei ceppi mutanti e sulla frequenza con cui le coppie di mutazioni compaiono insieme nei genomi SARS-CoV-2.

In primo luogo, il team di Kumar ha setacciato i dati su quasi 30.000 genomi completi del SARS-CoV-2, il virus che causa COVID-19.

Complessivamente, hanno analizzato 29.681 genomi di SARS-CoV-2, ciascuno contenente almeno 28.000 basi di dati di sequenza. Questi genomi sono stati campionati tra il 24 dicembre 2019 e il 7 luglio 2020, in rappresentanza di 97 paesi e regioni del mondo.

Molti precedenti tentativi di analizzare set di dati così grandi non hanno avuto successo a causa della “concentrazione sulla costruzione di un albero evolutivo di SARS-CoV-2”, afferma Kumar.

“Questo coronavirus si evolve troppo lentamente, il numero di genomi da analizzare è troppo grande e la qualità dei dati dei genomi è molto variabile. Ho subito visto parallelismi tra le proprietà di questi dati genetici del coronavirus con i dati genetici della diffusione clonale di un’altra nefasta malattia, il cancro “.

Il gruppo di Kumar ha sviluppato e studiato molte tecniche per analizzare i dati genetici dei tumori nei malati di cancro.

Hanno adattato e innovato quelle tecniche e costruito una scia di mutazioni che risalgono automaticamente al progenitore. “Fondamentalmente, il genoma prima della prima mutazione era quello del progenitore”, ha detto Kumar.

“L’approccio di monitoraggio delle mutazioni è bellissimo e predice una filogenesi di” ceppi principali “di SARS-CoV-2. È un ottimo esempio di come i big data, insieme al data mining biologicamente informato, rivelino modelli importanti “.

Genoma progenitore

Il team di Kumar ha scoperto una sequenza prevista del genoma progenitore (madre) di tutti i genomi SARS-CoV-2 (proCoV2).

Nel genoma proCoV2, hanno identificato 170 non sinonimi (mutazioni che causano un cambiamento dell’amminoacido in una proteina) e 958 sostituzioni sinonime rispetto al genoma di un coronavirus strettamente correlato , RaTG13 , trovato in un pipistrello Rhinolophus affinis.

Sebbene l’animale intermedio dai pipistrelli all’uomo sia ancora sconosciuto, ciò equivaleva a una somiglianza di sequenza del 96,12% tra le sequenze proCoV2 e RaTG13.

Successivamente, hanno identificato 49 varianti a singolo nucleotide (SNV) che si sono verificate con una frequenza di variante maggiore dell’1% dal loro set di dati. Questi sono stati ulteriormente esaminati per esaminare i loro modelli mutazionali e la diffusione globale.

“L’albero delle mutazioni predice un albero di ceppi”, ha detto Kumar. “Puoi anche fare prima l’albero dei ceppi e prevedere l’ordine delle mutazioni. Tuttavia, questo modo è fortemente influenzato dalla qualità delle sequenze. Quando il tasso di mutazione è basso, diventa difficile distinguere tra errore dovuto alla bassa qualità e una mutazione reale. L’approccio che abbiamo adottato è molto più robusto contro gli errori di sequenziamento perché l’analisi delle coppie di posizioni nei genomi è più informativa “.

Emerge una cronologia precedente

Quando il confronto della sequenza proCoV2 dedotta con i genomi nella loro raccolta non ha rivelato corrispondenze complete a livello di nucleotidi, il team di ricerca di Kumar sapeva che il momento iniziale dell’inizio della pandemia era sbagliato.

“Questo genoma progenitore aveva una sequenza diversa da quella che alcune persone chiamano sequenza di riferimento, che è quella che è stata osservata per prima in Cina e depositata nel database GISAID SARS-CoV-2”, ha detto Kumar.

La corrispondenza più vicina era ai genomi campionati 12 giorni dopo il primo virus campionato che è diventato disponibile il 24 dicembre 2019.

Sono state trovate più corrispondenze in tutti i continenti campionati e rilevate fino ad aprile 2020 in Europa. Complessivamente, 120 genomi del gruppo di Kumar analizzati contenevano solo differenze sinonime da proCoV2.

Cioè, tutte le loro proteine ​​erano identiche alle corrispondenti proteine ​​proCoV2 nella sequenza amminoacidica. La maggioranza (80 genomi) di queste corrispondenze a livello di proteine ​​proveniva da coronavirus campionati in Cina e in altri paesi asiatici.

Questi modelli spazio-temporali hanno suggerito che proCoV2 possedeva già l’intero repertorio di sequenze proteiche necessarie per infettare, diffondersi e persistere nella popolazione umana globale.

Hanno scoperto che il virus proCoV2 e i suoi discendenti iniziali sono nati in Cina, sulla base delle prime mutazioni di proCoV2 e delle loro posizioni. Inoltre, hanno anche dimostrato che una popolazione di ceppi con fino a sei differenze mutazionali da proCoV2 esisteva al momento del primo rilevamento di casi di COVID-19 in Cina.

Con stime di SARS-CoV-2 che mutano 25 volte all’anno, ciò significa che il virus deve aver già infettato le persone diverse settimane prima dei casi di dicembre 2019.

Firme mutazionali

Poiché c’erano forti prove di molte mutazioni prima di quelle trovate nel genoma di riferimento, il gruppo di Kumar ha dovuto elaborare una nuova nomenclatura delle firme mutazionali per classificare SARS-CoV-2 e spiegarle introducendo una serie di simboli di lettere greche a rappresentano ciascuno.

Ad esempio, hanno scoperto che l’emergere di varianti del genoma μ e α SARS-CoV-2 era anteriore alle prime segnalazioni di COVID-19. Ciò implica fortemente l’esistenza di una certa diversità di sequenza nelle popolazioni ancestrali SARS-CoV-2.

Tutti i 17 genomi campionati dalla Cina nel dicembre 2019, incluso il genoma di riferimento SARS-CoV-2 designato, portano tutte e tre le varianti μ e tre α. È interessante notare che i sei genomi contenenti varianti μ ma non varianti α sono stati campionati in Cina e negli Stati Uniti nel gennaio 2020. Pertanto, i primi genomi campionati (incluso il riferimento designato) non erano i ceppi progenitori.

Prevede anche che il genoma progenitore avesse una prole che si stava diffondendo in tutto il mondo durante le prime fasi di COVID-19. Era pronto a infettare fin dall’inizio.

“Il progenitore aveva tutte le capacità di cui aveva bisogno per diffondersi”, ha detto Sergei Pond. “Ci sono poche prove di selezione sui lignaggi tra pipistrelli e umani, sebbene vi sia una forte selezione sui coronavirus nei pipistrelli”.

Mutazioni autostop

Inoltre, hanno trovato prove confondenti che c’era sempre un’altra mutazione che accompagnava la mutazione della proteina spike D416G.

“Molte persone sono interessate alle mutazioni nella proteina spike a causa delle sue proprietà funzionali”, ha detto Kumar.

“Ma quello che stiamo osservando è che oltre alla proteina spike, ci sono stati diversi cambiamenti aggiuntivi all’interno del genoma che si trovano sempre insieme ai cambiamenti nella proteina spike (D416G). Li chiamiamo un gruppo beta di mutazioni e la mutazione spike è una di queste. Qualunque cosa pensiamo stia facendo la mutazione spike, è meglio non dimenticare che potrebbero essere coinvolte anche altre mutazioni. In alternativa, queste mutazioni potrebbero essere semplicemente fare l’autostop insieme, non possiamo ancora dirlo. “

“Ciò che è anche interessante è che il genoma contenente la mutazione della proteina spike ha subito molte altre mutazioni. E quelle che chiamiamo mutazioni epsilon (ce ne sono 3) si sono verificate sullo sfondo della mutazione spike e modificano i residui di arginina in una proteina molto importante, la proteina nucleocapsid (N).

Le mutazioni epsilon sono diffuse in Europa e si trovano sempre con la mutazione della proteina spike. Quindi, le mutazioni epsilon hanno dato il via a una propaggine dominante sia in Europa che in Asia “.

Una diffusione globale

Complessivamente, hanno identificato sette principali lignaggi evolutivi sorti dopo l’inizio della pandemia, alcuni dei quali sono sorti in Europa e Nord America dopo la genesi dei lignaggi ancestrali in Cina.

“I ceppi asiatici hanno fondato l’intera pandemia”, ha detto Kumar. “Ma nel tempo, è il sub-ceppo contenente la mutazione epsilon, che potrebbe essersi verificata al di fuori della Cina (osservata per la prima volta in Medio Oriente e in Europa), sta infettando l’Asia molto di più”.

Le loro analisi mutazionali hanno anche stabilito che i coronavirus nordamericani ospitano firme genomiche molto diverse da quelle prevalenti in Europa e in Asia.

“Questo è un processo dinamico”, ha detto Kumar. “Chiaramente, ci sono immagini molto diverse di diffusione dipinte dall’emergere di nuove mutazioni, i tre epsilon, gamma e delta, che abbiamo scoperto che si verificano dopo il cambiamento della proteina di picco. Dobbiamo scoprire se qualche proprietà funzionale di queste mutazioni ha accelerato la pandemia “.

Prossimi passi

Andando avanti, continueranno a perfezionare i risultati non appena saranno disponibili nuovi dati.

“Ci sono più di 100.000 genomi SARS-CoV-2 che sono stati sequenziati ora”, ha detto Pond. Kumar afferma che “il potere di questo approccio è che più dati hai, più facilmente puoi dire la frequenza precisa delle singole mutazioni e delle coppie di mutazioni.

Queste varianti prodotte, le varianti a singolo nucleotide o SNV, la loro frequenza e la storia possono essere raccontate molto bene con più dati. Pertanto, le nostre analisi deducono una radice credibile per la filogenesi SARS-CoV-2 “.

I loro risultati vengono aggiornati automaticamente online man mano che vengono segnalati nuovi genomi (che ora supera i 50.000 campioni e possono essere trovati su http://igem.temple.edu/COVID-19).

“Questi risultati e le nostre intuitive impronte digitali mutazionali dei ceppi SARS-CoV-2 hanno superato sfide scoraggianti per sviluppare una retrospettiva su come, quando e perché COVID-19 è emerso e diffuso, che è un prerequisito per la creazione di rimedi per superare questa pandemia attraverso il sforzi della scienza, della tecnologia, delle politiche pubbliche e della medicina “, ha detto Kumar.


Fino alla fine del 2019, solo sei coronavirus erano noti per infettare gli esseri umani: HCoV-229E, HCoV-OC43, SARS-CoV (SARS-CoV-1), HCoV-NL63, CoV-HKU1 e MERS-CoV. Un settimo, SARS-CoV-2, è emerso nell’inverno del 2019 da Wuhan, in Cina. SARS-CoV-2 è strettamente correlato a SARS-CoV-1, un virus apparso dalla provincia del Guangdong, in Cina, alla fine del 2002.

La proteina spike (S) del coronavirus media il legame del recettore e la fusione della membrana virale e cellulare. La proteina S si estende dalla membrana virale ed è disposta uniformemente come trimeri sulla superficie del virione per dare l’aspetto di una corona (corona in latino). La proteina S del coronavirus è divisa in due domini: S1 e S2.

Il dominio S1 media il legame del recettore e l’S2 media la fusione della membrana a valle1,2. Il recettore per SARS-CoV-2 è l’enzima di conversione dell’angiotensina 2 (ACE2) 3-7, una metalloproteasi che funge anche da recettore per SARS-CoV-18. Un piccolo sottodominio ripiegato in modo indipendente di S1, descritto come dominio di legame del recettore (RBD), lega direttamente ACE2 quando il virus impegna una cellula bersaglio9-12.

La giunzione S1 / S2 di SARS-CoV-2 viene elaborata da una propoteina convertasi simile alla furina nella cellula produttrice del virus. Al contrario, la giunzione S1 / S2 di SARS-CoV-1 viene elaborata da TMPRSS2 sulla superficie cellulare o da catepsine lisosomiali nelle cellule bersaglio13-18. Entrambe le proteine ​​S vengono ulteriormente elaborate nella cellula bersaglio all’interno del dominio S2 nel sito S2 ‘, un evento necessario anche per l’infezione produttiva19,20.

Recenti analisi della variazione di sequenza su scala fine degli isolati di SARS-CoV-2 hanno identificato diverse regioni genomiche di maggiore variazione genetica21-30. Una di queste variazioni codifica per una mutazione della proteina S, D614G, nella regione carbossi (C) -terminale del dominio S121-23,26,30.

Questa regione del dominio S1 si associa direttamente a S2 (Fig. 1a). Questa mutazione con glicina al residuo 614 (G614) è stata precedentemente rilevata per aumentare con una velocità allarmante21,22. La nostra analisi delle sequenze della proteina S disponibili dal GenBank ha mostrato un risultato simile: il genotipo G614 non è stato rilevato a febbraio (tra 33 sequenze) e osservato a bassa frequenza a marzo (26%), ma è aumentato rapidamente ad aprile (65 %) e maggio (70%) (Fig. 1b), indicando un vantaggio di trasmissione rispetto ai virus con D614. Korber et al. ha notato che questo cambiamento era anche correlato all’aumento della carica virale nei pazienti COVID-1922, ma poiché questo cambiamento è anche associato alle mutazioni nelle proteine ​​virali nsp3 e RdRp, il ruolo della proteina S in queste osservazioni è rimasto indefinito.

Un file esterno che contiene un'immagine, un'illustrazione, ecc. Il nome dell'oggetto è nihpp-2020.06.12.148726-f0001.jpg
Figura 1.
La mutazione D614G è associata a una maggiore infettività. Struttura Cryo-EM dell’eterodimero S1 (grigio) e S2 (arancione) (PBD 6VXX). I residui 581-676, una regione C-terminale del dominio S1 coinvolta nell’interazione S2, sono mostrati in verde. L’acido aspartico 614 è mostrato in verde chiaro. L’area indicata con un quadrato nero è presentata ingrandita a destra. I residui entro 5,5 Å di D614 sono mostrati in una rappresentazione a palla e bastone. b , una rappresentazione del SARS-CoV-2 Sprotein (pannello superiore) e D / G variante al residuo 614 presentato in trame logo in diversi momenti tra il 1 gennaio °  e 30 Maggio °, 2020 (riquadro inferiore). Numero totale di sequenze analizzate: 17 a gennaio, 33 a febbraio, 293 a marzo, 1511 ad aprile e 2544 a maggio. NTD: dominio N-terminale, RBD: dominio di legame al recettore, FP: peptide di fusione, HR1 e HR2: regione di ripetizione Heptad 1 e 2, rispettivamente, TM: regione transmembrana, CT: coda citoplasmatica. Le cellule c, d , Mock e hACE2-293T su piastre da 96 pozzetti sono state infettate con MLV PV (5 × 10 8 genoma del vettore per pozzetto) che esprime GFP e pseudotipizzato con la glicoproteina virale indicata e analizzato 24 ore dopo. Vengono mostrati istogrammi rappresentativi (c) o media ± SEM (d) di cinque esperimenti condotti utilizzando due preparati PV indipendenti. Ogni punto in (d) indica un valore medio di un esperimento duplicato. Differenze significative sono state analizzate mediante ANOVA a due vie con il test di confronti multipli Sidak. I titoli PV sono presentati in Extended Data Fig. 1. FKO: mutante knockout per la scissione della furina.

Per determinare se la mutazione D614G altera le proprietà della proteina S in un modo che potrebbe influire sulla trasmissione o la replicazione, abbiamo valutato il suo ruolo nell’ingresso virale. Gli pseudovirus (PV) basati sul virus della leucemia murina di Maloney (MLV), che esprimono la proteina fluorescente verde (GFP) e pseudotipizzati con la proteina S di SARS-CoV-2 (SARS2) recanti il ​​genotipo D614 o G614 (SD614 e SG614, rispettivamente) erano prodotto da cellule HEK293T trasfettate come precedentemente descritto31.

Una variante SD614, in cui il motivo di scissione della furina tra i domini S1 e S2 viene ablato (SFKO), è stata inclusa anche per il confronto. Le cellule HEK293T trasdotte per esprimere ACE2 umano (hACE2-293T) o quelle trasdotte con il solo vettore (Mock-293T) sono state infettate con lo stesso numero di particelle dei PV pseudotipizzati con SD614, SG614 o SFKO (PVD614, PVG614 o PVFKO, rispettivamente) e il livello di infezione è stato valutato un giorno dopo.

Abbiamo osservato PVG614 cellule hACE2-293T infettate con un’efficienza circa 9 volte superiore rispetto a PVD614 (Fig. 1c,, d) .d). Questa maggiore infettività di PVG614 non è un artefatto della normalizzazione del titolo PV, poiché i loro titoli sono molto simili (dati estesi Fig. 1).

Successivamente abbiamo studiato il meccanismo con cui SG614 ha aumentato l’infettività del virus. Poiché il residuo 614 di S1 ​​è prossimale al dominio S2, abbiamo prima confrontato il rapporto tra i domini S1 e S2 nel virione che potrebbe indicare un rilascio alterato o uno spargimento del dominio S1 dopo la scissione alla giunzione S1 / S2.

Per fare ciò, abbiamo utilizzato costrutti di proteine ​​S recanti tag Flag sia ai loro amino (N) che ai C-termini. I PV pseudotipizzati con queste forme con etichetta doppia di SD614, SG614 e SFKO sono stati parzialmente purificati e concentrati mediante pellet attraverso uno strato di saccarosio al 20 %32 e valutati per la loro infettività.

I titoli dei PV erano simili tra PVG614, PVD614 e PVFKO prima e dopo la purificazione (Fig. 2a). Inoltre, la modifica mediante flag-tag o pellet di PV attraverso uno strato di saccarosio non ha alterato l’infettività relativa tra PVG614 e PVD614 (Fig. 2b).

Abbiamo quindi determinato il loro rapporto S1: S2 mediante western blotting utilizzando l’anticorpo anti-Flag M2. Come mostrato in Fig. 2c, il rapporto S1: S2 è notevolmente maggiore in PVG614 rispetto a PVD614, indicando che la glicina al residuo 614 di SG614 stabilizza l’interazione tra i domini S1 e S2, limitando la dispersione di S1. Inoltre, la quantità totale della proteina S in PVG614 è anche molto superiore a quella in PVD614, come indicato da una banda S2 più densa, anche se è stato analizzato lo stesso numero di pseudovirioni, come determinato dalla PCR quantitativa.

Per confermare in modo indipendente che è stato analizzato un numero simile di virioni, la parte inferiore della stessa membrana è stata tamponata con un anticorpo gag anti-p30 MLV (Fig. 2c). Densità simili di bande p30 sono state osservate da tutti i PV, indicando che le differenze nell’incorporazione della proteina S osservate con PVG614 e PVD614 erano dovute alla mutazione del residuo 614, non da quantità diverse di PV analizzate.

Un esperimento simile eseguito con PV prodotti indipendentemente ha prodotto un risultato quasi identico (Extended Data Fig. 2a). L’analisi densitometrica mostra che c’è 4,7 volte più banda S1 + S2 in PVG614 rispetto a PVD614 (Fig. 2d). Per stimare più accuratamente il rapporto S1: S2, abbiamo quindi confrontato quantità diverse degli stessi campioni in modo che l’intensità della banda S2 in PVG614 e PVD614 fosse comparabile (Fig. 2e).

Le medie di diverse quantificazioni mostrano che il rapporto S1: S2 di PVG614 è 3,5 volte superiore a quello di PVD614 (Fig. 2f). L’anticorpo M2 usato in questo esperimento lega il tag Flag situato sia all’estremità N che a quello C di una proteina, ma lega il tag Flag N-terminale in modo più efficiente33.

Pertanto, abbiamo visualizzato direttamente le bande della proteina S virionica mediante colorazione con argento (Extended Data Fig. 2b). Sebbene le bande S2 siano mascherate da una proteina MLV della stessa dimensione, le bande S1 sono ben separate. Anche in questo caso, l’intensità della banda S1 del PVG614 è molto più forte di quella del PVD614, mentre le bande p30 sono comparabili, un risultato coerente con quelli osservati utilizzando l’anticorpo anti-Flag M2.

Un file esterno che contiene un'immagine, un'illustrazione, ecc. Il nome dell'oggetto è nihpp-2020.06.12.148726-f0002.jpg
Figura 2. L’
infettività superiore di G614 è il risultato di una diminuzione della dispersione di S1 ​​e di un più alto livello di proteina S nel virione.
a – f, i PV MLV indicati prodotti con la proteina S contenente il tag Flag sia all’estremità N che a quelli C sono stati parzialmente purificati e concentrati mediante pellettizzazione attraverso uno strato di saccarosio al 20%. I titoli PV sono stati valutati mediante RT-qPCR (a). Gli stessi simboli in diversi gruppi PV indicano che provengono dallo stesso batch. Gli stessi PV sono stati valutati per la loro infettività nelle cellule Mock e hACE2-293T (b). Ogni simbolo in (a, b) indica un valore medio di un esperimento duplicato. Viene mostrata la media ± SEM di tre PV preparati in modo indipendente (a) e quattro esperimenti che utilizzano questi tre lotti PV (b). La stessa quantità (1 × 1010 vg per corsia) (c, d) o per confrontare più accuratamente il rapporto S1 e S2, quantità diverse (e) dei PV purificati sono stati analizzati da WB utilizzando l’anticorpo anti-Flag M2 o l’anti- anticorpo gag p30 MLV. Un esperimento simile eseguito con un lotto di PV preparati in modo indipendente è mostrato nella Figura 2a dei dati estesi. Gli stessi PV visualizzati dalla macchia d’argento sono mostrati in Extended Data Fig. 2b. La proteina virionica S totale (d) e il rapporto S1 / S2 (f) di PVD614 e PVG614 sono stati calcolati da quattro (d) o cinque (f) WB eseguiti con tre lotti PV preparati indipendentemente e presentati come media ± SEM. Differenze significative sono state analizzate mediante ANOVA unidirezionale (a), ANOVA bidirezionale con test di confronto multiplo Sidak di dati trasformati in log (b) o test t di Student non accoppiato (d, f). La proteina virionica S totale (d) e il rapporto S1 / S2 (f) di PVD614 e PVG614 sono stati calcolati da quattro (d) o cinque (f) WB eseguiti con tre lotti PV preparati indipendentemente e presentati come media ± SEM. Differenze significative sono state analizzate mediante ANOVA unidirezionale (a), ANOVA bidirezionale con test di confronto multiplo Sidak di dati trasformati in log (b) o test t di Student non accoppiato (d, f). La proteina virionica S totale (d) e il rapporto S1 / S2 (f) di PVD614 e PVG614 sono stati calcolati da quattro (d) o cinque (f) WB eseguiti con tre lotti PV preparati indipendentemente e presentati come media ± SEM. Differenze significative sono state analizzate mediante ANOVA unidirezionale (a), ANOVA bidirezionale con test di confronto multiplo Sidak di dati trasformati in log (b) o test t di Student non accoppiato (d, f).

Successivamente abbiamo confermato questi risultati utilizzando particelle simili a virus (VLP) composte solo dalle proteine ​​SARS-CoV-2 native, dalla nucleoproteina (N), dalla proteina di membrana (M), dalla proteina dell’involucro (E) e dalla proteina S34. I VLP sono stati parzialmente purificati e analizzati allo stesso modo dei PV MLV. Le bande della proteina S sono state rilevate con l’anticorpo anti-Flag M2 e la proteina N con plasma convalescente aggregato derivato da pazienti COVID-19.

Il rapporto S1: S2 e la proteina S totale sul virione erano di nuovo molto più alti nelle VLP che trasportavano SG614 (VLPG614) rispetto a quelle che portavano SD614 (VLPD614) (Fig. 3a). Il rapporto S1: S2 è 3,4 volte più alto e la proteina S totale è quasi cinque volte arricchita in VLPG614 rispetto a VLPD614 (Fig. 3b,, c) .c). Pertanto, la mutazione D614G migliora l’infezione del virus attraverso due meccanismi correlati: riduce la diffusione di S1 ​​e aumenta la proteina S totale incorporata nel virione.

Un file esterno che contiene un'immagine, un'illustrazione, ecc. Il nome dell'oggetto è nihpp-2020.06.12.148726-f0003.jpg
Fig. 3.
SARS-CoV-2 VLPG614 mostra anche una diminuzione della dispersione di S1 ​​e un aumento della proteina S virionica totale.
a – c, le VLP sono state prodotte dalla trasfezione cellulare HEK293T delle proteine ​​M, N, E e S di SARS-CoV-2. I VLP sono stati raccolti dal supernatante della coltura e parzialmente purificati come PV MLV. Le bande della proteina S sono state visualizzate utilizzando l’anticorpo M2 anti-Flag tag e la banda della proteina N utilizzando plasma convalescente in pool (a). Viene mostrato un rappresentante dei WB eseguiti con tre VLP preparati indipendentemente. Il rapporto S1 / S2 (b) e la differenza nella proteina S virionica totale (c) incorporata nel VLPD614 e VLPG614 sono stati calcolati da quattro WB eseguiti con tre preparazioni VLP indipendenti e presentati come media ± SEM. Differenze significative sono state analizzate mediante test t di Student spaiato.

È stato precedentemente ipotizzato che la mutazione D614G promuova una configurazione aperta della proteina S che è più favorevole all’associazione ACE25,22,23,35. Per esplorare questa possibilità, abbiamo studiato se l’associazione ACE2 da SG614 fosse più efficiente di quella da SD614. Le cellule HEK293T trasfettate per esprimere ciascuna proteina S sono state valutate per il loro legame dell’immunoadesina hACE2, utilizzando hACE2-NN-Ig, la cui attività enzimatica è stata abolita per mutazione31. HACE2-NN-Ig legato a SARS-CoV-1 RBD con un’affinità equivalente a hACE2-Ig.

Queste proteine ​​S sono fuse a un C-terminale, ma non a un tag Flag N-terminale, consentendo così la misurazione dell’espressione totale della proteina S nelle cellule permeabilizzate mediante citometria a flusso. Sebbene l’espressione della proteina S totale fosse paragonabile, il legame di hACE2-NN-Ig alle cellule che esprimono SG614 era sostanzialmente più alto del suo legame alle cellule che esprimono SD614 (Fig. 4a).

Questa osservazione ha diverse spiegazioni. In primo luogo, G614 potrebbe aumentare l’associazione hACE2 promuovendo una maggiore esposizione del RBD, oppure, in secondo luogo, questa mutazione potrebbe aumentare il numero di siti di legame limitando l’eliminazione del dominio S1. Per differenziare queste possibilità, abbiamo aggiunto il tag Myc all’estremità N-terminale della proteina S contrassegnata con Flag al suo terminale C e ripetuto lo studio, questa volta rilevando il dominio S1 con un anticorpo anti-Myc.

Come mostrato in Fig. 4b, il rapporto tra Myc-tag e Flag-tag è maggiore nelle cellule che esprimono SG614 rispetto alle cellule che esprimono SD614. Tuttavia, il rapporto Myc-tag / Flag-tag è simile al rapporto hACE2-NN-Ig / Flag-tag, indicando che l’aumento del legame di hACE2 alle cellule che esprimono SG614 non è stato il risultato di una maggiore affinità dei picchi di SG614 con hACE2 o superiore accesso al RBD.

Invece, questi dati mostrano che c’è più dominio S1 nelle cellule che esprimono SG614, un risultato ancora coerente con l’osservazione che la mutazione D614G riduce la diffusione di S1. Abbiamo quindi valutato se la quantità differenziale della proteina S potesse influenzare la sensibilità alla neutralizzazione del virus. La Fig. 4c mostra che PVD614 e PVG614 sono similmente suscettibili agli antisieri neutralizzanti, indicando che il controllo mediato da anticorpi dei virus che trasportano SD614 e SG614 sarebbe simile.

Un file esterno che contiene un'immagine, un'illustrazione, ecc. Il nome dell'oggetto è nihpp-2020.06.12.148726-f0004.jpg
Fig 4.
PVG614 non è più resistente alla neutralizzazione rispetto a PVD614.
a, La proteina S contenente il tag Flag C-terminale viene trasfettata in cellule HEK293T e valutata per il legame con hACE2-NN-Ig. La proteina S totale è stata misurata rilevando il tag Flag nelle cellule permeabilizzate. Viene mostrato il rapporto tra il legame di hACE2-NN-Ig e la colorazione Flag-tag. b, Esperimenti simili a quelli in (a) eccetto che la proteina S contiene tag N-Myc e C-Flag, e il livello di S1 ​​è stato valutato utilizzando un anticorpo anti-Myc. Ogni simbolo in (a, b) indica un valore medio di un esperimento duplicato. I dati in (a, b) prima della normalizzazione sono presentati in Extended Data Fig. 3a,, bb Sono presentati la media ± SEM di tre esperimenti indipendenti. Differenze significative sono state analizzate mediante ANOVA unidirezionale e test di confronti multipli Sidak. c, I PV MLV che esprimono luciferasi di lucciola e pseudotipizzati con la proteina S indicata o la proteina VSV G sono stati preincubati senza (presentato ax = −6) o con plasma diluito in serie derivato da pazienti COVID-19 convalescenti o da un individuo naïve alla SARS-CoV. Le cellule hACE2-293T sono state infettate con queste miscele preincubate e l’infezione è stata valutata 24 ore dopo misurando l’attività della luciferasi. Viene presentata la media ± SEM di tre-cinque esperimenti indipendenti.

È stato anche ipotizzato che la mutazione D614G promuoverebbe, non limiterebbe, l’eliminazione del dominio S1, sulla base dell’ipotetica perdita di un legame idrogeno tra D614 in S1 e T859 in S222. Una spiegazione alternativa, più coerente con i dati presentati qui, è che Q613 forma un legame idrogeno con T859 e la maggiore flessibilità della spina dorsale fornita dall’introduzione di glicina in una posizione adiacente 614 consente un orientamento più favorevole di Q613.

È anche possibile che D614 possa formare un ponte salino intra-dominio con R646, promuovendo una conformazione S1 locale sfavorevole alla sua associazione con S2. In questo modello, la sostituzione dell’acido aspartico con glicina nella posizione 614 impedirebbe il campionamento di questa configurazione sfavorevole.

L’instabilità di SD614 può anche spiegare il livello inferiore osservato di incorporazione della proteina S funzionale in PV e VLP. In particolare, i trimeri della proteina S con i domini S2 esposti, come risultato della perdita di S1, potrebbero destabilizzare la membrana della rete trans-Golgi, il sito di elaborazione del confine S1 / S2 e tale interruzione potrebbe impedire l’incorporazione della proteina S nella il virione.

In caso di VLP, questa interruzione presumibilmente interferirebbe ulteriormente con appropriate associazioni di proteine ​​M e N alterando la conformazione e l’orientamento delle regioni prossimali della membrana della proteina S. In alternativa, questi trimeri della proteina S con i domini S2 esposti possono servire come substrati poveri per modifiche post-traduzionali a valle inclusa la palmitoilazione, e quelli privi di modifiche appropriate potrebbero non essere adatti per l’incorporazione del virione.

Una domanda interessante è perché i virus portatori di SG614 più stabile sembrano essere più trasmissibili senza comportare una grande differenza osservabile nella gravità della malattia22,27. È possibile che livelli più elevati di proteina S funzionale osservati con SG614 aumentino la possibilità di trasmissione da ospite a ospite, ma che altri fattori limitino la velocità e l’efficienza della replicazione intra-ospite.

In alternativa, la perdita di proteine ​​S associate al virione osservata con SD614 può essere compensata da una maggiore efficienza di fusione con la proteina S destabilizzata quando la successiva cellula bersaglio è adiacente in un tessuto ospite. È anche possibile che la nostra capacità di rilevare i cambiamenti di sequenza in questa fase iniziale della pandemia sia semplicemente maggiore della nostra capacità di rilevare modeste differenze nella patogenesi.

La forte differenza fenotipica che osserviamo qui tra D614 e G614 suggerisce che sono necessari ulteriori studi sull’impatto della mutazione D614G sul decorso della malattia.

Infine, i nostri dati sollevano interrogativi interessanti sulla storia naturale della SARS-CoV-2 mentre si è trasferita presumibilmente dai pipistrelli a ferro di cavallo agli umani. Ad un certo punto di questo processo, il virus ha acquisito un sito di scissione della furina, consentendo la scissione del suo confine S1 / S2 nelle cellule che producono virus.

Al contrario, il confine S1 / S2 di SARS-CoV-1, e in effetti tutti i virus simili a SARS isolati dai pipistrelli, mancano di questo sito polibasico e sono tagliati da TMPRSS2 o catepsine endosomiali nelle cellule bersaglio13-20. Quindi la maggiore stabilità che osserviamo con SG614 non sarebbe rilevante per i virus privi di questo sito, ma sembra essere fortemente favorita quando è presente un sito di scissione della pelliccia. Pertanto, la mutazione D614G potrebbe essere emersa per compensare questo sito furinico appena acquisito.

In sintesi, mostriamo che una mutazione della proteina S che si traduce in SARS-CoV-2 più trasmissibile limita anche lo spargimento del dominio S1 e aumenta l’incorporazione della proteina S nel virione. Saranno necessari ulteriori studi per determinare l’impatto di questo cambiamento sulla natura e la gravità del COVID-19.

link di riferimento: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7310631/


Ulteriori informazioni:  Sudhir Kumar et al. Un ritratto evolutivo del progenitore SARS-CoV-2 e delle sue propaggini dominanti nella pandemia COVID-19, (2020). DOI: 10.1101 / 2020.09.24.311845

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.