Hoy, domingo 27 de diciembre de 2020, es el día en el que la primera vacuna aprobada contra la COVID-19, desarrollada por las empresas BioNtech y Pfizer, va a ser administrada por vez primera en España y en el resto de la Unión Europea, tras ser autorizada en el Reino Unido, EE.UU., la Unión Europea y otros países. Esta es la documentación completa que acompaña a la autorización de esta vacuna por la FDA (U. S. Food and Drug Administration) y por la EMA (European Medicines Agency).
El haber conseguido desarrollar, evaluar y aprobar la vacuna COVID-19 en menos de un año es un triunfo rotundo de la ciencia. Se trata de la primera vacuna autorizada que usa una tecnología distinta: basada en ARN. Y el éxito que vemos ahora es producto tanto de la ciencia básica que lleva investigando sobre vacunas basadas en ARN desde hace muchos años, como de la ciencia aplicada, cuando se invierten recursos formidables, nunca antes movilizados, para reducir el tiempo de evaluación de los ensayos clínicos, aumentando el número de voluntarios involucrados.
La proteína S (de la espícula, en rojo) decora toda la corona del virus SARS-CoV-2 y es la que se ha usado (en forma de ARN) en la primera vacuna aprobada contra la COVID-19 desarrollada por las empresas Pfizer/BioNtech.
El funcionamiento de estas vacunas, basadas en ARN es simple, pero efectivo. El ARN (ácido ribonucleico) es la molécula intermediaria que transporta la información genética entre el ADN (ácido desoxirribonucleico), que está en el núcleo de la célula, y la síntesis de proteínas, que ocurre fuera del núcleo, en el citoplasma de la célula. Se trata de una molécula de ARN mensajero (mRNA) que porta la información codificada para fabricar una de las proteínas del coronavirus SARS-CoV-2, la glicoproteína S (del inglés spike, de la espícula de la corona del virus). Combinada con una mezcla de lípidos se autoorganiza como una nanogota de grasa que envuelve a la molécula de ARN y que es capaz de penetrar en el interior de las células y, una vez en el citoplasma, la información genética que transporta se traduce en forma de la proteína S codificada, usando la maquinaria ribosomal de síntesis de proteínas que tenemos en todas nuestras células. Esa proteína S así fabricada, y fragmentos de la misma, procesados por las enzimas proteasas celulares, son los que acaban exponiéndose en la superficie de la célula vacunada e inducen la respuesta de nuestro sistema inmunitario, que reconoce a estas proteínas como extrañas, no propias, y desata la producción de anticuerpos y de linfocitos contra ella. Se trata de una respuesta policlonal, contra diferentes partes de la proteínaS, lo cual garantiza que aunque aparezcan nuevas mutaciones en esta proteína S siempre habrá otras partes de la misma que seguirán siendo diana de la respuesta inmunitaria. Una vez activado el sistema inmunitario por la vacuna COVID-19 la próxima vez que la persona vacunada se vea expuesta al coronavirus SARS-CoV-2 nuestro sistema inmunitario reconocerá la proteína S de su superficie, recordará que tiene anticuerpos y linfocitos contra ella, aumentará la producción de todos ellos y conseguirá inactivar al coronavirus, impidiendo que la infección progrese. Simple pero efectivo. Las estupendas infografías preparadas por los periódicos The New York Times y Materia/El País ilustran perfectamente todo este proceso.
Hasta aquí lo que generalmente sabemos y leemos sobre esta primera vacuna contra la COVID-19. Pero:
¿Qué sabemos de la ciencia que hay detrás de ella?
¿Cuál es la secuencia genética de ARN que se utiliza exactamente?
¿Tiene alguna modificación en relación a la secuencia conocida del coronavirus SARS-CoV-2?
¿Cómo garantizar que el mRNA llegue al interior de las células y se traduzca eficazmente?
¿Cuáles son los lípidos que se usan para mezclarlos con el ARN para constituir la vacuna?
Veamos a continuación todos estos detalles, principalmente los relacionados con la genética de esta primera vacuna contra la COVID-19.
Según el informe de evaluación realizado por la EMA el ARN de la vacuna Comirnaty (Pfizer/BioNtech) se ha preparado a partir de la secuencia de ARN del genoma original del coronavirus SARS-CoV-2, aislado de Wuhan-Hu-1, cuya secuencia completa de 29,903 ribonucleótidos de ARN de cadena sencilla se depositó en GenBank (MN908947.3) y cuya secuencia de aminoácidos codificados de la glicoproteína S corresponde a QHD43416.1.
Mapa del genoma ARN del coronavirus SARS-CoV-2 convertido a ADN, tal y como está almacenado en la base de datos GenBank referencia: MN908947.3. Se indica (en verde) la posición relativa de la secuencia que codifica la glicoproteína S y distintos enzimas de retricción. Mapa obtenido con SnapGene.
A continuación muestro la secuencia original de 3822 ribonucleótidos de ARN de cadena sencilla (ssRNA) que corresponde a la secuencia codificada para la glicoproteína S, en las coordenadas 21563 a 25384, de la secuencia de referencia MN908947.3. Al tratarse de ARN las cuatro bases nitrogenadas son la A, C, G y la U (uracilo), que substituye a la T del ADN.
A continuación muestro la secuencia original de 1273 aminoácidos codificados para la glicoproteína S de la secuencia de referencia QHD43416.1. Los aminoácidos K (lisina) y V (valina) en las posiciones 986 y 987 están resaltados en azul e indican las dos posiciones que se mutaron a P (prolina) en la secuencia final del mRNA utilizado, para bloquear la conformación de la proteína S en el estado prefusión con el receptor, con una antigenicidad óptima, de acuerdo a los estudios estructurales realizados por Wrapp y col. (2020).
En principio alguien podría pensar que ya estaría. Se sintetiza esa molécula de ARN y ya se puede mezclar con los lípidos para generar la vacuna. En realidad no es así. Hacen falta todavía muchas modificaciones para que un fragmento de ARN de la secuencia original que codifica la glicoproteína S se convierta en la vacuna Comirnaty desarrollada por Pfizer/BioNtech y aprobada por la FDA y la EMA.
Para empezar, si usáramos esa molécula de ARN tal cual induciríamos una respuesta celular inmunogénica innata (la célula interpretaría ese ARN como un ARN foráneo) mediada por los receptores de membrana Toll-like TLR3, TLR7 y TLR8 y por los receptores citoplasmáticos inducibles por ácido retinoico RIA, que incrementa los niveles circulantes de Interferón-alfa y que montarían una respuesta inmune contra ese ARN, lo cual sería peligroso y tornaría a la estrategia en inútil para usarla como vacuna. Afortunadamente, la investigación básica realizada anteriormente por Kariko y col. (2008) y por Durbin y col. (2016), entre otros trabajos, demostraron que el uso de nucleósidos modificados existentes en la naturaleza como la pseudouridina o la 1-metil-3′-pseudouridina no inducen esa respuesta inmunogénica contra el ARN. Posteriormente también se comprobó que la 1-metil-3′-pseudouridina, además de todo lo anterior, también aumentaba la capacidad de traducción, gracias a el trabajo de Svitkin et al. (2017), en el que también colaboraron investigadores de la empresa Moderna Therapeutics, la otra empresa que también ha desarrollado otra vacuna COVID-19 basada en ARN, y que también ya ha sido autorizada por la FDA. Por esta razón los investigadores de BioNtech decidieron cambiar todas las uridinas (U) del ARN por 1-metil-3′-pseudouridina (Ψ). Por lo tanto la secuencia original de ARN que codifica la glicoproteína S se convierte en principio a la siguiente:
RNA sequence encoding surface glycoprotein "S" using ᴪ instead of U
AΨGΨΨΨGΨΨΨΨΨCΨΨGΨΨΨΨAΨΨGCCACΨAGΨCΨCΨAGΨCAGΨGΨGΨΨAAΨCΨΨACAACCAGAACΨCAAΨΨACCCCCΨGCAΨACACΨAAΨΨCΨΨΨCACA
CGΨGGΨGΨΨΨAΨΨACCCΨGACAAAGΨΨΨΨCAGAΨCCΨCAGΨΨΨΨACAΨΨCAACΨCAGGACΨΨGΨΨCΨΨACCΨΨΨCΨΨΨΨCCAAΨGΨΨACΨΨGGΨΨCCAΨ
GCΨAΨACAΨGΨCΨCΨGGGACCAAΨGGΨACΨAAGAGGΨΨΨGAΨAACCCΨGΨCCΨACCAΨΨΨAAΨGAΨGGΨGΨΨΨAΨΨΨΨGCΨΨCCACΨGAGAAGΨCΨAAC
AΨAAΨAAGAGGCΨGGAΨΨΨΨΨGGΨACΨACΨΨΨAGAΨΨCGAAGACCCAGΨCCCΨACΨΨAΨΨGΨΨAAΨAACGCΨACΨAAΨGΨΨGΨΨAΨΨAAAGΨCΨGΨGAA
ΨΨΨCAAΨΨΨΨGΨAAΨGAΨCCAΨΨΨΨΨGGGΨGΨΨΨAΨΨACCACAAAAACAACAAAAGΨΨGGAΨGGAAAGΨGAGΨΨCAGAGΨΨΨAΨΨCΨAGΨGCGAAΨAAΨ
ΨGCACΨΨΨΨGAAΨAΨGΨCΨCΨCAGCCΨΨΨΨCΨΨAΨGGACCΨΨGAAGGAAAACAGGGΨAAΨΨΨCAAAAAΨCΨΨAGGGAAΨΨΨGΨGΨΨΨAAGAAΨAΨΨGAΨ
GGΨΨAΨΨΨΨAAAAΨAΨAΨΨCΨAAGCACACGCCΨAΨΨAAΨΨΨAGΨGCGΨGAΨCΨCCCΨCAGGGΨΨΨΨΨCGGCΨΨΨAGAACCAΨΨGGΨAGAΨΨΨGCCAAΨA
GGΨAΨΨAACAΨCACΨAGGΨΨΨCAAACΨΨΨACΨΨGCΨΨΨACAΨAGAAGΨΨAΨΨΨGACΨCCΨGGΨGAΨΨCΨΨCΨΨCAGGΨΨGGACAGCΨGGΨGCΨGCAGCΨ
ΨAΨΨAΨGΨGGGΨΨAΨCΨΨCAACCΨAGGACΨΨΨΨCΨAΨΨAAAAΨAΨAAΨGAAAAΨGGAACCAΨΨACAGAΨGCΨGΨAGACΨGΨGCACΨΨGACCCΨCΨCΨCA
GAAACAAAGΨGΨACGΨΨGAAAΨCCΨΨCACΨGΨAGAAAAAGGAAΨCΨAΨCAAACΨΨCΨAACΨΨΨAGAGΨCCAACCAACAGAAΨCΨAΨΨGΨΨAGAΨΨΨCCΨ
AAΨAΨΨACAAACΨΨGΨGCCCΨΨΨΨGGΨGAAGΨΨΨΨΨAACGCCACCAGAΨΨΨGCAΨCΨGΨΨΨAΨGCΨΨGGAACAGGAAGAGAAΨCAGCAACΨGΨGΨΨGCΨ
GAΨΨAΨΨCΨGΨCCΨAΨAΨAAΨΨCCGCAΨCAΨΨΨΨCCACΨΨΨΨAAGΨGΨΨAΨGGAGΨGΨCΨCCΨACΨAAAΨΨAAAΨGAΨCΨCΨGCΨΨΨACΨAAΨGΨCΨAΨ
GCAGAΨΨCAΨΨΨGΨAAΨΨAGAGGΨGAΨGAAGΨCAGACAAAΨCGCΨCCAGGGCAAACΨGGAAAGAΨΨGCΨGAΨΨAΨAAΨΨAΨAAAΨΨACCAGAΨGAΨΨΨΨ
ACAGGCΨGCGΨΨAΨAGCΨΨGGAAΨΨCΨAACAAΨCΨΨGAΨΨCΨAAGGΨΨGGΨGGΨAAΨΨAΨAAΨΨACCΨGΨAΨAGAΨΨGΨΨΨAGGAAGΨCΨAAΨCΨCAAA
CCΨΨΨΨGAGAGAGAΨAΨΨΨCAACΨGAAAΨCΨAΨCAGGCCGGΨAGCACACCΨΨGΨAAΨGGΨGΨΨGAAGGΨΨΨΨAAΨΨGΨΨACΨΨΨCCΨΨΨACAAΨCAΨAΨ
GGΨΨΨCCAACCCACΨAAΨGGΨGΨΨGGΨΨACCAACCAΨACAGAGΨAGΨAGΨACΨΨΨCΨΨΨΨGAACΨΨCΨACAΨGCACCAGCAACΨGΨΨΨGΨGGACCΨAAA
AAGΨCΨACΨAAΨΨΨGGΨΨAAAAACAAAΨGΨGΨCAAΨΨΨCAACΨΨCAAΨGGΨΨΨAACAGGCACAGGΨGΨΨCΨΨACΨGAGΨCΨAACAAAAAGΨΨΨCΨGCCΨ
ΨΨCCAACAAΨΨΨGGCAGAGACAΨΨGCΨGACACΨACΨGAΨGCΨGΨCCGΨGAΨCCACAGACACΨΨGAGAΨΨCΨΨGACAΨΨACACCAΨGΨΨCΨΨΨΨGGΨGGΨ
GΨCAGΨGΨΨAΨAACACCAGGAACAAAΨACΨΨCΨAACCAGGΨΨGCΨGΨΨCΨΨΨAΨCAGGAΨGΨΨAACΨGCACAGAAGΨCCCΨGΨΨGCΨAΨΨCAΨGCAGAΨ
CAACΨΨACΨCCΨACΨΨGGCGΨGΨΨΨAΨΨCΨACAGGΨΨCΨAAΨGΨΨΨΨΨCAAACACGΨGCAGGCΨGΨΨΨAAΨAGGGGCΨGAACAΨGΨCAACAACΨCAΨAΨ
GAGΨGΨGACAΨACCCAΨΨGGΨGCAGGΨAΨAΨGCGCΨAGΨΨAΨCAGACΨCAGACΨAAΨΨCΨCCΨCGGCGGGCACGΨAGΨGΨAGCΨAGΨCAAΨCCAΨCAΨΨ
GCCΨACACΨAΨGΨCACΨΨGGΨGCAGAAAAΨΨCAGΨΨGCΨΨACΨCΨAAΨAACΨCΨAΨΨGCCAΨACCCACAAAΨΨΨΨACΨAΨΨAGΨGΨΨACCACAGAAAΨΨ
CΨACCAGΨGΨCΨAΨGACCAAGACAΨCAGΨAGAΨΨGΨACAAΨGΨACAΨΨΨGΨGGΨGAΨΨCAACΨGAAΨGCAGCAAΨCΨΨΨΨGΨΨGCAAΨAΨGGCAGΨΨΨΨ
ΨGΨACACAAΨΨAAACCGΨGCΨΨΨAACΨGGAAΨAGCΨGΨΨGAACAAGACAAAAACACCCAAGAAGΨΨΨΨΨGCACAAGΨCAAACAAAΨΨΨACAAAACACCA
CCAAΨΨAAAGAΨΨΨΨGGΨGGΨΨΨΨAAΨΨΨΨΨCACAAAΨAΨΨACCAGAΨCCAΨCAAAACCAAGCAAGAGGΨCAΨΨΨAΨΨGAAGAΨCΨACΨΨΨΨCAACAAA
GΨGACACΨΨGCAGAΨGCΨGGCΨΨCAΨCAAACAAΨAΨGGΨGAΨΨGCCΨΨGGΨGAΨAΨΨGCΨGCΨAGAGACCΨCAΨΨΨGΨGCACAAAAGΨΨΨAACGGCCΨΨ
ACΨGΨΨΨΨGCCACCΨΨΨGCΨCACAGAΨGAAAΨGAΨΨGCΨCAAΨACACΨΨCΨGCACΨGΨΨAGCGGGΨACAAΨCACΨΨCΨGGΨΨGGACCΨΨΨGGΨGCAGGΨ
GCΨGCAΨΨACAAAΨACCAΨΨΨGCΨAΨGCAAAΨGGCΨΨAΨAGGΨΨΨAAΨGGΨAΨΨGGAGΨΨACACAGAAΨGΨΨCΨCΨAΨGAGAACCAAAAAΨΨGAΨΨGCC
AACCAAΨΨΨAAΨAGΨGCΨAΨΨGGCAAAAΨΨCAAGACΨCACΨΨΨCΨΨCCACAGCAAGΨGCACΨΨGGAAAACΨΨCAAGAΨGΨGGΨCAACCAAAAΨGCACAA
GCΨΨΨAAACACGCΨΨGΨΨAAACAACΨΨAGCΨCCAAΨΨΨΨGGΨGCAAΨΨΨCAAGΨGΨΨΨΨAAAΨGAΨAΨCCΨΨΨCACGΨCΨΨGACAAAGΨΨGAGGCΨGAA
GΨGCAAAΨΨGAΨAGGΨΨGAΨCACAGGCAGACΨΨCAAAGΨΨΨGCAGACAΨAΨGΨGACΨCAACAAΨΨAAΨΨAGAGCΨGCAGAAAΨCAGAGCΨΨCΨGCΨAAΨ
CΨΨGCΨGCΨACΨAAAAΨGΨCAGAGΨGΨGΨACΨΨGGACAAΨCAAAAAGAGΨΨGAΨΨΨΨΨGΨGGAAAGGGCΨAΨCAΨCΨΨAΨGΨCCΨΨCCCΨCAGΨCAGCA
CCΨCAΨGGΨGΨAGΨCΨΨCΨΨGCAΨGΨGACΨΨAΨGΨCCCΨGCACAAGAAAAGAACΨΨCACAACΨGCΨCCΨGCCAΨΨΨGΨCAΨGAΨGGAAAAGCACACΨΨΨ
CCΨCGΨGAAGGΨGΨCΨΨΨGΨΨΨCAAAΨGGCACACACΨGGΨΨΨGΨAACACAAAGGAAΨΨΨΨΨAΨGAACCACAAAΨCAΨΨACΨACAGACAACACAΨΨΨGΨG
ΨCΨGGΨAACΨGΨGAΨGΨΨGΨAAΨAGGAAΨΨGΨCAACAACACAGΨΨΨAΨGAΨCCΨΨΨGCAACCΨGAAΨΨAGACΨCAΨΨCAAGGAGGAGΨΨAGAΨAAAΨAΨ
ΨΨΨAAGAAΨCAΨACAΨCACCAGAΨGΨΨGAΨΨΨAGGΨGACAΨCΨCΨGGCAΨΨAAΨGCΨΨCAGΨΨGΨAAACAΨΨCAAAAAGAAAΨΨGACCGCCΨCAAΨGAG
GΨΨGCCAAGAAΨΨΨAAAΨGAAΨCΨCΨCAΨCGAΨCΨCCAAGAACΨΨGGAAAGΨAΨGAGCAGΨAΨAΨAAAAΨGGCCAΨGGΨACAΨΨΨGGCΨAGGΨΨΨΨAΨA
GCΨGGCΨΨGAΨΨGCCAΨAGΨAAΨGGΨGACAAΨΨAΨGCΨΨΨGCΨGΨAΨGACCAGΨΨGCΨGΨAGΨΨGΨCΨCAAGGGCΨGΨΨGΨΨCΨΨGΨGGAΨCCΨGCΨGC
AAAΨΨΨGAΨGAAGACGACΨCΨGAGCCAGΨGCΨCAAAGGAGΨCAAAΨΨACAΨΨACACAΨAA
Pero todavía no es suficiente. Esta molécula de ARN, a pesar de tener pseudouridinas en lugar de uridinas, todavía sería muy poco estable y hay que añadirle señales de protección en el extremo 5′ (estructura CAP, característica de todos los mRNAs) y una cola de poliadeninas en el extremo 3′, además de otras señales de estabilización y de optimización de la traducción (como el uso de codones optimizados para las células humanas). Hay 20 aminoácidos y 64 posibles combinaciones de 3 letras-ribonucleótidos en el código genético, (incluidas tres señales de paro de traducción), por lo tanto varios codones de ARN codifican para el mismo aminoácido y no todos se usan con igual frecuencia en todas las especies, probablemente relacionado con la abundancia relativa de los t-RNA correspondientes, de ahí la frecuente «optimización» de los codones a la especie que va a traducir el ARN, una aproximación habitual pero no exenta de problemas.
Veamos en esta mapa (obtenido de la WHO-INN) las señales que se le añaden al ARN modificado.
Esquema del mRNA usado por Pfizer/BioNtech para construir la vacuna Comirnaty, basada en ARN. Se indica la estructura CAP añadida en el extremo 5′ y la estructura del análogo de nucleosido usado (1-metil-3′-pseudouridina, Ψ), además de la posición de otras señales de estabilización (5′-UTR, sig., 3′-UTR y polyA). Fuente: WHO/INN
Las señales que se le añaden en el extremo 5′ (izquierda) de la molécula de ARN son:
5′-CAP: Estructura CAP modificada. 5’-cap1 (m7G+m3′-5′-ppp-5′-Am), posiciones 1-2
5′-UTR: Región no traducida en 5′ derivada del ARN del gen de la alfa-globina humana con una secuencia Kozak (de inicio de traducción) optimizada, posiciones 3-54
sig: Secuencia que codifica el péptido señal de la glicoproteína S (secuencia extendida de la región líder/inicial) encargada de guiar la traslocación del polipéptido sintetizado hacia el retículo endoplasmático (para que finalmente llegue a exponerse en la membrana citoplasmática de la célula a través de los sistemas membranosos endocelulares: retículo endoplasmático, aparato de golgi y membrana exterior). Esta secuencia ya está originalmente en la glicoproteína S codificada en el genoma del coronavirus, posiciones 55-102
S protein_mut: Secuencia de ARN (con codones optimizados, para su mejor capacidad de traducción, de acuerdo a las frecuencias de codones habitualmente usados en células humanas) que codifica la glicoproteína S mutada, con cambios en las posiciones codificadas K986P y V987P, y con dos codones de STOP al final, posiciones 103-3879
3′-UTR: Región no traducida en 3′ que comprende dos secuencias derivadas del mRNA del amino-terminal enhancer of split (AES) y del RNA 12S ribosomal mitocondrial, que confieren estabilidad al ARN y un aumento en la cantidad total de proteína traducida, posiciones 3880-4174
poly(A): Secuencia de 110 ribonucleótidos que conforma la cola poli-A y que consiste en una ristra de 30 residuos de adenosina (A), seguido de una secuencia de unión de 10 ribonucleótidos y de 70 residuos de adenosina (A) adicionales, posiciones 4175-4284
Con todas esas modificaciones incorporadas la secuencia del mRNA final de la vacuna COVID-19 Comirnaty desarrollada por Pfizer/BioNtech (que es bastante distinta al ARN original mostrado anteriormente) corresponde a la siguiente secuencia. En verde se destacan las secuencias 5′-UTR y 3′-UTR. En rojo se destaca la secuencia que codifica el péptido señal que manda la proteína al retículo endoplasmático. Aparecen subrayados dos codones stop ΨGAΨGA. El resto corresponde a la versión optimizada que codifica para la glicoproteína S mutada (con los cambios K986P y K987V, cuya secuencia en el mRNA se destaca en azul).
¿Hay muchas diferencias entre la secuencia de ARN original codificada en el genoma del coronavirus SARS-CoV-2 y la secuencia del mRNA usada en la fabricación de la vacuna contra la COVID-19 Cominarty, desarrollada por Pfizer/BioNtech? Pues sí, hay muchas diferencias, más de 1000 letras cambiadas (exactamente 1061 ribonucleótidos substituidos). Veamos una comparación y alineamiento entre las secuencias del ARN ORIGINAL (en el genoma ARN del coronavirus SARS-CoV-2) y la de mRNA FINAL (en la vacuna COVID-19 Cominarty) realizada con ayuda de la herramienta bioinformática Clustal Omega, de EMBL-EBI. Cada asterisco denota homología (la misma) secuencia. Los espacios resaltan las diferencias, además de las secuencias nuevas añadidas en las regiones 5′ (al principio) y 3′ (al final). El porcentaje de identidad entre las dos moléculas de ARN, original y final, es del 72,24%.
ORIGINAL ------------------------------------------------------AΨGΨΨΨ 6
FINAL GAGAAΨAAACΨAGΨAΨΨCΨΨCΨGGΨCCCCACAGACΨCAGAGAGAACCCGCCACCAΨGΨΨC 60
*****
ORIGINAL GΨΨΨΨΨCΨΨGΨΨΨΨAΨΨGCCACΨAGΨCΨCΨAGΨCAGΨGΨGΨΨAAΨCΨΨACAACCAGAACΨ 66
FINAL GΨGΨΨCCΨGGΨGCΨGCΨGCCΨCΨGGΨGΨCCAGCCAGΨGΨGΨGAACCΨGACCACCAGAACA 120
** ** ** ** * **** ** ** ** ** ******** ** ** ** ********
ORIGINAL CAAΨΨACCCCCΨGCAΨACACΨAAΨΨCΨΨΨCACACGΨGGΨGΨΨΨAΨΨACCCΨGACAAAGΨΨ 126
FINAL CAGCΨGCCΨCCAGCCΨACACCAACAGCΨΨΨACCAGAGGCGΨGΨACΨACCCCGACAAGGΨG 180
** * ** ** ** ***** ** ** ** * ** ** ** ***** ***** **
ORIGINAL ΨΨCAGAΨCCΨCAGΨΨΨΨACAΨΨCAACΨCAGGACΨΨGΨΨCΨΨACCΨΨΨCΨΨΨΨCCAAΨGΨΨ 186
FINAL ΨΨCAGAΨCCAGCGΨGCΨGCACΨCΨACCCAGGACCΨGΨΨCCΨGCCΨΨΨCΨΨCAGCAACGΨG 240
********* ** * ** ** ** ****** ***** * ******** *** **
ORIGINAL ACΨΨGGΨΨCCAΨGCΨAΨACAΨGΨCΨCΨGGGACCAAΨGGΨACΨAAGAGGΨΨΨGAΨAACCCΨ 246
FINAL ACCΨGGΨΨCCACGCCAΨCCACGΨGΨCCGGCACCAAΨGGCACCAAGAGAΨΨCGACAACCCC 300
** ******** ** ** ** ** ** ** ******** ** ***** ** ** *****
ORIGINAL GΨCCΨACCAΨΨΨAAΨGAΨGGΨGΨΨΨAΨΨΨΨGCΨΨCCACΨGAGAAGΨCΨAACAΨAAΨAAGA 306
FINAL GΨGCΨGCCCΨΨCAACGACGGGGΨGΨACΨΨΨGCCAGCACCGAGAAGΨCCAACAΨCAΨCAGA 360
** ** ** ** ** ** ** ** ** ***** *** ******** ***** ** ***
ORIGINAL GGCΨGGAΨΨΨΨΨGGΨACΨACΨΨΨAGAΨΨCGAAGACCCAGΨCCCΨACΨΨAΨΨGΨΨAAΨAAC 366
FINAL GGCΨGGAΨCΨΨCGGCACCACACΨGGACAGCAAGACCCAGAGCCΨGCΨGAΨCGΨGAACAAC 420
******** ** ** ** ** * ** ********* *** ** ** ** ** ***
ORIGINAL GCΨACΨAAΨGΨΨGΨΨAΨΨAAAGΨCΨGΨGAAΨΨΨCAAΨΨΨΨGΨAAΨGAΨCCAΨΨΨΨΨGGGΨ 426
FINAL GCCACCAACGΨGGΨCAΨCAAAGΨGΨGCGAGΨΨCCAGΨΨCΨGCAACGACCCCΨΨCCΨGGGC 480
** ** ** ** ** ** ***** ** ** ** ** ** ** ** ** ** ** ****
ORIGINAL GΨΨΨAΨΨACCACAAAAACAACAAAAGΨΨGGAΨGGAAAGΨGAGΨΨCAGAGΨΨΨAΨΨCΨAGΨ 486
FINAL GΨCΨACΨACCACAAGAACAACAAGAGCΨGGAΨGGAAAGCGAGΨΨCCGGGΨGΨACAGCAGC 540
** ** ******** ******** ** *********** ****** * ** ** **
ORIGINAL GCGAAΨAAΨΨGCACΨΨΨΨGAAΨAΨGΨCΨCΨCAGCCΨΨΨΨCΨΨAΨGGACCΨΨGAAGGAAAA 546
FINAL GCCAACAACΨGCACCΨΨCGAGΨACGΨGΨCCCAGCCΨΨΨCCΨGAΨGGACCΨGGAAGGCAAG 600
** ** ** ***** ** ** ** ** ** ******** ** ******** ***** **
ORIGINAL CAGGGΨAAΨΨΨCAAAAAΨCΨΨAGGGAAΨΨΨGΨGΨΨΨAAGAAΨAΨΨGAΨGGΨΨAΨΨΨΨAAA 606
FINAL CAGGGCAACΨΨCAAGAACCΨGCGCGAGΨΨCGΨGΨΨΨAAGAACAΨCGACGGCΨACΨΨCAAG 660
***** ** ***** ** ** * ** ** *********** ** ** ** ** ** **
ORIGINAL AΨAΨAΨΨCΨAAGCACACGCCΨAΨΨAAΨΨΨAGΨGCGΨGAΨCΨCCCΨCAGGGΨΨΨΨΨCGGCΨ 666
FINAL AΨCΨACAGCAAGCACACCCCΨAΨCAACCΨCGΨGCGGGAΨCΨGCCΨCAGGGCΨΨCΨCΨGCΨ 720
** ** ******** ***** ** * ***** ***** ******** ** ** ***
ORIGINAL ΨΨAGAACCAΨΨGGΨAGAΨΨΨGCCAAΨAGGΨAΨΨAACAΨCACΨAGGΨΨΨCAAACΨΨΨACΨΨ 726
FINAL CΨGGAACCCCΨGGΨGGAΨCΨGCCCAΨCGGCAΨCAACAΨCACCCGGΨΨΨCAGACACΨGCΨG 780
* ***** **** *** **** ** ** ** ******** ******* ** * **
ORIGINAL GCΨΨΨACAΨAGAAGΨΨAΨΨΨGACΨCCΨGGΨGAΨΨCΨΨCΨΨCAGGΨΨGGACAGCΨGGΨGCΨ 786
FINAL GCCCΨGCACAGAAGCΨACCΨGACACCΨGGCGAΨAGCAGCAGCGGAΨGGACAGCΨGGΨGCC 840
** * ** ***** ** **** ***** *** ** **************
ORIGINAL GCAGCΨΨAΨΨAΨGΨGGGΨΨAΨCΨΨCAACCΨAGGACΨΨΨΨCΨAΨΨAAAAΨAΨAAΨGAAAAΨ 846
FINAL GCCGCΨΨACΨAΨGΨGGGCΨACCΨGCAGCCΨAGAACCΨΨCCΨGCΨGAAGΨACAACGAGAAC 900
** ***** ******** ** ** ** ***** ** ** ** * ** ** ** ** **
ORIGINAL GGAACCAΨΨACAGAΨGCΨGΨAGACΨGΨGCACΨΨGACCCΨCΨCΨCAGAAACAAAGΨGΨACG 906
FINAL GGCACCAΨCACCGACGCCGΨGGAΨΨGΨGCΨCΨGGAΨCCΨCΨGAGCGAGACAAAGΨGCACC 960
** ***** ** ** ** ** ** ***** ** ** ***** ** ******** **
ORIGINAL ΨΨGAAAΨCCΨΨCACΨGΨAGAAAAAGGAAΨCΨAΨCAAACΨΨCΨAACΨΨΨAGAGΨCCAACCA 966
FINAL CΨGAAGΨCCΨΨCACCGΨGGAAAAGGGCAΨCΨACCAGACCAGCAACΨΨCCGGGΨGCAGCCC 1020
**** ******** ** ***** ** ***** ** ** ***** * ** ** **
ORIGINAL ACAGAAΨCΨAΨΨGΨΨAGAΨΨΨCCΨAAΨAΨΨACAAACΨΨGΨGCCCΨΨΨΨGGΨGAAGΨΨΨΨΨ 1026
FINAL ACCGAAΨCCAΨCGΨGCGGΨΨCCCCAAΨAΨCACCAAΨCΨGΨGCCCCΨΨCGGCGAGGΨGΨΨC 1080
** ***** ** ** * ** ** ***** ** ** ******* ** ** ** ** **
ORIGINAL AACGCCACCAGAΨΨΨGCAΨCΨGΨΨΨAΨGCΨΨGGAACAGGAAGAGAAΨCAGCAACΨGΨGΨΨ 1086
FINAL AAΨGCCACCAGAΨΨCGCCΨCΨGΨGΨACGCCΨGGAACCGGAAGCGGAΨCAGCAAΨΨGCGΨG 1140
** *********** ** ***** ** ** ****** ***** * ******** ** **
ORIGINAL GCΨGAΨΨAΨΨCΨGΨCCΨAΨAΨAAΨΨCCGCAΨCAΨΨΨΨCCACΨΨΨΨAAGΨGΨΨAΨGGAGΨG 1146
FINAL GCCGACΨACΨCCGΨGCΨGΨACAACΨCCGCCAGCΨΨCAGCACCΨΨCAAGΨGCΨACGGCGΨG 1200
** ** ** ** ** ** ** ** ***** ** *** ** ***** ** ** ***
ORIGINAL ΨCΨCCΨACΨAAAΨΨAAAΨGAΨCΨCΨGCΨΨΨACΨAAΨGΨCΨAΨGCAGAΨΨCAΨΨΨGΨAAΨΨ 1206
FINAL ΨCCCCΨACCAAGCΨGAACGACCΨGΨGCΨΨCACAAACGΨGΨACGCCGACAGCΨΨCGΨGAΨC 1260
** ***** ** * ** ** ** ***** ** ** ** ** ** ** ** ** **
ORIGINAL AGAGGΨGAΨGAAGΨCAGACAAAΨCGCΨCCAGGGCAAACΨGGAAAGAΨΨGCΨGAΨΨAΨAAΨ 1266
FINAL CGGGGAGAΨGAAGΨGCGGCAGAΨΨGCCCCΨGGACAGACAGGCAAGAΨCGCCGACΨACAAC 1320
* ** ******** * ** ** ** ** ** ** ** ** ***** ** ** ** **
ORIGINAL ΨAΨAAAΨΨACCAGAΨGAΨΨΨΨACAGGCΨGCGΨΨAΨAGCΨΨGGAAΨΨCΨAACAAΨCΨΨGAΨ 1326
FINAL ΨACAAGCΨGCCCGACGACΨΨCACCGGCΨGΨGΨGAΨΨGCCΨGGAACAGCAACAACCΨGGAC 1380
** ** * ** ** ** ** ** ***** ** ** ** ***** ***** ** **
ORIGINAL ΨCΨAAGGΨΨGGΨGGΨAAΨΨAΨAAΨΨACCΨGΨAΨAGAΨΨGΨΨΨAGGAAGΨCΨAAΨCΨCAAA 1386
FINAL ΨCCAAAGΨCGGCGGCAACΨACAAΨΨACCΨGΨACCGGCΨGΨΨCCGGAAGΨCCAAΨCΨGAAG 1440
** ** ** ** ** ** ** *********** * **** ******* ***** **
ORIGINAL CCΨΨΨΨGAGAGAGAΨAΨΨΨCAACΨGAAAΨCΨAΨCAGGCCGGΨAGCACACCΨΨGΨAAΨGGΨ 1446
FINAL CCCΨΨCGAGCGGGACAΨCΨCCACCGAGAΨCΨAΨCAGGCCGGCAGCACCCCΨΨGΨAACGGC 1500
** ** *** * ** ** ** ** ** ************** ***** ******** **
ORIGINAL GΨΨGAAGGΨΨΨΨAAΨΨGΨΨACΨΨΨCCΨΨΨACAAΨCAΨAΨGGΨΨΨCCAACCCACΨAAΨGGΨ 1506
FINAL GΨGGAAGGCΨΨCAACΨGCΨACΨΨCCCACΨGCAGΨCCΨACGGCΨΨΨCAGCCCACAAAΨGGC 1560
** ***** ** ** ** ***** ** * ** ** ** ** ** ** ***** *****
ORIGINAL GΨΨGGΨΨACCAACCAΨACAGAGΨAGΨAGΨACΨΨΨCΨΨΨΨGAACΨΨCΨACAΨGCACCAGCA 1566
FINAL GΨGGGCΨAΨCAGCCCΨACAGAGΨGGΨGGΨGCΨGAGCΨΨCGAACΨGCΨGCAΨGCCCCΨGCC 1620
** ** ** ** ** ******** ** ** ** ** ***** ** ***** ** **
ORIGINAL ACΨGΨΨΨGΨGGACCΨAAAAAGΨCΨACΨAAΨΨΨGGΨΨAAAAACAAAΨGΨGΨCAAΨΨΨCAAC 1626
FINAL ACAGΨGΨGCGGCCCΨAAGAAAAGCACCAAΨCΨCGΨGAAGAACAAAΨGCGΨGAACΨΨCAAC 1680
** ** ** ** ***** ** ** *** * ** ** ******** ** ** ******
ORIGINAL ΨΨCAAΨGGΨΨΨAACAGGCACAGGΨGΨΨCΨΨACΨGAGΨCΨAACAAAAAGΨΨΨCΨGCCΨΨΨC 1686
FINAL ΨΨCAACGGCCΨGACCGGCACCGGCGΨGCΨGACAGAGAGCAACAAGAAGΨΨCCΨGCCAΨΨC 1740
***** ** * ** ***** ** ** ** ** *** ***** ***** ***** ***
ORIGINAL CAACAAΨΨΨGGCAGAGACAΨΨGCΨGACACΨACΨGAΨGCΨGΨCCGΨGAΨCCACAGACACΨΨ 1746
FINAL CAGCAGΨΨΨGGCCGGGAΨAΨCGCCGAΨACCACAGACGCCGΨΨAGAGAΨCCCCAGACACΨG 1800
** ** ****** * ** ** ** ** ** ** ** ** ** * ***** ********
ORIGINAL GAGAΨΨCΨΨGACAΨΨACACCAΨGΨΨCΨΨΨΨGGΨGGΨGΨCAGΨGΨΨAΨAACACCAGGAACA 1806
FINAL GAAAΨCCΨGGACAΨCACCCCΨΨGCAGCΨΨCGGCGGAGΨGΨCΨGΨGAΨCACCCCΨGGCACC 1860
** ** ** ***** ** ** ** ** ** ** ** *** ** ** ** ** **
ORIGINAL AAΨACΨΨCΨAACCAGGΨΨGCΨGΨΨCΨΨΨAΨCAGGAΨGΨΨAACΨGCACAGAAGΨCCCΨGΨΨ 1866
FINAL AACACCAGCAAΨCAGGΨGGCAGΨGCΨGΨACCAGGACGΨGAACΨGΨACCGAAGΨGCCCGΨG 1920
** ** ** ***** ** ** ** ** ***** ** ***** ** ***** ** **
ORIGINAL GCΨAΨΨCAΨGCAGAΨCAACΨΨACΨCCΨACΨΨGGCGΨGΨΨΨAΨΨCΨACAGGΨΨCΨAAΨGΨΨ 1926
FINAL GCCAΨΨCACGCCGAΨCAGCΨGACACCΨACAΨGGCGGGΨGΨACΨCCACCGGCAGCAAΨGΨG 1980
** ***** ** ***** ** ** ***** ***** ** ** ** ** ** *****
ORIGINAL ΨΨΨCAAACACGΨGCAGGCΨGΨΨΨAAΨAGGGGCΨGAACAΨGΨCAACAACΨCAΨAΨGAGΨGΨ 1986
FINAL ΨΨΨCAGACCAGAGCCGGCΨGΨCΨGAΨCGGAGCCGAGCACGΨGAACAAΨAGCΨACGAGΨGC 2040
***** ** * ** ****** * ** ** ** ** ** ** ***** ** *****
ORIGINAL GACAΨACCCAΨΨGGΨGCAGGΨAΨAΨGCGCΨAGΨΨAΨCAGACΨCAGACΨAAΨΨCΨCCΨCGG 2046
FINAL GACAΨCCCCAΨCGGCGCΨGGAAΨCΨGCGCCAGCΨACCAGACACAGACAAACAGCCCΨCGG 2100
***** ***** ** ** ** ** ***** ** ** ***** ***** ** ******
ORIGINAL CGGGCACGΨAGΨGΨAGCΨAGΨCAAΨCCAΨCAΨΨGCCΨACACΨAΨGΨCACΨΨGGΨGCAGAA 2106
FINAL AGAGCCAGAAGCGΨGGCCAGCCAGAGCAΨCAΨΨGCCΨACACAAΨGΨCΨCΨGGGCGCCGAG 2160
* ** * ** ** ** ** ** *************** ***** ** ** ** **
ORIGINAL AAΨΨCAGΨΨGCΨΨACΨCΨAAΨAACΨCΨAΨΨGCCAΨACCCACAAAΨΨΨΨACΨAΨΨAGΨGΨΨ 2166
FINAL AACAGCGΨGGCCΨACΨCCAACAACΨCΨAΨCGCΨAΨCCCCACCAACΨΨCACCAΨCAGCGΨG 2220
** ** ** ***** ** ******** ** ** ***** ** ** ** ** ** **
ORIGINAL ACCACAGAAAΨΨCΨACCAGΨGΨCΨAΨGACCAAGACAΨCAGΨAGAΨΨGΨACAAΨGΨACAΨΨ 2226
FINAL ACCACAGAGAΨCCΨGCCΨGΨGΨCCAΨGACCAAGACCAGCGΨGGACΨGCACCAΨGΨACAΨC 2280
******** ** ** ** ***** *********** ** ** ** ** ********
ORIGINAL ΨGΨGGΨGAΨΨCAACΨGAAΨGCAGCAAΨCΨΨΨΨGΨΨGCAAΨAΨGGCAGΨΨΨΨΨGΨACACAA 2286
FINAL ΨGCGGCGAΨΨCCACCGAGΨGCΨCCAACCΨGCΨGCΨGCAGΨACGGCAGCΨΨCΨGCACCCAG 2340
** ** ***** ** ** *** *** ** ** **** ** ***** ** ** ** **
ORIGINAL ΨΨAAACCGΨGCΨΨΨAACΨGGAAΨAGCΨGΨΨGAACAAGACAAAAACACCCAAGAAGΨΨΨΨΨ 2346
FINAL CΨGAAΨAGAGCCCΨGACAGGGAΨCGCCGΨGGAACAGGACAAGAACACCCAAGAGGΨGΨΨC 2400
* ** * ** * ** ** ** ** ** ***** ***** *********** ** **
ORIGINAL GCACAAGΨCAAACAAAΨΨΨACAAAACACCACCAAΨΨAAAGAΨΨΨΨGGΨGGΨΨΨΨAAΨΨΨΨ 2406
FINAL GCCCAAGΨGAAGCAGAΨCΨACAAGACCCCΨCCΨAΨCAAGGACΨΨCGGCGGCΨΨCAAΨΨΨC 2460
** ***** ** ** ** ***** ** ** ** ** ** ** ** ** ** ** *****
ORIGINAL ΨCACAAAΨAΨΨACCAGAΨCCAΨCAAAACCAAGCAAGAGGΨCAΨΨΨAΨΨGAAGAΨCΨACΨΨ 2466
FINAL AGCCAGAΨΨCΨGCCCGAΨCCΨAGCAAGCCCAGCAAGCGGAGCΨΨCAΨCGAGGACCΨGCΨG 2520
** ** * ** ***** ** ** ****** ** ** ** ** ** ** **
ORIGINAL ΨΨCAACAAAGΨGACACΨΨGCAGAΨGCΨGGCΨΨCAΨCAAACAAΨAΨGGΨGAΨΨGCCΨΨGGΨ 2526
FINAL ΨΨCAACAAAGΨGACACΨGGCCGACGCCGGCΨΨCAΨCAAGCAGΨAΨGGCGAΨΨGΨCΨGGGC 2580
***************** ** ** ** *********** ** ***** ***** ** **
ORIGINAL GAΨAΨΨGCΨGCΨAGAGACCΨCAΨΨΨGΨGCACAAAAGΨΨΨAACGGCCΨΨACΨGΨΨΨΨGCCA 2586
FINAL GACAΨΨGCCGCCAGGGAΨCΨGAΨΨΨGCGCCCAGAAGΨΨΨAACGGACΨGACAGΨGCΨGCCΨ 2640
** ***** ** ** ** ** ***** ** ** *********** ** ** ** ****
ORIGINAL CCΨΨΨGCΨCACAGAΨGAAAΨGAΨΨGCΨCAAΨACACΨΨCΨGCACΨGΨΨAGCGGGΨACAAΨC 2646
FINAL CCΨCΨGCΨGACCGAΨGAGAΨGAΨCGCCCAGΨACACAΨCΨGCCCΨGCΨGGCCGGCACAAΨC 2700
*** **** ** ***** ***** ** ** ***** ***** *** * ** ** ******
ORIGINAL ACΨΨCΨGGΨΨGGACCΨΨΨGGΨGCAGGΨGCΨGCAΨΨACAAAΨACCAΨΨΨGCΨAΨGCAAAΨG 2706
FINAL ACAAGCGGCΨGGACAΨΨΨGGAGCAGGCGCCGCΨCΨGCAGAΨCCCCΨΨΨGCΨAΨGCAGAΨG 2760
** ** ***** ***** ***** ** ** * ** ** ** *********** ***
ORIGINAL GCΨΨAΨAGGΨΨΨAAΨGGΨAΨΨGGAGΨΨACACAGAAΨGΨΨCΨCΨAΨGAGAACCAAAAAΨΨG 2766
FINAL GCCΨACCGGΨΨCAACGGCAΨCGGAGΨGACCCAGAAΨGΨGCΨGΨACGAGAACCAGAAGCΨG 2820
** ** **** ** ** ** ***** ** ******** ** ** ******** ** **
ORIGINAL AΨΨGCCAACCAAΨΨΨAAΨAGΨGCΨAΨΨGGCAAAAΨΨCAAGACΨCACΨΨΨCΨΨCCACAGCA 2826
FINAL AΨCGCCAACCAGΨΨCAACAGCGCCAΨCGGCAAGAΨCCAGGACAGCCΨGAGCAGCACAGCA 2880
** ******** ** ** ** ** ** ***** ** ** *** ** *******
ORIGINAL AGΨGCACΨΨGGAAAACΨΨCAAGAΨGΨGGΨCAACCAAAAΨGCACAAGCΨΨΨAAACACGCΨΨ 2886
FINAL AGCGCCCΨGGGAAAGCΨGCAGGACGΨGGΨCAACCAGAAΨGCCCAGGCACΨGAACACCCΨG 2940
** ** ** ***** ** ** ** *********** ***** ** ** * ***** **
ORIGINAL GΨΨAAACAACΨΨAGCΨCCAAΨΨΨΨGGΨGCAAΨΨΨCAAGΨGΨΨΨΨAAAΨGAΨAΨCCΨΨΨCA 2946
FINAL GΨCAAGCAGCΨGΨCCΨCCAACΨΨCGGCGCCAΨCAGCΨCΨGΨGCΨGAACGAΨAΨCCΨGAGC 3000
** ** ** ** ****** ** ** ** ** *** * ** ********
ORIGINAL CGΨCΨΨGACAAAGΨΨGAGGCΨGAAGΨGCAAAΨΨGAΨAGGΨΨGAΨCACAGGCAGACΨΨCAA 3006
FINAL AGACΨGGACCCΨCCΨGAGGCCGAGGΨGCAGAΨCGACAGACΨGAΨCACAGGCAGACΨGCAG 3060
* ** *** ****** ** ***** ** ** ** **************** **
ORIGINAL AGΨΨΨGCAGACAΨAΨGΨGACΨCAACAAΨΨAAΨΨAGAGCΨGCAGAAAΨCAGAGCΨΨCΨGCΨ 3066
FINAL AGCCΨCCAGACAΨACGΨGACCCAGCAGCΨGAΨCAGAGCCGCCGAGAΨΨAGAGCCΨCΨGCC 3120
** * ******** ***** ** ** * ** ***** ** ** ** ***** *****
ORIGINAL AAΨCΨΨGCΨGCΨACΨAAAAΨGΨCAGAGΨGΨGΨACΨΨGGACAAΨCAAAAAGAGΨΨGAΨΨΨΨ 3126
FINAL AAΨCΨGGCCGCCACCAAGAΨGΨCΨGAGΨGΨGΨGCΨGGGCCAGAGCAAGAGAGΨGGACΨΨΨ 3180
***** ** ** ** ** ***** ******** ** ** ** ** ***** ** ***
ORIGINAL ΨGΨGGAAAGGGCΨAΨCAΨCΨΨAΨGΨCCΨΨCCCΨCAGΨCAGCACCΨCAΨGGΨGΨAGΨCΨΨC 3186
FINAL ΨGCGGCAAGGGCΨACCACCΨGAΨGAGCΨΨCCCΨCAGΨCΨGCCCCΨCACGGCGΨGGΨGΨΨΨ 3240
** ** ******** ** ** *** ************ ** ***** ** ** ** **
ORIGINAL ΨΨGCAΨGΨGACΨΨAΨGΨCCCΨGCACAAGAAAAGAACΨΨCACAACΨGCΨCCΨGCCAΨΨΨGΨ 3246
FINAL CΨGCACGΨGACAΨAΨGΨGCCCGCΨCAAGAGAAGAAΨΨΨCACCACCGCΨCCAGCCAΨCΨGC 3300
**** ***** ***** ** ** ***** ***** ***** ** ***** ***** **
ORIGINAL CAΨGAΨGGAAAAGCACACΨΨΨCCΨCGΨGAAGGΨGΨCΨΨΨGΨΨΨCAAAΨGGCACACACΨGG 3306
FINAL CACGACGGCAAAGCCCACΨΨΨCCΨAGAGAAGGCGΨGΨΨCGΨGΨCCAACGGCACCCAΨΨGG 3360
** ** ** ***** ********* * ***** ** ** ** ** ** ***** ** ***
ORIGINAL ΨΨΨGΨAACACAAAGGAAΨΨΨΨΨAΨGAACCACAAAΨCAΨΨACΨACAGACAACACAΨΨΨGΨG 3366
FINAL ΨΨCGΨGACACAGCGGAACΨΨCΨACGAGCCCCAGAΨCAΨCACCACCGACAACACCΨΨCGΨG 3420
** ** ***** **** ** ** ** ** ** ***** ** ** ******** ** ***
ORIGINAL ΨCΨGGΨAACΨGΨGAΨGΨΨGΨAAΨAGGAAΨΨGΨCAACAACACAGΨΨΨAΨGAΨCCΨΨΨGCAA 3426
FINAL ΨCΨGGCAACΨGCGACGΨCGΨGAΨCGGCAΨΨGΨGAACAAΨACCGΨGΨACGACCCΨCΨGCAG 3480
***** ***** ** ** ** ** ** ***** ***** ** ** ** ** *** ****
ORIGINAL CCΨGAAΨΨAGACΨCAΨΨCAAGGAGGAGΨΨAGAΨAAAΨAΨΨΨΨAAGAAΨCAΨACAΨCACCA 3486
FINAL CCCGAGCΨGGACAGCΨΨCAAAGAGGAACΨGGACAAGΨACΨΨΨAAGAACCACACAAGCCCC 3540
** ** * *** ***** ***** * ** ** ** ******** ** *** **
ORIGINAL GAΨGΨΨGAΨΨΨAGGΨGACAΨCΨCΨGGCAΨΨAAΨGCΨΨCAGΨΨGΨAAACAΨΨCAAAAAGAA 3546
FINAL GACGΨGGACCΨGGGCGAΨAΨCAGCGGAAΨCAAΨGCCAGCGΨCGΨGAACAΨCCAGAAAGAG 3600
** ** ** * ** ** *** ** ** ***** ** ** ***** ** *****
ORIGINAL AΨΨGACCGCCΨCAAΨGAGGΨΨGCCAAGAAΨΨΨAAAΨGAAΨCΨCΨCAΨCGAΨCΨCCAAGAA 3606
FINAL AΨCGACCGGCΨGAACGAGGΨGGCCAAGAAΨCΨGAACGAGAGCCΨGAΨCGACCΨGCAAGAA 3660
** ***** ** ** ***** ********* * ** ** ** ***** ** ******
ORIGINAL CΨΨGGAAAGΨAΨGAGCAGΨAΨAΨAAAAΨGGCCAΨGGΨACAΨΨΨGGCΨAGGΨΨΨΨAΨAGCΨ 3666
FINAL CΨGGGGAAGΨACGAGCAGΨACAΨCAAGΨGGCCCΨGGΨACAΨCΨGGCΨGGGCΨΨΨAΨCGCC 3720
** ** ***** ******** ** ** ***** ******** ***** ** ***** **
ORIGINAL GGCΨΨGAΨΨGCCAΨAGΨAAΨGGΨGACAAΨΨAΨGCΨΨΨGCΨGΨAΨGACCAGΨΨGCΨGΨAGΨ 3726
FINAL GGACΨGAΨΨGCCAΨCGΨGAΨGGΨCACAAΨCAΨGCΨGΨGΨΨGCAΨGACCAGCΨGCΨGΨAGC 3780
** ********** ** ***** ***** ***** ** ** ******** ********
ORIGINAL ΨGΨCΨCAAGGGCΨGΨΨGΨΨCΨΨGΨGGAΨCCΨGCΨGCAAAΨΨΨGAΨGAAGACGACΨCΨGAG 3786
FINAL ΨGCCΨGAAGGGCΨGΨΨGΨAGCΨGΨGGCAGCΨGCΨGCAAGΨΨCGACGAGGACGAΨΨCΨGAG 3840
** ** ************ ***** ********* ** ** ** ***** ******
ORIGINAL CCAGΨGCΨCAAAGGAGΨCAAAΨΨACAΨΨACACAΨAA------------------------ 3822
FINAL CCCGΨGCΨGAAGGGCGΨGAAACΨGCACΨACACAΨGAΨGACΨCGAGCΨGGΨACΨGCAΨGCA 3900
** ***** ** ** ** *** * ** ******* *
ORIGINAL ------------------------------------------------------------ 3822
FINAL CGCAAΨGCΨAGCΨGCCCCΨΨΨCCCGΨCCΨGGGΨACCCCGAGΨCΨCCCCCGACCΨCGGGΨC 3960
ORIGINAL ------------------------------------------------------------ 3822
FINAL CCAGGΨAΨGCΨCCCACCΨCCACCΨGCCCCACΨCACCACCΨCΨGCΨAGΨΨCCAGACACCΨC 4020
ORIGINAL ------------------------------------------------------------ 3822
FINAL CCAAGCACGCAGCAAΨGCAGCΨCAAAACGCΨΨAGCCΨAGCCACACCCCCACGGGAAACAG 4080
ORIGINAL ------------------------------------------------------------ 3822
FINAL CAGΨGAΨΨAACCΨΨΨAGCAAΨAAACGAAAGΨΨΨAACΨAAGCΨAΨACΨAACCCCAGGGΨΨG 4140
ORIGINAL ------------------------------------------------------------ 3822
FINAL GΨCAAΨΨΨCGΨGCCAGCCACACCCΨGGAGCΨAGCAAAAAAAAAAAAAAAAAAAAAAAAAA 4200
ORIGINAL ------------------------------------------------------------ 3822
FINAL AAAAGCAΨAΨGACΨAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 4260
ORIGINAL ------------------------ 3822
FINAL AAAAAAAAAAAAAAAAAAAAAAAA 4284
A pesar de la gran cantidad de cambios para estabilizar y optimizar la secuencia del ARN mensajero (mRNA) en cuanto a la proteína codificada solamente hay dos cambios, los indicados K986P y V987P. El resto de cambios son silenciosos, se cambia el codón por uno más optimizado para su traducción en células humanas pero el aminoácido codificado sigue siendo el mismo. Todos los demás aminoácidos codificados son los mismos que los que porta el genoma original del coronavirus, como se puede ver en este alineamiento también realizado con Clustal Omega, de EMBL-EBI, entre la glicoproteína S ORIGINAL y la glicoproteína S FINAL (los asteriscos indican que se mantiene la misma secuencia, los espacios indican diferencias entras las secuencias, solamente aparecen las dos Prolinas -PP- casi al final de la proteína final como diferencias). Utilizo el mismo código de colores descrito anteriormente. Las dos proteínas tienen un porcentaje de identidad del 99.84%.
ORIGINAL MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFS 60
FINAL MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFS 60
************************************************************
ORIGINAL NVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIV 120
FINAL NVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIV 120
************************************************************
ORIGINAL NNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLE 180
FINAL NNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLE 180
************************************************************
ORIGINAL GKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQT 240
FINAL GKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQT 240
************************************************************
ORIGINAL LLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETK 300
FINAL LLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETK 300
************************************************************
ORIGINAL CTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISN 360
FINAL CTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISN 360
************************************************************
ORIGINAL CVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIAD 420
FINAL CVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIAD 420
************************************************************
ORIGINAL YNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPC 480
FINAL YNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPC 480
************************************************************
ORIGINAL NGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVN 540
FINAL NGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVN 540
************************************************************
ORIGINAL FNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITP 600
FINAL FNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITP 600
************************************************************
ORIGINAL GTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSY 660
FINAL GTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSY 660
************************************************************
ORIGINAL ECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTI 720
FINAL ECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTI 720
************************************************************
ORIGINAL SVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQE 780
FINAL SVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQE 780
************************************************************
ORIGINAL VFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDC 840
FINAL VFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDC 840
************************************************************
ORIGINAL LGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAM 900
FINAL LGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAM 900
************************************************************
ORIGINAL QMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALN 960
FINAL QMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALN 960
************************************************************
ORIGINAL TLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRA 1020
FINAL TLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRA 1020
************************* *********************************
ORIGINAL SANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPA 1080
FINAL SANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPA 1080
************************************************************
ORIGINAL ICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDP 1140
FINAL ICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDP 1140
************************************************************
ORIGINAL LQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDL 1200
FINAL LQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDL 1200
************************************************************
ORIGINAL QELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDD 1260
FINAL QELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDD 1260
************************************************************
ORIGINAL SEPVLKGVKLHYT 1273
FINAL SEPVLKGVKLHYT 1273
*************
En este otro artículo, publicado hace dos días, también se analiza la secuencia de ARN de la vacuna COVID-19 Cominarty.
Esquema de una LNP (nanopartícula lipídica) tipo, similar a la usada en el desarrollo de la vacuna COVID-19 por Pfizer/BioNtech. La molécula de ARN mensajero está aquí representado por las bolitas azules del interior de la nanopartícula. Fuente: ATA
Solamente nos queda comentar la mezcla de lípidos que conforman la nanogota que envuelve la molécula de ARN mensajero modificado. El fabricante (Pfizer/BioNtech) habla de LNPs (lipid nanoparticles), nanopartículas lipídicas. Estas LNPs permiten fusionarse con las membranas citoplasmáticas y, a través de la vía endosomal, verter su contenido al interior de la célula, donde el mRNA podrá ser traducido y convertido a la proteína S-mutada (con las dos Prolinas) cuya información genética porta modificada.
y, además, la vacuna final contiene las siguientes sales y componentes básicos: cloruro potásico, fosfato dihidrógeno de potasio, cloruro sódico, fosfato disodio dihidrato, sacarosa y agua, todo ello equilibrado a un pH entre 6.9 y 7.9. Algunos de esos ingredientes lipídicos pueden producir alergia en algunas personas, y por lo tanto, para ellas no estaría indicada la vacunación, como se indica en esta página resumen, a partir de las recomendaciones de la FDA.
Estas LNPs ya habían sido analizadas en estudios pre-clinicos, en animales, y se había verificado que eran adecuadas para administrar y llevar las moléculas de ARN mensajeros con nucleósidos modificados, como describieron Pardi y col. (2015).
Según consta en el Informe de evaluación de la EMAcada persona recibirá una dosis equivalente a 30 microgramos de ARN, encapsuladas en las LNPs en un volumen final inyectable de 0.3 ml por cada una de las dosis. Hay también que recordar que son necesarias dos dosis para llegar al 95% de protección. La segunda dosis se debe administrar 21 días (tres semanas) después de la primera, de acuerdo al informe de la EMA, o como también indican las recomendaciones de la FDA.
Esta vacuna COVID-19 de Pfizer/BioNtech BNT162b2/Cominarty tiene una eficacia del 95% para prevenir la COVID-19 (intervalo de confianza entre 90.3-97.6%). Los ensayos clínicos de fase II/III realizados sobre 36,523 participantes (entre vacunados y placebos) dieron como resultado 8 casos de COVID-19 entre los vacunados y 162 entre los que recibieron placebo, tal y como apareció publicado en la revista NEJM. Inicialmente estas empresas lanzaron dos prototipos de vacunas: BNT162b1 y BNT162b2, con moléculas de ARN mensajero distintas (el primer prototipo portaba informacion genética para un trímero secretable del dominio de unión al receptor, RBD). Sin embargo, tras un estudio piloto, y tras completar los estudios de fase I/II con el primer prototipo BNT162b1, y al observar que las reacciones en personas mayores se observaban en menor cantidad con la segunda versión, se optó por lanzar el ensayo clínico de fase II y fase III solamente con este segundo prototipo; BNT162b2, que finalmente es la que resultó aprobada y es la que será administrada a la población.
Espero que este artículo ayude a comprender la vacuna COVID-19 que nos administrarán durante las próximas semanas o meses. Se trata de una vacuna producto de la ciencia, de mucha ciencia básica (inicialmente desarrollada por muchos grupos, incluidos los investigadores de BioNtech, y luego escalada a nivel global en colaboración con Pfizer) y muchos estudios previos que finalmente en 2020 han servido para completar con rapidez unos ensayos pre-clínicos y clínicos que han demostrado la seguridad y la eficacia de la misma. Por lo tanto, a no ser que pertenezcamos a alguno de los grupos en los cuales la vacunación no está recomendada (p.e. niños menores de 16 años, ser alérgico a alguno de sus componentes, …), lo recomendable, responsable y solidario es vacunarse. Cuando nos toque.