ARTÍCULO ORIGINAL

 

Predicción computacional cuantitativa de epítopos de células B

 

In silico quantitative prediction of B-cell epitope

 

 

Raúl Isea

Fundación Instituto de Estudios Avanzados, Hoyo de la Puerta, Baruta, Venezuela.

email: risea@idea.gob.ve

Dr. en Ciencias Químicas

 

 


RESUMEN

El presente trabajo desarrolla una metodología computacional para la predicción cuantitativa de epítopos de células B. Para ello, se definió la función <F> que reflejará el valor promedio de los epítopos B predichos tras considerar ocho predictores de epítopos B diferentes, así como los factores estructurales y energéticos de la proteína de donde estos se derivan. La metodología propuesta pudiera ser útil para desarrollar nuevas vacunas contra el dengue y el chikungunya.

Palabras clave: epítopo, célula B, dengue, chikungunya.


ABSTRACT

This paper shows a computational approach for quantitative prediction of B cell epitopes. The function <F> was defined, which reflects the average value of B epitopes, according to eight predictors of different B epitopes, as well as structural and energetic considerations of the origin protein. The proposed methodology could be useful to develop both dengue and chikungunya vaccines.

Keywords: epitope, B cell, dengue, chikungunya.


 

INTRODUCCIÓN

La predicción de epítopos en células B es una de las técnicas computacionales por excelencia que están siendo empleadas para el diseño racional de vacunas, así como en el desarrollo potencial de métodos de diagnóstico, como se ha explicado en esta serie de trabajos científicos (1-3).

Actualmente, existe una gama de programas de computación capaces de realizar la predicción de epítopos de células B, algunos de los cuales se muestran en la Tabla 1. Estos se agrupan según el tipo de predicción: conformacional o discontinua, y lineal o continua.

Una recopilación más completa están indicadas en (4, 5).

Los programas mencionados permiten la predicción de epítopos B, pero condicionados porque su valor debe superar un valor de corte (del inglés cutoff) que va a variar en cada programa; es decir, y a modo de ejemplo: el programa BepiPred considera que un aminoácido contribuye a un potencial epítopo B si dicho valor es igual o superior a 0,7, mientras que el criterio de acuerdo al programa DiscoTope es que el resultado sea menor a -7. En el caso de BcePred y ElliPro, rige que deben superar el valor de corte de 1,9 y 0,7, respectivamente.

Conviene recordar que los epítopos B predichos deben estar expuestos al solvente, por ende, debe ser un criterio importante a la hora de seleccionarlos. Entre los programas que se utilizan para determinar el grado de exposición al solvente, cabe citar NetSurfP (6), Vadar (7) y PoPMuSiC (8). Esta idea no es nueva, y se ha empleado como pauta en múltiples trabajos publicados en la literatura científica (9).

Existen además diversas revisiones centradas en realizar comparaciones de resultados entre los distintos predictores de epítopos B; un ejemplo es el estudio publicado por Kringelum (10) donde se analizan los resultados obtenidos con los programas PEPITO (ahora conocido como BEpro), ElliPro, SEPPA, Epitopia, EPCES y EPSVR (10).

Nosotros vamos a definir una función cuantitativa llamada <F> que reflejará información de la frecuencia de aparición de los epítopos B predichos por una gama de programas (tanto lineales como conformacionales), y a su vez expresará las contribuciones debido a factores energéticos y estructurales de la proteína de los cuales ellas se derivan. En ese sentido, se determinará la energía libre de Gibbs, que nos indica cuán estable es un aminoácido con respecto a posibles mutaciones en dicha posición. Esta condición no se ha considerado hasta la fecha para cuantificar un epítopo, pero puede ayudar a describir aquellos epítopos B que provienen de secciones de la proteína propensas a cambios por algún proceso evolutivo donde se suponga que pueden ser los mejores candidatos a la hora de diseñar una vacuna o método de diagnóstico. De modo que valores muy altos muestran la tendencia a que el aminoácido sea propenso a una mutación. Entre los programas que permiten este estudio figuran por ejemplo PoPMuSiC (11), ENCoM (12) y BAPPL (13).

Por otra parte, se determinará el grado de movilidad de cada uno de los aminoácidos dependiendo del análisis de los modos de vibración normal de los átomos que conforman la proteína. De manera que valores muy altos corresponderán a gran movilidad de los átomos que integran esos aminoácidos. Lógicamente, la movilidad de los átomos en el epítopo no se correlacionará con el valor predicho en el epítopo, pero permitirá reconocer regiones lábiles con respecto a las de menor movilidad. Entre los programas empleados para el cálculo de los modos de vibración normal se cuentan elNémo (14) y WEBnm@ (15).

Recordemos que elNémo obtiene los cinco modos normales de baja frecuencia de la proteína para finalmente fijar un coeficiente de correlación entre los factores B observados en la estructura tridimensional de la proteína, y los predichos por esta metodología computacional. El coeficiente debe ser mayor a 0,6 para ser significativo; y es justamente este valor el que determinará la selección de aquellos epítopos que presenten los valores menores.

Este procedimiento se aplicará en dos proteínas independientes entre sí, que han sido empleadas como candidatas a vacuna para posiblemente afrontar la fiebre causada por el virus de chikungunya y la producida por el virus del dengue. Recordemos que el dengue y el chikungunya, transmitidos por la picadura de mosquitos infectados, el Aedes aegypti y el Aedes albopictus, presentan similar sintomatología. Ambos virus son del tipo arbovirus: el primero pertenece a la familia Flaviviridae, mientras que el del chikungunya pertenece a la familia Togaviridae y se propagan frecuentemente en las regiones tropicales y subtropicales.

En la literatura se consiguen diversos estudios focalizados en la predicción de epítopos en células B en dengue como se muestra en el trabajo de Nevis y colaboradores (16), basados en los resultados de los programas ABCPred y BcePred; así como el recientemente publicado por Isea (17) donde empleó los programas BepiPred, BcePred y BCPreds. Sin embargo, el presente trabajo plantea una nueva función para cuantificar la predicción de los epítopos B según factores estructurales y energéticos, en vez de indicar únicamente la frecuencia de aparición de esos epítopos mediante una amplia gama de predictores.

 

MATERIALES Y MÉTODOS

El requisito de la presente metodología para determinar la predicción de epítopos B es conocer tanto su secuencia de aminoácidos (necesario para la predicción de los epítopos lineales), y la información derivada de su conformación tridimensional (requisito para la predicción conformacional), como se describe a continuación:

1.-Se realizan las ocho predicciones de epítopos B empleando para ello todos los programas indicados en la Tabla 1. Es importante reseñar que para obtener los resultados con los programas BCPreds y ABCPred, fue necesario indicar la longitud del epítopo B predicho, el cual se fijó en 10 aminoácidos, con una especificidad del 75% y 0,51, impuestos respectivamente.

2.-A partir de los epítopos predichos, se agrupan los resultados de acuerdo al tipo de predicción, es decir, aquellos que potencialmente pueden presentar una conformación lineal y los otros del tipo conformacional. En cada grupo, se determina la frecuencia de aparición del aminoácido presente en el epítopo, y lo vamos a denotar con las letras WL y WC, que corresponden a los obtenidos por los epítopos lineales (de allí la letra "L") y conformacionales (representado con "C"); con la condición que sí el mismo no es predicho por al menos dos predictores, dicho valor será igual cero (más adelante se visualiza con un ejemplo ilustrativo).

3.-Se determinan computacionalmente los cambios energéticos en cada uno de los aminoácidos que conforman la proteína inicial con la que se desea predecir los epítopos empleando para ello el cálculo de la energía libre de Gibbs. Para ello, se empleó el programa PoPMuSiC. Este criterio no tiene base experimental, es una condición que pretende examinar la posibilidad de considerar la estabilidad del aminoácido predicho en cada epítopo. El programa puede ofrecer un valor igual a cero (0), en cuyo caso, se sustituirá por -0,01, un valor seleccionado arbitrariamente, hasta que se optimice dicho valor a través de ensayos experimentales.

4.-Se predicen los modos normales de vibración de la proteína a partir de un modelo de redes elásticas, que ha sido posible gracias al uso del programa elNémo. Sin embargo, no es una garantía que dicha predicción sea exitosa hasta que se valide con una data experimental, la cual se espera realizar en futuros trabajos.

5.-Se van a definir y determinar los valores de las funciones cuantitativas FL y FC de la siguiente manera:

FL = WL . ΔΔ G . S1 . S2 / B

FC = WC . ΔΔ G . S1 . S2 / B

WL y WC son la frecuencia de aparición de los aminoácidos presentes en dicho epítopo, mientras que ΔΔ G es el valor del cambio de energía libre obtenido con PoPMuSiC. Asimismo, debería favorecer a aquellos que están expuestos a la superficie gracias a los resultados logrados mediante el programa PoPMuSiC (representado por S1) y con el programa NetSurfP (S2), e inversamente proporcional a la movilidad resultante de los aminoácidos de la proteína de donde se deriva el epítopo obtenido con ayuda del programa elNémo (señalado con la letra B).

6.-Finalmente, las funciones <FL> y <FC> corresponde al valor promedio de cada epítopo B de acuerdo a cada uno de los valores de FL y FC descrito en los puntos anteriores, con la condición adicional que la extensión del mismo debe ser igual o superior a cinco aminoácidos. Dicho rango se podrá ajustar tras ensayos estadísticos que se realizará a futuro.

 

RESULTADOS Y DISCUSIÓN

En la Tabla 2 se muestra una región ilustrativa con los resultados obtenidos tras evaluar la glicoproteína del virus del chikungunya (cuyo identificador en la base de datos PDB es 2XFB) desde el aminoácido Cisteína (posición 330) hasta la Valina (347), donde se indican los valores del factor de temperatura conseguido con elNémo (abreviado como B), y el valor del cálculo de energía libre (ΔΔ G) y la accesibilidad del solvente (S1) logrados con el programa PoPMuSiC y NetSurfP (S2). El resultado de la predicción de los epítopos B fue posible con los programas BcePred (abreviado como Bce), ABCPred (ABC), BCPreds (BCP), BepiPred (Bepi), DiscoTope (Dis), ElliPro (Elli) y SEPPA (SEP). Se resaltaron en negritas aquellos aminoácidos que de acuerdo a los programas de predicción son candidatos a formar parte de un epítopo B. Posteriormente, se observan los valores de FL y FC que reflejan el valor de la función correspondiente a una predicción lineal y conformacional, respectivamente. Consideremos por ejemplo la Alanina en la posición 335. Este aminoácido está presente en la predicción de los epítopos B del tipo lineal (BCPreds y BepiPred), y conformacional (DiscoTope), de allí que los valores de WL y WC sean dos y cero, respectivamente (no se muestran en la Tabla 2). WC es cero porque solo es predicho por un método conformacional (ver sección anterior para detalles). FL será resultado de multiplicar los siguiente cuatro términos, WL (2), el valor del cambio de energía libre de Gibbs (-0,27), y los valores de exposición del solvente 35,80 y 0,101 (correspondientes a S1 y S2, respectivamente), dividido por el factor de temperatura en dicha posición (0,19). Finalmente, el valor de FL será -10,1, mientras que el valor de FC para dicho aminoácido es cero al ser WC igual a cero (véase la posición 335 en la Tabla 2).

Solo resta indicar como se determinó <FL> que refleja el valor promedio de la predicción de epítopos B sopesado con contribuciones estructurales y energéticas del epítopo predicho per se. Del ejemplo anterior se desprende que el epítopo está entre la posición 333 hasta 341, cuyo valor medio de los valores FL en dicho intervalo (es decir, -595,0, -174,3, -10,1, -1,5, -108,1, -145,2, -8,7, -0,2 y -0,6) es igual a -115,96. De manera que según la metodología que proponemos en este trabajo, se predice el epítopo B lineal — PKARNPTVT — presenta un valor <FL> de -115,96 tras considerar propiedades estructurales y fisicoquímicas.

En la Tabla 3, se muestra la lista completa de los epítopos B obtenidos tras analizar la glicoproteína del virus del chikungunya cadena E con predictores del tipo lineal (3a) y conformacional (3b), y en la Tabla 4, los derivados de la glicoproteína del virus del dengue posiblemente presente con una conformación lineal (4a) y conformacional (4b).

 

CONCLUSIONES

El presente trabajo plantea una nueva metodología computacional para determinar epítopos lineales y conformacionales tras considerar los resultados de ocho predictores de epítopos de células B teniendo presente factores energéticos y estructurales de la proteína que los deriva. De hecho, la variable WL y WC expresan la frecuencia de aparición de los epítopos B según sea el método predicho, pero no contemplan otros factores que permitan dar valor agregado a los epítopos B predichos.

Por ello, se emplearon factores energéticos así como el grado de exposición del solvente para complementar y posiblemente dar un factor de peso para la selección del epítopo predicho de acuerdo a la movilidad y estimaciones energéticas de la proteína problema que produce los epítopos que serán escogidos. Sin embargo, es necesario realizar estudios adicionales para poder comparar entre sí los epítopos predichos antes de poder seleccionar y diseñar, por ejemplo, candidatos vacunales contra enfermedades virales como el dengue y el chikungunya.

 

Agradecimientos

Queremos expresar nuestro reconocimiento a los árbitros del trabajo por sus sugerencias. Este trabajo está dedicado a la memoria del Dr. Rafael Horacio Borges García.

 

Referencias

1. Yang X, Yu X. An introduction to epitope prediction methods and software. Rev Med Virol. 2009;19(2):77-96.

2. Isea, R. Designing a peptide-dendrimer for use as a synthetic vaccine against Plasmodium falciparum. Am J Bioinform Comput Biol. 2013;1:1-8.

3. Isea, R. Vacunología inversa aplicada en malaria: del genoma a los antígenos. En: De la Iglesia D, Aguiló J, Freire A, López V, Pazos A, editores. Tecnologías NBIC en salud: El papel protagonista de la Nanociencia. Aplicación de especial interés al cáncer colorrectal. España: CYTED; 2012: p. 34-40.

4. EL-Manzalawy Y, Honavar V. Recent advances in B-cell epitope prediction methods. Immunome Res. 2010;6(Suppl 2):S2. Disponible en: doi: 10.1186/1745-7580-6-S2-S2

5. Sun P, Ju H, Liu Z, Ning Q, Zhang J, Zhao X et al. Bioinformatics Resources and Tools for Conformational B-Cell Epitope Prediction. Comput Math Methods Med. 2013; 943636. Disponible en: doi: 10.1155/2013/943636

6. Petersen B, Petersen TN, Andersen P, Nielsen M, Lundegaard C. A generic method for assignment of reliability scores applied to solvent accessibility predictions. BMC Structural Biology 2009;9(51):1-10.

7. Willard L, Ranjan A, Zhang H, Monzavi H, Boyko RF, Sykes BD et al. VADAR: a web server for quantitative evaluation of protein structure quality. Nucleic Acids Res. 2003;31(13):3316-9.

8. Kwasigroch JM, Gilis D, Dehouck Y, Rooman M. PoPMuSiC, rationally designing point mutations in protein structures. Bioinformatics 2002;18(12):1701-2.

9. Isea R. Predicción de epítopos consenso de células B lineales en Plasmodium falciparum 3D7. Vaccimonitor 2013; 22(1):43-6.

10. Kringelum JV, Lundegaard C, Lund O, Nielsen M. Reliable B cell epitope predictions: impacts of method development and improved benchmarking. PLoSComput Biol. 2012;8(12):e1002829. Disponible en: doi: 10.1371/journal.pcbi.1002829

11. Gilis D, Rooman M. PoPMuSiC, an algorithm for predicting protein mutant stability changes. Application to prion proteins. Protein Eng. 2000;13(12):849-56.

12. Frappier V, Najmanovich RJ. A Coarse-Grained Elastic Network Atom Contact Model and Its Use in the Simulation of Protein Dynamics and the Prediction of the Effect of Mutations. PLoSComput Biol. 2014;10(4):e1003569. Disponible en: doi:10.1371/journal.pcbi.1003569

13. Jain T, Jayaram B. Anall atom energy based computational protocol for predicting binding affinities of protein-ligand complexes. FEBS Lett. 2005;579:6659-66.

14. Suhre K, Sanejouand YH. ElNémo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 2004;32(suppl 2) 610-4: disponible en: doi: 10.1093/nar/gkh368

15. Hollup SM, Salensminde G, Reuter N. WEBnm@: a web application for normal mode analyses of proteins. BMC Bioinformatics 2005;6(52):1-8.

16. Nevis A, Reyes F, Calero R, Camacho F, Acosta A. Predicción de epítopos T y B de la proteína NS4b del virus dengue tipo 3. Vaccimonitor 2013;22(3):14-21.

17. Isea R. Mapeo computacional de epítopos de células B presentes en el virus del dengue. INHRR 2013;44(1):25-9.

Recibido: Diciembre de 2014              Aceptado: Febrero de 2015