Predicción de estructura secundaria de proteínas

Las proteínas naturales en disolución no son estables en conformaciones extendidas. Dentro de un solvente acuoso un polipéptido tiene muchos grupos capaces de formar puentes de hidrógeno y por tanto de manera espontánea se forman [elementos de estructura secundaria] como láminas beta y alfa hélices dextrógiras, que quedan conectados entre si por lazos loops y a veces por regiones intrínsecamente desordenadas.

Figura 2.1: Cuatro ejemplos de proteínas y sus elementos de estructura secundaria en estado nativo. Figura tomada de Freddolino et al. (2010).
Image sselements

A la hora de modelar una proteína puede ser útil conocer su estructura secundaria, fundamentalmente porque nos ayuda a descartar templates o a alinearlos correctamente, haciendo que las alfa hélices coincidan, por ejemplo. Además, si una secuencia se predice como intrínsecamente desordenada no tiene sentido tratar de modelarla. Por estas razones, antes de empezar un proyecto de modelado comparativo es conveniente hacer un breve análisis computacional de la secuencia problema. Aquí nos centraremos en la estructura secundaria y el posible desorden, pero hay otras características que pueden ser asimismo interesantes, como señales de localización celular, motivos funcionales o sitios de procesamiento postransduccional.

La estructura secundaria se puede predecir con bastantes errores a partir de la secuencia de aminoácidos, en 3 estados:

La calidad de las predicciones mejora sustancialmente cuando consideramos las secuencias de otras proteínas homólogas, puesto que los patrones de sustitución de aminoácidos proporcionan información valiosa. El primer método que dio un salto de calidad usando redes neuronales para capturar esta información fue PHD (Rost, 1996), hoy integrado en PredictProtein, y el primero en proponer predicciones consensuadas entre distintos programas fue Jpred. El mejor método, validado de manera recurrente en CASP, sigue siendo PSIPRED (Jones, 1999).

Gracias a estas aportaciones hoy se estima que la precisión a nivel de residuo de las predicciones de estructura secundaria es del orden del 80%, y la búsqueda de nuevos métodos continúa, tratando de hacer predicciones más realistas, por ejemplo evitando predecir hélices de un solo residuo (Madera et al., 2010).

Un tipo de predictores relacionado con éstos son los que predicen topologías transmembrana, que pueden ser muy útiles para modelar transportadores o en general cualquier proteína que atraviese una membrana lipídica, y para averiguar de qué lado queda un loop que nos interesa, por ejemplo. Entre el software adecuado para estas tareas destaco por ejemplo MEMSAT, TMHMM o el consenso TOPCONS.

Figura 2.2: Modelo de topología transmembrana tomado de Zhen et al. (1997).
Image transm

Finalmente, como consecuencia de los descubrimientos de proteínas intrínsecamente desordenadas, ha habido mucho interés recientemente por caracterizar y predecir este tipo de desorden. De hecho ya se evalúan este tipo de predicciones en CASP, donde destacan los servidores DISOPRED, PreDisorder y PrDOS. El reto de estas herramientas es afinar sus resultados para regiones desordenadas de más de 20 residuos (Monastyrskyy et al., 2011).



Subsecciones

Bruno Contreras-Moreira
http://www.eead.csic.es/compbio