Fecha: 29/04/2021

Delimitación de promotores para optimizar el descubrimiento de secuencias reguladoras en plantas no modelo: el melocotonero como ejemplo

En el marco del trabajo de tesis doctoral realizado en la Estación Experimental de Aula Dei por Najla Ksouri, dirigido por Yolanda Gogorcena (Grupo de Genómica de Frutales y Vid) y Bruno Contreras Moreira (Laboratorio de Biología Computacional y Estructural), se han estudiado distintas estrategias para mejorar la eficiencia en la búsqueda de secuencias de ADN reguladoras en melocotonero. El estudio se realizó en colaboración con investigadores de la Universidad de Aix-Marsella y el Instituto Francés de Bioinformática. El artículo “Tuning promoter boundaries improves regulatory motif discovery in non model plants: the peach example”, se publicó en la revista Plant Physiology (https://doi.org/10.1093/plphys/kiaa091) https://plantae.org/recognizing-plant-physiology-authors-najla-ksouri/ [1].

La modulación de la expresión génica es un proceso extremadamente complejo, que ocurre a varios niveles y donde la regulación transcripcional juega un papel central. La maquinaria de transcripción está regulada por la interacción entre un tipo de proteínas, denominadas factores de transcripción (FT), y secuencias específicas de ADN localizadas en torno al promotor génico conocidas como elementos cis, que se suelen representar como consensos o motivos. En contraste con toda la cantidad de información disponible sobre los FT, conocemos muy pocas secuencias reguladoras.

Sin conocimientos previos, la búsqueda de secuencias reguladoras en melocotonero es difícil de abordar. Por tanto, para el descubrimiento de estos elementos se ha desarrollado un flujo de trabajo. La metodología requiere grupos de genes co-expresados y se evalúan 4 regiones promotoras en torno al sitio de inicio de la transcripción (Transcription Start Site, TSS, 0 pb) para determinar el intervalo más informativo en cuanto al número, significación y localización de los motivos de ADN encontrados. Up 1: [−1,500 pb +200 pb], Up 2: [−500 pb, +200 pb], Up 3: [−500 pb, 0 pb] and Up 4 [0 pb, +200 pb]

   
     
 

En total, logramos identificar 77 motivos reconocidos por varias familias de FT (bHLH, bZip, BZR, CAMTA, DOF, E2FE, AP2-ERF, Myb-like, NAC, TCP y WRKY), así como otros no caracterizados hasta el momento. Nuestros resultados revelaron que los grupos pequeños de genes co-expresados y una ventana promotora definida entre -500 pb y +200 pb maximizan el número de motivos encontrados y reducen los motivos de baja complejidad (poco informativas). Por otro lado, la distribución espacial de los sitios reguladores mostró un perfil heterogéneo ya que se acumularon en el intervalo [-500 pb y +200 pb].

 

 
   
 

 

Para comprobar la validez de nuestra metodología, desarrollada inicialmente en melocotonero, la pusimos a prueba en una especie monocotiledónea (maíz) y otra dicotiledónea (Arabidopsis thaliana). En ambos casos encontramos algunos motivos de ADN descritos en experimentos previos.

El código fuente y los datos del estudio están disponibles en el repositorio GitHub:
https://eead-csic-compbio.github.io/coexpression_motif_discovery

Además, hay disponibles una guía paso a paso y un contenedor Docker para reproducir el análisis en otras especies:
https://eead-csic-compbio.github.io/coexpression_motif_discovery/peach/Tutorial.htm

[1] Ksouri N, Castro-Mondragón J, Montardit-Tarda F, van Helden J, Contreras-Moreira B, Gogorcena Y (2021). Tuning promoter boundaries improves regulatory motif discovery in non-model plants: the peach example. Plant Physiology, 185 (3), March 2021, Pages 1242-1258. (I.F. 6.902; Q1)

 
   

 

Ficheros: