Plantas que tienen rasgos potenciados relacionados con el rendimiento y un procedimiento de producción de las mismas.

Un procedimiento para potenciar rasgos relacionados con el rendimiento en plantas con respecto a plantas de control, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38, para lo cual el polipéptido PRP38 tiene al menos el 70 % o más de identidad de secuencia con la SEC ID N.º: 77 entera y en el que dicha expresión modulada se efectúa mediante la introducción y expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38, en el que dichos rasgos relacionados con el rendimiento son uno o más de los siguientes rasgos:

(i) biomasa de la parte aérea, (ii) vigor de emergencia, (iii) rendimiento de semilla total, (iv) número de semillas llenas, (v) tasa de llenado, (vi) índice de cosecha, y (vii) número de semillas por planta.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E12195082.

Solicitante: BASF PLANT SCIENCE GMBH.

Nacionalidad solicitante: Alemania.

Dirección: 67056 LUDWIGSHAFEN ALEMANIA.

Inventor/es: FRANKARD,VALERIE, SANZ MOLINERO,ANA ISABEL, REUZEAU,CHRISTOPHE, SALOM,RAMON SERRANO, MULET SALORT,JOSÉ MIGUEL.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION C — QUIMICA; METALURGIA > BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE;... > MICROORGANISMOS O ENZIMAS; COMPOSICIONES QUE LOS... > Técnicas de mutación o de ingeniería genética;... > C12N15/82 (para células vegetales)
  • SECCION C — QUIMICA; METALURGIA > QUIMICA ORGANICA > PEPTIDOS (péptidos que contienen β -anillos lactamas... > Péptidos con más de 20 aminoácidos; Gastrinas;... > C07K14/415 (de vegetales)
google+ twitter facebook

Texto extraído del PDF original:

DESCRIPCIÓN

Plantas que tienen rasgos potenciados relacionados con el rendimiento y un procedimiento de producción de las mismas La presente invención se refiere, en líneas generales, al campo de la biología molecular y atañe a un procedimiento para potenciar el rendimiento mediante la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38 (factor 38 de Procesamiento de ARN precursor). La presente invención también atañe a plantas que tienen expresión modulada de un ácido nucleico que codifica un polipéptido PRP38 cuyas plantas tienen rasgos relacionados con el rendimiento potenciados con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. La invención también proporciona construcciones de PRP38 desconocidas hasta ahora útiles para los procedimientos de la invención.

El continuo aumento de la población mundial y la disminución de suministro de tierra cultivable disponible para la agricultura incentivan la investigación hacia el aumento de la eficiencia de la agricultura. Los medios convencionales para mejoras de cultivo y hortícolas utilizan técnicas de siembra selectiva para identificar plantas que tienen características deseables. Sin embargo, dichas técnicas de siembra selectiva tienen diversos inconvenientes, en concreto, que estas técnicas son típicamente laboriosas y producen plantas que a menudo contienen componentes genéticos heterogéneos que no siempre producen el rasgo deseable que se transmite desde las plantas progenitoras. Los avances en biología molecular han permitido a la humanidad modificar el plasma germinal de animales y plantas. La ingeniería genética de las plantas conlleva el aislamiento y la manipulación de material genético (típicamente en forma de ADN o ARN) y la introducción posterior de ese material genético en una planta.

Dicha tecnología tiene la capacidad de producir cultivos o plantas que tienen diversos rasgos económicos, agronómicos u hortícolas mejorados.

Un rasgo de interés económico particular es el aumento del rendimiento. El rendimiento se define normalmente como el producto medible de valor económico de un cultivo. Esto puede definirse en términos de cantidad y/o calidad. El rendimiento depende directamente de diversos factores, por ejemplo, del número y tamaño de los órganos, de la arquitectura de la planta (por ejemplo, del número de ramas), de la producción de semillas, de la senescencia de las hojas y de más factores. El desarrollo de raíces, la absorción de nutrientes, la tolerancia al estrés, y el vigor temprano también pueden ser factores importantes en la determinación del rendimiento. Por lo tanto, optimizar los factores mencionados anteriormente puede contribuir a aumentar el rendimiento del cultivo.

El rendimiento de las semillas es un rasgo particularmente importante, ya que las semillas de muchas plantas son importantes para la nutrición humana y animal. Cultivos tales como maíz, arroz, trigo, canola y soja representan más de la mitad de la ingesta calórica humana total, bien a través del consumo directo de las propias semillas o a través del consumo de productos cárnicos generados sobre semillas procesadas. También son una fuente de azúcares, aceites y muchos tipos de metabolitos utilizados en los procesos industriales. Las semillas contienen un embrión (la fuente de nuevos brotes y raíces) y un endospermo (la fuente de nutrientes para el crecimiento del embrión durante la germinación y durante el crecimiento temprano de las plántulas). El desarrollo de una semilla implica muchos genes y requiere la transferencia de metabolitos desde las raíces, hojas y tallos al interior de la semilla en crecimiento. El endospermo, en particular, asimila los precursores metabólicos de los carbohidratos, aceites y proteínas y los sintetiza en macromoléculas de almacenamiento para llenar el grano.

La biomasa de plantas es la producción para cultivos de forraje como alfalfa, maíz de ensilaje y heno. Se han utilizado muchas estrategias para el rendimiento en cultivos de grano. Entre estas, destacan las estimaciones del tamaño de la planta. El tamaño de la planta puede medirse de muchos modos dependiendo de la especie y de la etapa del desarrollo, pero incluye el peso seco total de la planta, el peso seco de la parte aérea, el peso fresco de la parte aérea, el área foliar, el volumen del tallo, la altura de la planta, el diámetro de roseta, la longitud foliar, la longitud de la planta, la masa radicular, el número de brotes y el número de hojas. Muchas especies mantienen una proporción conservativa entre el tamaño de diferentes partes de la planta en una etapa dada del desarrollo. Estas relaciones alométricas se usan para extrapolar desde una de estas mediciones de tamaño a otra (por ejemplo, Tittonell y col. 2005 Agric Ecosys & Environ 105: 213). De forma típica, el tamaño de la planta en una etapa temprana del desarrollo correlacionará con el tamaño de la planta más tarde durante el desarrollo. De forma típica, una planta más grande con un área foliar mayor puede absorber más luz y dióxido de carbono que una planta más pequeña y, por lo tanto, probablemente ganará un peso mayor durante el mismo período (Fasoula & Tollenaar 2005 Maydica 50:39). Esto se suma a la continuación potencial de la ventaja microambiental o genética que la planta tenía inicialmente para conseguir el mayor tamaño. Hay un fuerte componente genético para el tamaño de la planta y la tasa de crecimiento (por ejemplo, ter Steege y col. 2005 Plant Physiology 139:1078), y así, para una serie de genotipos diversos, el tamaño de la planta en una condición ambiental correlaciona probablemente con el tamaño en otra (Hittalmani y col. 2003 Theoretical Applied Genetics 107:679). De este modo, se usa un entorno estándar como una aproximación para los entornos diversos y dinámicos que encuentran los cultivos en diferentes emplazamientos y tiempos.

Otro rasgo importante para muchos cultivos es el vigor temprano. Mejorar el vigor temprano es un objetivo importante de los programas de siembra de arroz modernos en variedades de cultivo de arroz tanto de clima templado como tropical. Las raíces largas son importantes para el anclaje adecuado al suelo en arroz sembrado en agua. Cuando el arroz se siembra directamente en campos inundados, y cuando las plantas deben emerger rápidamente a través del agua, los brotes más alargados se asocian con el vigor. Cuando se practica siembra con perforación, para la buena emergencia de las plántulas son importantes mesocótilos y coleóptilos más alargados. La capacidad de modificar genéticamente el vigor temprano en plantas sería de gran importancia en la agricultura. Por ejemplo, un vigor temprano pobre ha sido una limitación para la introducción de híbridos de maíz (Zea mays L.) basados en plasma germinal del Cinturón de Maíz en el Atlántico Europeo.

El índice de cosecha, la proporción entre el rendimiento de semillas y el peso seco de la parte aérea, es relativamente estable en muchas condiciones ambientales y así, a menudo se puede obtener una correlación robusta entre el tamaño de la planta y el rendimiento de grano (por ejemplo, Rebetzke y col. 2002 Crop Science 42:739). Estos procesos están ligados de forma intrínseca, dado que la mayoría de la biomasa del grano depende de la productividad fotosintética actual o almacenada de las hojas y los tallos de la planta (Gardener y col. 1985 Physiology of Crop Plants. Iowa State University Press, pág. 68-73). Por lo tanto, se ha utilizado la selección del tamaño de la planta, incluso en etapas tempranas del desarrollos, como un indicador del futuro rendimiento potencial (por ejemplo, Tittonell y col. 2005 Agric Ecosys & Environ 105:213). Cuando se prueba el impacto de las diferencias genéticas sobre la tolerancia al estrés, la capacidad de estandarizar las propiedades del suelo, la temperatura, la disponibilidad de agua y de nutrientes, y la intensidad de luz, es una ventaja intrínseca de los entornos de invernaderos y de las cámaras de crecimiento de plantas en comparación con el campo,. Sin embargo, las limitaciones artificiales sobre el rendimiento, debido a una pobre polinización debido a la ausencia de viento o de insectos, o al espacio insuficiente para las raíces maduras o el crecimiento de la cubierta, pueden restringir el uso de estos entornos controlados para probar diferencias en el rendimiento. Por lo tanto, las mediciones del tamaño de la planta en el desarrollo temprano en condiciones estandarizadas en una cámara de crecimiento o un invernadero, son prácticas estándar para proporcionar una indicación de las potenciales ventajas genéticas de rendimiento.

Otro rasgo de importancia es el de tolerancia mejorada al estrés abiótico. El estrés abiótico es la causa principal de pérdidas de cultivo en todo el mundo, reduciendo en más de un 50 % los rendimientos promedio para la mayoría de las plantas de cultivo principales (Wang y col. (2003) Planta 218: 1-14). El estrés abiótico puede producirse por sequía, salinidad, temperaturas extremas, toxicidad química, exceso o deficiencia de nutrientes (macroelementos y/o microelementos), radiación y estrés oxidativo. La capacidad de aumentar la tolerancia de la planta al estrés abiótico sería de gran ventaja económica para los granjeros de todo el mundo y permitiría la cosecha de cultivos durante condiciones adversas y en territorios cuando la cosecha de cultivos no pueda ser posible de otra forma.

Por lo tanto el rendimiento del cultivo puede aumentarse optimizando uno de los factores mencionados anteriormente.

Dependiendo del uso final, la modificación de determinados rasgos de rendimiento puede estar favorecida sobre otros. Por ejemplo, para aplicaciones tales como forraje o producción de madera, o fuente de biocombustible, puede ser deseable un aumento en las partes vegetativas de una planta, y para aplicaciones tales como producción de harina, almidón o aceite, el aumento en los parámetros de semilla puede ser particularmente deseable. Incluso entre los parámetros de semilla, algunos pueden estar favorecidos sobre otros, dependiendo de la aplicación. Diversos mecanismos pueden contribuir a aumentar el rendimiento de las semillas, ya sea que esté en la forma de tamaño de semilla aumentado o número de semilla aumentado.

Una estrategia para aumentar los rasgos relacionados con el rendimiento (rendimiento de semillas y/o biomasa) en las plantas puede ser a través de la modificación de los mecanismos de crecimiento intrínsecos de una planta, tal como el ciclo celular o diversas rutas de señalización implicados en el crecimiento de la planta o en los mecanismos de defensa.

Ahora se ha descubierto que mediante la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38 (factor 38 de procesamiento del precursor de ARN) se pueden potenciar en plantas varios rasgos relacionados con el rendimiento.

En una célula, la síntesis y función del ARN mensajero (ARNm) necesita una serie de acontecimientos incluyendo transcripción, procesamiento, transporte, traducción y degradación. El procesamiento de ARN se refiere a acontecimientos que modifican ARN de forma postranscripcional. En organismos eucarióticos la mayoría de los pre- ARNm nacientes contienen intrones, los que se cortan y empalman dando como resultado el ligamiento preciso de exones para producir un ARNm maduro, que es la forma de ARN usada por los ribosomas para traducir a una proteína. La modificación postranscripcional de los ARN también incluye la protección del extremo 5’ y poliadenilación del extremo 3’, lo que afecta a la estabilidad y la eficiencia de la traducción. La relación entre la traducción y la renovación de ARNm es crítica para la regulación de la expresión génica y para el funcionamiento correcto de la célula. En organismos eucarióticos, están implicadas en el metabolismo del ARN varias decenas de proteínas. Un ejemplo de tal proteína es el factor PRP38 de corte y empalme de pre-ARNm.

PRP38 de levadura se identificó en una exploración genérica de mutantes sensibles a temperatura de Saccharomyces cerevisiae defectuosos en corte y empalme de pre-ARNm (Blanton y col. 1992, Mol. Cel. Biol. 12, 3939-3947). La escisión de las secuencias de transcritos de pre-ARNm eucarióticos intervinientes se produce en el núcleo en una estructura grande, compleja, llamada el esplaiceosoma. El esplaiceosoma dirige la eliminación de intrones mediante un mecanismo de dos etapas que comprende (i) escisión en el sitio de corte y empalme 5’ y el ligamiento del nucleótico 5’-terminal del intrón a una adenosina en el intrón cerca del extremo 3’ y (ii) escisión en el sitio de corte y empalme 3’ y ligamiento de exón. El ensamblaje del esplaiceosoma progresa mediante la adición secuencial de las snRNP U1, U2ü ü U4/U6 y U5 (Proteínas Ribonucleares Pequeñas U1-U6). Al final del proceso de ensamblaje la U4 se disocia del esplaiceosoma. Se cree que los acontecimientos catalíticos de corte y empalme que conducen a la eliminación de intrones en moléculas pre-ARNm se producen de forma subsecuente a la disociación de U4. Supuestamente, en levaduras PRP38 es prescindible para el ensamblaje del esplaiceosoma, pero es necesaria para los cambios conformacionales que conducen a la activación catalítica del esplaiceosoma (Xie y col. (1998) EMBO Journal Vol.17 pág.2938-2946).

En Arabidopsis thaliana, la proteína PRP38 (AtPRP38) se denominó SRL1 (similar a SR 1), por su similitud de secuencia con las proteínas SR (Forment y col. Plant J. 2002 Jun; 30(5):511-9). Sin embargo, PRP38 es estructuralmente distinta de otras proteínas SR. De forma típica las proteínas SR comprenden un dominio RRM (dominio de unión a ARN) y un dominio RS (Kalyna y Barta Biochem Soc Trans. 2004 32:561-4.), mientras que AtPRP38 comprende el dominio RS pero carece del dominio RRM.

El documento WO 01/81599 describe procedimientos para mejorar la tolerancia al estrés en levaduras y plantas utilizando ácidos nucleicos que codifican varias proteínas SR. Se ha encontrado que SRL1, así como otras proteínas que operan en el corte y empalme de pre-ARNm, desempeñan una función importante en la respuesta de plantas a los estreses abióticos (Lee y col. 2006 Plant Cell. Jul; 18(7):1736-49).

De forma sorprendente, ahora se ha encontrado que la modulación de la expresión de un ácido nucleico que codifica un polipéptido PRP38 como se define en el presente documento proporciona plantas que tienen rasgos potenciados (o mejorados) relacionados con el rendimiento, en particular el rendimiento mejorado con respecto a las plantas de control, también en condiciones que no sean de estrés osmótico provocado por sal, sequía, frío o congelamiento.

De acuerdo con una realización de la presente invención, se proporciona un procedimiento para mejorar (o potenciar) rasgos relacionados con el rendimiento en una planta en comparación con plantas de control, que comprende modular en una planta la expresión de un ácido nucleico que codifica un polipéptido PRP38.

Definiciones

Polipéptido(s)/proteína(s) Los términos “polipéptido” y “proteína” se usan indistintamente en el presente documento y se refieren a aminoácidos en una forma polimérica de cualquier longitud, unidos entre sí por enlaces peptídicos.

Polinucleótido(s)/Ácido(s) nucleico(s)/Secuencia(s) de ácidos nucleicos/secuencia(s) de nucleótidos En el presente documento, los términos “polinucleótido(s)”, “secuencia(s) de ácidos nucleicos”, “secuencia(s) de nucleótidos”, “ácido(s) nucleico(s)” y “molécula de ácido nucleico” se usan indistintamente y se refieren a nucleótidos, ya sean ribonucleótidos o desoxirribonucleótidos o una combinación de ambos, en una forma polimérica no ramificada de cualquier longitud.

Planta(s) de control La elección de plantas de control adecuadas es una parte rutinaria de un montaje experimental y puede incluir plantas de tipo silvestre correspondientes o plantas correspondientes sin el gen de interés. La planta de control es típicamente de la misma especie de planta o incluso de la misma variedad de planta que la planta que se va a evaluar. La planta de control también puede ser un nulicigoto de la planta que se va a evaluar. Los nulicigotos son individuos que perdieron el transgén por segregación. Una “planta de control” como se usa en el presente documento no solo se refiere a plantas completas, sino también a partes de planta, incluyendo semillas y partes de semilla.

Homólogo(s) Los “homólogos” de una proteína incluyen péptidos, oligopéptidos, polipéptidos, proteínas y enzimas que tienen sustituciones, deleciones y/o inserciones de aminoácidos con respecto a la proteína no modificada en cuestión y que tienen actividad funcional y biológica similar como la proteína no modificada de la cual proceden.

Una deleción se refiere a la eliminación de uno o más aminoácidos de una proteína.

Una inserción se refiere a uno o más restos de aminoácido que se introducen en un sitio predeterminado en una proteína. Las inserciones pueden comprender fusiones de N y/o C terminal, así como inserciones intra-secuencia de un solo aminoácido o múltiples aminoácidos. Generalmente, las inserciones en la secuencia de aminoácidos serán más pequeñas que las fusiones de N o C terminal, del orden de aproximadamente 1 a 10 restos. Los ejemplos de proteínas de fusión de N o C terminal o péptidos incluyen el dominio de unión o dominio de activación de un activador transcripcional como se usa en el sistema de doble híbrido de levadura, proteínas de cubierta de fago, etiqueta de (histidina)-6, etiqueta de glutatión S-transferasa, proteína A, proteína de unión a maltosa, dihidrofolato reductasa, epítopo Tag•100, epítopo c-myc, epítopo FLAG®, lacZ, CMP (péptido de unión a calmodulina), epítopo HA, epítopo de proteína C, epítopo VSV.

Una sustitución se refiere a un reemplazo de aminoácidos de la proteína con otros aminoácidos que tienen propiedades semejantes (tales como hidrofobicidad, hidrofilicidad, antigenicidad, propensidad para formar o romper estructuras α-helicoidales o  laminares semejantes). Las sustituciones de aminoácidos son típicamente de restos únicos, pero pueden agruparse dependiendo de las limitaciones funcionales puestas al polipéptido y variar desde 1 a 10 aminoácidos; las inserciones normalmente serán del orden de aproximadamente 1 a 10 restos de aminoácido. Las sustituciones de aminoácidos son preferentemente sustituciones de aminoácidos conservativas. En la técnica se conocen bien las tablas de sustitución conservativa (véase, por ejemplo, Creighton (1984) Proteins. W. H. Freeman and Company (Eds) y la Tabla 1 a continuación).

Tabla 1: Ejemplos de sustituciones de aminoácidos conservativas

Resto

Sustituciones conservativas

Resto

Sustituciones conservativas

Ala Ser Leu Ile; Val Arg Lys Lys Arg; Gln Asn Gln; His Met Leu; Ile Asp Glu Phe Met; Leu; Tyr Gln Asn Ser Thr; Gly Cys Ser Thr Ser; Val Glu Asp Trp Tyr Gly Pro Tyr Trp; Phe His Asn; Gln Val Ile; Leu Ile Leu, Val Las sustituciones, deleciones y/o inserciones de aminoácidos pueden realizarse fácilmente usando técnicas sintéticas de péptidos bien conocidas en la técnica, tales como síntesis peptídica de fase sólida y similares, o por manipulación de ADN recombinante. En la técnica se conocen bien procedimientos de manipulación de secuencias de ADN para producir variantes de sustitución, inserción o deleción de una proteína. Por ejemplo, los expertos en la técnica conocen técnicas para realizar mutaciones de sustitución en sitios predeterminados en el ADN e incluyen mutagénesis M13, mutagénesis in vitro T7-Gen (USB, Cleveland, OH), mutagénesis dirigida a sitio QuickChange (Stratagene, San Diego, CA), mutagénesis dirigida a sitio mediada por PCR u otros protocolos de mutagénesis dirigida a sitio.

Derivados Los “derivados” incluyen péptidos, oligopéptidos, polipéptidos que pueden, en comparación con la secuencia de aminoácidos de forma natural de la proteína, tal como el polipéptido factor 38 de Procesamiento de ARN precursor, comprender sustituciones de aminoácidos con restos de aminoácido de origen no natural, o adiciones de restos de aminoácido de origen no natural. Los “derivados” de una proteína también incluyen péptidos, oligopéptidos, polipéptidos, que comprenden restos de aminoácido modificados de origen natural (glucosilado, acilado, prenilado, fosforilado, miristoilado, sulfatado, etc.) o modificados de origen no natural en comparación con la secuencia de aminoácidos de forma no natural del polipéptido. Un derivado también puede comprender uno o más sustituyentes o adiciones que no son de aminoácido en comparación con la secuencia de aminoácidos de la que procede, por ejemplo una molécula indicadora u otro ligando, unido covalente o no covalentemente a la secuencia de aminoácidos, tal como una molécula indicadora que se une para facilitar su detección, y restos de aminoácido que no son de origen natural con respecto a la secuencia de aminoácidos de una proteína de origen natural. Además, los “derivados” también incluyen fusiones de la forma de origen natural de la proteína con péptidos etiquetadores, tales como FLAG, HIS6 o tiorredoxina (para una revisión de péptidos etiquetadores, véase Terpe, Appl. Microbiol. Biotechnol. 60, 523-533, 2003).

Ortólogo(s)/Parálogo(s) Los ortólogos y parálogos incluyen conceptos evolutivos usados para describir las relaciones antecesoras de los genes. Los parálogos son genes dentro de la misma especie que se han originado a través de la duplicación de un gen antecesor; los ortólogos son genes de diferentes organismos que se han originado a través de la especiación, y también proceden de un gen antecesor común.

Dominio El término “dominio” se refiere a un conjunto de aminoácidos conservados en posiciones específicas a lo largo de un alineamiento de secuencias de las proteínas evolutivamente relacionadas. Aunque los aminoácidos en otras posiciones pueden variar entre los homólogos, los aminoácidos que están muy conservados en posiciones específicas indican aminoácidos que son probablemente esenciales en la estructura, estabilidad o función de una proteína. Identificado por su alto grado de conservación en las secuencias alineadas de una familia de homólogos de proteína, éstas pueden usarse como identificadores para determinar si cualquier polipéptido en cuestión pertenece a una familia polipeptídica previamente identificada.

Motivo/Secuencia consenso/Firma Las expresiones “motivo” o “secuencia consenso” o “firma” se refieren a una región conservada corta en la secuencia de las proteínas evolutivamente relacionadas. Los motivos son partes de dominios frecuentemente muy conservadas, pero también pueden incluir solo parte del dominio, o localizarse fuera del dominio conservado (si todos los aminoácidos del motivo se encuentran fuera de un dominio definido).

Hibridación El término “hibridación”, como se define en el presente documento, es un proceso en el que secuencias de nucleótidos complementarias, sustancialmente homólogas, se hibridan entre sí. El proceso de hibridación puede producirse completamente en solución, es decir, ambos ácidos nucleicos complementarios están en solución. El proceso de hibridación también puede producirse con uno de los ácidos nucleicos complementarios inmovilizado en una matriz, tal como perlas magnéticas, perlas de Sefarosa o cualquier otra resina. El proceso de hibridación puede producirse adicionalmente con uno de los ácidos nucleicos complementario inmovilizado en un soporte sólido, tal como una membrana de nitrocelulosa o de nailon, o inmovilizado, por ejemplo, mediante fotolitografía a, por ejemplo, un soporte vítreo silíceo (el último conocido como matrices o micromatrices de ácido nucleico o como microplacas de ácido nucleico). Para permitir que se produzca la hibridación, las moléculas de ácido nucleico están, generalmente, térmica o químicamente desnaturalizadas para fundir una doble cadena en dos cadenas únicas y/o retirar horquillas u otras estructuras secundarias de ácidos nucleicos monocatenarios.

El término “rigurosidad” se refiere a las condiciones en las que se realiza la hibridación. La rigurosidad de la hibridación está influenciada por condiciones tales como temperatura, concentración salina, fuerza iónica y composición del tampón de hibridación. Generalmente, se seleccionan condiciones de baja rigurosidad por ser aproximadamente 30 ºC menores que el punto de fusión térmico (Tf) para la secuencia específica a una fuerza iónica definida y pH. Las condiciones de rigurosidad media son cuando la temperatura es 20 ºC por debajo de la Tf, y las condiciones de rigurosidad alta son cuando la temperatura es 10 ºC por debajo de la Tf. Las condiciones de hibridación de rigurosidad alta se usan típicamente para aislar secuencias de hibridación que tiene alta similitud de secuencia con la secuencia de ácidos nucleicos diana. Sin embargo, los ácidos nucleicos pueden desviarse en cuanto a la secuencia y aún codificar un polipéptido sustancialmente idéntico, debido a la generación del código genético. Por lo tanto, en ocasiones, pueden necesitarse condiciones de hibridación de rigurosidad media para identificar dichas moléculas de ácidos nucleicos.

La Tf es la temperatura bajo fuerza iónica definida y pH, en la que el 50 % de la secuencia diana se hibrida con una sonda perfectamente emparejada. La Tf depende de las condiciones de solución y de la composición base y longitud de la sonda. Por ejemplo, las secuencias más largas hibridan específicamente a temperaturas más altas. La tasa máxima de hibridación se obtiene de aproximadamente 16 ºC hasta 32 ºC por debajo de la Tf. La presencia de cationes monovalentes en la solución de hibridación reduce la repulsión electrostática entre las dos cadenas de ácido nucleico por lo cual se promueve la formación del híbrido; este efecto es visible para concentraciones de sodio de hasta 0,4 M (para mayores concentraciones, este efecto puede ignorarse). La formamida reduce la temperatura de fusión de dúplex de ADN-ADN y ADN-ARN con 0,6 a 0,7 ºC para cada porcentaje de formamida, y la adición de formamida al 50 % permite que se realice la hibridación de 30 a 40 ºC, aunque la tasa de hibridación disminuirá. Los emparejamientos erróneos de los pares de bases reducen la tasa de hibridación y la estabilidad térmica de los dúplex. Por término medio y para sondas grandes, la Tf disminuye aproximadamente 1 ºC por % de emparejamiento erróneo de bases. La Tf puede calcularse usando las siguientes ecuaciones, dependiendo de los tipos de híbridos: 1) híbridos de ADN-ADN (Meinkoth y Wahl, Anal. Biochem., 138: 267-284, 1984): Tf = 81,5 ºC + 16,6xlog10[(Na+]a + 0,41x%[G/Cb] – 500x[Lc]-1 – 0,61x% formamida 2) híbridos de ADN-ARN o ARN-ARN: Tf = 79,8 + 18,5 (log10[(Na+]a) + 0,58 (%G/Cb) + 11,8 (%G/Cb)2 – 820/Lc 3) híbridos de oligo-ADN u oligo-ARNd: Para <20 nucleótidos: Tf= 2 (In) Para 20-35 nucleótidos: Tf= 22 + 1,46 (In) a o para otro catión monovalente, pero solo exacto en el intervalo de 0,01-0,4 M.

b solo exacto para % GC en el intervalo de 30 % a 75 %.

c L = longitud del dúplex en los pares de bases.

d oligo, oligonucleótido; In, = longitud eficaz del cebador = 2x(n.º de G/C)+(n.º de A/T).

La unión no específica puede controlarse usando una cualquiera de las numerosas técnicas conocidas, tales como, por ejemplo, bloqueo de la membrana con soluciones que contienen la proteína, adiciones del ARN heterólogo, ADN y SDS al tampón de hibridación y tratamiento con Rnasa. Para sondas no homólogas, puede realizarse una serie de hibridaciones al variar uno de (i) disminuir progresivamente la temperatura de hibridación (por ejemplo de 68 ºC a 42 ºC) o (ii) disminuir progresivamente la concentración de formamida (por ejemplo del 50 % al 0 %). El experto en la técnica es consciente de que durante la hibridación pueden alterarse diversos parámetros y que se mantendrán o cambiarán las condiciones de rigurosidad.

Además de las condiciones de hibridación, la especificidad de hibridación también depende típicamente de la función de los lavados post-hibridación. Para retirar el fondo resultante de la hibridación no específica, las muestras se lavan con soluciones salinas diluidas. Los factores críticos de dichos lavados incluyen la fuerza iónica y la temperatura de la solución de lavado final: a menor concentración salina y mayor temperatura de lavado, mayor rigurosidad de lavado. Las condiciones de lavado se realizan típicamente a, o por debajo de, la rigurosidad de hibridación. Una hibridación positiva da lugar a una señal que es al menos dos veces la del fondo. Generalmente, las condiciones de rigurosidad adecuadas para los ensayos de hibridación de ácidos nucleicos o los procedimientos de detección de amplificación de genes son como se expusieron anteriormente. También pueden seleccionarse condiciones más o menos rigurosas. El experto en la técnica es consciente de que, durante el lavado, pueden alterarse diversos parámetros y que mantendrán o cambiarán las condiciones de rigurosidad.

Por ejemplo, las condiciones de hibridación típicas de alta rigurosidad para híbridos de ADN mayores de 50 nucleótidos incluyen una hibridación a 65 ºC en 1x SSC o a 42 ºC en 1x SSC y formamida al 50 %, seguido de lavado a 65 ºC en 0,3x SSC. Los ejemplos de condiciones de hibridación de rigurosidad media para híbridos de ADN más largos de 50 nucleótidos incluyen una hibridación a 50 ºC en 4x SSC o a 40 ºC en 6x SSC y formamida al 50 %, seguido de lavado a 50 ºC en 2x SSC. La longitud del híbrido es la longitud prevista para la hibridación del ácido nucleico. Cuando los ácidos nucleicos de secuencia conocida se hibridan, la longitud del híbrido puede determinarse alineando las secuencias e identificando las regiones conservadas descritas en el presente documento. 1x SSC es NaCl 0,15 M y citrato sódico 15 mM, la solución de hibridación y las soluciones de lavado pueden incluir adicionalmente reactivo de Denhardt 5x, SDS al 0,5-1,0 %, 100 g/ml de ADN de esperma de salmón fragmentado, desnaturalizado 100 g/ml, pirofosfato sódico al 0,5 %.

Con el fin de definir el nivel de rigurosidad, puede hacerse referencia a Sambrook y col. (2001) Molecular Cloning: a laboratory manual, 3ª Edición, Cold Spring Harbor Laboratory Press, CSH, Nueva York o a Current Protocols in Molecular Biology, John Wiley & Sons, N. Y. (1989 y actualizaciones anuales).

Variante de corte y empalme La expresión “variante de corte y empalme” como se usa en el presente documento incluye variantes de una secuencia de ácidos nucleicos en la que los intrones y/o exones seleccionados se han escindido, reemplazado, desplazado o añadido, o en la que los intrones se han acortado o alargado. Dichas variantes serán aquellas en las que la actividad biológica de la proteína esté sustancialmente conservada; esto puede conseguirse conservando selectivamente los segmentos funcionales de la proteína. Dichas variantes de corte y empalme pueden encontrarse en la naturaleza o pueden ser sintetizadas por el hombre. En la técnica se conocen bien procedimientos para predecir y aislar dichas variantes de corte y empalme (véase, por ejemplo, Foissac y Schiex (2005) BMC Bioinformatics 6: 25).

Variante alélica Los alelos o variantes alélicas son formas alternativas de un gen determinado, localizado en la misma posición cromosómica. Las variantes alélicas incluyen Polimorfismos Mononucleotídicos (SNP, por las siglas Single Nucleotide Polymorphisms), así como Polimorfismos Pequeños de Inserción/Deleción (INDELs, por las siglas Small Insertion/Deletion Polymorphisms). El tamaño de los INDELs es normalmente menor de 100 pb. Los SNP y los INDELs forman la serie de variantes de secuencia más grande en las cepas polimórficas de origen natural de la mayoría de los organismos.

Combinación de genes/Evolución dirigida La combinación de genes o evolución dirigida consiste en repeticiones de combinación de ADN seguido de exploración y/o selección apropiada para generar variantes de ácidos nucleicos o partes de las mismas que codifican proteínas que tienen una actividad biológica modificada (Castle y col., (2004) Science 304(5674): 1151-4; Patentes de Estados Unidos 5.811.238 y 6.395.547).

Elemento regulador/Secuencia de control/Promotor Las expresiones “elemento regulador”, “secuencia de control” y “promotor” se usan todas indistintamente en el presente documento y se toman en un contexto amplio para referirse a una secuencia de ácidos nucleicos reguladora capaz de efectuar la expresión de las secuencias a las que se unen. El término “promotor” se refiere típicamente a una secuencia de control de ácido nucleico localizada cadena arriba del inicio transcripcional de un gen y que está implicado en el reconocimiento y unión de la ARN polimerasa y otras proteínas, dirigiendo así la transcripción de un ácido nucleico unido operativamente. En los términos anteriormente mencionados se incluyen las secuencias reguladoras transcripcionales procedentes de un gen genómico eucariota clásico (incluyendo la caja TATA que es necesaria para el inicio de la transcripción adecuado, con o sin secuencia de caja CCAAT) y elementos reguladores adicionales (es decir, secuencias activadoras cadena arriba, potenciadores y silenciadores) que alteran la expresión génica en respuesta al desarrollo y/o estímulo externo, o de una manera específica de tejido. También se incluye en el término una secuencia reguladora transcripcional de un gen procariota clásico, en cuyo caso puede incluir una secuencia de caja -35 y/o secuencias reguladores transcripcionales de caja -10. La expresión “elemento regulador” también incluye una molécula de fusión sintética o un derivado que confiere, activa o potencia la expresión de una molécula de ácido nucleico en una célula, tejido u órgano.

Un “promotor de planta” comprende elementos reguladores, que median la expresión de un segmento de secuencia codificante en células de plantas. Por consiguiente, un promotor de planta no tiene que ser de origen vegetal, sino que puede originarse de virus o microorganismos, por ejemplo de virus que atacan a las células de planta. El “promotor de planta” también puede originarse de una célula de planta, por ejemplo, de la planta que se transforma con la secuencia de ácidos nucleicos a expresar en el proceso de la invención y descrito en el presente documento. Esto también se aplica a las otras señales reguladoras de “planta”, tales como terminadores de “planta”. Los promotores cadena arriba de la secuencias de nucleótidos útiles en los procedimientos de la presente invención pueden modificarse mediante una o más sustituciones, inserciones y/o deleciones de nucleótido sin interferir con la funcionalidad o actividad de cualquiera de los promotores, la fase de lectura abierta (ORF, Open Reading Frame) o la región reguladora 3’ tal como terminadores u otras regiones reguladoras 3’ que se localizan fuera de la ORF. Además es posible que la actividad de los promotores aumente por la modificación de su secuencia o que se reemplacen completamente mediante más promotores activos, incluso promotores de organismos heterólogos. Para la expresión en plantas, la molécula de ácido nucleico debe, como se ha descrito anteriormente, estar unida operativamente a, o comprender, un promotor adecuado que exprese el gen de manera adecuada, en tiempo y con el patrón de expresión espacial requerido.

Para la identificación de promotores funcionalmente equivalentes, la fuerza del promotor y/o el patrón de expresión de un promotor candidato pueden analizarse, por ejemplo, uniendo operativamente el promotor a un gen indicador y evaluando el nivel de expresión y el patrón del gen indicador en diversos tejidos de la planta. Los genes indicadores bien conocidos adecuados incluyen, por ejemplo, beta-glucuronidasa o la beta-galactosidasa. La actividad del promotor se evalúa midiendo la actividad enzimática de la beta-glucuronidasa o beta-galactosidasa. La fuerza del promotor y/o el patrón de expresión pueden después compararse con la de un promotor de referencia (tal como el que se usa en los procedimientos de la presente invención). Como alternativa, la fuerza del promotor puede evaluarse cuantificando niveles de ARNm o comparando niveles de ARNm del ácido nucleico usado en los procedimientos de la presente invención, con niveles de ARNm de genes constitutivos tal como ARNr 18S, usando procedimientos conocidos en la técnica, tales como transferencia de Northern con análisis densitométrico de autorradiogramas, PCR cuantitativa en tiempo real o RT-PCR (Heid y col., 1996 Genome Methods 6: 986-994). Generalmente por “promotor débil” se entiende un promotor que dirige la expresión de una secuencia codificante a un nivel bajo. Por “nivel bajo” se entiende niveles de aproximadamente 1/10.000 transcriptos a aproximadamente 1/100.000 transcriptos, a aproximadamente 1/5000000 transcriptos por célula. Por el contrario, un “promotor fuerte” dirige la expresión de una secuencia codificante a alto nivel, o a aproximadamente 1/10 transcriptos a aproximadamente 1/100 transcriptos a aproximadamente 1/1000 transcriptos por célula. Generalmente, por “promotor de fuerza media” se entiende un promotor que dirige la expresión de una secuencia codificante a un nivel más bajo que el de un promotor fuerte, en particular a un nivel que es, en todos los casos, inferior al obtenido cuando está bajo el control de un promotor CaMV 35S. De forma típica, un promotor de fuerza media es capaz de dirigir la expresión de un ácido nucleico de forma al menos 3, 5,10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 veces más baja que el promotor CaMV 35S.

Unido operativamente La expresión “unido operativamente” como se usa en el presente documento se refiere a un enlace funcional entre la secuencia promotora y el gen de interés, de tal manera que la secuencia promotora puede iniciar la transcripción del gen de interés.

Promotor constitutivo Un “promotor constitutivo” se refiere a un promotor que es transcripcionalmente activo durante la mayor parte, aunque no necesariamente en todas, las fases de crecimiento y desarrollo y en la mayor parte de las condiciones ambientales, en al menos una célula, tejido u órgano. La siguiente Tabla 2 proporciona ejemplos de promotores constitutivos.

Tabla 2: Ejemplos de promotores constitutivos

Fuente del gen

Referencia

Actina McElroy y col, Plant Cell, 2: 163-171, 1990 HMGP WO 2004/070039 CAMV 35S Odell y col, Nature, 313: 810-812, 1985 CaMV 19S Nilsson y col., Physiol. Plant. 100:456-462, 1997 GOS2 de Pater y col, Plant J Nov; 2(6):837-44, 1992, WO 2004/065596 Ubiquitina Christensen y col, Plant Mol. Biol. 18: 675-689, 1992 Ciclofilina de arroz Buchholz y col, Plant Mol Biol. 25(5): 837-43, 1994 Histona H3 de maíz Lepetit y col, Mol. Gen. Genet. 231:276-285, 1992 Histona H3 de alfalfa Wu y col. Plant Mol. Biol. 11:641-649, 1988 Actina n 2 An y col, Plant J. 10(1); 107-121, 1996 34S FMV Sanger y col., Plant. Mol. Biol., 14, 1990: 433-443 Subunidad pequeña Rubisco US 4,962,028 OCS Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553 SAD1 Jain y col., Crop Science, 39 (6), 1999: 1696 SAD2 Jain y col., Crop Science, 39 (6), 1999: 1696 nos Shaw y col. (1984) Nucleic Acids Res. 12(20): 7831-7846 V-ATPasa WO 01/14572 Súper promotor WO 95/14098 Proteínas de la caja G WO 94/12015 Promotor ubicuo Un promotor ubicuo es activo en sustancialmente todos los tejidos o células de un organismo.

Promotor regulado evolutivamente Un promotor regulado evolutivamente es activo durante determinadas etapas del desarrollo o en partes de la planta que experimentan cambios evolutivos.

Promotor inducible Un promotor inducible ha inducido o aumentado el inicio de la transcripción en respuesta a un estímulo químico (para una revisión véase Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48: 89-108), ambiental o físico, o puede ser “inducible por estrés”, es decir, activado cuando una planta se expone a diversas condiciones de estrés, o un “patógeno inducible,” es decir, activado cuando una planta está expuesta a la exposición a diversos patógenos.

Promotor especifico de órgano/específico de tejido Un promotor específico de órgano o específico de tejido es uno que es capaz de iniciar preferentemente la transcripción en determinados órganos o tejidos, tales como hojas, raíces tejido de semillas, etc. Por ejemplo, un “promotor específico de raíz” es un promotor que es transcripcionalmente activo predominantemente en las raíces las de plantas, sustancialmente con la exclusión de cualquier otra parte de una planta, mientras que aún permite cualquier expresión parcial en estas otras partes de la planta. En el presente documento a los promotores capaces de iniciar la transcripción solo en determinadas células se les denomina promotores “específicos de célula”.

En la siguiente Tabla i se indican ejemplos de promotores específicos de raíz:

Tabla i: ejemplos de promotores específicos de raíz

Fuente del gen

Referencia

RCc3 de arroz Xu y col. (1995) Plant Mol Biol 27(2): 237-48 Transportador de fosfato en Arabidopsis Kovama y col., 2005 PHT1 Transportador de fosfato de Medicago

Xiao y col., 2006 (continuación)

Fuente del gen

Referencia

Pyk10 de Arabidopsis

Nitz y col. (2001) Plant Sci 161(2): 337-346 Genes específicos de la raíz del tabaco Conkling y col. (1990) Plant Phys 93(3): 1203-1211 RB7, RD2, RD5, RH12 Lectina específica de raiz de cebada Lerner & Raikhel (1989) Plant Phys 91: 124-129 Proteína rica en hidroxiprolina específica Keller & Lamb (1989) Genes & Dev 3:1639-1646 de raiz CDC27/hobbit de Arabidopsis

Blilou et al. (2002) Genes & Dev 16:2566-2575 Un promotor específico de semilla es transcripcionalmente activo predominantemente en tejidos de semilla, pero no necesariamente exclusivamente en tejidos de semilla (en casos de expresión parcial). El promotor específico de semilla puede ser activo durante el desarrollo y/o durante la germinación de la semilla. Se proporcionan ejemplos de promotores específicos de semilla en Qing Qu y Takaiwa (Plant Biotechnol. J. 2, 113-125, 2004) y en la Tabla ii a continuación

Tabla ii: Ejemplos de promotores específicos de semilla

Fuente del gen

Referencia

genes específicos de semilla Simon y col., Plant Mol. Biol. 5: 191, 1985; Scofield y col., J. Biol. Chem. 262: 12202, 1987; Baszczynski y col., Plant Mol. Biol. 14: 633, 1990.

albúmina de Nuez del Brasil Pearson y col., Plant Mol. Biol. 18: 235-245, 1992.

Legumina Ellis y col., Plant Mol. Biol. 10: 203-214, 1988.

Glutelina (arroz) Takaiwa y col., Mol. Gen. Genet. 208: 15-22, 1986; Takaiwa y col., FEBS Letts. 221: 43-47, 1987.

Zeína Matzke y col Plant Mol Biol, 14(3):323-32 1990 NapA Stalberg y col, Planta 199: 515-519, 1996.

Gluteína-1 de BPM y APM de trigo Mol Gen Genet 216:81-90, 1989; NAR 17:461-2, 1989 SPA de trigo Albani y col, Plant Cell, 9: 171-184, 1997 ,  y  gliadinas de trigo EMBO J. 3:1409-15, 1984 Promotor Itr1 de cebada Diaz y col. (1995) Mol Gen Genet 248(5):592-8 Hordeína B1, C, D de cebada Theor Appl Gen 98:1253-62, 1999; Plant J 4:343-55, 1993; Mol Gen Genet 250:750-60, 1996 DOF de cebada Mena y col, The Plant Journal, 116(1): 53-62, 1998 blz2 EP99106056.7 promotor sintético Vicente-Carbajosa y col., Plant J. 13: 629-640, 1998.

Prolamina NRP33 de arroz Wu y col, Plant Cell Physiology 39(8) 885-889, 1998  globulina Glb-1 de arroz Wu y col, Plant Cell Physiology 39(8) 885-889, 1998 OSH1 de arroz Sato y col, Proc. Natl. Acad. Sci. USA, 93: 8117-8122, 1996  globulina REB/OHP-1 de arroz Nakase y col. Plant Mol. Biol. 33: 513-522, 1997 ADP-glucosa pirofosforilasa de Trans Res 6:157-68, 1997 arroz (continuación)

Fuente del gen

Referencia

familia del gen ESR de maíz Plant J 12:235-46, 1997 -kafirina de sorgo DeRose y col., Plant Mol. Biol 32:1029-35, 1996 KNOX Postma-Haarsma y col, Plant Mol. Biol. 39:257-71, 1999 Oleosina de arroz Wu y col, J. Biochem. 123:386, 1998 Oleosina de girasol Cummins y col., Plant Mol. Biol. 19: 873-876, 1992 PRO0117, supuesta proteína WO 2004/070039 ribosomal 40S de arroz PRO0136, alanina aminotransferasa de arroz No publicado PRO0147, inhibidor de tripsina No publicado ITR1 (cebada) PRO0151, WSI18 de arroz WO 2004/070039 PRO0175, RAB21 de arroz WO 2004/070039 PRO005 WO 2004/070039 PRO0095 WO 2004/070039  Lanahan y col, Plant Cell 4: 203-211, 1992; Skriver y col, Proc Natl Acad Sci -amilasa (Amy32b) USA 88:7266-7270, 1991 gen similar a la  catepsina Cejudo y col, Plant Mol Biol 20: 849-856, 1992 Ltp2 de cebada Kalla y col., Plant J. 6: 849-60, 1994 Chi26 Leah y col., Plant J. 4: 579-89, 1994 B-Perú de maíz Selinger y col., Genetics 149; 1125-38, 1998 Un promotor específico de tejido verde como se define en el presente documento es un promotor que es transcripcionalmente activo predominantemente en tejido verde, sustancialmente con la exclusión de cualquier otra parte de una planta, mientras que aún permite cualquier expresión parcial en estas otras partes de la planta. Los ejemplos de promotores específicos de tejido verde que pueden usarse para realizar los procedimientos de la invención se muestran a continuación en la Tabla iii.

Tabla iii: ejemplo de promotores específicos de tejido verde

Gen

Expresión

Referencia

Ortofosfato diquinasa de maíz Específica de hoja Fukavama y col., 2001 Fosfoenolpiruvato carboxilasa de maíz Específica de hoja Kausch y col., 2001 Fosfoenolpiruvato carboxilasa de arroz Específica de hoja Liu y col., 2003 Pequeña subunidad de Rubisco de arroz Específica de hoja Nomura y col., 2000 Beta expansina EXBP9 de arroz Específica de brote WO 2004/070039 Pequeña subunidad de Rubisco de frijol de palo Específica de hoja Panguluri y col., 2005 RBCS3A de guisante Específica de hoja Otro ejemplo de un promotor específico de tejido es un promotor específico de meristemo, que es transcripcionalmente activo predominantemente en tejido meristemático, sustancialmente con la exclusión de cualquier otra parte de una planta, mientras que aún permite cualquier expresión parcial en estas otras partes de la planta. Los ejemplos de promotores específicos de meristemo que pueden usarse para realizar los procedimientos de la invención se muestran en la siguiente Tabla iv.

Tabla iv: ejemplos de promotores específicos de meristemo

Fuente del gen

Patrón de expresión

Referencia

OSH1 de arroz Meristemo apical de brote, desde la fase globular Sato y col. (1996) Proc. Natl. Acad. Sci.

embrionaria a la fase de plántula USA, 93: 8117-8122 Metalotioneína de arroz Específico de meristemo BAD87835.1 Meristemos apicales de brote y raíz y en hojas y Wagner y Kohorn (2001) Plant Cell 13(2): WAK1 y WAK 2 sépalos en expansión 303-318 Terminador El término “terminador” incluye una secuencia de control que es una secuencia de ADN en el extremo de una unidad transcripcional que señaliza el procesamiento y la poliadenilación en dirección 3’ de un transcripto primario y la terminación de la transcripción. El terminador puede proceder del gen natural, de una variedad de otros genes de planta, o de ADN T. El terminador a añadir puede proceder, por ejemplo, de genes de nopalina sintasa u octopina sintasa, o como alternativa, de otro gen de planta, o menos preferentemente, de cualquier otro gen eucariota.

Modulación El término “modulación” significa en relación a la expresión o expresión de un gen, un proceso en el que en el nivel de expresión se cambia mediante dicho gen de expresión en comparación con la planta de control, el nivel de expresión puede aumentarse o disminuirse. La expresión original, no modulada, puede ser de cualquier tipo de expresión de un ARN estructural (ARNr, ARNt) o ARNm con traducción posterior. La expresión “modulación de la actividad” significará cualquier cambio de la expresión de las secuencias de ácidos nucleicos de la invención o proteínas codificadas, que conduce a un rendimiento aumentado y/o a un crecimiento aumentado de las plantas.

Expresión El término “expresión” o “expresión génica” significa la transcripción de un gen específico o genes específicos o construcción genética específica. El término “expresión” o “expresión génica” significa en particular la transcripción de un gen o genes o construcción genética en ARN estructural (ARNr, ARNt) o ARNm con o sin traducción posterior del último en una proteína. El proceso incluye la transcripción de ADN y el procesamiento del producto de ARNm resultante.

Expresión aumentada/sobreexpresión La frase “expresión aumentada” o “sobreexpresión” como se usa en el presente documento, significa cualquier forma de expresión que es adicional al nivel de expresión original de tipo silvestre.

En la técnica se documentan bien procedimientos para aumentar la expresión de genes o productos génicos e incluyen, por ejemplo, la sobreexpresión conducida por promotores apropiados, el uso de potenciadores de la transcripción o potenciadores de la traducción. Los ácidos nucleicos aislados que sirven como promotores o elementos potenciadores pueden introducirse en una posición apropiada (típicamente cadena arriba) de una forma no heteróloga de un polinucleótido para regular positivamente la expresión de un ácido nucleico que codifica el polipéptido de interés. Por ejemplo, pueden alterarse promotores endógenos in vivo por mutación, deleción y/o sustitución (véase, Kmiec, US 5.565.350; Zarling y col., WO9322443) o pueden introducirse promotores aislados en una célula de planta en la orientación y distancia apropiada de un gen de la presente invención para controlar la expresión del gen.

Si se desea la expresión del polipéptido, generalmente es deseable incluir una región de poliadenilación en el extremo 3’ de una región codificante polinucleotídica. La región de poliadenilación puede proceder del gen natural, de una diversidad de otros genes de planta, o de ADN T. La secuencia de extremo 3’ a añadir pude proceder, por ejemplo, de los genes de nopalina sintasa u octopina sintasa, o como alternativa de otro gen de planta, o menos preferentemente de cualquier otro gen eucariota.

También puede añadirse una secuencia intrónica a la región no traducida (UTR, untranslated region) 5’ o la secuencia codificante de la secuencia codificante parcial para aumentar la cantidad del mensaje maduro que se acumula en el citosol. Se ha observado que la inclusión de un intrón de corte y empalme en la unidad de transcripción en construcciones de expresión tanto de plantas como de animales aumenta la expresión génica tanto a nivel de proteína como de ARNm hasta 1000 veces (Buchman y Berg (1988) Mol. Cell Biol. 8: 4395-4405; Callis y col. (1987) Genes Dev 1: 1183-1200). Dicha potenciación intrónica de la expresión génica es típicamente mayor cuando se pone cerca del extremo 5’ de la unidad de transcripción. En la técnica se conoce el uso de los intrones de maíz, el intrón Adh1-S, 1, 2 y 6, el intrón Bronze-1. Para una información general véase: The Maize Handbook, Capítulo 116, Freeling y Walbot, Eds., Springer, N. Y. (1994).

Gen endógeno En el presente documento la referencia a un gen “endógeno”, no solo se refiere al gen en cuestión como se encuentra en una planta en su forma natural (es decir, sin existir ninguna intervención humana), sino también se refiere a aquel mismo gen (o un ácido nucleico/gen sustancialmente homólogo) en una forma aislada posteriormente (re)introducida en una planta (un transgén). Por ejemplo, una planta transgénica que contiene dicho transgén puede encontrar una reducción sustancial de la expresión transgénica y/o reducción sustancial de la expresión del gen endógeno. El gen aislado puede aislarse de un organismo o puede fabricarlo el hombre, por ejemplo, mediante síntesis química.

Expresión disminuida En el presente documento la referencia a “expresión disminuida” o “reducción o eliminación sustancial” de expresión significa una disminución en la expresión del gen endógeno y/o los niveles de polipéptido y/o actividad de polipéptido con respecto a las plantas de control. La reducción o eliminación sustancial está en orden creciente de preferencia al menos 10 %, 20 %, 30 %, 40 % o 50 %, 60 %, 70 %, 80 %, 85 %, 90 % o 95 %, 96 %, 97 %, 98 %, 99 % o más reducido en comparación con el de las plantas de control.

Para la reducción o eliminación sustancial de la expresión de un gen endógeno en una planta, se requiere una longitud suficiente de nucleótidos sustancialmente contiguos de una secuencia de ácidos nucleicos. Para realizar el silenciamiento génico, éste puede ser tan pequeño como 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 o menos nucleótidos, como alternativa éste puede ser tanto como el gen completo (incluyendo la UTR 5’ y/o 3’, ya sea en parte o en su totalidad). El tramo de los nucleótidos sustancialmente contiguos puede proceder del ácido nucleico que codifica el polipéptido factor 38 de Procesamiento de ARN precursor (genes diana), o de cualquier ácido nucleico capaz de codificar un ortólogo, parálogo y homólogo del polipéptido factor 38 de Procesamiento de ARN precursor. Preferentemente, el tramo de los nucleótidos sustancialmente contiguos es capaz de formar enlaces de hidrógeno con el gen diana (cadena en sentido o antisentido), más preferentemente, el tramo de nucleótidos sustancialmente contiguos tiene, en orden creciente de preferencia, una identidad de secuencia de 50 %, 60 %, 70 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % 100 % con el gen diana (cadena en sentido o antisentido). Una secuencia de ácidos nucleicos que codifica un polipéptido (funcional) no es un requisito para los diversos procedimientos analizados en el presente documento para la reducción o eliminación sustancial de la expresión de gen endógeno.

Ejemplos de diversos procedimientos para la reducción o eliminación sustancial de la expresión en una planta de un gen endógeno, o para disminuir los niveles y/o actividad de una proteína, son conocidos para un experto en la técnica. Un experto en la técnica podrá adaptar fácilmente los procedimientos conocidos para el silenciamiento, para conseguir la reducción de la expresión de un gen endógeno en una planta completa o en partes de la misma a través del uso de un promotor apropiado, por ejemplo.

Esta reducción o eliminación sustancial de la expresión puede conseguirse usando herramientas y técnicas rutinarias.

Marcador de selección (gen)/Gen indicador Un “marcador de selección”, “gen marcador de selección” o “gen indicador” incluye cualquier gen que confiere un fenotipo a una célula en la que se expresa para facilitar la identificación y/o selección de células que se transfectan o transforman con una construcción de ácido nucleico de la invención. Estos genes marcadores permiten la identificación de una transferencia satisfactoria de las moléculas de ácido nucleico mediante una serie de principios diferentes. Los marcadores adecuados pueden seleccionarse de marcadores que confieren resistencia a antibióticos o a herbicidas, que introducen un nuevo rasgo metabólico o que permiten selección visual. Los ejemplos de genes marcadores de selección incluyen genes que confieren resistencia a antibióticos (tales como nptll que fosforila neomicina y kanamicina, o hpt, que fosforila higromicina, o genes que confieren resistencia a, por ejemplo, bleomicina, estreptomicina, tetraciclina, cloranfenicol, ampicilina, gentamicina, geneticina (G418), espectinomicina o blasticidina), a herbicidas (por ejemplo bar que proporciona resistencia a Basta®; aroA o gox que proporciona resistencia contra glifosato, o los genes que confieren resistencia a, por ejemplo, imidazolinona, fosfinotricina o sulfonilurea), o genes que proporcionan un rasgo metabólico (tal como manA que permite a las plantas usar manosa como única fuente de carbono o xilosa isomerasa para la utilización de xilosa, o marcadores antinutritivos tales como la resistencia a 2-desoxiglucosa). La expresión de genes marcadores visuales da como resultado la formación de color (por ejemplo -glucuronidasa, GUS o -galactosidasa con sus sustratos de color, por ejemplo X Gal), luminiscencia (tal como el sistema luciferina/luciferasa) o fluorescencia (Proteína Fluorescente Verde, GFP y derivados de los mismos). Esta lista solo representa una pequeña cantidad de marcadores posibles. El experto está familiarizado con dichos marcadores. Se prefieren diferentes marcadores dependiendo del organismo y del procedimiento de selección.

Se sabe que, después de la integración estable o transitoria de los ácidos nucleicos en células de plantas, solo una minoría de las células capta el ADN exógeno y, si se desea, lo integra en su genoma, dependiendo del vector de expresión usado y de la técnica de transfección usada. Para identificar y seleccionar estos integrantes, normalmente se introduce un gen que codifica un marcador de selección (tal como los descritos anteriormente) en las células huésped junto con el gen de interés. Estos marcadores pueden usarse, por ejemplo, en mutantes en los que estos genes no son funcionales mediante, por ejemplo, deleción por procedimientos convencionales. Además, las moléculas de ácido nucleico que codifican un marcador de selección pueden introducirse en una célula huésped en el mismo vector que comprende la secuencia que codifica los polipéptidos de la invención o usarse en los procedimientos de la invención, o incluso en un vector distinto. Las células que se han transfectado de manera estable con el ácido nucleico introducido pueden identificarse, por ejemplo, por selección (por ejemplo, células que tienen integrado el marcador de selección sobreviven mientras que las otras mueren). Se conocen en la técnica técnicas para la eliminación de genes marcadores, se describen anteriormente técnicas útiles en la sección de definiciones.

Dado que los genes marcadores, particularmente genes para resistencia a antibióticos y herbicidas, ya no se requieren o no se desean en la célula huésped transgénica una vez que se han introducido satisfactoriamente los ácidos nucleicos, el proceso de acuerdo con la invención para introducir los ácidos nucleicos emplea ventajosamente técnicas que permiten la retirada o escisión de estos genes marcadores. Un procedimiento de este tipo es lo que se conoce como co-transformación. El procedimiento de co-transformación emplea dos vectores simultáneamente para la transformación, un vector que lleva el ácido nucleico de acuerdo con la invención y un segundo que lleva el gen (o genes) marcador. Una proporción grande de transformantes recibe o, en el caso de plantas, comprende (hasta el 40 % o más de los transformantes), ambos vectores. En el caso de transformación con Agrobacteria, los transformantes normalmente solo reciben una parte del vector, es decir, la secuencia flanqueada por el ADN-T, que normalmente representa el casete de expresión. Posteriormente los genes marcadores pueden retirarse de la planta transformada realizando cruzamientos. En otro procedimiento, se usan genes marcadores integrados en un transposón para la transformación junto con el ácido nucleico deseado (conocido como tecnología Ac/Ds). Los transformantes pueden cruzarse con una fuente transposasa o los transformantes se transforman con una construcción de ácido nucleico que confiere expresión de una transposasa, de manera transitoria o estable. En algunos casos (aprox. 10 %), el transposón salta del genoma de la célula huésped una vez que se ha producido la transformación satisfactoriamente y se pierde. En una serie de casos adicionales, el transposón salta a una localización diferente. En estos casos, el gen marcador debe eliminarse realizando cruzamientos. En microbiología, se desarrollan técnicas que hacen posible, o facilitan, la detección de dichos acontecimientos. Un procedimiento ventajoso adicional se basa en lo que se conoce como sistemas de recombinación; cuya ventaja es que la eliminación puede dispensarse por cruzamiento. El sistema mejor conocido de este tipo es lo que se conoce como sistema Cre/lox. Cre1 es una recombinasa que retira las secuencias localizadas entre las secuencias loxP. Si el gen marcador se integra entre las secuencias loxP, éste se elimina una vez se haya producido la transformación satisfactoriamente, por expresión de la recombinasa. Otros sistemas de recombinación son el sistema HIN/HIX, FLP/FRT y REP/STB (Tribble y col., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan y col., J. Cell Biol., 149, 2000: 553-566). De acuerdo con la invención, es posible una integración específica de sitio en el genoma de la planta de la secuencia de ácidos nucleicos. Naturalmente, estos procedimientos también pueden aplicarse a microorganismos tales como levaduras, hongos o bacterias.

Transgénico/Transgén/Recombinante Para los fines de la invención, “transgénico”, “transgén” o “recombinante” significa con respecto a, por ejemplo, una secuencia de ácidos nucleicos, un casete de expresión, una construcción génica o un vector que comprende la secuencia de ácidos nucleicos o un organismo transformado con las secuencias de ácidos nucleicos, casetes o vectores de expresión de acuerdo con la invención, todas estas construcciones realizadas por procedimientos recombinantes en los que (a) las secuencias de ácidos nucleicos que codifican las proteínas útiles en los procedimientos de la invención o (b) la secuencia (o secuencias) de control genético que se une operativamente con la secuencia de ácidos nucleicos de acuerdo con la invención, por ejemplo un promotor, o (c) a) y b) no se localizan en su ambiente genético natural o se han modificado por procedimientos recombinantes, siendo posible que se produzca la modificación de, por ejemplo, una sustitución, adición, deleción, inversión o inserción de uno o más restos de nucleótido. Se entiende que, ambiente genético natural, significa el locus genómico o cromosómico natural en la planta original o la presencia en una genoteca. En el caso de una genoteca, el ambiente genético natural de la secuencia de ácidos nucleicos se conserva preferentemente, al menos en parte. El ambiente flanquea la secuencia de ácidos nucleicos al menos en un lado y tiene una longitud de secuencia de al menos 50 pb, preferentemente al menos 500 pb, en especial preferentemente al menos 1000 pb, más preferentemente al menos 5000 pb. Un casete de expresión de origen natural - por ejemplo la combinación de origen natural del promotor natural de las secuencias de ácidos nucleicos con la secuencia de ácidos nucleicos correspondiente que codifica un polipéptido útil en los procedimientos de la presente invención, como se ha definido anteriormente - llega a ser un casete de expresión transgénica cuando esta casete de expresión se modifica mediante procedimientos sintéticos no naturales (“artificiales”) tal como, por ejemplo, tratamiento mutagénico. Se describen procedimientos adecuados, por ejemplo, en los documentos US 5.565.350 o WO 00/15815.

Por lo tanto, una planta transgénica, para los fines de la invención, se entiende que significa, como se ha indicado anteriormente, que los ácidos nucleicos usados en el procedimiento de la invención no están en su locus natural en el genoma de dicha planta, siendo posible que los ácidos nucleicos se expresen de manera homóloga o heteróloga. Sin embargo, como se ha mencionado, transgénico también significa que, aunque los ácidos nucleicos de acuerdo con la invención o usados en el procedimiento de la invención están en su posición natural en el genoma de una planta, la secuencia se ha modificado con respecto a la secuencia natural y/o que las secuencias reguladoras de las secuencias naturales se han modificado. Por transgénico se entiende preferentemente que significa la expresión de los ácidos nucleicos de acuerdo con la invención en un locus no natural en el genoma, es decir, se produce la expresión homólogo o, preferentemente, heteróloga de los ácidos nucleicos. En el presente documento se mencionan las plantas transgénicas preferidas.

Transformación El término “introducción” o “transformación” como se denomina en el presente documento, incluye la transferencia de un polinucleótido exógeno en una célula huésped, independientemente del procedimiento usado para la transferencia. El tejido de planta capaz de propagación clonal posterior, mediante organogénesis o embriogénesis, puede transformarse con una construcción genética de la presente invención y a partir del mismo regenerarse una planta completa. El tejido particular seleccionado variará dependiendo de los sistemas de propagación clonales disponibles para, y mejor adaptados a, la especie particular que se va a transformar. Las dianas tisulares ejemplares incluyen discos foliares, polen, embriones, cotiledones, hipocotiledones, megagametofitos, tejido de callo, tejido meristemático existente (por ejemplo, meristemo apical, brotes axilares y meristemos radiculares) e inducen tejido meristemático (por ejemplo, meristemo de cotiledón y meristemo de hipocotiledón). El polinucleótido puede introducirse de manera estable o transitoria en una célula huésped y puede mantenerse no integrado, por ejemplo, como un plásmido. Como alternativa, éste puede integrarse en el genoma huésped. La célula de la planta transformada resultante puede después usarse para regenerar una planta transformada de una manera conocida por los expertos en la técnica.

La transferencia de genes externos dentro del genoma de una planta se denomina transformación. La transformación de especies plantas es actualmente una técnica muy habitual. Ventajosamente, cualquiera de los diversos procedimientos de trasformación puede usarse para introducir el gen de interés en una célula antecesora adecuada. Los procedimientos descritos para la transformación y regeneración de plantas de tejidos de plantas o células de plantas pueden utilizarse para la transformación transitoria o estable. Los procedimientos de transformación incluyen el uso de liposomas, electroporación, productos químicos que aumentan la captación de ADN libre, inyección del ADN directamente en la planta, pistola de bombardeo de partículas, transformación usando virus o polen y microproyección. Pueden seleccionarse procedimientos entre, el procedimiento de calcio/polietilenglicol para protoplastos (Krens, F. A. y col., (1982) Nature 296, 72-74; Negrutiu I y col. (1987) Plant Mol Biol 8: 363-373); electroporación de protoplastos (Shillito R. D. y col. (1985) Bio/Technol 3, 1099-1102); microinyección en el material de planta (Crossway A y col., (1986) Mol. Gen Genet 202: 179-185); bombardeo de partículas revestido con ADN o ARN (Klein TM y col., (1987) Nature 327: 70) infección con virus (no integrantes) y similares. Las plantas transgénicas, incluyendo plantas de cultivo transgénicas, se producen preferentemente mediante transformación mediada por Agrobacterium. Un procedimiento de transformación ventajoso es la transformación en la planta. Para esta finalidad, es posible, por ejemplo, permitir que la agrobacterias actúen en las semillas de la planta o inocular las agrobacterias en el meristemo de la planta. Se ha demostrado de un modo particularmente conveniente, de acuerdo con la invención, permitir que una suspensión de agrobacterias transformadas actúe en la planta intacta o al menos en los primordios florales. Posteriormente la planta crece hasta que se obtienen las semillas de la planta tratada (Clough y Bent, Plant J. (1998) 16, 735-743). Los procedimientos para la transformación de arroz mediada por Agrobacterium incluyen procedimientos bien conocidos para la transformación de arroz, tales como los descritos en cualquiera de las siguientes referencias bibliográficas: solicitud de patente Europea EP 1198985 A1, Aldemita y Hodges (Planta 199: 612-617, 1996); Chan y col. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei y col. (Plant J 6 (2): 271-282, 1994). En el caso de la transformación de maíz, el procedimiento preferido es como se describe en Ishida y col. (Nat. Biotechnol 14(6): 745-50, 1996) o en Frame y col. (Plant Physiol 129(1): 13-22, 2002). Dichos procedimientos se describen adicionalmente, a modo de ejemplo, en B.

Jenes y col., Techniques for Gene Transfer, en: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S. D. Kung y R. Wu, Academic Press (1993) 128-143 y en Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225). Los ácidos nucleicos o la construcción a expresar se clona preferentemente en un vector, que es adecuado para transformar Agrobacterium tumefaciens, por ejemplo, pBin19 (Bevan y col., Nucl. Acids Res. 12 (1984) 8711). Las agrobacterias transformadas por dicho vector pueden después usarse de una manera conocida para la transformación de plantas, tales como plantas usadas como un modelo, como Arabidopsis (Arabidopsis thaliana que se encuentra dentro del ámbito de la presente invención no se considera como una planta de cultivo) o plantas de cultivo tales como, a modo de ejemplo, plantas de tabaco, por ejemplo, sumergiendo hojas laceradas o picadas en una solución agrobacteriana y después cultivarlas en un medio adecuado. La transformación de plantas mediante Agrobacterium tumefaciens la describen, por ejemplo, Höfgen y Willmitzer en Nucl. Acid Res. (1988) 16, 9877 o se conoce, entre otros, de F. F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S. D. Kung y R. Wu, Academic Press, 1993, págs. 15-38.

Además de la transformación de células somáticas, que después deben regenerarse en plantas intactas, también es posible transformar las células de meristemos de planta y en particular aquellas células que se desarrollan en gametos. En este caso, los gametos transformados siguen el desarrollo natural de la planta, dando lugar a plantas transgénicas. Por tanto, por ejemplo, semillas de Arabidopsis se tratan con agrobacterias y se obtienen semillas del desarrollo de plantas de las que se transforma una determinada proporción y por tanto transgénicas [Feldman, KA y Marks MD (1987). Mol Gen Genet 208: 274-289; Feldmann K (1992). En: C Koncz, N-H Chua y J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pág. 274-289]. Los procedimientos alternativos se basan en la retirada repetida de las inflorescencias e incubación del sitio de escisión en el centro de la roseta con agrobacterias transformadas, por lo que las semillas transformadas pueden obtenerse de modo similar en un punto de tiempo final (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). Sin embargo, un procedimiento especialmente eficaz es el procedimiento de infiltración por vacío con sus modificaciones tal como el procedimiento de “inmersión floral”. En el caso de la infiltración por vacío de Arabidopsis, las plantas intactas bajo presión reducida se tratan con una suspensión agrobacteriana [Bechthold, N (1993). C R Acad Sci Paris Life Sci, 316: 1194-1199], mientras que en el caso del procedimiento de “inmersión floral” el tejido floral en desarrollo se incuba brevemente con una suspensión agrobacteriana tratada con tensioactivo [Clough, SJ y Bent AF (1998) The Plant J. 16, 735-743]. En ambos casos se recoge una determinada proporción de semillas transgénicas y estas semillas pueden diferenciarse de semillas no transgénicas al cultivar bajo las condiciones selectivas descritas anteriormente. Además, la transformación estable de los plástidos es ventajosa ya que estos se heredan por vía materna en la mayor parte de los cultivos reduciendo o eliminando el riesgo de flujo transgénico a través del polen. La transformación del genoma del cloroplasto generalmente se realiza mediante un proceso que han presentado esquemáticamente Klaus y col., 2004 [Nature Biotechnology 22 (2), 225-229]. En resumen, las secuencias a transforman se clonan junto con un gen marcador de selección entre las secuencias flanqueantes homólogas al genoma del cloroplasto. Estas secuencias flanqueantes homólogas dirigen la integración específica de sitio en el plastoma. La transformación plastidial se ha descrito para muchas especies de plantas diferentes y se ofrece una revisión en Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 o Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28. Recientemente se han descrito progresos biotecnológicos adicionales, en forma de transformantes plastidiales sin marcador, que pueden producirse mediante un gen marcador co-integrado transitorio (Klaus y col., 2004, Nature Biotechnology 22(2), 225-229).

El etiquetado en activación de ADN T El etiquetado en activación de ADN T (Hayashi y col. Science (1992) 1350-1353), implica la inserción de ADN T, que normalmente contiene un promotor (también puede ser un potenciador de traducción o un intrón), en la región genómica del gen de interés o 10 kb cadena arriba o cadena abajo de la región codificante de un gen en una configuración de tal manera que el promotor dirige la expresión del gen diana. Típicamente, la regulación de la expresión del gen diana mediante su promotor natural se interrumpe y el gen cae bajo el control del promotor nuevamente introducido. El promotor se incorpora típicamente en un ADN T. Este ADN T se inserta al azar el genoma de la planta, por ejemplo, a través de infección por Agrobacterium y conduce a expresión modificada de genes cerca al ADN T insertado. Las plantas transgénicas resultantes muestran fenotipos dominantes debidos a la expresión modificada de los genes cerca al promotor introducido.

TILLING El término “TILLING” es la abreviatura de “Targeted Induced Local Lesions In Genomes” (Inducción Dirigida de Lesiones Locales en el Genoma) y se refiere a una tecnología de mutagénesis útil para generar y/o identificar ácidos nucleicos que codifican proteínas con expresión y/o actividad modificada. El TILLING también permite la selección de plantas que llevan dichas variantes mutantes. Estas variantes mutantes pueden presentar expresión modificada, en fuerza o en localización o en tiempo (si las mutaciones afectan, por ejemplo, al promotor). Estas variantes mutantes pueden presentar mayor actividad que la mostrada por el gen en su forma natural. El TILLING combina mutagénesis de alta densidad con procedimientos de detección de alto rendimiento. Las etapas seguidas típicamente en el TILLING son: (a) mutagénesis EMS (Redei GP y Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, páginas 16-82; Feldmann y col., (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, páginas 137-172; Lightner J y Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, páginas 91-104); (b) preparación y agrupamiento de ADN en individuos; (c) amplificación por PCR de una región de interés; (d) desnaturalización e hibridación para permitir la formación de heteroduplex; (e) DHPLC, donde la presencia de un heteroduplex en un grupo se detecta como un pico extra en el cromatograma; (f) identificación del mutante individual; y (g) secuenciación del producto PCR mutante. Los procedimientos de TILLING son bien conocidos en la técnica (McCallum y col., (2000) Nat Biotechnol 18: 455- 457; revisado por Stemple (2004) Nat Rev Genet 5(2): 145-50).

Recombinación homóloga La recombinación homóloga permite la introducción en un genoma de un ácido nucleico seleccionado en una posición definida seleccionada. La recombinación homóloga es una tecnología convencional utilizada rutinariamente en ciencias biológicas para organismos inferiores tales como levaduras o el musgo Physcomitrella. Se han descrito procedimientos para realizar recombinación homóloga en plantas no solo para el modelo de plantas (Offringa y col. (1990) EMBO J 9(10): 3077-84) sino también para plantas de cultivo, por ejemplo, arroz (Terada y col. (2002) Nat Biotech 20(10): 1030-4; lida y Terada (2004) Curr Opin Biotech 15(2): 132-8), y existen estrategias que son generalmente aplicables independientemente del organismo diana (Miller y col, Nature Biotechnol. 25, 778-785, 2007).

Rendimiento El término “rendimiento” en general significa un producto medible de valor económico, típicamente relacionado con un cultivo, un área y un periodo de tiempo específicos. Las partes de planta individuales contribuyen directamente al rendimiento en base a su número, tamaño y/o peso, o el rendimiento real es el rendimiento por metro cuadrado de un cultivo y año, que se determina dividiendo la producción total (incluyendo la producción tanto cosechada como valorada) por metro cuadrado plantado. El término “rendimiento” de una planta puede estar relacionado con biomasa vegetativa (biomasa de raíz y/o brote), con órganos reproductores y/o con propágulos (tal como semillas) de esta planta.

Vigor temprano “Vigor temprano” se refiere a un crecimiento bien equilibrado saludable activo especialmente durante las etapas tempranas del crecimiento de la planta, y puede ser el resultado del aumento de la eficacia biológica de la planta debido a, por ejemplo, plantas que están mejor adaptadas a su ambiente (es decir, optimizando el uso de fuentes de energía y repartiendo entre brotes y raíces). Las plantas que tienen vigor temprano también muestran supervivencia aumentada de plántula y un mejor establecimiento del cultivo, que a menudo produce campos muy uniformes (creciendo el cultivo de una manera uniforme, es decir, alcanzando la mayoría de las plantas las diversas etapas de desarrollo a sustancialmente el mismo tiempo) y a menudo mejor y mayor rendimiento. Por lo tanto, el vigor temprano puede determinarse midiendo diversos factores, tales como, peso de mil granos, porcentaje de germinación, porcentaje de emergencia, crecimiento de plántula, altura de plántula, longitud de raíz, biomasa de brote y raíz y muchos más.

Aumento/Mejora/Potenciación Los términos “aumento”, “mejora” o “potenciación” son intercambiables y significan en el sentido de la solicitud al menos 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 % o 10 %, preferentemente al menos 15 % o 20 %, más preferentemente 25 %, 30 %, 35 % o 40 % más rendimiento y/o crecimiento en comparación con plantas de control como se define en el presente documento.

Rendimiento de semilla El rendimiento de semilla aumentado puede manifestarse por sí mismo como uno o más de los siguientes: a) un aumento en biomasa de semilla (peso total de semilla) que puede establecerse sobre una semilla individual y/o por planta y/o por metro cuadrado; b) número de flores por planta aumentado; c) número de semillas (llenas) aumentado; d) tasa de llenado de semilla aumentado (que se expresa como la proporción entre el número de semillas llenas dividido entre el número total de semillas); e) índice de cosecha aumentado, que se expresa como una proporción del rendimiento de partes cosechables, tales como semillas, dividido entre la biomasa total, y f) peso de mil granos (PMG) aumentado y g) número aumentado de panículas primarias, que se extrapola a partir del número de semillas llenas contadas y su peso total. Un PMG aumentado puede ser el resultado de un tamaño y/o peso de semilla aumentado y también puede ser el resultado de un aumento en el tamaño del embrión y/o endospermo.

También puede manifestarse un aumento en el rendimiento de la semilla como un aumento del tamaño de la semilla y/o volumen de la semilla. Además, también puede manifestarse un aumento en el rendimiento de la semilla en sí mismo como un aumento en el área de semilla y/o longitud de semilla y/o anchura de semilla y/o un perímetro de semilla. El rendimiento de semilla aumentado puede ser también el resultado de arquitectura modificada, o puede ocurrir debido a la arquitectura modificada.

Índice de verdor El “índice de verdor” como se usa en el presente documento se calcula a partir de imágenes digitales de plantas. Para cada píxel que pertenece al objeto de la planta sobre la imagen, se calcula la proporción del valor verde frente al valor rojo (en el modelo RGB por el que se codifica el color). El índice de verdor se expresa como el porcentaje de píxeles por el que la proporción con verde con respecto a rojo supera un umbral determinado. En condiciones de crecimiento normales, en condiciones de crecimiento de estrés salino y en condiciones de crecimiento de disponibilidad de nutrientes reducido, el índice de verdor de las plantas se mide en la última imagen antes de la floración. Por otro lado, en condiciones de crecimiento de estrés por sequía, el índice de verdor de las plantas se mide en la primera imagen después de la sequía.

Planta El término “planta” como se usa en el presente documento incluye plantas completas, antecesores y progenie de las plantas y partes de las plantas, incluyendo semillas, brotes, tallos, hojas, raíces (incluyendo tubérculos), flores y tejidos y órganos, donde cada uno de los elementos anteriormente mencionados comprende el gen/ácido nucleico de interés. El término “planta” también incluye células de planta, cultivos en suspensión, tejido de callo, embriones, regiones meristemáticas, gametofitos, esporofitos, polen y microesporas, de nuevo donde cada uno de los elementos mencionados anteriormente comprende el gen/ácido nucleico de interés.

Las plantas que son particularmente útiles en los procedimientos de la invención incluyen todas las plantas que pertenecen a la superfamilia Viridiplantae, en particular plantas monocotiledóneas y dicotiledóneas incluyendo forraje o leguminosas forrajeras, plantas ornamentales, cultivos alimenticios, árboles o arbustos seleccionados de la lista que comprende Acer spp., Actinidia spp., Abelmoschus spp., Agave sisalana, Agropyron spp., Agrostis stolonifera, Allium spp., Amaranthus spp., Ammophila arenaria, Ananas comosus, Annona spp., Apium graveolens, Arachis spp,

Artocarpus spp., Asparagus officinalis, Avena spp. (por ejemplo, Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida), Averrhoa carambola, Bambusa sp., Benincasa hispida, Bertholletia excelsea, Beta vulgaris, Brassica spp. (por ejemplo, Brassica napus, Brassica rapa ssp. [canola, colza, nabo]), Cadaba farinosa, Camellia sinensis, Canna indica, Cannabis sativa, Capsicum spp., Carex elata, Carica papaya, Carissa macrocarpa, Carya spp., Carthamus tinctorius, Castanea spp., Ceiba pentandra, Cichorium endivia, Cinnamomum spp., Citrullus

lanatus, Citrus spp., Cocos spp., Coffea spp., Colocasia esculenta, Cola spp., Corchorus sp., Coriandrum sativum, Corylus spp., Crataegus spp., Crocus sativus, Cucurbita spp., Cucumis spp., Cynara spp., Daucus carota, Desmodium spp., Dimocarpus longan, Dioscorea spp., Diospyros spp., Echinochloa spp., Elaeis (por ejemplo, Elaeis guineensis, Elaeis oleifera), Eleusine coracana, Eragrostis tef, Erianthus sp., Eriobotrya japonica, Eucalyptus sp., Eugenia uniflora, Fagopyrum spp., Fagus spp., Festuca arundinacea, Ficus carica, Fortunella spp., Fragaria spp.,

Ginkgo biloba, Glycine spp. (por ejemplo, Glycine max, Soja hispida o Soja max), Gossypium hirsutum, Helianthus spp. (por ejemplo, Helianthus annuus), Hemerocallis fulva, Hibiscus spp., Hordeum spp. (por ejemplo, Hordeum vulgare), Ipomoea batatas, Juglans spp., Lactuca sativa, Lathyrus spp., Lens culinaris, Linum usitatissimum, Litchi chinensis, Lotus spp., Luffa acutangula, Lupinus spp., Luzula sylvatica, Lycopersicon spp. (por ejemplo, Lycopersicon esculentum, Lycopersicon lycopersicum, Lycopersicon pyriforme), Macrotyloma spp., Malus spp.,

Malpighia emarginata, Mammea americana, Mangifera indica, Manihot spp., Manilkara zapota, Medicago sativa, Melilotus spp., Mentha spp., Miscanthus sinensis, Momordica spp., Morus nigra, Musa spp., Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. (por ejemplo Oryza sativa, Oryza latifolia), Panicum miliaceum, Panicum virgatum, Passiflora edulis, Pastinaca sativa, Pennisetum sp., Persea spp., Petroselinum crispum, Phalaris arundinacea, Phaseolus spp., Phleum pratense, Phoenix spp., Phragmites australis, Physalis spp., Pinus spp.,

Pistacia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Punica granatum, Pyrus communis, Quercus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Ricinus communis, Rubus spp., Saccharum spp., Salix sp., Sambucus spp., Secale cereale, Sesamum spp., Sinapis sp., Solanum spp. (por ejemplo, Solanum tuberosum, Solanum integrifolium o Solanum lycopersicum), Sorghum bicolor, Spinacia spp., Syzygium spp., Tagetes spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Triticale sp., Triticosecale

rimpaui, Triticum spp. (por ejemplo, Triticum aestivum, Triticum durum, Triticum turgidum, Triticum hybernum, Triticum macha, Triticum sativum o Triticum vulgare), Tropaeolum minus, Tropaeolum majus, Vaccinium spp., Vicia spp., Vigna spp., Viola odorata, Vitis spp., Zea mays, Zizania palustris, Ziziphus spp., entre otras.

Descripción detallada de la invención

Sorprendentemente, se ha descubierto ahora que la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38 como se define en el presente documento produce plantas que tienen rasgos relacionados con rendimiento potenciados con respecto a plantas de control. De acuerdo con una primera realización, la presente invención proporciona un procedimiento para potenciar rasgos relacionados con el rendimiento en plantas con respecto a plantas de control, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38 y de forma opcional seleccionar plantas que tienen rasgos potenciados relacionados con el rendimiento.

La invención es como se define en las reivindicaciones. En particular, la invención se refiere a un procedimiento para potenciar rasgos relacionados con rendimiento en plantas respecto a plantas de control, que comprende modular en una planta la expresión de un ácido nucleico que codifica un polipéptido PRP38, por lo cual el polipéptido PRP38 tiene al menos el 70 % o más de identidad de secuencia con la SEC ID N.º: 77 entera y donde dicha expresión modulada se lleva a cabo mediante la introducción y la expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38, donde dichos rasgos relacionados con el rendimiento son uno o más de los siguientes rasgos: (i) biomasa de la parte aérea, (ii) vigor de emergencia, (iii) rendimiento de semilla total, (iv) número de semillas llenas, (v) tasa de llenado, (vi) índice de cosecha, y (vii) número de semillas por planta.

Un procedimiento preferente para modular (preferentemente, aumentar) la expresión de un ácido nucleico que codifica un polipéptido PRP38 es mediante la introducción y expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38 y de forma opcional seleccionar plantas que tienen rasgos potenciados relacionados con el rendimiento.

En lo sucesivo, cualquier referencia en el presente documento a “proteína útil en los procedimientos de la invención” se considera que significa un polipéptido PRP38 como se define en el presente documento... En lo sucesivo, cualquier referencia en el presente documento a un “ácido nucleico útil en los procedimientos de la invención” se considera que significa un ácido nucleico capaz de codificar tal polipéptido PRP38. El ácido nucleico que se introducirá en una planta (y por lo tanto útil en la realización de los procedimientos de la invención) es cualquier ácido nucleico que codifique el tipo de proteína que será descrita ahora, también llamado “ácido nucleico de PRP38” o “gen de PRP38”.

Los términos “dominio” y “motivo” se definen en la sección de “Definiciones” del presente documento. Existen bases de datos especializadas para la identificación de dominios, por ejemplo, SMART (Schultz y col. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic y col. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder y col., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher y Bairoch (1994), A generalized profile syntax for biomolecular SECuences motifs and its function in automatic SECuence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., páginas 53-61, AAAl Press, Menlo Park; Hulo y col., Nucl. Acids. Res. 32:D134-D137, (2004)), o Pfam (Bateman y col., Nucleic Acids Research 30(1): 276-280 (2002)). En el servidor de proteomics ExPASy (Swiss Institute of Bioinformatics (Gasteiger y col., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31: 3784-3788(2003)) se encuentra disponible un conjunto de herramientas para realizar análisis informatizados de secuencias de proteínas. Los dominios o los motivos también pueden identificarse usando técnicas rutinarias, tales como mediante alineamiento de secuencias.

Los procedimientos para el alineamiento de las secuencias para comparación son bien conocidos en la técnica, dichos procedimientos incluyen GAP, BESTFIT, BLAST, FASTA y TFASTA. GAP utiliza el algoritmo de Needleman y Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar el alineamiento global (es decir el tramo de la secuencia completa) de dos secuencias que maximizan el número de emparejamientos y minimiza el número de espacios. El algoritmo BLAST (Altschul y col. (1990) J Mol Biol 215: 403-10) calcula el porcentaje de identidad de secuencia y realiza un análisis estadístico de la similitud entre las dos secuencias. El programa informático para realizar el análisis BLAST está públicamente disponible a través del National Centre for Biotechnology Information (NCBI). Los homólogos pueden identificarse fácilmente usando, por ejemplo, el algoritmo de alineamiento de secuencia múltiple ClustalW (versión 1,83), con los parámetros de alineamiento por pares predeterminados y un procedimiento de clasificación en porcentaje. Los porcentajes globales de similitud e identidad también pueden determinarse utilizando uno de los procedimientos disponibles en el paquete informático MatGAT (Campanella y col., BMC Bioinformatics. Jul 2003 10; 4: 29. MatGAT: una aplicación que genera matrices de similitud/identidad utilizando secuencias de ADN o proteína). Como sería evidente para un experto en la materia, puede realizarse una edición manual menor para optimizar el alineamiento entre los motivos conservados. Adicionalmente, también pueden usarse dominios específicos en lugar de usar secuencias de longitud completa para la identificación de homólogos. Los valores de identidad de secuencia pueden determinarse sobre toda la secuencia de ácidos nucleicos o de aminoácidos o sobre los dominios seleccionados o uno o más motivos conservados, usando los programas mencionados anteriormente usando los parámetros predeterminados. Para alineamientos locales, es particularmente útil el algoritmo Smith- Warerman (Smith TF, Waterman MS (1981) J. Mol. Biol 147(1);195-7).

Además, los polipéptidos PRP38, cuando se expresan en arroz y se evalúan de acuerdo con los procedimientos de la presente invención como se describe en los Ejemplos 7 y 8, produce plantas que tienen rasgos potenciados relacionados con el rendimiento, en particular uno cualquiera o más de peso de semilla total, tasa de llenado se semilla, número de semillas llenas y número total de flores por panícula.

La presente invención se ilustra mediante la transformación de plantas con la secuencia de ácidos nucleicos representada por la SEC ID N.º: 76, que codifica la secuencia de polipéptidos de la SEC ID N.º: 77. Sin embargo, la realización de la invención no está limitada a estas secuencias; pudiendo realizarse los procedimientos de la invención de forma ventajosa usando cualquier ácido nucleico que codifique a PRP38 o un polipéptido PRP38, como se define en el presente documento.

En la Tabla A del Ejemplo 1 del presente documento, se proporcionan ejemplos de ácidos nucleicos que codifican los polipéptidos PRP38. Dichos ácidos nucleicos son útiles para realizar los procedimientos de la invención. Las secuencias de aminoácidos proporcionadas en la Tabla A del Ejemplo 1 son secuencias ejemplo de ortólogos y parálogos del polipéptido PRP38 representado por la SEC ID N.º: 77, siendo los términos “ortólogos” y “parálogos” como se define en el presente documento. Adicionalmente, los ortólogos y parálogos pueden identificarse fácilmente realizando una búsqueda BLAST denominada recíproca. Típicamente, esto implica un primer BLAST que implica una secuencia de consulta BLASTing (por ejemplo usando cualquiera de las secuencias indicadas en la Tabla A del Ejemplo 1) contra cualquier base de datos de secuencia, tal como la base de datos NCBI públicamente disponible. BLASTN o TBLASTX (utilizando valores predeterminados convencionales) pueden usarse cuando se parte de una secuencia de nucleótidos y BLASTP o TBLASTN (usando valores predeterminados convencionales) pueden usarse cuando se parte de una secuencia de proteína. Los resultados BLAST pueden filtrarse opcionalmente. Las secuencias de longitud completa de los resultados filtrados o no filtrados vuelven después a buscarse con BLAST (segundo BLAST) contra las secuencias del organismo del cual procede la secuencia de consulta (donde la secuencia de consulta es la SEC ID N.º: 76 o SEC ID N.º: 77, por lo que el segundo BLAST se realizaría contra las secuencias de Arabidopsis thaliana). Después se comparan los resultados del primer y segundo BLAST. Se identifican un parálogo si un acierto de alta clasificación del primer BLAST es de la misma especie de la que procede la secuencia de consulta, después, un BLAST posterior da como resultado idealmente la secuencia de consulta entre los mayores aciertos; un ortólogo se identifica si un acierto de alta clasificación en el primer BLAST no es de la misma especie de la que procede la secuencia de consulta, y preferentemente los resultados basados en un BLAST posterior en la secuencia de consulta se encuentran entre los mayores aciertos.

Dominio de PRP38 se refiere a una secuencia de aminoácidos conservada encontrada en polipéptidos que pueden funcionar como factores de procesamiento de pre-ARNm. Esta tiene de forma típica aproximadamente 170 aminoácidos de longitud pero, por ejemplo, es más corta en el polipéptido Ostta_PRP38_1 y más larga en el polipéptido Vitvi_PRP38_1 (véase tabla C). Los dominios de PRP38 se pueden representar por una cualquiera de las secuencias de los dominios de PRP38 de la tabla C, y por cualquier dominio de polipéptido que tiene el orden creciente de preferencia de al menos el 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 92 %, 95 %, 98 % o más de identidad de secuencia con uno cualquiera de los dominios de PRP38 de la tabla C. Los dominios de PRP38 pueden comprender uno o más de los motivos de secuencia altamente conservados como se representa en SEC ID N.º: 123 y SEC ID N.º: 124.

De forma alternativa, un dominio de PRP38 puede definirse como cualquier dominio de polipéptido que se alinea de forma significativa a un polipéptido conocido de PRP38, preferentemente a uno cualquiera de los polipéptidos de la tabla A. Un alineamiento significativo entre dos polipéptidos o dos dominios como se define en el presente documento es un alineamiento que tiene en orden creciente de preferencia un valor e menor de e-5 (e a la menos 5), 1.e-10 , 1.e-15, 1.e-20, 1.e-25, 1.e-50, 1.e-75, 1.e-100, 1.e-200, 1.e-300, 1.e-400, 1.e-500,1.e-600,1.e-700 y 1.e-800. Las secuencias de polipéptidos se pueden alinear utilizando cualquiera de los procedimientos bien conocidos en la técnica, incluyendo procedimientos de alineamiento global y local tales como algoritmos Blast, por ejemplo el algoritmo descrito en Altschul, SF, y col. (1990) J. Mol. Biol. 215:403-10. La probabilidad de que se produzca el alineamiento con una dada secuencia se toma como base para identificar polipéptidos similares. Un parámetro que se usa de forma típica para representar tal probabilidad se llama un valor e (valor E). El valor E es una medida de la fiabilidad de la puntuación S. La puntuación S es una medida de la similitud de la secuencia de búsqueda a la secuencia conocida que comprende el dominio de PRP38. El valor e describe con qué frecuencia se espera que se produzca una dada puntuación S al azar. El límite del valor E puede ser de hasta 1.0.

Preferentemente, los polipéptidos PRP38 útiles en los procedimientos de la invención comprenden un dominio de PRP38 que tiene en orden creciente de preferencia un valor e menor de e-5, 1.e-10, 1.e-15, 1.e20, 1.e-25, 1.e-50, 1.e-75, 1.e-100, 1.e-200,1.e-300, 1.e-400, 1.e-500, 1.e-600, 1.e-700 y 1.e-800 cuando se alinean con un dominio de PRP38 conocido, más preferentemente cuando se alinean con uno cualquiera de los dominios de PRP38 de la tabla C.

La presencia de un dominio PRP38 en un polipéptido puede identificarse mediante la búsqueda en bases de datos especializadas que contienen colecciones de múltiples alineamientos de secuencia y modelos de Marcov ocultos cubriendo dominios y familias de proteínas conservados, tales como Pfam, que está disponible en el Sanger Institute, Reino Unido. El ejemplo 2 en el presente documento, muestra los resultados de una búsqueda de Pfam utilizando polipéptidos PRP38 como secuencia de búsqueda.

Un dominio DUF1777 es una secuencia de aminoácidos conservada encontrada en un subconjunto pequeño de las proteínas descritas hasta la fecha. De forma típica, es de 140 a 150 aminoácidos de longitud, aunque también se encuentran versiones mucho más cortas, véase por ejemplo el DUF1777 del polipéptido Chlre_PRP38_1 (tabla C). Se identificaron los dominios DUF1777 en diferentes organismos vivos a base de homología de secuencia. Se puede encontrar una recopilación de los dominios DUF1777 en la base de datos Pfam disponible en el Sanger Institute (RU). Puede identificarse fácilmente la presencia de un dominio DUF1777 en un polipéptido mediante la búsqueda especializada en bases de datos tales como Pfam, que contienen colecciones de múltiples alineamientos de secuencia y modelos de Markov ocultos cubriendo dominios de proteína y familias conservados. Un polipéptido que comprende un dominio DUF1777 se registrará como un acierto con un dominio DUF1777 conocido de forma previa en una búsqueda en la base de datos Pfam. Las secuencias de aminoácidos de los dominios DUF1777 en proteínas de origen eucariótico son con frecuencia en gran medida divergentes, con solo unos pocos restos de aminoácidos conservados de forma precisa. De forma típica, el valor e de un alineamiento de dos dominios DUF1777 es alto, de forma típica por encima de 0,001, de forma más típica por encima de 0,01.

Preferentemente, los polipéptidos PRP38 útiles en los procedimientos de la invención comprenden un dominio DUF1777 que tiene en orden creciente de preferencia un valor e menor de 1.e-5, 1.e-10, 1.e-15, 1.e-20, 1.e-25, 1.e-50, 1.e-75, 1.e-100, 1.e-200,e-300, i.e-400, i.e-500, 1.e-600, 1.e-700 y 1.e-800 cuando se alinean con un dominio DUF1777 conocido, más preferentemente cuando se alinean con uno cualquiera de los dominios DUF1777 de la tabla C.

Más preferentemente, los polipéptidos PRP38 útiles en los procedimientos de la invención comprenden un DUF1777 que tiene en orden creciente de preferencia al menos el 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 92 %, 95 %, 98 % o más de identidad de secuencia con uno cualquiera de los dominios DUF1777 de la tabla C.

Un dominio DUF1777 presente en un polipéptido puede identificarse mediante la búsqueda especializada en bases de datos que contienen colecciones de alineamientos de secuencia múltiples y modelos de Markov ocultos cubriendo dominios de proteína y familias conservados, tales como Pfam disponible en el Sanger Institute, Reino Unido. El Ejemplo 2 del presente documento muestra los resultados de una búsqueda de Pfam utilizando polipéptidos PRP38 como secuencia de búsqueda.

Los polipéptidos PRP38 pueden comprender un dominio RS. Un dominio RS es una región de polipéptido rica en restos de aminoácidos arginina (R) y serina (S). Los dominios RS comprenden una multiplicidad de dipéptidos como se representa en la secuencia RS (Arginina-Serina), RD (Arginina-Ácido glutámico), RD (Arginina-Ácido aspártico). - De forma típica los dipéptidos están distribuidos en una región del polipéptido PRP38 que se extiende desde los aminoácidos 4 a 150. Los dipéptidos mencionados anteriormente pueden aparecer en grupos, tales grupos se componen de forma exclusiva de uno cualquiera o más de los dipéptidos RS, RE, RD y son de forma típica de entre 4 y 40 aminoácidos de largo.

Preferentemente, los polipéptidos PRP38 útiles en los procedimientos de la invención comprenden uno o más de los dipéptidos RS, RE, RD en un tramo de 4, 6, 8, 10, 12, 14, 20, 24, 30, 40, 50, 100 o más, hasta un máximo de 150 aminoácidos.

Más preferentemente, los polipéptidos PRP38 útiles en los procedimientos de la invención comprenden uno o más grupos de dipéptidos que tienen exclusivamente restos de aminoácidos RS, RE y/o RD. De forma adicional, preferentemente el polipéptido PRP38 comprende grupos de cuatro dipéptidos, más preferentemente el grupo de dipéptidos representado por RSRSRSRS.

Los polipéptidos PRP38 pueden comprender de forma adicional uno cualquiera o más de los siguientes motivos de secuencia conservados: (i) SEC ID N.º: 120/Motivo Ib: RRPPSVKASLSVSFGQRAPHRASTRDSSPVRRT, o un motivo que tiene en orden creciente de preferencia al menos el 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 % o más de identidad de secuencia con el Motivo lb; y/o (ii) SEC ID N.º: 121/Motivo IIb: SPYIRA(I/V)GFLYLRY, o un motivo que tiene en orden creciente de preferencia al menos el 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 % o más de identidad de secuencia con un Motivo Ib; y/o (iii) SEC ID N.º: 122/Motivo IIIb: KLKDLYGD, o un motivo que tiene en orden creciente de preferencia al menos el 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 % o más de identidad de secuencia con el Motivo IIIb.

Preferentemente, los polipéptidos PRP38 útiles en los procedimientos de la invención comprenden uno cualquiera o más de los siguientes motivos: (i) Motivo 1b (SEC ID N.º: 120) en el que cualquier resto de aminoácido puede sustituirse por un aminoácido conservativo y/o hasta el 50 % de los restos de aminoácidos pueden sustituirse por un aminoácido no conservativo.

(ii) Motivo 1b (SEC ID N.º: 121) en el que cualquier resto de aminoácido puede sustituirse por un aminoácido conservativo y/o hasta el 50 % de los restos de aminoácido pueden sustituirse por un aminoácido no conservativo. (iii) Motivo 1b (SEC ID N.º: 122) en el que cualquier resto de aminoácidos puede sustituirse por un aminoácido conservativo y/o hasta el 50 % de los restos de aminoácido pueden sustituirse por un aminoácido no conservativo.

Los polipéptidos PRP38 útiles en los procedimientos de la invención son preferentemente aquellos que tienen en orden creciente de preferencia al menos el 70 %, 75 %, 80 %, 85 %, 90 %, 92 %, 93 %, 95 %, 96 %; 98 % o más de identidad de secuencia con SEC ID N.º: 77 entera.

Preferentemente, la secuencia del polipéptido PRP38 útil en los procedimientos de la invención es una que cuando se usa en la construcción de un árbol filogenético, tal como la descrita en la figura 4, se agrupa con cualquiera de las secuencias en el grupo Ib que comprende SEC ID N.º: 77 entera.

De forma típica en los polipéptidos PRP38, el dominio de PRP38 se encuentra en el extremo N-terminal y el dominio DUF1777 en el extremo C-terminal. Los polipéptidos PRP38 tienen de forma típica un C-terminal acídico y se localizan en el núcleo.

Además, los polipéptidos PRP38 tienen de forma típica actividad de corte y empalme de pre-ARNm. Las herramientas y técnicas para medir la actividad de corte y empalme de pre-ARNm se conocen bien en la técnica (Blanton S, y col. (1992) Mol Cell Biol 12(9):3939-47; Stevens SW y Abelson J (1999) Proc Natl Acad Sci U S A 96(13):7226-31; Gottschalk A, y col. (1999) EMBO J 18(16):4535-48; Pandit S, y col. (2006) Proc Natl Acad Sci U S A 103(37):13700-5).

Además, los polipéptidos PRP38, cuando se expresan en arroz de acuerdo con los procedimientos como se describe en el presente documento como se describe en los ejemplo 7 y 8, proporciona plantas que tienen rasgos relacionados con rendimiento potenciados, en particular uno cualquiera o más de biomasa de hoja de parte aérea, vigor de emergencia, peso de semilla total, tasa de llenado de semilla, índice de cosecha, y número total de semillas.

La presente invención se ilustra mediante la transformación de plantas con la secuencia de ácido nucleico representada por SEC ID N º: 76, que codifica la secuencia de polipéptido de SEC ID N º: 77. Sin embargo, la realización de la invención no se restringe a estas secuencias; los procedimientos de la invención pueden realizarse de forma ventajosa utilizando cualquier ácido nucleico codificante de PRP38 o polipéptido de PRP38 como se define en el presente documento.

Los aciertos de alta clasificación son aquellos que tienen un valor E bajo. Cuanto menor es el valor E, más significativa la clasificación (o en otras palabras menor es la probabilidad de que se encuentre el acierto casualmente). El cálculo del valor E es bien conocido en la técnica. Además de los valores E, las comparaciones también se clasifican mediante el porcentaje de identidad. El porcentaje de identidad se refiere al número de nucleótidos (o aminoácidos) idénticos entre las dos secuencias de ácidos nucleicos (o polipéptido) sobre una longitud particular. En el caso de grandes familias, puede usarse ClustalW, seguido de la generación de un árbol de unión del vecino más próximo para ayudar a visualizar el agrupamiento de los genes relacionados y para identificar los ortólogos y parálogos.

Las variantes de ácidos nucleicos también pueden ser útiles en la realización práctica de los procedimientos de la invención. Los ejemplos de dichas variantes incluyen ácidos nucleicos que codifican homólogos y derivados de una cualquiera de las secuencias de aminoácidos proporcionada en la Tabla A del Ejemplo 1, siendo los términos “homólogo” y “derivado” como se definen en el presente documento. También son útiles en los procedimientos de la invención los ácidos nucleicos que codifican homólogos y derivados de ortólogos o parálogos de una cualquiera de las secuencias de aminoácidos proporcionadas en la Tabla A del Ejemplo 1. Los homólogos y derivados útiles en los procedimientos de la presente invención tienen sustancialmente la misma actividad biológica y funcional que la proteína no modificada de la cual proceden. Las variantes de ácidos nucleicos adicionales útiles en la realización práctica de los procedimientos de la invención incluyen porciones de ácidos nucleicos que codifican polipéptidos PRP38, ácidos nucleicos que se hibridan con ácidos nucleicos que codifican polipéptidos PRP38, variantes de corte y empalme de ácidos nucleicos que codifican polipéptidos PRP38, variantes alélicas de ácidos nucleicos que codifican polipéptidos de PRP38 y variantes de ácidos nucleicos que codifican polipéptidos PRP38 obtenidos por combinación de genes. Las expresiones hibridación de secuencias, variante de corte y empalme, variante alélica y combinación de genes son como se describen en el presente documento.

Los ácidos nucleicos que codifican polipéptidos PRP 38 no tienen por qué ser ácidos nucleicos de longitud completa, dado que la realización de los procedimientos de la invención no se basa en el uso de secuencias de ácidos nucleicos completas. De acuerdo con la presente invención se proporciona un procedimiento para potenciar rasgos relacionados con el rendimiento de semilla en plantas, que comprende introducir y expresar en una planta una porción de una cualquiera de las secuencias de ácidos nucleicos proporcionadas en la Tabla A del Ejemplo 1, o una porción de un ácido nucleico que codifica un ortólogo, parálogo y homólogo de cualquiera de las secuencias de aminoácidos proporcionadas en la Tabla A del Ejemplo 1.

Una porción de un ácido nucleico puede prepararse, por ejemplo, realizando una o más deleciones en el ácido nucleico. Las porciones pueden usarse en forma aislada o pueden fusionarse a otras secuencias codificantes (o no codificantes) para producir por ejemplo, una proteína que combine diversas actividades. Cuando se fusiona con otras secuencias codificantes, el polipéptido resultante producido después de la traducción puede ser más grande que el esperado para la porción proteica.

Las porciones útiles en los procedimientos de la invención, codifican un polipéptido PRP38 como se define en el presente documento, y tienen sustancialmente la misma actividad biológica que la secuencia de aminoácidos proporcionada en la Tabla A del Ejemplo 1. Las porciones útiles en los procedimientos de la invención comprenden un dominio de proteína que tiene en orden creciente de preferencia el 50 %, 55 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 92 %, 93 %, 95 %, 96 %, 98 % o más de identidad de secuencia con uno cualquiera de los dominios conservados definidos en la Tabla C. Preferentemente, la porción es una porción de uno cualquiera de los ácidos nucleicos proporcionados en la Tabla A del Ejemplo 1, o es una porción de un ácido nucleico que codifica un ortólogo o parálogo de una cualquiera de las secuencias de aminoácidos proporcionadas en la Tabla A del Ejemplo 1. Preferentemente la porción es al menos de 50, 100, 150, 200, 300, 400, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200 o más nucleótidos consecutivos de longitud, siendo los nucleótidos consecutivos de una cualquiera de las secuencias de ácido nucleico proporcionadas en la Tabla A del Ejemplo 1, o de un ácido nucleico que codifica un ortólogo o parálogo de una cualquiera de las secuencias de aminoácidos proporcionadas en la Tabla A del Ejemplo 1. Preferentemente, la porción es una porción del ácido nucleico de SEC ID N.º: 76, más preferentemente es una porción como se representa en SEC ID N.º: 82. Preferentemente la porción codifica un fragmento de una secuencia de aminoácidos que, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en la figura 4, se agrupa con cualquiera de las secuencias del grupo Ib, que comprende SEC ID N.º: 77.

Otra variante de ácido nucleico útil en los procedimientos de la invención es un ácido nucleico capaz de hibridar, en condiciones de rigurosidad reducida, preferentemente en condiciones rigurosas, con un ácido nucleico que codifica un polipéptido PRP38 según se define en el presente documento, o con una porción del mismo según se define en el presente documento.

De acuerdo con la presente invención, se proporciona un procedimiento para potenciar rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta un ácido nucleico capaz de hibridar con uno cualquiera de los ácidos nucleicos dados en la Tabla A del Ejemplo 1, o que comprende introducir y expresar en una planta un ácido nucleico capaz de hibridar con un ácido nucleico que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de ácidos nucleicos dadas en la Tabla A del Ejemplo 1.

Las secuencias de hibridación útiles en los procedimientos de la invención codifican un polipéptido PRP38 como se define en el presente documento, que tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos proporcionadas en la Tabla A del Ejemplo 1. Preferentemente, la secuencia de hibridación es capaz de hibridar con uno cualquiera de los ácidos nucleicos dados en la Tabla A del Ejemplo 1, o con una porción de cualquiera de estas secuencias, siendo una porción como se define anteriormente, o la secuencia de hibridación es capaz de hibridar a un ácido nucleico que codifica un ortólogo o parálogo de una cualquiera de las secuencias de ácidos nucleicos dadas en la Tabla A del Ejemplo 1. Más preferentemente, la secuencia de hibridación es capaz de hibridar con el complemento de un ácido nucleico como se representa por SEC ID N.º: 76 o con una porción del mismo.

Preferentemente, la secuencia de hibridación codifica un polipéptido con una secuencia de aminoácidos que, cuando es de longitud completa y se usa en la construcción de un árbol filogenético, tal como el representado en la Figura 4, se agrupa con cualquiera de las secuencias del grupo Ib, que comprende SEC ID N.º: 77.

Otra variante de ácido nucleico útil en los procedimientos de la invención es una variante de corte y empalme que codifica un polipéptido PRP38 como se define anteriormente en el presente documento, siendo una variante de corte y empalme como se define en el presente documento.

De acuerdo con la presente invención, se proporciona un procedimiento para potenciar rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta una variante de corte y empalme de una cualquiera de las secuencias de ácidos nucleicos dadas en la Tabla A del Ejemplo 1, o una variante de corte y empalme de un ácido nucleico que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de aminoácidos dadas en la Tabla A del Ejemplo 1.

Las variantes de corte y empalme preferentes son variantes de corte y empalme de un ácido nucleico representado en SEC ID N.º: 76, o una variante de corte y empalme de un ácido nucleico que codifica un ortólogo o parálogo de SEC ID N.º: 77. Más preferentemente la variante de corte y empalme es una variante de SEC ID N.º: 76, más preferentemente es una variante de corte y empalme como se representa en SEC ID N.º: 80. Preferentemente, la secuencia de aminoácidos que codifica la variante de corte y empalme, cuando se utiliza en la construcción de un árbol filogenético tal como el representado en la Figura 4, se agrupa con cualquiera de las secuencias del grupo Ib, que comprende SEC ID N.º: 77 Otra variante de ácido nucleico útil en realizar los procedimientos de la invención es una variante alélica de un ácido nucleico que codifica un polipéptido PRP38 como se define anteriormente en el presente documento, siendo una variante alélica como se define en el presente documento.

De acuerdo con la presente invención, se proporciona un procedimiento para potenciar rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta una variante alélica de uno cualquiera de los ácidos nucleicos dados en la Tabla A del Ejemplo 1, o que comprende introducir y expresar en una planta una variante alélica de un ácido nucleico que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de aminoácidos dadas en la Tabla A del Ejemplo 1.

Las variantes alélicas útiles en los procedimientos de la presente invención tienen sustancialmente la misma actividad biológica que los polipéptidos similares a PRP38 de SEC ID N.º: 77 y cualquiera de los aminoácidos representados en la Tabla A del Ejemplo 1. Las variantes alélicas existen en la naturaleza, y los procedimientos de la presente invención abarcan el uso de estos alelos naturales. Preferentemente, la variante alélica es una variante alélica de SEC ID N.º: 76 o una variante alélica de un ácido nucleico que codifica un ortólogo o parálogo de SEC ID N.º: 77. Preferentemente, la secuencia de aminoácidos que codifica la variante alélica, cuando se usa en la construcción de un árbol filogenético, tal como el representado en la Figura 4, se agrupa con cualquiera de las secuencias del grupo Ib, que comprenden SEC ID N.º: 77:.

La combinación de genes o evolución dirigida también puede usarse para generar variantes de ácidos nucleicos que codifican polipéptidos PRP38 como se define anteriormente; siendo la expresión “combinación de genes” como se define en el presente documento.

De acuerdo con la presente invención, se proporciona un procedimiento para potenciar rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta una variante de una cualquiera de las secuencias de ácidos nucleicos dadas en la Tabla A del Ejemplo 1, o que comprende introducir y expresar en una planta una variante de un ácido nucleico que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de ácidos nucleicos dadas en la Tabla A del Ejemplo 1, cuyo ácido nucleico variante se obtiene mediante combinación de genes.

Preferentemente, la secuencia de aminoácidos que codifica el ácido nucleico variante obtenido por combinación de genes, cuando se utiliza en la construcción de un árbol filogenético tal como el representado en la Figura 4, se agrupa con cualquiera de las secuencias en el árbol, más preferentemente con las secuencia en el grupo Ia, que comprende SEC ID N.º: 77.

Además, las variantes de ácidos nucleicos se pueden también obtener mediante mutagénesis dirigida. Hay disponibles varios procedimientos para conseguir la mutagénesis dirigida, siendo los más comunes los procedimientos basados en PCR (Current Protocols in Molecular Biology. Wiley Eds.).

Los ácidos nucleicos que codifican los polipéptidos PRP38 se pueden obtener a partir de cualquier fuente natural o artificial. Los ácidos nucleicos se pueden modificar a partir de su forma natural en composición y/o entorno genómico a través de manipulación deliberada por el ser humano. Preferentemente el ácido nucleico que codifica el polipéptido PRO38 es de una planta, además, preferentemente de una planta dicotiledónea, más preferentemente de la familia brasicaceae, muy preferentemente el ácido nucleico es de Arabidopsis thaliana .

La realización de los procedimientos de la invención proporciona plantas que tienen rasgos potenciados relacionados con el rendimiento. En particular la realización de los procedimientos de la invención proporciona plantas que tienen rendimiento aumentado, especialmente rendimiento de semilla aumentado con respecto a las plantas de control. Las expresiones “rendimiento” y “rendimiento de semilla” se describen con más detalle en la sección “definiciones” en el presente documento.

En el presente documento la referencia a rasgos potenciados relacionados con el rendimiento se considera que significa un aumento en la biomasa (peso) de una o más partes de una planta, las que pueden incluir partes aéreas (cosechables) y/o partes por debajo del suelo (cosechables). En particular, tales partes cosechables son semillas, y la realización de los procedimientos de la invención da como resultado plantas que tienen rendimiento de semilla aumentado en comparación con el rendimiento de semilla de las plantas de control.

Tomando al maíz como ejemplo, un aumento en el rendimiento puede manifestarse como uno o más de los siguientes: el aumento del número de plantas establecidas por metro cuadrado, un aumento en el número de mazorcas por planta, un aumento en el número de hileras, el número de granos por hilera, el peso del grano, el peso de mil granos, el longitud/diámetro de la mazorca, el aumento de la tasa de llenado de semilla (que es el número de semillas llenas dividido entre el número total de semillas y multiplicado por 100), entre otros. Tomando el arroz como ejemplo, un incremento en el rendimiento puede manifestarse en sí mismo como un aumento en uno o más de los siguientes: el número de plantas por metro cuadrado, el número de panículas por planta, el número de espigas por panícula, el número de flores (floretes) por panícula (que se expresa como una proporción del número de semillas llenas sobre el número de panículas principales), el aumento en la tasa de llenado de semilla (que es el número de semillas llenas dividido entre el número total de semillas y multiplicado por 100), el aumento en el peso de mil granos, entre otros.

La presente invención proporciona un procedimiento para aumentar el rendimiento, de forma especial el rendimiento de semilla de plantas, en comparación con las plantas de control, cuyo procedimiento comprende la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38 como se define en el presente documento.

Dado que las plantas transgénicas de acuerdo con la presente invención tienen un rendimiento aumentado, es probable que estas plantas presenten una tasa de crecimiento aumentada (durante al menos parte de su ciclo de vida) con respecto a la tasa de crecimiento de plantas de control en una etapa correspondiente en su ciclo de vida.

La tasa de crecimiento aumentada puede ser específica a una o más partes de una planta (incluyendo semillas), o puede ser sustancialmente en toda la planta. Las plantas que tienen una tasa de crecimiento aumentada pueden tener un ciclo de vida más corto. El ciclo de vida de una planta puede significar el tiempo necesario para crecer a partir de una semilla madura seca hasta la etapa en la que la planta ha producido semillas maduras secas, similar al material de partida. Este ciclo de vida puede estar influenciado por factores tales como el vigor temprano, tasa de crecimiento, índice de verdor, tiempo de floración y velocidad de la maduración de la semilla. El aumento en la tasa de crecimiento puede tener lugar en una o más etapas en el ciclo de vida de una planta o durante sustancialmente el ciclo de vida completo de una planta. Una tasa de crecimiento aumentada durante las etapas tempranas en el ciclo de vida de una planta puede reflejar vigor potenciado. El aumento en la tasa de crecimiento puede alterar el ciclo de la cosecha de una planta lo que permite que las plantas se siembren más tarde y/o se cosechen más pronto de lo que de otra manera sería posible (puede obtenerse un efecto similar con un tiempo de floración más temprano). Si la tasa de crecimiento se aumenta suficientemente, puede permitir la siembra adicional de semillas de la misma especie de la planta (por ejemplo siembra y cosecha de plantas de arroz seguido de siembra y cosecha de plantas de arroz adicionales todas dentro de un periodo de crecimiento convencional). De manera similar, si la tasa de crecimiento se aumenta suficientemente, puede permitir la siembra adicional de semillas de diferentes especies de plantas (por ejemplo, la siembra y cosecha de plantas de maíz seguido de, por ejemplo, la siembra y cosecha opcional de plantas de soja, patata o cualquier otra planta adecuada). Los tiempos de cosecha adicionales del mismo rizoma en el caso de algunas plantas de cultivo también pueden ser posibles. Alterar el ciclo de cosecha de una planta puede conducir a un aumento en producción de biomasa anual por metro cuadrado (debido a un aumento en el número de tiempos (dicho en un año) que se puede cultivar y cosechar cualquier planta particular). Un aumento en la tasa de crecimiento también puede permitir el cultivo de plantas transgénicas en un área geográfica más amplia que sus homólogos de tipo silvestre, debido a que las limitaciones territoriales para cosechar un cultivo a menudo se determinan por condiciones ambientales adversas bien en el momento de plantar (estación temprana) o bien en el momento de cosechar (estación tardía). Dichas condiciones adversas pueden evitarse si se acorta el ciclo de la cosecha. La tasa de crecimiento puede determinarse derivando diversos parámetros de curvas de crecimiento, dichos parámetros pueden ser: T-Medio (el tiempo que tardan las planta en alcanzar el 50 % de su tamaño máximo) y T-90 (el tiempo que tardan las plantas en alcanzar el 90 % de su tamaño máximo) entre otros.

De acuerdo con una característica preferida de la presente invención, la realización de los procedimientos de la invención proporciona plantas que tienen una tasa de crecimiento aumentada en comparación con plantas de control. Por lo tanto, de acuerdo con la presente invención, se proporciona un procedimiento para aumentar la tasa de crecimiento en plantas, cuyo procedimiento comprende modular la expresión en una planta un ácido nucleico que codifica un polipéptido PRP38 como se define en el presente documento.

Un aumento en el rendimiento y/o tasa de crecimiento se produce en condiciones de crecimiento agrícola típicas que comprenden los estreses diarios a los que están expuestas las plantas. Típicamente las plantas responden a exposición frente al estrés creciendo más lentamente. En condiciones de estrés intenso la planta puede incluso detener por completo el crecimiento. Por otro lado, estrés leve o diario son estreses a los que se expone la planta que no da como resultado el cese total del crecimiento de la planta sin la capacidad de reanudar el crecimiento. El estrés leve, en el sentido de la invención, conduce a una reducción en el crecimiento de la planta estresada de menos de 40 %, 35 % o 30 %, preferentemente menos del 25 %, 20 % o 15 %, más preferentemente menos de 14 %, 13 %, 12 %, 11 % o 10 % o menos en comparación con la planta de control en condiciones sin estrés. Debido a los avances en las prácticas agrícolas (riego, fertilización, tratamientos con pesticidas) las formas de estrés intenso no se encuentran frecuentemente en las plantas cultivadas. Una planta cultivada en condiciones agrícolas típicas puede encontrar a menudo estrés leve. Como consecuencia, el crecimiento comprometido inducido por estrés leve es a menudo una característica indeseable para la agricultura. El estrés leve es un estrés biótico y/o abiótico (ambiental) común al cual está expuesta la planta. El estrés abiótico puede deberse a sequía o a exceso de agua, a estrés anaeróbico, estrés salino, toxicidad química, estrés oxidativo y a temperaturas altas, frías o heladas. El estrés abiótico puede ser un estrés osmótico causado por estrés hídrico (particularmente debido a sequía), estrés salino, estrés oxidativo y estrés iónico.

En particular, los procedimientos de la presente invención pueden realizarse en condiciones sin estrés o en condiciones de sequía leve para proporcionar plantas que tienen rendimiento aumentado con respecto a las plantas de control. Como se informa en Wang y col. (Planta (2003) 218: 1-14), el estrés abiótico conduce a una serie de cambios morfológicos, fisiológicos, bioquímicos y moleculares que afectan de forma adversa el crecimiento y la productividad de la planta. Se sabe que la sequía, la salinidad, las temperaturas extremas y el estrés oxidativo están interconectados y pueden inducir daño en el crecimiento y daño celular a través de mecanismos similares. Rabbani y col. (Plant Physiol (2003) 133: 1755-1767) describen un particularmente alto grado de “interferencia” entre estrés por sequía y estrés por alta salinidad. Por ejemplo, la sequía y/o salinización se manifiestan principalmente como estrés osmótico, dando como resultado la alteración de la homeostasis y de la distribución iónica en la célula. El estrés oxidativo, que de forma frecuente acompaña a alta o baja temperatura, salinidad o estrés por sequía, puede provocar la desnaturalización de proteínas funcionales y estructurales. En consecuencia, estos diversos estreses medioambientales a menudo activan rutas de señalización celulares y respuestas celulares semejantes, tales como la producción de proteínas de estrés, la regulación positiva de antioxidantes, la acumulación de solutos compatibles y la detención del crecimiento. La expresión condiciones “sin estrés” son aquellas condiciones medioambientales que permiten el crecimiento óptimo de las plantas son aquellas condiciones ambientales que permiten el crecimiento óptimo de las plantas. Los expertos en la técnica saben cuáles son las condiciones normales en el suelo y las condiciones climáticas en una localización determinada. La expresión condiciones sin estrés, como se usa en el presente documento, abarca el estrés moderado ocasional o diario al que la planta está expuesta, como se define en el presente documento, pero no abarca estrés grave.

La realización de los procedimientos de la invención da lugar a plantas cultivadas en condiciones sin estrés o en condiciones de sequía leve de rendimiento aumentado con respecto a plantas de control que crecen en condiciones comparables. Por lo tanto, de acuerdo con la presente invención, se proporciona un procedimiento para aumentar el rendimiento en plantas que crecen en condiciones sin estrés o en condiciones de sequía leve, cuyo procedimiento comprende la modulación de la expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38.

La realización de los procedimientos de la invención da lugar a plantas que crecen en condiciones de déficit de nutrientes, particularmente en condiciones de déficit de nitrógeno, con rendimiento aumentado con respecto a plantas de control que se cultivan en condiciones comparables. Por lo tanto de acuerdo con la presente invención, se proporciona un procedimiento para aumentar el rendimiento de semilla en plantas que se cultivan en condiciones de déficit de nutrientes, cuyo procedimiento comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38. El déficit de nutrientes puede producirse por una carencia de nutrientes tales como nitrógeno, fosfatos y otros compuestos que contienen fósforo, potasio, calcio, cadmio, magnesio, manganeso, hierro y boro entre otros.

La presente invención engloba a plantas o partes de las mismas (incluyendo semillas) obtenibles por los procedimientos de acuerdo con la presente invención. Las plantas o partes de las mismas comprenden un transgén de ácido nucleico que codifica un polipéptido PRP38 como se define anteriormente.

La invención también proporciona construcciones génicas y vectores para facilitar la introducción y/o expresión en plantas de ácidos nucleicos que codifican polipéptidos PRP38. Las construcciones génicas pueden insertarse en vectores, que pueden estar disponibles en el comercio, adecuados para la transformación en plantas y adecuados para la expresión del gen de interés en las células transformadas. La invención también proporciona el uso de una construcción génica como se define en el presente documento en los procedimientos de la invención.

Más específicamente, la presente invención proporciona una construcción que comprende: (a) un ácido nucleico que codifica un polipéptido PRP38 como se ha definido anteriormente; (b) una o más secuencias de control capaces de conducir la expresión de la secuencia de ácidos nucleicos de (a); y opcionalmente (c) una secuencia de terminación de la transcripción.

Preferentemente, el ácido nucleico que codifica un polipéptido PRP38 es como se define anteriormente. La expresión “secuencia de control” y “secuencia de terminación” son como se define en el presente documento.

Las plantas se transforman con un vector que comprende cualquiera de los ácidos nucleicos descritos anteriormente. El experto en la técnica conocerá los elementos genéticos que deben estar presentes en un vector para transformar, seleccionar y propagar satisfactoriamente células hospedadoras que contengan la secuencia de interés. La secuencia de interés está unida operativamente a una o más secuencias de control (al menos a un promotor).

Ventajosamente, cualquier tipo de promotor, ya sea natural o sintético, puede usarse para aumentar la expresión de la secuencia de ácidos nucleicos. Un promotor constitutivo es particularmente útil en los procedimientos. Preferentemente, el promotor constitutivo es también un promotor ubicuo. Véase la sección “Definiciones” del presente documento para las definiciones de los diversos tipos de promotores.

Debe aclararse que la aplicabilidad de la invención no está limitada al ácido nucleico que codifica el polipéptido PRP38 representado por la SEC ID N.º: 76, ni la aplicabilidad de la invención está limitada a la expresión de un ácido nucleico que codifica un polipéptido PRP38 cuando se dirige por un promotor constitutivo, o cuando se dirige por un promotor específico de raíz.

En lo que respecta a PRP38, el promotor constitutivo es preferentemente un promotor GOS2, preferentemente un promotor GOS2 de arroz. Adicionalmente de manera preferente el promotor constitutivo está representado por una secuencia de ácidos nucleicos sustancialmente similar a la SEC ID N.º: 127, más preferentemente el promotor constitutivo es como se representa en la SEC ID N.º: 127. Véase la sección “Definiciones” del presente documento para otros ejemplos de promotores constitutivos.

Los elementos reguladores adicionales pueden incluir potenciadores transcripcionales así como traduccionales. Los expertos en la técnica serán conscientes de que pueden ser adecuadas sustancias terminadoras y potenciadoras para su uso en la realización de la invención. También puede añadirse una secuencia intrónica en la región no traducida (UTR) 5’ o en la secuencia codificante para aumentar la cantidad del mensaje maduro que se acumula en el citosol, como se describe en la sección de definiciones. Otras secuencias de control (además de las secuencias promotoras, potenciadoras, silenciadoras, intrónicas, regiones UTR3’ y/o UTR5’) pueden ser elementos estabilizadores de proteína y/o ARN. Un experto en la materia conocería dichas secuencias o podría obtenerlas fácilmente.

Las construcciones genéticas de la invención pueden incluir adicionalmente un origen de secuencia de replicación que es necesario para la conservación y/o replicación en un tipo de célula específico. Un ejemplo es cuando en una célula bacteriana se requiere conservar una construcción genética como un elemento genético episomal (por ejemplo, una molécula de plásmido o de cósmido). Como orígenes de replicación preferidos se incluyen, pero sin limitación f1-ori y colE1.

Para la detección de la transferencia satisfactoria de las secuencias de ácidos nucleicos como se usa en los procedimientos de la invención y/o selección de plantas transgénicas que comprenden estos ácidos nucleicos, es ventajoso usar genes marcadores (o genes indicadores). Por lo tanto, la construcción genética puede comprender opcionalmente un gen marcador de selección. Los marcadores de selección se describen con más detalle en la sección “definiciones” del presente documento. Los genes marcadores pueden retirarse o escindirse de la célula transgénica una vez que ya no se necesitan. Las técnicas para retirar marcadores son conocidas en la materia, en la sección de definiciones anterior se describen técnicas útiles.

La invención también proporciona un procedimiento para la producción de plantas transgénicas que tienen rasgos potenciados relacionados con el rendimiento con respecto a las plantas de control, que comprende la introducción y expresión en una planta de cualquier ácido nucleico que codifique un polipéptido PRP38 según se define anteriormente en el presente documento, en el que dichos rasgos relacionados con el rendimiento son uno o más de los siguientes rasgos: (i) biomasa de la parte aérea, (ii) vigor de emergencia, (iii) rendimiento de semilla total, (iv) número de semillas llenas, (v) tasa de llenado, (vi) índice de cosecha, y (vii) número de semillas por planta.

De forma más específica, la presente invención proporciona un procedimiento para la producción de plantas transgénicas que tienen rasgos potenciados relacionados con el rendimiento aumentados, donde dichos rasgos relacionados con rendimiento son uno o más de los siguientes rasgos: (i) biomasa de la parte aérea, (ii) vigor de emergencia, (iii) rendimiento de semilla total, (iv) número de semillas llenas, (v) tasa de llenado, (vi) índice de cosecha, y (vii) número de semillas por planta, cuyo procedimiento comprende: (i) introducir y expresar en una planta o célula de planta un ácido nucleico que codifica un polipéptido PRP38 como se define en el presente documento; y (ii) cultivar la célula de planta en condiciones que promueven el crecimiento y el desarrollo de la planta, y de forma opcional (iii) seleccionar plantas que tienen rasgos relacionados con rendimiento potenciados El ácido nucleico de (i) puede ser cualquiera de los ácidos nucleicos capaces de codificar un polipéptido PRP38 como se define en el presente documento.

El ácido nucleico puede introducirse directamente en una célula de planta o en la propia planta (incluyendo la introducción en un tejido, órgano o en cualquier otra parte de una planta). De acuerdo con una característica preferida de la presente invención, el ácido nucleico se introduce preferentemente en una planta por transformación.

El término “transformación” se describe con más detalle en la sección “definiciones” del presente documento.

Las células de planta modificadas genéticamente pueden regenerarse mediante todos los procedimientos con los que está familiarizado el experto en la técnica. Pueden encontrarse procedimientos adecuados en las publicaciones anteriormente mencionadas de S. D. Kung y R. Wu, Potrykus o Höfgen y Willmitzer.

Generalmente, después de la transformación, las células o grupos de células de planta se seleccionan para detectar la presencia de uno o más marcadores que están codificados por genes que pueden expresarse en plantas co- transferidos con el gen de interés, después de lo cual el material transformado se regenera en una planta completa. Para seleccionar plantas transformadas, el material de planta obtenido en la transformación, como norma, se somete a condiciones selectivas de tal manera que las plantas transformadas pueden diferenciarse de las plantas no transformadas. Por ejemplo, las señales obtenidas de la manera descrita anteriormente pueden plantarse y, después de un periodo de crecimiento inicial, someterse a una selección adecuada por pulverización. Una posibilidad adicional consiste en cultivar las semillas, si fuera apropiado, después de esterilización, en placas de agar usando un agente de selección adecuado de tal manera que solamente las semillas transformadas puedan desarrollarse en plantas. Como alternativa, las plantas transformadas se exploran para determinar la presencia de un marcador de selección tal como el descrito anteriormente.

Después de la transferencia y regeneración de ADN, las plantas supuestamente transformadas pueden evaluarse utilizando, por ejemplo, análisis de Southern, para determinar la presencia del gen de interés, número de copias y/u organización genómica. Como alternativa o adicionalmente, los niveles de expresión del ADN recién introducido pueden supervisarse usando análisis de Northern y/o Western, ambas técnicas bien conocidas por los expertos habituales en la materia.

Las plantas transformadas generadas pueden propagarse mediante diversos medios, tales como mediante técnicas clásicas de propagación clonal o de reproducción. Por ejemplo, una primera generación (o T1) de planta transformada puede reproducirse asexualmente y puede seleccionarse una segunda generación homocigota (o T2) y después las plantas T2 pueden propagarse adicionalmente a través de técnicas de reproducción clásicas. Los organismos transformados generados pueden adoptar diversas formas. Por ejemplo, pueden ser quimeras de células transformadas y de células no trasformadas; transformantes clonales (por ejemplo, todas las células transformadas que contengan el casete de expresión); injertos de tejidos transformados y no transformados (por ejemplo, en plantas, una planta madre transformada injertada a un vástago no transformado).

La presente invención se amplía claramente a cualquier célula de planta o planta producida mediante cualquiera de los procedimientos de la divulgación descritos en el presente documento, y a todas las partes de la planta y propágulos de la misma. La presente invención se amplía adicionalmente para incluir la progenie de una célula, tejido u órgano primario transformado o transfectado o la planta completa que se ha producido mediante cualquiera de los procedimientos anteriormente mencionados, siendo el único requisito que la progenie presente las mismas características, o características, genotípicas y/o fenotípicas que las producidas por el precursor en los procedimientos de acuerdo con la invención.

La invención también incluye células huésped que contienen un ácido nucleico aislado que codifica un polipéptido PRP38 como se ha definido anteriormente en el presente documento. De acuerdo con la invención, las células huésped preferentes son células de plantas. Las plantas huésped para los ácidos nucleicos o el vector usados en el procedimiento de acuerdo con la invención, el casete de expresión o construcción o vector son, en principio, ventajosamente todas las plantas, que pueden sintetizar los polipéptidos usados en el procedimiento inventivo.

Los procedimientos de la invención son ventajosamente aplicables a cualquier planta. Las plantas que son particularmente útiles en los procedimientos de la invención incluyen todas las plantas que pertenecen a la superfamilia Viridiplantae, en particular plantas monocotiledóneas y dicotiledóneas incluyendo forraje o leguminosas forrajeras, plantas ornamentales, cultivos alimenticios, árboles o arbustos. De acuerdo con una realización preferida de la presente invención, la planta es una planta de cultivo. Los ejemplos de plantas de cultivo incluyen soja, girasol, canola, alfalfa, colza, algodón, tomate, patata y tabaco. Adicionalmente de modo preferente, la planta es una planta monocotiledónea. Ejemplos de plantas monocotiledóneas incluyen caña de azúcar. Más preferentemente la planta es un cereal. Ejemplos de cereales incluyen arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo y avena.

De acuerdo con una característica preferente de la invención, la expresión modulada es expresión aumentada. Los procedimientos para aumentar la expresión de ácidos nucleicos o genes, o productos génicos, están bien documentados en la técnica y en la sección definiciones se proporcionan ejemplos.

Como se menciona anteriormente, un procedimiento preferente para modular la expresión de un ácido nucleico que codifica un polipéptido PRP38 es introduciendo y expresando en una planta un ácido nucleico que codifica un polipéptido PRP38; sin embargo, también pueden obtenerse los efectos de la realización del procedimiento, es decir potenciar rasgos relacionados con el rendimiento, usando otras técnicas bien conocidas, incluyendo, pero sin limitación, etiquetado en activación de ADN T, TILLING, recombinación homóloga. Una descripción de estas técnicas se proporciona en la sección definiciones.

La presente invención también engloba el uso de ácidos nucleicos que codifican polipéptidos PRP38 como se describe en el presente documento y el uso de estos polipéptidos PRP38 en la potenciación de cualquiera de los anteriormente mencionados rasgos relacionados con rendimiento en plantas, en condiciones de crecimiento normales, en condiciones de crecimiento de estrés abiótico (preferentemente condiciones de crecimiento de estrés osmótico), y en condiciones de crecimiento de disponibilidad reducida de nutrientes, preferentemente en condiciones de disponibilidad reducida de nitrógeno.

Los ácidos nucleicos que codifican el polipéptido PRP38 descrito en el presente documento, o los propios polipéptidos PRP38, pueden encontrar uso en programas de reproducción en los que se identifica un marcador de ADN, que puede estar unido genéticamente a un gen que codifica un polipéptido PRP38. Los ácidos nucleicos/genes, o los propios polipéptidos PRP38 pueden usarse para definir un marcador molecular. Este marcador de ADN o de proteína puede después usarse en programas de reproducción para seleccionar plantas que tengan rasgos potenciados relacionados con el rendimiento como se ha definido en el presente documento anteriormente en los procedimientos de la invención.

Las variantes alélicas de un ácido nucleico/gen que codifica el polipéptido PRP38 también pueden encontrar uso en programas de reproducción asistida mediante marcador. Dichos programas de reproducción a veces requieren la introducción de variación alélicas por tratamiento mutagénico de las plantas, usando, por ejemplo, mutagénesis con EMS; como alternativa, el programa puede comenzar con una colección de variantes alélicas de origen denominado “natural” producida involuntariamente. Después se realiza la identificación de variantes alélicas, por ejemplo, por PCR. A esto le sigue una etapa de selección de variantes alélicas superiores de la secuencia en cuestión y que dará un rendimiento aumentado. La selección se realiza típicamente supervisando el rendimiento del crecimiento de las plantas que contienen diferentes variantes alélicas de la secuencia en cuestión. El rendimiento de crecimiento puede supervisarse en un invernadero o en el campo. Etapas opcionales adicionales incluyen cruzamiento de plantas en el que se identificó la variante alélica superior con otra planta. Esto podría usarse, por ejemplo, para realizar una combinación de características fenotípicas interesantes.

Los ácidos nucleicos que codifican los polipéptidos PRP38 también pueden usarse como sondas para mapear genética y físicamente, genes que forman parte de, y como marcadores para rasgos ligados a estos genes. Dicha información puede ser útil en reproducción de plantas para desarrollar líneas con fenotipos deseados. Dicho uso de ácidos nucleicos que codifican el polipéptido PRP38 requiere solo una secuencia de ácidos nucleicos de al menos 15 nucleótidos de longitud. Los ácidos nucleicos que codifican el polipéptido PRP38 pueden usarse como marcadores de polimorfismos de longitud de fragmentos de restricción (PLFR). Con los ácidos nucleicos que codifican PRP38 pueden explorarse transferencias de Southern (Sambrook J, Fritsch EF y Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de ADN genómico de planta digerido por enzimas de restricción. Los patrones de banda resultantes pueden después someterse a análisis genético usando programas informáticos tales como MapMaker (Lander y col. (1987) Genomics 1: 174-181) para construir un mapa genético. Además, los ácidos nucleicos pueden usarse para explorar transferencias de Southern que contienen ADN genómicos tratados con endonucleasas de restricción de un conjunto de individuos que representan a los padres y a la progenie de un cruce genético definido. La segregación de polimorfismos de ADN se observa y se usa para calcular la posición del ácido nucleico que codifica el polipéptido PRP38 en el mapa genético previamente obtenido usando esta población (Botstein y col. (1980) Am. J. Hum. Genet. 32:314-331).

La producción y uso de sondas derivadas de genes de plantas para su uso en mapeo genético se describe en Bernatzky y Tanksley (1986) Plant Mol. Biol. Reporter 4: 37-41. Numerosas publicaciones describen el mapeo genético de clones de ADNc específicos utilizando la metodología indicada anteriormente o variaciones de la misma. Por ejemplo, para el mapeo pueden utilizarse poblaciones de intercruzamiento F2, poblaciones de retrocruzamiento, poblaciones apareadas al azar, líneas isogénicas cercanas y otros grupos de individuos. Dichas metodologías son bien conocidas por los expertos en la técnica.

Las sondas de ácidos nucleicos también pueden usarse para mapeo físico (es decir, colocación de secuencias en mapas físicos; véase Hoheisel y col. en: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, páginas 319-346, y referencias citadas en su interior).

En otra realización, las sondas de ácidos nucleicos en mapeo directo de hibridación in situ con fluorescencia (HISF, Fluorescent In Situ Hybridization) (Trask (1991) Trends Genet. 7: 149-154). Aunque los procedimientos actuales del mapeo HISF favorecen el uso de clones grandes (de varios kb a varios cientos de kb; véase Laan y col. (1995) Genome Res. 5: 13-20), mejoras en sensibilidad pueden permitir la realización de mapeo HISF usando sondas más cortas.

Usando los ácidos nucleicos pueden realizarse diversos procedimientos basados en amplificación de ácidos nucleicos para el mapeo genético y físico. Como ejemplos se incluyen la amplificación específica de alelo (Kazazian (1989) J. Lab. Clin. Med 11: 95-96), el polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield y col. (1993) Genomics 16: 325-332), el ligamiento específico de alelo (Landegren y col. (1988) Science 241: 1077-1080), las reacciones de extensión de nucleótidos (Sokolov (1990) Nucleic Acid Res. 18: 3671), el Mapeo Híbrido por Radiación (Walter y col. (1997) Nat. Genet. 7: 22-28) y el Mapeo Happy (por las siglas en inglés mapping based on the analysis of approximately HAPloid DNA samples using the PolYmerase chain reaction) (Dear y Cook (1989) Nucleic Acid Res. 17: 6795-6807). Para estos procedimientos, se utiliza la secuencia de un ácido nucleico para diseñar y producir pares de cebadores para su uso en la reacción de amplificación o en reacciones de extensión con cebador. El diseño de dichos cebadores es muy conocido por los expertos en la técnica. En los procedimientos que emplean mapeo genético basado en PCR puede ser necesario identificar diferencias de secuencias de ADN entre los padres del cruce del mapeo en la región correspondiente a la secuencia de ácidos nucleicos instantánea. Sin embargo, generalmente esto no es necesario para procedimientos de mapeo.

Los procedimientos de acuerdo con la presente invención dan como resultado plantas que tienen rasgos potenciados relacionados con el rendimiento, como se ha descrito anteriormente en el presente documento. Estos rasgos también pueden combinarse con otros rasgos económicamente ventajosos, tales como rasgos que potencian adicionalmente el rendimiento, la tolerancia a diversos estreses abióticos y bióticos, rasgos que modifican diversas características arquitectónicas y/o características bioquímicas y/o fisiológicas.

Descripción de las figuras

La presente invención se describirá ahora con referencia a las siguientes figuras, en las que:

La Figura 1 representa la secuencia de SEC ID N.º: 77. Se indican los dominios y motivos conservados: el dominio PRP38 está subrayado, el dominio DUF1777 tiene caracteres en negrita, los motivos Ib, IIb; IIIb y IVb están recuadrados. La Figura 2 representa un alineamiento múltiple de los polipéptidos de PRP38 de la Tabla A. La Figura 3 muestra un árbol filogenético de los polipéptidos PRP38 de la Tabla A. La Figura 4 representa el vector binario para la expresión aumentada en Oryza sativa de un ácido nucleico que codifica PRP38 bajo el control de un promotor de arroz GOS2 (pGOS2).

La Figura 5 detalla ejemplos de las secuencias útiles en la realización de los procedimientos de acuerdo a la presente invención.

Ejemplos

La presente invención se describirá ahora con referencia a los siguientes ejemplos, que son solo a modo ilustrativo. Los siguientes ejemplos no pretenden definir completamente o de otra manera limitar el alcance de la invención.

Manipulación de ADN: a menos que se indique otra cosa, se realizarán técnicas de ADN recombinante de acuerdo con los protocolos convencionales descritos en (Sambrook (2001) Molecular Cloning: a laboratory manual, 3ª Edición Cold Spring Harbor Laboratory Press, CSH, Nueva York) o en los Volúmenes 1 y 2 de Ausubel y col. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiales y procedimientos convencionales de trabajos moleculares en plantas se describen en Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (RU) y Blackwell Scientific Publications (RU).

Ejemplo 1: Identificación de secuencias relacionadas con la secuencia de ácidos nucleicos usada en los procedimientos de la invención

Las secuencias (ADNc de longitud completa, EST o genómicas) relacionadas con la secuencia de ácidos nucleicos usadas en los procedimientos de la presente invención se identificaron entre las conservadas en la base de datos de Nucleótidos Entrez en el National Center for Biotechnology Information (NCBI) usando herramientas de búsqueda de secuencias de bases de datos, tales como la Herramienta Básica de Alineamiento Local (BLAST, Basic Local Alignment Tool) (Altschul y col. (1990) J. Mol. Biol. 215:403-410; and Altschul y col. (1997) Nucleic Acids Res. 25:3389-3402). La búsqueda de secuencias también se realizó en otras bases de datos públicas y de patente. Se usaron herramientas de búsqueda de secuencia tales como la Herramienta de Alineamiento Local Básica (BLAST,

Basic Local Alignment Tool) (Altschul y col. (1990) J. Mol. Biol. 215: 403-410; y Altschul y col. (1997) Nucleic Acids Res. 25: 3389-3402). El programa se usó para encontrar regiones de similitud local entre las secuencias comparando las secuencias de ácidos nucleicos o polipéptidos con las bases de datos de secuencia y calculando el significado estadístico de los emparejamientos. Por ejemplo, el polipéptido codificado por el ácido nucleico usado en la presente invención se usó para el algoritmo TBLASTN, con configuraciones predeterminadas y el filtro para ignorar la activación de secuencias de baja complejidad. El resultado de los análisis se observó por comparación por pares, y se clasificó de acuerdo con la puntuación de probabilidad (valor E), en el que la puntuación refleja la probabilidad de que se produzca un alineamiento particular por casualidad (cuanto menor sea el valor E más significativo es el acierto). Además de los valores E, las comparaciones también se puntuaron por porcentaje de identidad. El porcentaje de identidad se refiere al número de nucleótidos (o aminoácidos) idénticos entre las dos secuencias de ácidos nucleicos (o de polipéptidos) comparadas sobre una longitud particular.

La Tabla A proporciona un listado de secuencias de ácidos nucleicos relacionados con la secuencia de

ácidos nucleicos usados en los procedimientos de la presente invención.

Tabla A: Ejemplos de ácidos nucleicos y polipéptidos PRP38:

SEC ID N.º: de ácido

SEC ID N.º: de

Nombre

Especie de origen

nucleico

polipéptido

Arath_PRP38_1

Arabidopsis thaliana

SEC ID N.º: 76 SEC ID N.º: 77 Arath_PRP38_2

Arabidopsis thaliana

SEC ID N.º: 78 SEC ID N.º: 79 Arath_PRP38_3

Arabidopsis thaliana

SEC ID N.º: 80 SEC ID N.º: 81 Arath_PRP38_4

Arabidopsis thaliana

SEC ID N.º: 82 SEC ID N.º: 83 Arath_PRP38_5

Arabidopsis thaliana

SEC ID N.º: 84 SEC ID N.º: 85 brasy_PRP38_1

Brachypodium sylvaticum

SEC ID N.º: 86 SEC ID N.º: 87 brasv_PRP38_2

Brachypodium sylvaticum

SEC ID N.º: 88 SEC ID N.º: 89 Chlre_PRP38_1

Chlamydomonas reinhardtii

SEC ID N.º: 90 SEC ID N.º: 91 Horvu_PRP38_1

Hordeum vulgare

SEC ID N.º: 92 SEC ID N.º: 93 Lvces_PRP38_1

Lycopersicum esculentum

SEC ID N.º: 94 SEC ID N.º: 95 Medtr_PRP38_1

Medicago truncatula

SEC ID N.º: 96 SEC ID N.º: 97 Orvsa_PRP38_1

Oryza sativa

SEC ID N.º: 98 SEC ID N.º: 99 Orvsa_PRP38_2

Oryza sativa

SEC ID N.º: 100 SEC ID N.º: 101 Ostta_PRP38_1

Ostreococcus tauri

SEC ID N.º: 102 SEC ID N.º: 103 Ostta_PRP38_2

Ostreococcus tauri

SEC ID N.º: 104 SEC ID N.º: 105 Poptr_PRP38_1

Populus trichocarpa

SEC ID N.º: 106 SEC ID N.º: 107 Poptr_PRP38_2

Populus trichocarpa

SEC ID N.º: 108 SEC ID N.º: 109 Sacof_PRP38_1

Saccharum officiarum

SEC ID N.º: 110 SEC ID N.º: 111 Sacof_PRP38_3

Saccharum officiarum

SEC ID N.º: 112 SEC ID N.º: 113 Schce_PRP38_1

Saccharomyces cerevisie

SEC ID N.º: 114 SEC ID N.º: 115 Triae_PRP38_1

Triticum aestivum

SEC ID N.º: 116 SEC ID N.º: 117 Vitvi_PRP38_1

Vitis vinifera

SEC ID N.º: 118 SEC ID N.º: 119

Ejemplo 2: Alineamiento de las secuencias del polipéptido PRP38

El alineamiento de las secuencias de polipéptidos se realizó utilizando el programa AlignX del vector NTI (Invitrogen) que es a base del popular algoritmo de alineamiento progresivo Clustal W (Thompson y col. (1997) Nucleic Acids Res 25:4876-4882; Chenna y col. (2003). Nucleic Acids Res 31:3497-3500). Los valores predeterminados fueron: para la penalización de apertura de hueco de 10, para la penalización de la extensión de hueco de 0,1 y la matriz de peso seleccionada fue Blosum 62 (si se alinean polipéptidos).

La conservación de secuencia entre polipéptidos PRP38 fue esencialmente en el dominio N-terminal de PRP38 de los polipéptidos, siendo de forma habitual el dominio N-terminal más variable en longitud y composición de secuencia, estaba enriquecido en aminoácidos acídicos. Los polipéptidos PRP38 están alineados en la Figura 2. Se construyó un árbol filogenético de polipéptidos PRP38 (Figura 3) utilizando un algoritmo de agrupamiento de unión de vecindad como se proporciona en el programa AlignX del vector NTI (Invitrogen).

Ejemplo 3: Cálculo del porcentaje de identidad global entre las secuencias de polipéptidos útiles en la realización de los procedimientos de la invención

Los porcentajes de similitud e identidad globales entre las secuencias de polipéptidos de longitud completa útiles en la realización de los procedimientos de la invención se determinaron usando uno de los procedimientos disponibles en la técnica, el programa informático MatGAT (Matrix Global Alignment Tool) (BMC Bioinformatics. 2003 4: 29. MatGAT: una aplicación que genera matrices de similitud/identidad utilizando secuencias de proteína o de ADN. Campanella JJ, Bitincka L, Smalley J; programa informático presentado por Ledion Bitincka). El programa informático MatGAT genera matrices de similitud/identidad para secuencias de ADN o proteína sin la necesidad de alinear previamente los datos. El programa realiza una serie de alineamientos por pares usando el algoritmo de alineamiento global de Myers y Miller (con una penalización por apertura de hueco de 12, y una penalización por extensión de hueco de 2), calcula la similitud e identidad usando, por ejemplo, Blosum 62 (para polipéptidos), y después se pusieron los resultados en una matriz de distancia. La similitud de secuencia se muestra en la mitad inferior de la línea divisoria y la identidad de secuencia se muestra en la mitad superior de la línea divisoria diagonal.

En referencia a los polipéptidos PRP38, se muestran en la Tabla B los resultados del análisis del programa informático AlignX de la identidad global sobre la longitud total de secuencias de polipéptidos seleccionadas de la Tabla A en comparación con el Arath_PRP38_1 (Tabla A).

Tabla B: Similitud de secuencia entre polipéptidos PRP38

% de similitud de secuencia con SEC ID

Polipéptido PRP38

N.º:77

Arath_PRP38_5 23,6 brasy_PRP38_1 63,5 brasy_PRP38_2 32,1 Chlre_PRP38_1 40,6 Horvu_PRP38_1 56,1 Lyces_PRP38_1 60,7 Medtr_PRP38_1 25,4 Orysa_PRP38_1 60,9 Orysa_PRP38_2 25,9 El porcentaje de identidad entre las secuencias de los polipéptidos PRP38 de la Tabla B y útil en la realización de los procedimientos de la invención puede ser tan bajo como el 23,6 % de identidad de aminoácidos en comparación con SEC ID N.º: 77.

Ejemplo 4: Identificación de dominios comprendidos en las secuencias de polipéptidos útiles en la realización de los procedimientos de la invención

Los dominios conservados de proteínas se identificaron mediante búsqueda en la base de datos InterPro. La base de datos The Integrated Resource of Protein Families, Domains and Sites (InterPro) es una interfaz integrada por las bases de datos de firmas usadas comunmente para búsquedas basadas en texto y secuencia. La base de datos InterPro combina estas bases e datos, que usan diferentes metodologías y grados variables de información biológica sobre proteínas bien caracterizadas pata obtener firmas proteicas. Las bases de datos colaboradoras incluyen SWISS-PROT, PROSITE, TrEMBL, Panther, PRINTS, ProDom y Pfam, Smart y TIGRFAMs. Pfam es una gran colección de múltiples alineamientos de secuencias y modelos de Markov escondidos incluyendo muchos dominios de proteínas y familias comunes. Pfam está alojado en el servidor del Sanger Institute en el Reino Unido. InterPro está alojada en el European Bioinformatics Institute en el Reino Unido.

Los resultados de la exploración de Pfam de la secuencia de polipéptido como se representa en SEC ID N.º: 77 se presentan en la Tabla C.

Tabla C: Resultados de exploración Pfam (números de registro principales) de la secuencia de polipéptidos de la Tabla A. Se proporcionan las coordenadas de aminoácidos que delimitan el dominio (Nombre de Dominio) en el polipéptido explorado (Polipéptido de Búsqueda). Se proporciona el valor e del alineamiento del Polipéptido de búsqueda para el acierto en la entrada de Pfam.

Polipéptido de

Nombre de

Coordenadas de

Coordenadas de

Valor e

Búsqueda

Dominio

aminoácidos: Inicio

aminoácidos: Fin

Arath_PRP38_1 PRP38 1 170 2,4e-31 Arath_PRP38_1 DUF1777 255 389 0,026 Arath_PRP38_4 DUF1777 87 221 0,026 Arath_PRP38_5 PRP38 1 177 9,3e-65 Arath_PRP38_5 DUF1777 208 355 0,15 Brasy_PRP38_1 PRP38 1 169 1,5e-24 Brasy_PRP38_1 DUF1777 251 392 0,14 Brasy_PRP38_2 PRP38 1 162 1E-15 Chlre_PRP38_1 PRP38 1 169 1,9e-22 Chlre_PRP38_1 DUF1777 289 354 0,77 Horvu_PRP38_1 PRP38 1 169 2,1e-29 Lyces_PRP38_1 PRP38 1 170 3,5e-26 Lyces_PRP38_1 DUF1777 266 428 0,024 Medtr_PRP38_1 PRP38 1 177 5E-71 Orysa_PRP38_1 PRP38 1 169 2,9e-29 Orysa_PRP38_1 DUF1777 270 434 0,1 Orysa_PRP38_2 PRP38 1 177 5,5e-75 Orysa_PRP38_2 DUF1777 235 392 0,071 Ostta_PRP38_1 PRP38 1 146 6,5e-41 Ostta_PRP38_2 PRP38 16 191 7,1e-10 Poptr_PRP38_1 PRP38 1 169 5,8e-29 Poptr_PRP38_1 DUF1777 263 414 0,0074 Poptr_PRP38_2 PRP38 1 169 3,7e-26 Poptr_PRP38_2 DUF1777 258 414 0,23 Sacof_PRP38_1 PRP38 1 169 8,6e-27 Sacof_PRP38_3 PRP38 1 169 3,3e-27 Sacof_PRP38_3 DUF1777 263 375 0,067 Schce_PRP38_1 PRP38 6 221 2,8e-150 Triae_PRP38_1 PRP38 1 177 4,6e-71 Triae_PRP38_1 DUF1777 220 371 0,17 Vitvi_PRP38_1 PRP38 1 177 4,6e-71 Vitvi_PRP38_1 DUF1777 220 371 0,17

Ejemplo 5: Clonado de la secuencia de ácidos nucleicos utilizada en los procedimientos de la invención

La secuencia de ácidos nucleicos usada en los procedimientos de la invención se amplificó mediante PCR usando como molde una biblioteca de ADNc de plántulas de Arabidopsis thaliana hecha por el cliente (en pCMV Sport 6.0; Invitrogen, Paisley, RU). La PCR se realizó utilizando la polimerasa de ADN Hifi Taq en condiciones estándar, usando 200 ng de molde en 50 μl de una mezcla de PCR.

Con respecto a la PRP38, los cebadores usados fueron SEC ID N. º: 125: 5’ ggggacaagtttgtacaaaaaagcaggcttaaacaatggcggagatacagtcaaa 3’ y SEC ID N. º: 126; 5’ ggggaccactttgtacaagaaagctgggttcacctccaagaggaacca 3’, que incluyen los sitios AttB para recombinación Gateway.

El fragmento de PCR amplificado se purificó utilizando también procedimientos estándar. Después se realizó la primera etapa de la metodología Gateway, la reacción BP, durante la cual los fragmentos de PCR se recombinan in vivo con el plásmido pDONR201 para producir, de acuerdo con la terminología Gateway, un “clon de entrada”, pPRP38. El plásmido pDONR201 se adquirió en Invitrogen, como parte de la tecnología Gateway®. El clon de entrada que comprendía la SEC ID N.º: 76 se usó posteriormente en una reacción LR con un vector destinatario utilizado para transformación de Oryza sativa. Este vector contiene, como elementos funcionales dentro de los límites del ADN T: un marcador de selección de plantas; un casete de expresión marcador detectable y un casete Gateway diseñado para recombinación LR in vivo con la secuencia de ácidos nucleicos de interés ya clonada en el clon de entrada. Un promotor GOS2 de arroz (SEC ID N.º: 127) para expresión constitutiva se localizaba cadena arriba de este casete Gateway.

Después de la etapa de recombinación LR, el vector de expresión resultante pGOS2::PRP38 (Figura 4) se transformó en la cepa LBA4044 de Agrobacterium de acuerdo con procedimientos bien conocidos en la técnica.

A menos que se manifieste de otro modo, las técnicas de ADN recombinante se realizaron de acuerdo a protocolos estándar descritos en (Sambrook (2001) Molecular Cloning: a laboratory manual, 3ª Edición Cold Spring Harbor Laboratory Press, CSH, Nueva York) o en los Volúmenes 1 y 2 de Ausubel y col. (1994), Current Protocols in Molecular Biology, Current Protocols. Los materiales y procedimientos estándares para el trabajo molecular de plantas se describen Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (RU) y Blackwell Scientific Publications (RU).

Ejemplo 6: Transformación de plantas

Transformación de arroz El Agrobacterium que contenía el vector de expresión se usó para transformar plantas de Oryza sativa. Se descascarillaron semillas secas maduras de la variedad de cultivo japónica de arroz Nipponbare. La esterilización se realizó incubando durante un minuto en etanol al 70 %, seguido de 30 minutos en HgCl2 al 0,2 %, seguido de un lavado de 6 veces durante 15 minutos con agua destilada estéril. Las semillas estériles germinaron después en un medio que contenía 2,4-D (medio de inducción de callo). Después de incubación en la oscuridad durante cuatro semanas, los callos embrionarios, derivados de escutelo, se cortaron y se propagaron en el mismo medio. Después de 2 semanas, los callos se multiplicaron o se propagaron mediante subcultivo en el mismo medio durante otras 2 semanas. Trozos de callos embriogénicos se subcultivaron en medio reciente 3 días antes del co-cultivo (para reforzar la actividad de la división celular).

Para el co-cultivo se usó la cepa LBA4404 de Agrobacterium que contenía el vector de expresión. Se inoculó

Agrobacterium en medio AB con los anticuerpos apropiados y se cultivó durante 3 días a 28 ºC. Después, las bacterias se recogieron y se suspendieron en medio de co-cultivo líquido a una densidad (DO600) de aproximadamente 1. Después, la suspensión se transfirió a una placa de Petri y los callos se sumergieron en la suspensión durante 15 minutos. Después, los tejidos de callo se secaron por transferencia en un papel de filtro y se transfirieron a medio de co-cultivo solidificado y se incubaron durante 3 días en la oscuridad a 25 ºC. Los callos co- cultivados crecieron sobre un medio que contenía 2,4-D durante 4 semanas en la oscuridad a 28 ºC en presencia de un agente de selección. Durante este periodo, rápidamente se desarrollaron islas de callos resistentes a crecimiento. Después de la transferencia de este material a un medio de regeneración e incubación a la luz, el potencial embriogénico se liberó y se desarrollaron brotes las siguientes cuatro a cinco semanas. Los brotes se extirparon de los callos y se incubaron durante 2 a 3 semanas en un medio que contenía auxina desde el cual se transfirieron al suelo. Los brotes endurecidos se cultivaron a alta humedad y en días cortos en un invernadero.

Se generaron aproximadamente 35 transformantes de arroz T0 independientes para una construcción. Los transformantes primarios se transfirieron desde una cámara de cultivo tisular a un invernadero. Después de un análisis de PCR cuantitativa para verificar el número de copias del inserto de ADN-T, solo una única copia de plantas transgénicas que presentaban tolerancia al agente de selección, se guardaron para la cosecha de la semilla T1. Después, las semillas se cosecharon de tres a cinco meses después del trasplante. El procedimiento produjo transformantes de locus único a una tasa de aproximadamente 50 % (Aldemita y Hodges 1996, Chan y col. 1993, Hiei y col. 1994).

Transformación de maíz

La transformación de maíz (Zea mays) se realizó con una modificación del procedimiento descrito por Ishida y col.

(1996) Nature Biotech 14(6): 745-50. La transformación es dependiente del genotipo en maíz y solo genotipos específicos son susceptibles a transformación y regeneración. Como progenitores, la línea endogámica A188 (University of Minnesota) o híbridos con A188, son buenas fuentes de material donante para la transformación aunque también pueden usarse otros genotipos satisfactoriamente. Se cosecharon espigas de plantas de maíz aproximadamente 11 días después de la polinización (DDP) cuando la longitud del embrión inmaduro era de aproximadamente 1 a 1,2 mm. Los embriones inmaduros se co-cultivaron con Agrobacterium tumefaciens que contenía el vector de expresión y las plantas transgénicas se recuperaron a través de organogénesis. Los embriones cortados se cultivaron en medio de inducción de callo y después en medio de la regeneración de maíz, que contenía el agente de selección (por ejemplo imidazolinona, aunque pueden usarse diversos marcadores de selección). Las placas de Petri se incubaron a la luz a 25 ºC durante 2-3 semanas, o hasta que se desarrollasen los brotes. Los brotes verdes se transfirieron desde cada embrión al medio de enraizamiento de maíz y se incubaron a 25 ºC durante 2-3 semanas, hasta el desarrollo de las raíces. Los brotes enraizados se trasplantaron al suelo en el invernadero. Se produjeron semillas T1 de plantas que presentaban tolerancia al agente de selección y que contenían una sola copia del inserto de ADN-T.

Transformación de trigo

La transformación de trigo se realizó con el procedimiento descrito por Ishida y col. (1996) Nature Biotech 14(6): 745-50. Normalmente se utiliza la variedad de cultivo Bobwhite (disponible en CIMMYT, México) para la transformación. Embriones inmaduros se co-cultivaron con Agrobacterium tumefaciens que contenía el vector de expresión y las plantas transgénicas se recuperaron a través de organogénesis. Después de la incubación con Agrobacterium, los embriones se cultivaron in vitro en medio de inducción de callo, después en medio de regeneración que contiene el agente de selección (por ejemplo imidazolinona, aunque pueden utilizarse diversos marcadores de selección). Las placas de Petri se incubaron a la luz a 25 ºC durante 2-3 semanas o hasta que se desarrollasen los brotes. Los brotes verdes se transfirieron desde cada embrión al medio de enraizamiento y se incubaron a 25 ºC durante 2-3 semanas, hasta el desarrollo de las raíces. Los brotes enraizados se trasplantaron al suelo en el invernadero. Se produjeron semillas T1 de plantas que presentaban tolerancia al agente de selección y que contenían una sola copia del inserto de ADN-T.

Transformación de soja

La soja se transformó de acuerdo con una modificación del procedimiento descrito en el Texas A y M patente de Estados Unidos 5.164.310. Diversas variedades comerciales de soja son susceptibles a transformación mediante este procedimiento. La variedad de cultivo Jack (disponible en la fundación Illinois Seed) se utiliza normalmente para la transformación. Se esterilizaron semillas de soja para la siembra in vitro. El hipocotiledóneo, el radículo y un cotiledón se extirparon de plántulas jóvenes de siete días de vida. El epicótilo y el cotiledón restantes se cultivaron adicionalmente para desarrollar nodos axilares. Estos nodos axilares se extirparon y se incubaron con

Agrobacterium tumefaciens que contenía el vector de expresión. Después del tratamiento de co-cultivo, los explantes se lavaron y se transfirieron a medios de selección. Los brotes regenerados se extirparon y se colocaron en un medio de elongación de brote. Los brotes no mayores de 1 cm se colocaron en medio de enraizamiento hasta que se desarrollaron las raíces. Los brotes enraizados se trasplantaron al suelo en el invernadero. Se produjeron semillas T1 de plantas que presentaban tolerancia al agente de selección y que contenían una sola copia del inserto de ADN-T.

Transformación de colza/canola

Peciolos cotiledonarios e hipocótilos de plántulas jóvenes de 5-6 días de vida se utilizaron como explantes para el cultivo tisular y se transformaron de acuerdo con Babic y col. (1998, Plant Cell Rep 17: 183-188). La variedad de cultivo comercial Westar (Agriculture Canadá) es la variedad convencional usada para transformación, pero también pueden usarse otras variedades. Se esterilizaron semillas de canola en la superficie para la siembre in vitro. Explantes de peciolos cotiledonarios con el cotiledón unido se extirparon de las plántulas in vitro y se inocularon con Agrobacterium (que contenía el vector de expresión) sumergiendo el extremo cortado del explante del peciolo en la suspensión bacteriana. Después, los explantes se cultivaron durante 2 días en medio MSBAP-3 que contenía BAP 3 mg/l, sacarosa al 3 %, Fitagar al 0,7 % a 23 ºC, 16 h de luz. Después de dos días de co-cultivo con Agrobacterium, los explantes de peciolos se transfirieron a medio MSBAP-3 que contenía BAP 3 mg/l, cefotaxima, carbenicilina o timentina (300 mg/l) durante 7 días y después se cultivaron en medio MSBAP-3 con cefotaxima, carbenicilina o timentina y agente de selección hasta la regeneración del brote. Cuando los brotes tenía una longitud de 5 - 10 mm, se cortaron y se transfirieron al medio de elongación de brote (MSBAP-0,5 que contenía BAP 0,5 mg/l). Los brotes de aproximadamente 2 cm de longitud se transfirieron al medio de enraizamiento (MS0) para la inducción de raíces.

Los brotes enraizados trasplantaron al suelo en el invernadero. Se produjeron semillas T1 de plantas que presentaban tolerancia al agente de selección y que contenían una sola copia del inserto de ADN-T.

Transformación de alfalfa

Utilizando el procedimiento de (McKersie y col., 1999 Plant Physiol 119: 839-847) se transformó un clon de regeneración de alfalfa (Medicago sativa). La regeneración y transformación de la alfalfa es dependiente del genotipo y por lo tanto se requiere una planta regenerada. Se han descrito procedimientos para obtener plantas regeneradas. Por ejemplo, estas pueden seleccionarse de variedades de cultivo Rangelander (Agriculture Canadá) o de cualquier otra variedad comercial de alfalfa como describen Brown DCW y A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Como alternativa, se ha seleccionado la variedad RA3 (University of Wisconsin) para su uso en cultivo tisular (Walker y col., 1978 Am J Bot 65: 654-659). Explantes de peciolos se co-cultivaron durante una noche con un cultivo de Agrobacterium tumefaciens C58C1 pMP90 (McKersie y col., 1999 Plant Physiol 119: 839- 847) o LBA4404 que contenía el vector de expresión. Los explantes se co-cultivaron durante 3 días en la oscuridad en un medio de inducción SH que contenía Pro 288 mg/l, tioprolina 53 mg/l, K2SO4 4,35 g/l y acetosiringinona 100 m. Los explantes se lavaron en medio Murashige-Skoog de fuerza media (Murashige y Skoog, 1962) y se sembraron en placas en el mismo medio de inducción SH con acetosiringinona pero con un agente de selección adecuado y un antibiótico adecuado para inhibir el crecimiento de Agrobacterium. Después de varias semanas, los embriones somáticos se transfirieron al medio de desarrollo BOi2Y que no contenía reguladores de crecimiento, sin antibióticos, y sacarosa 50 g/l. Posteriormente, los embriones somáticos germinaron en medio Murashige-Skoog de fuerza media. Las plántulas enraizadas se trasplantaron en macetas y se cultivaron en un invernadero. Se produjeron semillas T1 de plantas que presentaban tolerancia al agente de selección y que contenían una sola copia del inserto de ADN-T.

Transformación de algodón

El algodón se transformó utilizando Agrobacterium tumefaciens de acuerdo con el procedimiento descrito en el documento US 5.159.135. Se esterilizó la superficie de semillas de algodón en una solución de hipoclorito sódico al 3 % durante 20 minutos y se lavaron en agua destilada con cefotaxima 500 g/ml. Las semillas después se transfirieron a medio SH con benomil 50 g/ml para la germinación. Se retiraron hipocotilos de plántulas de de 4 a 6 días, se cortaron en trozos de 0,5 cm y se pusieron en agar al 0,8 %. Para la inoculación de los explantes de hipocotilo se utilizó una suspensión de Agrobacterium (aprox. 108 células por ml, diluidas a partir de un cultivo de cultivado durante toda la noche transformado con el gen de interés y con marcadores de selección adecuados).

Después de 3 días a temperatura ambiente e iluminación, se transfirieron los tejidos a medio sólido (Gelrite 1,6 g/l), con sales de Murashige y Skoog con vitaminas B5 (Gamborg y col., Exp. Cell Res. 50: 151-158 (1968)), 2,4-D 0,1 mg/l, 6-furfurilaminopurina 0,1 mg/ml y MgCl2 750 g/2, y con de cefotaxima 50 a 100 g/ml y carbenicilina 400-500 g/ml para eliminar bacterias residuales. Después de dos a tres meses se aislaron líneas celulares individuales (con subcultivos cada cuatro a seis semanas) y se cultivaron adicionalmente en medio selectivo para amplificación tisular (30 ºC, fotoperíodo de 16 h). Posteriormente, los tejidos transformados se cultivaron adicionalmente en medio no selectivo durante dos a tres meses para obtener los embriones somáticos. Se transfirieron embriones de apariencia saludable de al menos 4 mm de longitud a tubos con medio SH en vermiculita fina, complementado con ácido indolacético 0,1 mg/l, 6 furfurilaminopurina y ácido giberélico. Los embriones se cultivaron a 30 ºC con una fotoperíodo de 16 h, y los plantones en la etapa de 2 a 3 hojas se transfirieron a recipientes con vermiculita y nutrientes. Las plantas se endurecieron y posteriormente se trasladaron al invernadero para cultivo adicional.

Ejemplo 7: Procedimiento de evaluación fenotípica

7.1 Configuración de la evaluación Se generaron aproximadamente 35 transformantes de arroz T0 independientes. Los transformantes primarios se transfirieron desde una cámara de cultivo tisular a un invernadero para siembra y cosecha de la semilla T1. Se conservaron seis acontecimientos, de los cuales la progenie T1 segregó 3:1 para la presencia/ausencia del transgén. Para cada uno de estos acontecimientos, se seleccionan aproximadamente 10 plántulas T1 que contenían el transgén (hetero y homocigotos) y aproximadamente 10 plántulas T1 que carecían del transgén (nulicigotos) supervisando la expresión con marcador visual. Las plantas transgénicas y los correspondientes nulicigotos se cultivaron a cada lado en posiciones aleatorias. Las condiciones en el invernadero (sin estrés) eran días cortos (12 horas de luz), 28 ºC con luz y 22 ºC en oscuridad, y una humedad relativa del 70 %. Se aplicaron regados frecuentes para satisfacer las necesidades de la planta de agua y nutrientes para un crecimiento y desarrollo con aspecto saludable.

Desde la etapa de siembra hasta la etapa de madurez las plantas pasaron varias veces a través de una cabina de formación de imágenes digital. En cada punto de tiempo se tomaron imágenes digitales (2048x1536 pixeles, 16 millones de colores) de cada planta desde al menos 6 ángulos diferentes.

Detección de sequía

Se cultivaron plantas de semillas T2 en suelo de maceta en condiciones normales hasta que alcanzaron la etapa de encabezamiento. Después se transfirieron a una sección “seca” donde se mantenía el riego. Se insertaron sondas de humedad en macetas seleccionadas al azar para supervisar el contenido hídrico del suelo (CHS). Cuando el CHS estaba por debajo de determinados umbrales, las plantas volvieron a regarse automáticamente de manera continua hasta que de nuevo alcanzaron un nivel normal. Después las plantas se volvieron a transferir a condiciones normales. El resto del cultivo (maduración de planta, cosecha de semilla) fue igual que para las plantas que no se cultivaron en condiciones de estrés abiótico. Los parámetros de cultivo y rendimiento se registraron como se detalla para el cultivo en condiciones normales.

Detección de la eficiencia del uso de nitrógeno

Se cultivaron plantas de arroz de semillas T2 en suelo de maceta en condiciones normales excepto para la solución de nutrientes. Las macetas se regaron desde el trasplante hasta la maduración con una solución de nutrientes específica que contenía un contenido de nitrógeno N (N) reducido, normalmente entre 7 a 8 veces menor. El resto del cultivo (maduración de planta, cosecha de semilla) es igual que para las plantas que no se cultivaron bajo estrés abiótico. Los parámetros de cultivo y rendimiento se registraron como se detalla para el cultivo en condiciones normales.

7.2 Análisis estadístico: ensayo F Se utilizó un ANOVA (análisis de varianza) de dos factores como un modelo estadístico para la evaluación global de las características fenotípicas de la planta. Se realizó un ensayo F en todos los parámetros medidos de todas las plantas de todos los acontecimientos transformados con el gen de la presente invención. El ensayo F se realizó para verificar un efecto del gen sobre todos los acontecimientos de transformación y para verificar un efecto global del gen, también conocido efecto génico global. El umbral de significado de un efecto génico global verdadero se establece a un nivel de probabilidad de 5 % para el ensayo F. Un valor significativo del ensayo F para un efecto génico, significa que no solo la mera presencia o la posición del gen ocasionan las diferencias en el fenotipo.

Se realizó un análisis combinado dado que se realizaron dos experimentos con dos acontecimientos de solapado. Esto es útil para comprobar la consistencia de los efectos sobre los dos experimentos, y si este es el caso, para acumular evidencia a partir de ambos experimentos para aumentar la confianza en la conclusión. El procedimiento usado fue una estrategia de modelo mixto que tiene en cuenta la estructura multinivel de los datos (es decir experimento-acontecimiento-segregantes). Se obtuvieron los valores P mediante la comparación de la prueba de proporción de probabilidades para las distribuciones chi cuadrado.

7.3 Parámetros medidos

Medición de parámetros relacionados con biomasa

Desde la etapa de siembra hasta la etapa de madurez las plantas pasaron varias veces a través de una cabina de formación de imágenes digital. En cada punto de tiempo se tomaron imágenes digitales (2048x1536 pixeles, 16 millones de colores) de cada planta desde al menos 6 ángulos diferentes.

El área aérea de la planta (o biomasa foliar) se determinó contando el número total de pixeles en las imágenes digitales de las partes de la planta por encima de la superficie discriminadas del fondo. Este valor se promedió para las imágenes tomadas en el mismo momento de los diferentes ángulos y se convirtió a un valor de superficie física expresado en mm cuadrados por calibración. Los experimentos mostraron que el área de la planta por encima de la superficie medida de este modo se correlacionaba con la biomasa de las partes de la planta por encima de la superficie. El área por encima de la superficie es el área medida en el momento en el que la planta ha alcanzado su máxima biomasa foliar. El vigor temprano es el área por encima de la superficie de la planta (plántula) tres semanas después de la germinación. El aumento de la biomasa radicular se expresa como un incremento en la biomasa radicular total (medido como biomasa radicular máxima observada durante la vida útil de una planta); o como un aumento en el índice de raíz/brote (medido como la relación entre la masa radicular y la masa de brote en el período de crecimiento activo de raíces y brotes).

El vigor temprano se determinó contando el número total de pixeles de las partes de la planta por encima de la superficie discriminadas del fondo. Este valor se promedió para las imágenes tomadas en el mismo momento desde diferentes ángulos y se convirtió a un valor de superficie física expresado en mm cuadrados por calibración. Los resultados descritos a continuación son para plantas tres semanas después de la germinación.

Mediciones de parámetros relacionados con la semilla

Las panículas primarias maduras se cosecharon, se contaron, se metieron en bolsas, se etiquetaron con código de barras y después se secaron durante tres días en un horno a 37 ° C. Después, las panículas se trillaron y todas las semillas se recogieron y se contaron. Las vainas llenas se separaron de las vacías utilizando un dispositivo de soplado de aire. Las vainas vacías se desecharon y la fracción restante volvió a contarse. Las vainas llenas se pesaron en una balanza analítica. El número de semillas llenas se determinó contando el número de vainas llenas que quedaron después de la etapa de separación. El rendimiento total de la semilla se midió pesando todas las vainas llenas cosechadas de una planta. El número total de semillas por planta se midió contando el número de vainas cosechadas de una planta. El peso de mil granos (PMG) se extrapoló del número de semillas llenas contadas y de su peso total. El índice de cosecha (IC) en la presente invención se define como la relación entre el rendimiento de semilla total y el área por encima de la superficie (mm2), multiplicado por un factor de 106. El número total de flores por panícula como se define en la presente invención es la relación entre el número total de semillas y el número de panículas primarias maduras. La tasa de llenado de semilla, como se define en la presente invención, es la proporción (expresada en %) del número de semillas llenas sobre el número total de semillas (o floretes).

Detección de estrés salino

Las plantas se crecieron en un sustrato hecho de fibras de coco y argex (proporción 3 a 1). Se usó una solución de nutrientes normal durante las dos primeras semanas después del trasplante de los plantones en el invernadero. Después de las dos primeras semanas, se añadió a la solución de nutrientes sal 25 mM (NaCl), hasta que las plantas se cosecharon. Para el crecimiento en condiciones normales, los parámetros de crecimiento y rendimiento se registraron como se detalla.

Detección de la disponibilidad reducida de nutrientes (nitrógeno)

Se crecieron las plantas de seis acontecimientos (semillas T2) en suelo de recipientes en condiciones normales excepto para la solución de nutrientes. Los recipientes se regaron desde el trasplantado hasta la maduración con una solución de nutrientes específica conteniendo contenido reducido de nitrógeno (N), habitualmente entre 7 y 8 veces menos. El resto del cultivo (maduración de la planta, cosecha de semilla) es la misma que la de las plantas no crecidas en estrés abiótico. Los parámetros de crecimiento y rendimiento se registraron como se detalla para el crecimiento en condiciones normales.

Ejemplo 8: Resultados de la evaluación fenotípica de las plantas transgénicas

Se presentan a continuación los resultados de la evaluación de las plantas de arroz transgénicas que expresan un ácido nucleico de AtPRP38_1 (SEC ID N.º: 76), crecidas en un invernadero en condiciones sin estrés (Ejemplo 7). Se observó un aumento de al menos el 5 % de la biomasa de la parte aérea (AreaMax), vigor de emergencia (vigor temprano), rendimiento de semilla total, número de semillas llenas, tasa de llenado, índice de cosecha, y número de semillas por planta (Tabla D).

Tabla D: Resultado de la evaluación del desempeño de las plantas transgénicas transformadas con pGOS::PRP38

Rasgo relacionado con el rendimiento

Aumento porcentual en las planta transgénica en comparación con las plantas de control

Área de la parte aérea Vigor de emergencia 38 Peso de semilla total 18 Número de semillas llenas 18 Tasa de llenado de semillas 7 Índice de cosecha 8 Número total de semillas 11 LISTADO DE SECUENCIAS <110> BASF Plant Science GmbH <120> Plantas que tienen rasgos potenciados relacionados con el rendimiento y un procedimiento de producción de las mismas. <130> PF60259 <160> 275 <170> PatentIn versión 3.5 <210> 1 <211> 1842 <212> ADN <213> Oryza sativa

<400> 1 <210> 2 <211> 613 <212> PRT <213> Oryza sativa

<400> 2 <210> 4 <211> 435 <212> PRT <213> Oryza sativa

<400> 4 <210> 6 <211> 585 <212> PRT <213> Oryza sativa

<400> 6 <210> 8 <211> 517 <212> PRT <213> Oryza sativa

<400> 8 <210> 10 <211> 307 <212> PRT <213> Brassica napus

<400> 10 <210> 12 <211> 251 <212> PRT <213> Helianthus annuus

<400> 12 <210> 13 <211> 1409 <212> ADN <213> Zea mays

<400> 13 <210> 14 <211> 307 <212> PRT <213> Zea mays

<400> 14

ES 2 553 652 T3   <210> 16 <211> 305 <212> PRT <213> Glycine max

<400> 16

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 17 <211> 2212 <212> ADN <213> Triticum aestivum

<400> 17

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 18 <211> 587 <212> PRT <213> Triticum aestivum

<400> 18

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 19 <211> 1393 <212> ADN <213> Triticum aestivum

<400> 19

ES 2 553 652 T3   <210> 20 <211> 312 <212> PRT <213> Triticum aestivum

<400> 20

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 21 <211> 2018 <212> ADN <213> Glycine max

<220> <221> misc_feature <222> (1862)..(1862) <223> n es a, c, g, o t <220> <221> misc_feature <222> (1878)..(1878) <223> n es a, c, g, o t <220> <221> misc_feature <222> (1889)..(1889) <223> n es a, c, g, o t

ES 2 553 652 T3   <220> <221> misc_feature <222> (1922)..(1922) <223> n es a, c, g, o t <220> <221> misc_feature <222> (1929)..(1930) <223> n es a, c, g, o t <220> <221> misc_feature <222> (1936)..(1936) <223> n es a, c, g, o t <220> <221> misc_feature <222> (1962)..(1962) <223> n es a, c, g, o t <220> <221> misc_feature <222> (1971)..(1972) <223> n es a, c, g, o t <220> <221> misc_feature <222> (2006)..(2006) <223> n es a, c, g, o t <400> 21

ES 2 553 652 T3   <210> 22 <211> 606 <212> PRT <213> Glycine max

<220> <221> DUDOSO <222> (590)..(590) <223> Xaa puede ser cualquier aminoácido de origen natural <220> <221> DUDOSO <222> (599)..(599) <223> Xaa puede ser cualquier aminoácido de origen natural <400> 22

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 23 <211> 1642 <212> ADN <213> Glycine max

<400> 23

ES 2 553 652 T3   <210> 24 <211> 424 <212> PRT <213> Glycine max

<400> 24

ES 2 553 652 T3  

ES 2 553 652 T3   <213> Zea mays

<400> 25

ES 2 553 652 T3   <210> 26 <211> 620 <212> PRT <213> Zea mays

<400> 26

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 27 <211> 2151 <212> ADN <213> Zea mays

<400> 27

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 28 <211> 571 <212> PRT <213> Zea mays

<400> 28

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 29 <211> 682 <212> ADN <213> Saccharum officinarum

<220> <221> misc_feature <222> (674)..(674) <223> n es a, c, g, o t <400> 29 <210> 30 <211> 156 <212> PRT <213> Saccharum officinarum

<220> <221> DUDOSO <222> (154)..(154) <223> Xaa puede ser cualquier aminoácido de origen natural <400> 30

ES 2 553 652 T3   <210> 31 <211> 837 <212> ADN <213> Saccharum officinarum

<220> <221> misc_feature <222> (563)..(563) <223> n es a, c, g, o t <220> <221> misc_feature <222> (588)..(588) <223> n es a, c, g, o t <220> <221> misc_feature <222> (755)..(755) <223> n es a, c, g, o t <220> <221> misc_feature <222> (760)..(761)

ES 2 553 652 T3   <223> n es a, c, g, o t <220> <221> misc_feature <222> (771)..(773) <223> n es a, c, g, o t <220> <221> misc_feature <222> (807)..(807) <223> n es a, c, g, o t <400> 31 <210> 32 <211> 159 <212> PRT <213> Saccharum officinarum

<220> <221> DUDOSO <222> (158)..(158) <223> Xaa puede ser cualquier aminoácido de origen natural <220> <221> DUDOSO <222> (158)..(158) <400> 32

ES 2 553 652 T3   <210> 33 <211> 1143 <212> ADN <213> Saccharum officinarum

<220> <221> misc_feature <222> (1033)..(1033) <223> n es a, c, g, o t <400> 33

ES 2 553 652 T3   <210> 34 <211> 244 <212> PRT <213> Saccharum officinarum

<220> <221> DUDOSO <222> (243)..(243) <223> Xaa puede ser cualquier aminoácido de origen natural <400> 34

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 35 <211> 1404 <212> ADN <213> Saccharum officinarum

<220> <221> misc_feature <222> (565)..(565) <223> n es a, c, g, o t <220> <221> misc_feature <222> (577)..(577) <223> n es a, c, g, o t <400> 35 <210> 36 <211> 436 <212> PRT

ES 2 553 652 T3   <213> Saccharum officinarum

<220> <221> DUDOSO <222> (157)..(157) <223> Xaa puede ser cualquier aminoácido de origen natural <220> <221> DUDOSO <222> (161)..(161) <223> Xaa puede ser cualquier aminoácido de origen natural <400> 36

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 37 <211> 1658 <212> ADN <213> Triticum aestivum

<400> 37

ES 2 553 652 T3   <210> 38 <211> 528 <212> PRT <213> Triticum aestivum

<400> 38

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 39 <211> 1722 <212> ADN <213> Arabdidopsis thaliana

<400> 39

ES 2 553 652 T3   <210> 40 <211> 573 <212> PRT <213> Arabdidopsis thaliana

<400> 40

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 41 <211> 1473 <212> ADN <213> Arabdidopsis thaliana

<400> 41 <210> 42 <211> 490 <212> PRT <213> Arabdidopsis thaliana

<400> 42

ES 2 553 652 T3  

ES 2 553 652 T3   <213> Arabdidopsis thaliana <400> 43

ES 2 553 652 T3   <210> 44 <211> 683 <212> PRT <213> Arabdidopsis thaliana

<400> 44

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 45 <211> 1230 <212> ADN <213> Arabdidopsis thaliana

<400> 45

ES 2 553 652 T3   <210> 46 <211> 409 <212> PRT <213> Arabdidopsis thaliana

<400> 46

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 47 <211> 1623 <212> ADN <213> Arabdidopsis thaliana

<400> 47

ES 2 553 652 T3   <210> 48 <211> 540 <212> PRT <213> Arabdidopsis thaliana

<400> 48

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 49 <211> 2007 <212> ADN <213> Arabdidopsis thaliana

<400> 49

ES 2 553 652 T3   <210> 50

ES 2 553 652 T3   <211> 668 <212> PRT <213> Arabdidopsis thaliana

<400> 50

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 51 <211> 1542 <212> ADN <213> Populus trichocarpa

<400> 51

ES 2 553 652 T3   <210> 52 <211> 309 <212> PRT <213> Populus trichocarpa

<400> 52

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 53 <211> 1080 <212> ADN <213> Populus trichocarpa

<400> 53

ES 2 553 652 T3   <210> 54 <211> 159 <212> PRT <213> Populus trichocarpa

<400> 54

ES 2 553 652 T3   <210> 55 <211> 911 <212> ADN <213> Populus trichocarpa

<400> 55

ES 2 553 652 T3   <210> 56 <211> 157 <212> PRT <213> Populus trichocarpa

<400> 56

ES 2 553 652 T3   <210> 57 <211> 840 <212> ADN <213> Populus trichocarpa

<400> 57

ES 2 553 652 T3   <210> 58 <211> 194 <212> PRT <213> Populus trichocarpa

<400> 58

ES 2 553 652 T3   <210> 59 <211> 1564 <212> ADN <213> Lycopersicum esculentum

<400> 59

ES 2 553 652 T3   <210> 60 <211> 370 <212> PRT <213> Lycopersicum esculentum

<400> 60

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 61 <211> 2297 <212> ADN <213> Medicago truncatula

<400> 61

ES 2 553 652 T3   <210> 62 <211> 595 <212> PRT <213> Medicago truncatula

<400> 62

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 63 <211> 1510 <212> ADN <213> Beta vulgaris

<220> <221> misc_feature <222> (2)..(3) <223> n es a, c, g, o t <400> 63 <210> 64 <211> 427 <212> PRT <213> Beta vulgaris

ES 2 553 652 T3   <400> 64

ES 2 553 652 T3   <210> 65 <211> 552 <212> ADN <213> Chlamydomonas reinhardtii

<400> 65

ES 2 553 652 T3   <210> 66 <211> 184 <212> PRT <213> Chlamydomonas reinhardtii

<400> 66

ES 2 553 652 T3   <210> 67 <211> 1335 <212> ADN <213> Dictyostelium discoideum

<400> 67

ES 2 553 652 T3   <210> 68 <211> 444 <212> PRT <213> Dictyostelium discoideum

<400> 68

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 69 <211> 8 <212> PRT <213> Secuencia artificial <220> <223> motivo 1 <220> <221> VARIANTE <222> (2)..(2) <223> / reemplaza = "Thr" <400> 69

ES 2 553 652 T3   <210> 70 <211> 8 <212> PRT <213> Secuencia artificial <220> <223> motivo 2 <220> <221> VARIANTE <222> (1)..(1) <223> / reemplaza = "Phe" <220> <221> VARIANTE <222> (2)..(2) <223> / reemplaza = "Glu" <400> 70 <210> 71 <211> 169 <212> PRT <213> Secuencia artificial <220> <223> Dominio SEC <400> 71

ES 2 553 652 T3   <210> 72 <211> 102 <212> PRT <213> Secuencia artificial <220> <223> dominio ORO <400> 72

ES 2 553 652 T3   <210> 73 <211> 51 <212> ADN <213> Secuencia artificial <220> <223> cebador 1 <400> 73 ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc ggaggagcca c 51 <210> 74 <211> 50 <212> ADN <213> Secuencia artificial <220> <223> cebador 2 <400> 74 ggggaccact ttgtacaaga aagctgggtg tggtgaatct ggtgatcagg 50 <210> 75 <211> 2194 <212> ADN <213> Oryza sativa

<400> 75

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 76 <211> 1182 <212> ADN <213> Arabidopsis thaliana

<400> 76

ES 2 553 652 T3   <210> 77 <211> 393 <212> PRT <213> Arabidopsis thaliana

<400> 77

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 78 <211> 1182 <212> ADN <213> Arabidopsis thaliana

<400> 78

ES 2 553 652 T3   <210> 79 <211> 393 <212> PRT <213> Arabidopsis thaliana

<400> 79

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 80 <211> 1158 <212> ADN <213> Arabidopsis thaliana

<400> 80 <210> 81 <211> 385 <212> PRT <213> Arabidopsis thaliana

<400> 81

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 82 <211> 680 <212> ADN <213> Arabidopsis thaliana

<400> 82 <210> 83 <211> 225

ES 2 553 652 T3   <212> PRT <213> Arabidopsis thaliana

<400> 83

ES 2 553 652 T3   <210> 84 <211> 1068

ES 2 553 652 T3   <212> ADN <213> Arabidopsis thaliana

<400> 84 <210> 85 <211> 355 <212> PRT <213> Arabidopsis thaliana

<400> 85

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 86 <211> 1185 <212> ADN <213> Brachypodium sylvaticum

<400> 86 <210> 87 <211> 394 <212> PRT <213> Brachypodium sylvaticum

<400> 87

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 88 <211> 489 <212> ADN <213> Brachypodium sylvaticum

<400> 88 <210> 89 <211> 162 <212> PRT

ES 2 553 652 T3   <213> Brachypodium sylvaticum

<400> 89 <210> 90 <211> 1116 <212> ADN <213> Chlamydomonas reinhardtii

<400> 90

ES 2 553 652 T3   <210> 91 <211> 371 <212> PRT <213> Chlamydomonas reinhardtii

<400> 91

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 92 <211> 1676 <212> ADN <213> Hordeum vulgare

<400> 92 <210> 93 <211> 365 <212> PRT <213> Hordeum vulgare

<400> 93

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 94 <211> 1824 <212> ADN <213> Lycopersicum esculentum

<400> 94

ES 2 553 652 T3   <210> 95 <211> 444 <212> PRT <213> Lycopersicum esculentum

<400> 95

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 96 <211> 1157 <212> ADN <213> Medicago truncatula

<400> 96

ES 2 553 652 T3   <210> 97 <211> 385 <212> PRT <213> Medicago truncatula

<400> 97

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 98 <211> 1305 <212> ADN <213> Oryza sativa

<400> 98

ES 2 553 652 T3   <210> 99 <211> 434 <212> PRT <213> Oryza sativa

<400> 99

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 100 <211> 1179 <212> ADN <213> Oryza sativa

<400> 100

ES 2 553 652 T3   <210> 101 <211> 392 <212> PRT <213> Oryza sativa

<400> 101

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 102 <211> 915 <212> ADN <213> Ostreococcus tauri

<400> 102

ES 2 553 652 T3   <210> 103 <211> 304 <212> PRT <213> Ostreococcus tauri

<400> 103

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 104 <211> 630 <212> ADN <213> Ostreococcus tauri

<400> 104

ES 2 553 652 T3   <210> 105 <211> 209 <212> PRT <213> Ostreococcus tauri

<400> 105

ES 2 553 652 T3   <210> 106 <211> 1409 <212> ADN <213> Populus trichocarpa

<400> 106

ES 2 553 652 T3   <210> 107 <211> 432 <212> PRT <213> Populus trichocarpa

<400> 107

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 108 <211> 1394 <212> ADN <213> Populus trichocarpa

<400> 108

ES 2 553 652 T3   <210> 109 <211> 427 <212> PRT <213> Populus trichocarpa

<400> 109

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 110 <211> 1281 <212> ADN <213> Saccharum officinarum

<220> <221> misc_feature <222> (1140)..(1141) <223> n es a, c, g, o t <220> <221> misc_feature <222> (1220)..(1220) <223> n es a, c, g, o t <400> 110

ES 2 553 652 T3   <210> 111 <211> 331 <212> PRT <213> Saccharum officinarum

<220> <221> misc_feature <222> (322)..(322) <223> Xaa puede ser cualquier aminoácido de origen natural <400> 111

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 112 <211> 1179 <212> ADN <213> Saccharum officinarum

<400> 112

ES 2 553 652 T3   <210> 113 <211> 392 <212> PRT <213> Saccharum officinarum

<400> 113

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 114 <211> 729 <212> ADN <213> Saccharomyces cerevisiae

<400> 114 <210> 115 <211> 242 <212> PRT <213> Saccharomyces cerevisiae

<400> 115

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 116 <211> 1182 <212> ADN <213> Triticum aestivum

<400> 116 <210> 117 <211> 393 <212> PRT <213> Triticum aestivum

<400> 117

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 118 <211> 1119 <212> ADN <213> Vitis vinifera

<400> 118 <210> 119 <211> 372 <212> PRT <213> Vitis vinifera

<400> 119

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 120 <211> 33 <212> PRT <213> Secuencia artificial <220> <223> Motivo I <400> 120 <210> 121 <211> 14 <212> PRT <213> Secuencia artificial <220> <223> Motivo II <220> <221> VARIANTE <222> (7)..(7) <223> / reemplaza = "Val" <400> 121 <210> 122 <211> 8 <212> PRT <213> Secuencia artificial

ES 2 553 652 T3   <220> <223> Motivo III <400> 122 <210> 123 <211> 6 <212> PRT <213> Secuencia artificial <220> <223> Motivo IV <220> <221> VARIANTE <222> (1)..(1) <223> / reemplaza = "Asn" <220> <221> DUDOSO <222> (2)..(2) <223> Xaa puede ser cualquier aminoácido de origen natural <220> <221> VARIANTE <222> (4)..(4) <223> / reemplaza = "Asn" <400> 123 <210> 124 <211> 5 <212> PRT <213> Secuencia artificial <220> <223> Motivo V <400> 124 <210> 125 <211> 55 <212> ADN <213> Secuencia artificial <220> <223> cebador 1 <400> 125 ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc ggagatacag tcaaa 55 <210> 126 <211> 48

ES 2 553 652 T3   <212> ADN <213> Secuencia artificial <220> <223> cebador 2 <400> 126 ggggaccact ttgtacaaga aagctgggtt cacctccaag aggaacca 48 <210> 127 <211> 2194 <212> ADN <213> Oryza sativa

<400> 127

ES 2 553 652 T3   <210> 128 <211> 1062 <212> ADN <213> Oryza sativa

<400> 128

ES 2 553 652 T3   <210> 129 <211> 353 <212> PRT <213> Oryza sativa

<400> 129

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 130 <211> 16 <212> PRT <213> Secuencia artificial <220> <223> Motivo 1 <220> <221> VARIANTE <222> (2)..(2) <223> / reemplaza = "Ala" / reemplaza = "Thr" <220> <221> VARIANTE <222> (3)..(3) <223> / reemplaza = "Glu" / reemplaza = "Asn" <220> <221> DUDOSO

ES 2 553 652 T3   <222> (5)..(5) <223> Xaa puede ser cualquier aminoácido de origen natural, preferiblemente uno de Asn, Lys, Gly, His, Asp <220> <221> VARIANTE <222> (7)..(7) <223> / reemplaza = "Ser" / reemplaza = "Ala" <220> <221> VARIANTE <222> (8)..(8) <223> / reemplaza = "Ser" <220> <221> VARIANTE <222> (11)..(11) <223> / reemplaza = "Met" <220> <221> VARIANTE <222> (14)..(14) <223> / reemplaza = "Gly" / reemplaza = "Asn" <400> 130 <210> 131 <211> 15 <212> PRT <213> Secuencia artificial <220> <223> Motivo 2 <220> <221> DUDOSO <222> (13)..(13) <223> Xaa puede ser cualquier aminoácido de origen natural, preferiblemente uno de Gln, His, Asn, Ser, Tyr, Phe <220> <221> VARIANTE <222> (14)..(14) <223> / reemplaza = "Lys" <400> 131 <210> 132 <211> 9 <212> PRT <213> Secuencia artificial <220> <223> Motivo 3 <220> <221> VARIANTE <222> (1)..(1) <223> / reemplaza = "Ser" <220>

ES 2 553 652 T3   <221> VARIANTE <222> (2)..(2) <223> / reemplaza = "Trp" <220> <221> DUDOSO <222> (3)..(3) <223> Xaa puede ser cualquier aminoácido de origen natural, preferiblemente uno de Met, Leu, Val, Ile, Arg <220> <221> VARIANTE <222> (4)..(4) <223> / reemplaza = "Cys" <220> <221> VARIANTE <222> (5)..(5) <223> / reemplaza = "Asn" <220> <221> VARIANTE <222> (6)..(6) <223> / reemplaza = "Leu" / reemplaza = "Val" <220> <221> VARIANTE <222> (7)..(7) <223> / reemplaza = "Leu" / reemplaza = "Ala" <220> <221> VARIANTE <222> (8)..(8) <223> / reemplaza = "Asp" <220> <221> VARIANTE <222> (9)..(9) <223> / reemplaza = "Arg" <400> 132 <210> 133 <211> 58 <212> ADN <213> Secuencia artificial <220> <223> cebador: prm10133 <400> 133 ggggacaagt ttgtacaaaa aagcaggctt aaacaatgtc tactatctac atgagcca 58 <210> 134 <211> 50 <212> ADN <213> Secuencia artificial <220> <223> cebador: prm10134 <400> 134 ggggaccact ttgtacaaga aagctgggta gctagctagt tttgatcagc 50

ES 2 553 652 T3   <210> 135 <211> 2194 <212> ADN <213> Oryza sativa

<400> 135

ES 2 553 652 T3   <210> 136 <211> 3308 <212> ADN <213> Secuencia artificial <220> <223> casete de expresión <400> 136

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 137 <211> 1044 <212> ADN <213> Oryza sativa

<400> 137 <210> 138 <211> 347 <212> PRT <213> Oryza sativa

<400> 138

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 139 <211> 1065 <212> ADN <213> Oryza sativa

<400> 139

ES 2 553 652 T3   <210> 140 <211> 354 <212> PRT <213> Oryza sativa

<400> 140

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 141 <211> 1128 <212> ADN <213> Oryza sativa

<400> 141

ES 2 553 652 T3   <210> 142 <211> 375 <212> PRT <213> Oryza sativa

<400> 142

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 143 <211> 1119 <212> ADN <213> Oryza sativa

<400> 143

ES 2 553 652 T3   <210> 144 <211> 372 <212> PRT <213> Oryza sativa

<400> 144

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 145 <211> 1044 <212> ADN <213> Oryza sativa

<400> 145 <210> 146 <211> 347 <212> PRT <213> Oryza sativa

<400> 146

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 147 <211> 363 <212> ADN <213> Arabidopsis thaliana

<400> 147 <210> 148 <211> 120 <212> PRT <213> Arabidopsis thaliana

<400> 148

ES 2 553 652 T3   <210> 149 <211> 1653 <212> ADN <213> Arabidopsis thaliana

<400> 149

ES 2 553 652 T3   <210> 150 <211> 550 <212> PRT <213> Arabidopsis thaliana

<400> 150

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 151 <211> 363 <212> ADN <213> Arabidopsis thaliana

<400> 151 <210> 152 <211> 121 <212> PRT <213> Arabidopsis thaliana

<400> 152

ES 2 553 652 T3   <210> 153 <211> 363 <212> ADN <213> Arabidopsis thaliana

<400> 153 <210> 154 <211> 120 <212> PRT <213> Arabidopsis thaliana

<400> 154

ES 2 553 652 T3   <210> 155 <211> 1197 <212> ADN <213> Arabidopsis thaliana

<400> 155

ES 2 553 652 T3   <210> 156 <211> 398 <212> PRT <213> Arabidopsis thaliana

<400> 156

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 157 <211> 1197 <212> ADN <213> Arabidopsis thaliana

<400> 157

ES 2 553 652 T3   <210> 158 <211> 398 <212> PRT <213> Arabidopsis thaliana

<400> 158

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 159 <211> 1059 <212> ADN <213> Arabidopsis thaliana

<400> 159 <210> 160 <211> 352 <212> PRT <213> Arabidopsis thaliana

<400> 160

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 161 <211> 636 <212> ADN <213> Vitis vinifera

<400> 161 <210> 162 <211> 211 <212> PRT <213> Vitis vinifera

<220> <221> misc_feature <222> (66)..(66) <223> Xaa puede ser cualquier aminoácido de origen natural <400> 162

ES 2 553 652 T3   <210> 163 <211> 546 <212> ADN <213> Vitis vinifera

<400> 163

ES 2 553 652 T3   <210> 164 <211> 181 <212> PRT <213> Vitis vinifera

<400> 164

ES 2 553 652 T3   <210> 165 <211> 420 <212> ADN <213> Arabidopsis thaliana

<400> 165

ES 2 553 652 T3   <210> 166 <211> 139 <212> PRT <213> Arabidopsis thaliana

<400> 166 <210> 167 <211> 363 <212> ADN <213> Vitis vinifera

<400> 167

ES 2 553 652 T3   <210> 168 <211> 120 <212> PRT <213> Vitis vinifera

<400> 168 <210> 169 <211> 378 <212> ADN <213> Vitis vinifera

<400> 169

ES 2 553 652 T3   <210> 170 <211> 125 <212> PRT <213> Vitis vinifera

<400> 170 <210> 171 <211> 411 <212> ADN <213> Oryza sativa

<400> 171

ES 2 553 652 T3   <210> 172 <211> 136 <212> PRT <213> Oryza sativa

<400> 172 <210> 173 <211> 429 <212> ADN <213> Oryza sativa

ES 2 553 652 T3   <400> 173 <210> 174 <211> 142 <212> PRT <213> Oryza sativa

<400> 174 <210> 175 <211> 885 <212> ADN <213> Arabidopsis thaliana

ES 2 553 652 T3   <400> 175 <210> 176 <211> 295 <212> PRT <213> Arabidopsis thaliana

<400> 176

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 177 <211> 840 <212> ADN <213> Oryza sativa

<400> 177

ES 2 553 652 T3   <210> 178 <211> 279 <212> PRT <213> Oryza sativa

<400> 178

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 179 <211> 56 <212> ADN <213> Secuencia artificial <220> <223> cebador: prm10106 <400> 179 ggggacaagt ttgtacaaaa aagcaggctt aaacaatgct tcaccattac tacagc 56 <210> 180 <211> 48 <212> ADN <213> Secuencia artificial <220> <223> cebador: prm10107 <400> 180 ggggaccact ttgtacaaga aagctgggtc caacgctaat gctacact 48 <210> 181 <211> 1647 <212> ADN <213> Arabidopsis thaliana

<400> 181

ES 2 553 652 T3   <210> 182 <211> 548 <212> PRT <213> Arabidopsis thaliana

<400> 182

ES 2 553 652 T3  

ES 2 553 652 T3   <212> ADN <213> Arabidopsis thaliana

<400> 183 <210> 184 <211> 487 <212> PRT <213> Arabidopsis thaliana

<400> 184

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 185 <211> 2745 <212> ADN <213> Dictyostelium discoideum

<400> 185

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 186 <211> 914 <212> PRT <213> Dictyostelium discoideum

<400> 186

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 187 <211> 1683 <212> ADN <213> Lycopersicum esculentum

<400> 187 <210> 188 <211> 560 <212> PRT <213> Lycopersicum esculentum

ES 2 553 652 T3   <400> 188

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 189 <211> 1632 <212> ADN <213> Lycopersicum esculentum

<400> 189

ES 2 553 652 T3   <210> 190 <211> 543 <212> PRT <213> Lycopersicum esculentum

<400> 190

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 191 <211> 1548 <212> ADN <213> Ostreococcus lucimarinus

<400> 191

ES 2 553 652 T3   <210> 192 <211> 515 <212> PRT <213> Ostreococcus lucimarinus

<400> 192

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 193 <211> 1704 <212> ADN <213> Oryza sativa

<400> 193

ES 2 553 652 T3   <210> 194 <211> 567 <212> PRT <213> Oryza sativa

<400> 194

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 195 <211> 1683 <212> ADN <213> Populus trichocarpa

<400> 195

ES 2 553 652 T3   <210> 196 <211> 540 <212> PRT <213> Populus trichocarpa

<400> 196

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 197 <211> 1623 <212> ADN <213> Populus trichocarpa

<400> 197 <210> 198 <211> 560 <212> PRT <213> Populus trichocarpa

<400> 198

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 199 <211> 1680 <212> ADN <213> Populus trichocarpa

<400> 199

ES 2 553 652 T3   <210> 200 <211> 559 <212> PRT <213> Populus trichocarpa

<400> 200

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 201 <211> 1722 <212> ADN <213> Vitis vinifera

<400> 201

ES 2 553 652 T3   <210> 202 <211> 573 <212> PRT <213> Vitis vinifera

<400> 202

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 203 <211> 1698 <212> ADN <213> Zea mays

<400> 203

ES 2 553 652 T3   <210> 204 <211> 565 <212> PRT <213> Zea mays

<400> 204

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 205 <211> 1698 <212> ADN <213> Zea mays

<400> 205

ES 2 553 652 T3   <210> 206 <211> 565 <212> PRT <213> Zea mays

<400> 206

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 207 <211> 46 <212> PRT <213> Secuencia artificial <220> <223> Dedo de zinc tipo ZZ <400> 207 <210> 208 <211> 49 <212> PRT <213> Secuencia artificial <220> <223> dominio de unión a ADN SANT <400> 208

ES 2 553 652 T3   <210> 209 <211> 13 <212> PRT <213> Secuencia artificial <220> <223> mano de EF de unión a calcio <400> 209 <210> 210 <211> 88 <212> PRT <213> Secuencia artificial <220> <223> SWIRM <400> 210 <210> 211

ES 2 553 652 T3   <211> 55 <212> ADN <213> Secuencia artificial <220> <223> cebador 1 <400> 211 ggggacaagt ttgtacaaaa aagcaggctt aaacaatggg tcgttcgaaa ctagc 55 <210> 212 <211> 52 <212> ADN <213> Secuencia artificial <220> <223> cebador 2 <400> 212 ggggaccact ttgtacaaga aagctgggtc atgttaggac catgaagcta tg 52 <210> 213 <211> 1130 <212> ADN <213> Oryza sativa

<400> 213 <210> 214 <211> 1244

ES 2 553 652 T3   <212> ADN <213> Oryza sativa

<400> 214 <210> 215 <211> 1482 <212> ADN <213> Arabidopsis thaliana

<400> 215

ES 2 553 652 T3   <210> 216 <211> 493 <212> PRT <213> Arabidopsis thaliana

<400> 216

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 217 <211> 1458 <212> ADN <213> Aquilegia formosa x Aquilegia pubescens

<400> 217

ES 2 553 652 T3   <210> 218 <211> 485 <212> PRT <213> Aquilegia formosa x Aquilegia pubescens

<400> 218

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 219 <211> 1488 <212> ADN <213> Brassica napus

<400> 219

ES 2 553 652 T3   <210> 220 <211> 495 <212> PRT <213> Brassica napus

<400> 220

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 221 <211> 1428 <212> ADN <213> Glycine max

<400> 221

ES 2 553 652 T3   <210> 222 <211> 475 <212> PRT <213> Glycine max

<400> 222

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 223 <211> 1467 <212> ADN <213> Gossypium hirsutum

<400> 223

ES 2 553 652 T3   <210> 224 <211> 488 <212> PRT <213> Gossypium hirsutum

<400> 224

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 225 <211> 1464 <212> ADN <213> Helianthus annuus

<400> 225 <210> 226 <211> 487 <212> PRT <213> Helianthus annuus

ES 2 553 652 T3   <400> 226

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 227 <211> 1410 <212> ADN <213> Hordeum vulgare

<400> 227 <210> 228 <211> 469 <212> PRT <213> Hordeum vulgare

<400> 228

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 229 <211> 1479 <212> ADN <213> Linum usitatissum

<400> 229

ES 2 553 652 T3   <210> 230 <211> 490 <212> PRT <213> Linum usitatissum

<400> 230

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 231 <211> 1422 <212> ADN <213> Lithospermum erythrorhizon

<400> 231

ES 2 553 652 T3   <210> 232 <211> 473 <212> PRT <213> Lithospermum erythrorhizon

<400> 232

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 233 <211> 1464 <212> ADN <213> Lycopersicon esculentum

<400> 233

ES 2 553 652 T3   <210> 234 <211> 487 <212> PRT <213> Lycopersicon esculentum

<400> 234

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 235 <211> 1488 <212> ADN <213> Medicago truncatula

<400> 235

ES 2 553 652 T3   <210> 236 <211> 495 <212> PRT <213> Medicago truncatula

<400> 236

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 237 <211> 1392 <212> ADN <213> Oryza sativa

<400> 237

ES 2 553 652 T3   <210> 238 <211> 463 <212> PRT <213> Oryza sativa

<400> 238

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 239 <211> 1476 <212> ADN <213> Pinus radiata

<400> 239 <210> 240 <211> 491 <212> PRT <213> Pinus radiata

<400> 240

ES 2 553 652 T3  

ES 2 553 652 T3   <212> ADN <213> Populus tremuloides

<400> 241 <210> 242 <211> 488 <212> PRT <213> Populus tremuloides

<400> 242

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 243 <211> 1428 <212> ADN <213> Prunus armeniaca

<400> 243

ES 2 553 652 T3   <210> 244 <211> 475 <212> PRT <213> Prunus armeniaca

<400> 244

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 245 <211> 1437 <212> ADN <213> Saccharum officinarum

<400> 245

ES 2 553 652 T3   <210> 246 <211> 478 <212> PRT <213> Saccharum officinarum

<400> 246

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 247 <211> 1380 <212> ADN <213> Triticum aestivum

<400> 247

ES 2 553 652 T3   <210> 248 <211> 459 <212> PRT <213> Triticum aestivum

<400> 248

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 249 <211> 1416 <212> ADN <213> Triticum aestivum

<400> 249 <210> 250 <211> 471 <212> PRT <213> Triticum aestivum

ES 2 553 652 T3   <400> 250

ES 2 553 652 T3   <210> 251 <211> 1461

ES 2 553 652 T3   <212> ADN <213> Vitis vinifera

<400> 251 <210> 252 <211> 486 <212> PRT <213> Vitis vinifera

<400> 252

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 253 <211> 1431 <212> ADN <213> Zea mays

<400> 253

ES 2 553 652 T3   <210> 254 <211> 460 <212> PRT <213> Zea mays

<400> 254

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 255 <211> 1383 <212> ADN <213> Zea mays

<400> 255

ES 2 553 652 T3   <210> 256 <211> 476 <212> PRT <213> Zea mays

<400> 256

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 257 <211> 1491 <212> ADN <213> Citrus sinensis

<220> <221> misc_feature <222> (665)..(769) <223> n puede ser a, c, g, o t <220> <221> misc_feature <222> (770)..(799) <223> n puede ser a, c, g, t o o puede ser omitido <400> 257

ES 2 553 652 T3   <210> 258 <211> 495 <212> PRT <213> Citrus sinensis

<220> <221> misc_feature <222> (222)..(256) <223> Xaa puede ser cualquier aminoácido de origen natural <220> <221> misc_feature <222> (257)..(266) <223> Xaa puede ser cualquier aminoácido de origen natural o puede ser omitido <400> 258

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 259 <211> 1119 <212> ADN <213> Glycine max

<400> 259

ES 2 553 652 T3   <210> 260 <211> 372 <212> PRT <213> Glycine max

<400> 260

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 261 <211> 448 <212> ADN <213> Hordeum vulgare

<400> 261

ES 2 553 652 T3   <210> 262 <211> 149 <212> PRT <213> Hordeum vulgare

<400> 262

ES 2 553 652 T3   <210> 263 <211> 1029 <212> ADN <213> Hordeum vulgare

<400> 263 <210> 264 <211> 342 <212> PRT <213> Hordeum vulgare

<400> 264

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 265 <211> 1555 <212> ADN <213> Pinus taeda

<220> <221> misc_feature <222> (730)..(1044) <223> n puede ser a, c, g, o t <220> <221> misc_feature <222> (1045)..(1059) <223> n puede ser, c, g, t o puede ser omitido <400> 265

ES 2 553 652 T3   <210> 266 <211> 470 <212> PRT <213> Pinus taeda <220> <221> misc_feature <222> (197)..(301) <223> Xaa puede ser cualquier aminoácido de origen natural <220> <221> misc_feature <222> (302)..(306) <223> Xaa puede ser cualquier aminoácido de origen natural o puede ser omitido

ES 2 553 652 T3   <400> 266

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 267 <211> 1269 <212> ADN <213> Saccharum officinarum

<220> <221> Dudoso <222> (566)..(566) <220> <221> misc_feature <222> (566)..(566) <223> n es a, c, g, o t <400> 267

ES 2 553 652 T3   <210> 268 <211> 461 <212> PRT <213> Saccharum officinarum

<220> <221> misc_feature <222> (189)..(218) <223> Xaa puede ser cualquier aminoácido de origen natural <220> <221> misc_feature <222> (219) .. (228) <223> Xaa puede ser cualquier aminoácido de origen natural o puede ser omitido <400> 268

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 269 <211> 1337 <212> ADN <213> Sorghum bicolor

<220> <221> misc_feature <222> (528)..(662) <223> n puede ser a, c, g, o t <220> <221> misc_feature <222> (663)..(692) <223> n puede ser a, c, g, t o puede ser omitido <400> 269

ES 2 553 652 T3   <210> 270 <211> 445 <212> PRT <213> Sorghum bicolor

<220> <221> misc_feature <222> (177)..(221) <223> Xaa puede ser cualquier aminoácido de origen natural <220> <221> misc_feature <222> (222)..(231) <223> Xaa puede ser cualquier aminoácido de origen natural o puede ser omitido <400> 270

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 271 <211> 336 <212> PRT <213> Secuencia artificial <220> <223> Dominio conservado comprendido en SEC ID N.º: 02 <400> 271

ES 2 553 652 T3  

ES 2 553 652 T3   <210> 272 <211> 2194 <212> ADN <213> Oryza sativa

<400> 272

ES 2 553 652 T3   <210> 273 <211> 1245 <212> ADN <213> Oryza sativa

<400> 273

ES 2 553 652 T3   <210> 274 <211> 56 <212> ADN <213> Secuencia artificial <220> <223> cebador: prm09100 <400> 274 ggggacaagt ttgtacaaaa aagcaggctt aaacaatgtt ttttggacca agtgag 56 <210> 275 <211> 50 <212> ADN <213> Secuencia artificial <220> <223> cebador: prm09101 <400> 275 ggggaccact ttgtacaaga aagctgggtt gtgtagagag acgcatcagt 50

ES 2 553 652 T3  

REIVINDICACIONES

1. Un procedimiento para potenciar rasgos relacionados con el rendimiento en plantas con respecto a plantas de control, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38, para lo cual el polipéptido PRP38 tiene al menos el 70 % o más de identidad de secuencia con la SEC ID N.º: 77 entera y en el que dicha expresión modulada se efectúa mediante la introducción y expresión en una planta de un ácido nucleico que codifica un polipéptido PRP38, en el que dichos rasgos relacionados con el rendimiento son uno o más de los siguientes rasgos: (i) biomasa de la parte aérea, (ii) vigor de emergencia, (iii) rendimiento de semilla total, (iv) número de semillas llenas, (v) tasa de llenado, (vi) índice de cosecha, y (vii) número de semillas por planta.

2. El procedimiento de acuerdo con la reivindicación 1, en el que dicho polipéptido PRP38 comprende uno o más de los siguientes motivos: (i) Un dominio DUF1777 (ii) Un dominio RS (iii) El motivo Ib (SEC ID N.º: 120) en el que cualquier resto de aminoácido puede sustituirse por un aminoácido conservativo y/o hasta el 50 % de los restos de aminoácidos pueden sustituirse por un aminoácido no conservativo. (iv) El motivo IIb (SEC ID N.º: 121) en el que cualquier resto de aminoácido puede sustituirse por un aminoácido conservativo y/o hasta el 50 % de los restos de aminoácidos pueden sustituirse por un aminoácido no conservativo. (v) El motivo IIIb (SEC ID N.º: 122) en el que cualquier resto de aminoácido puede sustituirse por un aminoácido conservativo y/o hasta el 50 % de los restos de aminoácidos pueden sustituirse por un aminoácido no conservativo.

3. El procedimiento de acuerdo con cualquier reivindicación precedente, en el que dicho ácido nucleico que codifica un polipéptido PRP38 codifica una cualquiera de las proteínas enumeradas en la Tabla A o es una porción de dicho ácido nucleico, o un ácido nucleico capaz de hibridar con tal ácido nucleico, preferentemente, en el que dicha secuencia de ácido nucleico codifica un ortólogo o parálogo de cualquiera de las proteínas proporcionadas en la Tabla A.

4. El procedimiento de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en las que dichos rasgos potenciados relacionados con el rendimiento se obtienen en condiciones sin estrés o en condiciones de deficiencia de nitrógeno.

5. El procedimiento de acuerdo con una cualquiera de las reivindicaciones 3 a 4, en las que dicho ácido nucleico está ligado operativamente a un promotor constitutivo, preferentemente a un promotor GOS2, muy preferentemente a un promotor GOS2 de arroz.

6. El procedimiento de acuerdo con cualquier reivindicación precedente, en las que dicho ácido nucleico codifica un polipéptido PRP38 es de origen vegetal, preferentemente de una planta dicotiledónea, además preferentemente de la familia Brassicaceae, más preferentemente del género Arabidopsis, muy preferentemente de Arabidopsis thaliana.

7. La construcción que comprende: (i) el ácido nucleico que codifica un polipéptido PRP38 como se define en las reivindicaciones 1, 2, 3 o 6; (ii) una o más secuencias de control capaces de dirigir la expresión de la secuencia del ácido nucleico de (i); y opcionalmente (iii) una secuencia de terminación de la transcripción preferentemente, en la que una de dichas secuencias de control es un promotor constitutivo, preferentemente un promotor GOS2, muy preferentemente un promotor GOS2 de arroz.

8. El uso de una construcción de acuerdo a la reivindicación 7 en un procedimiento de producción de plantas que tienen rasgos potenciados relacionados con el rendimiento con respecto a las plantas de control, en el que dichos rasgos relacionados con el rendimiento son uno o más de los siguientes rasgos: (i) biomasa de la parte aérea, (ii) vigor de emergencia, (iii) rendimiento total de semilla, (iv) número de semillas llenas, (v) tasa de llenado, (vi) índice de cosecha, y (vii) número de semillas por planta.

9. Un procedimiento de producción de una planta transgénica que tiene rasgos potenciados relacionados con el rendimiento con respecto a las plantas de control, en el que dichos rasgos relacionados con el rendimiento son uno o más de los siguientes rasgos: (i) biomasa de la parte aérea, (ii) vigor de emergencia, (iii) rendimiento total de semilla, (iv) número de semillas llenas, (v) tasa de llenado, (vi) índice de cosecha, y (vii) número de semillas por planta, comprendiendo: (i) introducir y expresar en una planta un ácido nucleico que codifica un polipéptido PRP38 como se define en la reivindicación 1, 2, 3 o 6; y (ii) cultivar la célula de planta en condiciones que promuevan el crecimiento y desarrollo de la planta.

ES 2 553 652 T3   10. La planta transgénica, parte de la planta o célula de planta transformada con una construcción de acuerdo con la reivindicación 7, o una planta o parte de la misma, incluyendo semillas, obtenible por un procedimiento de acuerdo a cualquiera de las reivindicaciones 1-6, en la que dicha planta o parte de la misma comprende un ácido nucleico recombinante que codifica un polipéptido PRP38, o una planta transgénica que tiene rasgos potenciados relacionados con el rendimiento respecto a las plantas de control, en el que dichos rasgos relacionados con el rendimiento son uno o más de los siguientes rasgos: (i) biomasa de la parte aérea, (ii)vigor de emergencia, (iii) rendimiento de semilla total, (iv) número de semillas llenas, (v) tasa de llenado, (vi) índice de cosecha, y (vii) número de semillas por planta, que se produce por la introducción en la planta y la expresión de un ácido nucleico que codifica un polipéptido PRP38 como se define en la reivindicación 1, 2, 3 o 6, o una célula de planta transgénica obtenida de dicha planta transgénica o una célula de planta transgénica obtenida de la misma, en la que preferentemente dicha planta transgénica es una planta de cultivo o una monocotiledónea o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticalo, sorgo y avena.

11. El uso de un ácido nucleico que codifica un polipéptido PRP38 en el aumento del rendimiento de acuerdo a la reivindicación 1, particularmente en el aumento del rendimiento de semilla y/o la biomasa de los brotes en plantas, con respecto a las plantas de control.

ES 2 553 652 T3