COMPOSICIONES DE MOLECULAS DE ACIDO NUCLEICO SINTETICAS Y METODOS DE PREPARACION.

Una molécula de ácido nucleico sintética que comprende al menos 300 nucleótidos de una región codificante de un polipéptido indicador,

que tiene una composición de codones que difiere en más del 25% de los codones de una secuencia de ácido nucleico de tipo natural que codifica un polipéptido indicador, y que tiene al menos 3 veces menos secuencias reguladoras de la transcripción respecto del número de tales secuencias en la secuencia de ácido nucleico de tipo natural, en la que las secuencias reguladoras de la transcripción se seleccionan del grupo que consiste en secuencias de unión para factores de transcripción de mamíferos, sitios de corte y empalme de intrones, sitios de adición de poli(A) y secuencias promotoras, en la que el polipéptido indicador codificado por la molécula de ácido nucleico sintética tiene al menos un 90% de identidad de secuencias respecto del polipéptido indicador codificado por la secuencia de ácido nucleico de tipo natural, en la que los codones que son diferentes son codones empleados más frecuentemente en mamíferos, y se seleccionan para dar como resultado una molécula de ácido nucleico sintética que tiene un número reducido de una combinación de diferentes secuencias de unión para factores de transcripción de mamíferos y opcionalmente sitios de corte y empalme de intrones, sitios de adición de poli(A) y/o secuencias promotoras, respecto de la secuencia de ácido nucleico de tipo natural

Tipo: Resumen de patente/invención. Número de Solicitud: W0126566US.

Solicitante: PROMEGA CORPORATION.

Inventor/es: WOOD, KEITH, V., WOOD,MONIKA,G, ZHUANG,YAO, PAGUIO,AILEEN.

Fecha de Publicación: .

Fecha Concesión Europea: 23 de Diciembre de 2009.

Clasificación Internacional de Patentes:

  • C12N15/67 QUIMICA; METALURGIA.C12 BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE; MICROBIOLOGIA; ENZIMOLOGIA; TECNICAS DE MUTACION O DE GENETICA.C12N MICROORGANISMOS O ENZIMAS; COMPOSICIONES QUE LOS CONTIENEN; PROPAGACION, CULTIVO O CONSERVACION DE MICROORGANISMOS; TECNICAS DE MUTACION O DE INGENIERIA GENETICA; MEDIOS DE CULTIVO (medios para ensayos microbiológicos C12Q 1/00). › C12N 15/00 Técnicas de mutación o de ingeniería genética; ADN o ARN relacionado con la ingeniería genética, vectores, p. ej. plásmidos, o su aislamiento, su preparación o su purificación; Utilización de huéspedes para ello (mutantes o microorganismos modificados por ingeniería genética C12N 1/00, C12N 5/00, C12N 7/00; nuevas plantas en sí A01H; reproducción de plantas por técnicas de cultivo de tejidos A01H 4/00; nuevas razas animales en sí A01K 67/00; utilización de preparaciones medicinales que contienen material genético que es introducido en células del cuerpo humano para tratar enfermedades genéticas, terapia génica A61K 48/00; péptidos en general C07K). › Métodos generales para favorecer la expresión.
  • C12N9/02K

Clasificación PCT:

  • C07K14/00 C […] › C07 QUIMICA ORGANICA.C07K PEPTIDOS (péptidos que contienen β -anillos lactamas C07D; ipéptidos cíclicos que no tienen en su molécula ningún otro enlace peptídico más que los que forman su ciclo, p. ej. piperazina diones-2,5, C07D; alcaloides del cornezuelo del centeno de tipo péptido cíclico C07D 519/02; proteínas monocelulares, enzimas C12N; procedimientos de obtención de péptidos por ingeniería genética C12N 15/00). › Péptidos con más de 20 aminoácidos; Gastrinas; Somatostatinas; Melanotropinas; Sus derivados.

Clasificación antigua:

  • G01N33/53 FISICA.G01 METROLOGIA; ENSAYOS.G01N INVESTIGACION O ANALISIS DE MATERIALES POR DETERMINACION DE SUS PROPIEDADES QUIMICAS O FISICAS (procedimientos de medida, de investigación o de análisis diferentes de los ensayos inmunológicos, en los que intervienen enzimas o microorganismos C12M, C12Q). › G01N 33/00 Investigación o análisis de materiales por métodos específicos no cubiertos por los grupos G01N 1/00 - G01N 31/00. › Ensayos inmunológicos; Ensayos en los que interviene la formación de uniones bioespecíficas; Materiales a este efecto.

Fragmento de la descripción:

Composiciones de moléculas de ácido nucleico sintéticas y métodos de preparación.

Declaración de derechos gubernamentales

La invención se hizo al menos en parte con una subvención del Gobierno de los Estados Unidos de América (subvención DMI-9402762 de la Fundación Nacional de Ciencias). El Gobierno tiene ciertos derechos respecto a la invención.

Antecedentes de la invención

La transcripción, la síntesis de una molécula de ARN a partir de una secuencia de ADN, es la primera etapa en la expresión génica. Las secuencias que regulan la transcripción del ADN incluyen secuencias promotoras, señales de poliadenilación, sitios de unión para factores de transcripción y elementos potenciadores. Un promotor es una secuencia de ADN capaz de provocar la iniciación específica de la transcripción, y consiste en tres regiones generales. El promotor central es la secuencia en la que la ARN polimerasa y sus cofactores se unen al ADN. Inmediatamente en posición 5' respecto del promotor central está el promotor proximal, que contiene varios sitios de unión para factores de transcripción que son responsables del ensamblaje de un complejo de activación, que a su vez recluta el complejo de la polimerasa. El promotor distal, localizado en posición 5' más allá del promotor proximal, contiene también sitios de unión para factores de transcripción. La terminación de la transcripción y la poliadenilación, como la iniciación de la transcripción, son específicas de sitio y están codificadas por secuencias definidas. Los potenciadores son regiones reguladoras que contienen múltiples sitios de unión para factores de transcripción, que pueden incrementar significativamente el nivel de transcripción a partir de un promotor sensible independientemente de la orientación del potenciador y de la distancia con respecto al promotor, con tal de que el potenciador y el promotor estén localizados en la misma molécula de ADN. La cantidad de transcrito producido a partir de un gen se puede regular también mediante un mecanismo post-transcripcional, siendo el más importante el corte y empalme del ARN que elimina secuencias intermedias (intrones) de un transcrito primario entre las secuencias donantes y aceptoras de corte y empalme.

La selección natural es la hipótesis de que las interacciones genotipo-medio que se dan a nivel fenotípico conducen a un éxito reproductivo diferencial de los individuos, y por lo tanto a la modificación del patrimonio genético de una población. Algunas propiedades de las moléculas de ácido nucleico que se ven afectadas por la selección natural incluyen la frecuencia del uso de los codones, la estructura secundaria del ARN, la eficacia del corte y empalme de intrones, y las interacciones con factores de transcripción u otras proteínas de unión al ácido nucleico. Debido a la naturaleza degenerada del código genético, estas propiedades pueden ser optimizadas por la selección natural sin alterar la secuencia de aminoácidos correspondiente.

En ciertas condiciones, es útil alterar sintéticamente la secuencia nucleotídica natural que codifica un polipéptido para adaptar mejor el polipéptido a aplicaciones alternativas. Un ejemplo habitual es alterar la frecuencia del uso de los codones de un gen cuando se expresa en una célula hospedadora exógena. Aunque la redundancia del código genético permite que los aminoácidos estén codificados por múltiples codones, los diferentes organismos favorecen algunos codones respecto de otros. Se ha descubierto que la eficacia de la traducción de proteínas en una célula hospedadora no nativa se puede incrementar sustancialmente ajustando la frecuencia del uso de los codones pero manteniendo el mismo producto génico (patentes de EE.UU. nºs 5.096.825, 5.670.356, y 5.874.304).

Sin embargo, la alteración del uso de los codones puede dar como resultado, a su vez, la introducción involuntaria en una molécula de ácido nucleico sintética de secuencias reguladoras de la transcripción inapropiadas. Esto puede afectar de manera adversa a la transcripción, lo que da como resultado una expresión anómala del ADN sintético. La expresión anómala se define como la desviación de los niveles de expresión normales o esperados. Por ejemplo, se ha demostrado que los sitios de unión para factores de transcripción localizados en posición 3' respecto de un promotor afectan a la actividad del promotor (Michael et al., 1990; Lamb et al., 1998; Johnson et al., 1998; Jones et al., 1997). Además, es habitual que un elemento potenciador ejerza su actividad y dé como resultado niveles elevados de transcripción de ADN en ausencia de una secuencia promotora, o que la presencia de secuencias reguladoras de la transcripción incremente los niveles basales de expresión génica en ausencia de una secuencia promotora.

Así, se necesita un método para producir moléculas de ácido nucleico sintéticas con un uso alterado de los codones, sin introducir además secuencias reguladoras de la transcripción inapropiadas o no intencionadas, para la expresión en una célula hospedadora particular.

Sumario de la invención

La invención proporciona una molécula de ácido nucleico sintética que comprende al menos 300 nucleótidos de una región codificante de un polipéptido indicador, que tiene una composición de codones que difiere en más del 25% de los codones de una secuencia de ácido nucleico de tipo natural que codifica un polipéptido indicador, y que tiene al menos 3 veces menos, preferiblemente al menos 5 veces menos, secuencias reguladoras de la transcripción respecto del número de tales secuencias en la secuencia de ácido nucleico de tipo natural. La molécula de ácido nucleico sintética codifica un polipéptido que tiene una secuencia de aminoácidos que es al menos un 90%, y lo más preferiblemente un 95% o 99%, idéntica a la secuencia de aminoácidos del polipéptido (proteína) natural (nativo o de tipo natural) del que procede. Así, se reconoce que también pueden ser deseables ciertos cambios de aminoácidos específicos para alterar una característica fenotípica particular del polipéptido codificado por la molécula de ácido nucleico sintética. Preferiblemente, la identidad de secuencias de aminoácidos se da a lo largo de al menos 100 residuos de aminoácidos contiguos. En una realización de la invención, los codones de la molécula de ácido nucleico sintética que difieren codifican preferiblemente los mismos aminoácidos que los codones correspondientes de la secuencia de ácido nucleico de tipo natural.

Las secuencias reguladoras de la transcripción que se reducen en la molécula de ácido nucleico sintética incluyen cualquier combinación de secuencias de unión para factores de transcripción de mamíferos, sitios de corte y empalme de intrones, sitios de adición de poli(A) y secuencias promotoras. Las secuencias reguladoras de la transcripción se conocen bien en la técnica.

Se prefiere que la molécula de ácido nucleico sintética de la invención tenga una composición de codones que difiere de la secuencia de ácido nucleico de tipo natural en más de un 30%, 35%, 40% o más de un 45%, p.ej., 50%, 55%, 60% o más de los codones. Los codones preferidos para el uso en la invención son aquellos que se emplean más frecuentemente que al menos otro codón para el mismo aminoácido en un organismo particular y, más preferiblemente, además no son codones de uso bajo en ese organismo, y no son codones de uso bajo en el organismo usado para clonar o cribar la expresión de la molécula de ácido nucleico sintética (por ejemplo, E. coli). Además, los codones preferidos para ciertos aminoácidos (es decir, los aminoácidos que tienen tres o más codones), pueden incluir dos o más codones que se emplean más frecuentemente que el/los otro(s) codon(es) (no preferido(s)). La presencia de codones en la molécula de ácido nucleico sintética que se emplean más frecuentemente en un organismo que en otro organismo da como resultado una molécula de ácido nucleico sintética que, cuando se introduce en las células del organismo que emplea esos codones más frecuentemente, se expresa en esas células a un nivel que es superior que la expresión de la secuencia de ácido nucleico original o de tipo natural en esas células. Por ejemplo, la molécula de ácido nucleico sintética de la invención se expresa a un nivel que es al menos alrededor del 110%, p.ej., 150%, 200%, 500% o más (1000%, 5000%, o 10000%) del de la secuencia de ácido nucleico de tipo natural en una célula o extracto celular en condiciones idénticas (tales como las condiciones de cultivo celular, el esqueleto del vector, y...

 


Reivindicaciones:

1. Una molécula de ácido nucleico sintética que comprende al menos 300 nucleótidos de una región codificante de un polipéptido indicador, que tiene una composición de codones que difiere en más del 25% de los codones de una secuencia de ácido nucleico de tipo natural que codifica un polipéptido indicador, y que tiene al menos 3 veces menos secuencias reguladoras de la transcripción respecto del número de tales secuencias en la secuencia de ácido nucleico de tipo natural, en la que las secuencias reguladoras de la transcripción se seleccionan del grupo que consiste en secuencias de unión para factores de transcripción de mamíferos, sitios de corte y empalme de intrones, sitios de adición de poli(A) y secuencias promotoras, en la que el polipéptido indicador codificado por la molécula de ácido nucleico sintética tiene al menos un 90% de identidad de secuencias respecto del polipéptido indicador codificado por la secuencia de ácido nucleico de tipo natural, en la que los codones que son diferentes son codones empleados más frecuentemente en mamíferos, y se seleccionan para dar como resultado una molécula de ácido nucleico sintética que tiene un número reducido de una combinación de diferentes secuencias de unión para factores de transcripción de mamíferos y opcionalmente sitios de corte y empalme de intrones, sitios de adición de poli(A) y/o secuencias promotoras, respecto de la secuencia de ácido nucleico de tipo natural.

2. La molécula de ácido nucleico sintética de la reivindicación 1, en la que la molécula de ácido nucleico sintética tiene al menos 5 veces menos secuencias reguladoras de la transcripción.

3. La molécula de ácido nucleico sintética de la reivindicación 1 ó 2, en la que la composición de los codones de la molécula de ácido nucleico sintética difiere de la secuencia de ácido nucleico de tipo natural en más del 35% de los codones.

4. La molécula de ácido nucleico sintética de la reivindicación 1 ó 2, en la que la composición de los codones de la molécula de ácido nucleico sintética difiere de la secuencia de ácido nucleico de tipo natural en más del 45% de los codones.

5. La molécula de ácido nucleico sintética de la reivindicación 1 ó 2, en la que la composición de los codones de la molécula de ácido nucleico sintética difiere de la secuencia de ácido nucleico de tipo natural en más del 55% de los codones.

6. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 5, en la que la molécula de ácido nucleico sintética codifica una luciferasa.

7. La molécula de ácido nucleico sintética de la reivindicación 6, en la que la secuencia de ácido nucleico de tipo natural codifica una luciferasa de Renilla.

8. La molécula de ácido nucleico sintética de la reivindicación 6, en la que la secuencia de ácido nucleico de tipo natural codifica una luciferasa de escarabajo.

9. La molécula de ácido nucleico sintética de la reivindicación 8, en la que la molécula de ácido nucleico sintética codifica el aminoácido valina en el residuo equivalente a la posición 224 de SEQ ID NO: 23.

10. La molécula de ácido nucleico sintética de la reivindicación 8, en la que la molécula de ácido nucleico sintética codifica el aminoácido tirosina en el residuo equivalente a la posición 224 de SEQ ID NO: 23, histidina en el residuo equivalente a la posición 247 de SEQ ID NO: 23, isoleucina en el residuo equivalente a la posición 346 de SEQ ID NO: 23, glutamina en el residuo equivalente a la posición 348 de SEQ ID NO: 23, o cualquier combinación de los mismos.

11. La molécula de ácido nucleico sintética de la reivindicación 1, en la que la mayoría de los codones que difieren en la molécula de ácido nucleico sintética son aquellos que son codones preferidos en humanos.

12. La molécula de ácido nucleico sintética de la reivindicación 6, en la que la molécula de ácido nucleico sintética comprende SEQ ID NO:21 (Rlucver2) o SEQ ID NO:22 (Rluc-final).

13. La molécula de ácido nucleico sintética de la reivindicación 6, en la que la molécula de ácido nucleico sintética comprende SEQ ID NO:7 (GRver5), SEQ ID NO:8 (GRver6), SEQ ID NO:9 (GRver5.1), o SEQ ID NO:297 (GRver5.1).

14. La molécula de ácido nucleico sintética de la reivindicación 6, en la que la molécula de ácido nucleico sintética comprende SEQ ID NO:14 (RDver5), SEQ ID NO:15 (RDver7), SEQ ID NO:16 (RDver5.1), SEQ ID NO:299 (RDver5.1), SEQ ID NO:17 (RDver5.2), SEQ ID NO:18 (RD156-1H9) o SEQ ID NO:301 (RD156-1H9).

15. La molécula de ácido nucleico sintética de la reivindicación 11, en la que la mayoría de los codones que difieren son los codones humanos CGC, CTG, TCT, AGC, ACC, CCA, CCT, GCC, GGC, GTG, ATC, ATT, AAG, AAC, CAG, CAC, GAG, GAC, TAC, TGC y TTC.

16. La molécula de ácido nucleico sintética de la reivindicación 11, en la que la mayoría de los codones que difieren son los codones humanos CGC, CTG, TCT, ACC, CCA, GCC, GGC, GTC y ATC, o los codones CGT, TTG, AGC, ACT, CCT, GCT, GGT, GTG, y ATT.

17. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11, 15 ó 16, en la que la molécula de ácido nucleico sintética se expresa en una célula hospedadora de mamífero a un nivel que es mayor que el de la secuencia de ácido nucleico de tipo natural.

18. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11 ó 15 a 17, en la que la molécula de ácido nucleico sintética tiene un número incrementado de codones CTG o TTG que codifican leucina.

19. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11 ó 15 a 17, en la que la molécula de ácido nucleico sintética tiene un número incrementado de codones GTG o GTC que codifican valina.

20. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11 ó 15 a 17, en la que la molécula de ácido nucleico sintética tiene un número incrementado de codones GGC o GGT que codifican glicocola.

21. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11 ó 15 a 17, en la que la molécula de ácido nucleico sintética tiene un número incrementado de codones ATC o ATT que codifican isoleucina.

22. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11 ó 15 a 17, en la que la molécula de ácido nucleico sintética tiene un número incrementado de codones CCA o CCT que codifican prolina.

23. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11 ó 15 a 17, en la que la molécula de ácido nucleico sintética tiene un número incrementado de codones CGC o CGT que codifican arginina.

24. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11 ó 15 a 17, en la que la molécula de ácido nucleico sintética tiene un número incrementado de codones AGC o TCT que codifican serina.

25. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11 ó 15 a 17, en la que la molécula de ácido nucleico sintética tiene un número incrementado de codones ACC o ACT que codifican treonina.

26. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11 ó 15 a 17, en la que la molécula de ácido nucleico sintética tiene un número incrementado de codones GCC o GCT que codifican alanina.

27. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 11 ó 15 a 26, en la que los codones de la molécula de ácido nucleico sintética que difieren codifican los mismos aminoácidos que los codones correspondientes de la secuencia de ácido nucleico de tipo natural.

28. Un plásmido que comprende la molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 27.

29. Un vector de expresión que comprende la molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 27 unida a un promotor funcional en una célula.

30. El vector de expresión de la reivindicación 29, en el que la molécula de ácido nucleico sintética está unida de manera operable a una secuencia Kozak consenso.

31. El vector de expresión de la reivindicación 29, en el que el promotor es funcional en una célula de mamífero.

32. El vector de expresión de la reivindicación 29, en el que el promotor es funcional en una célula humana.

33. El vector de expresión de cualquiera de las reivindicaciones 29 a 32, en el que el vector de expresión comprende además un sitio de clonación múltiple.

34. El vector de expresión de la reivindicación 33, en el que el vector de expresión comprende un sitio de clonación múltiple colocado entre el promotor y la molécula de ácido nucleico sintética.

35. El vector de expresión de la reivindicación 33, en el que el vector de expresión comprende un sitio de clonación múltiple colocado en 3' respecto de la molécula de ácido nucleico sintética.

36. Una célula hospedadora aislada que comprende el vector de expresión de cualquiera de las reivindicaciones 29 a 35.

37. Un equipo de expresión de un gen indicador que comprende, en un recipiente adecuado, el vector de expresión de cualquiera de las reivindicaciones 29 a 35.

38. La molécula de ácido nucleico sintética de la reivindicación 1, que hibrida en condiciones de hibridación rigurosas al complemento de SEQ ID NO:9 (GRver5.1), SEQ ID NO:18 (HRD156-1H9), SEQ ID NO:297 (GRver5.1), SEQ ID NO:301 (RD156-1H9), y que comprende una secuencia de ácido nucleico sintética que codifica un polipéptido de luciferasa que tiene al menos un 90% de identidad de secuencias de aminoácidos respecto de una luciferasa codificada por SEQ ID NO: 2.

39. La molécula de ácido nucleico sintética de la reivindicación 1, que hibrida en condiciones de hibridación rigurosas al complemento de SEQ ID NO: 22 (Rluc-final), y que comprende una secuencia de ácido nucleico sintética que codifica un polipéptido de luciferasa que tiene al menos un 90% de identidad de secuencias respecto de una luciferasa codificada por SEQ ID NO: 19.

40. Un método para preparar una molécula de ácido nucleico sintética que comprende un marco de lectura abierto, que comprende:

a) alterar una diversidad de secuencias reguladoras de la transcripción en una secuencia de ácido nucleico original que codifica un polipéptido indicador que tiene al menos 100 aminoácidos para proporcionar una molécula de ácido nucleico sintética que tiene al menos 3 veces menos secuencias reguladoras de la transcripción respecto de la secuencia de ácido nucleico original, en la que las secuencias reguladoras de la transcripción se seleccionan del grupo que consiste en secuencias de unión para factores de transcripción de mamíferos, sitios de corte y empalme de intrones, sitios de adición de poli(A), y secuencias promotoras; y

b) alterar más de un 25% de los codones en la secuencia de ácido nucleico sintética que tiene un número disminuido de secuencias reguladoras de la transcripción hasta codones de mamífero, para proporcionar una molécula de ácido nucleico sintética adicional, en la que los codones que se alteran no dan como resultado un número incrementado de secuencias reguladoras de la transcripción, en la que la molécula de ácido nucleico sintética adicional codifica un polipéptido indicador con al menos un 85% de identidad de secuencias de aminoácidos respecto del polipéptido codificado por la secuencia de ácido nucleico original,

en la que los codones que se alteran son codones empleados más frecuentemente en mamíferos, y seleccionados para dar como resultado la molécula de ácido nucleico sintética y la molécula de ácido nucleico sintética adicional que tienen un número reducido de una combinación de diferentes secuencias de unión para factores de transcripción de mamíferos, y opcionalmente sitios de corte y empalme de intrones, sitios de adición de poli(A), y/o secuencias promotoras respecto de la secuencia de ácido nucleico original.

41. Un método para preparar una molécula de ácido nucleico sintética que comprende un marco de lectura abierto, que comprende:

a) alterar más de un 25% de los codones en una secuencia de ácido nucleico original que codifica un polipéptido indicador que tiene al menos 100 aminoácidos hasta codones de mamífero, para proporcionar una molécula de ácido nucleico sintética con codones alterados de mamífero que codifica una molécula indicadora; y

b) alterar una diversidad de secuencias reguladoras de la transcripción en la molécula de ácido nucleico sintética con codones alterados para proporcionar una molécula de ácido nucleico sintética adicional, en la que las secuencias reguladoras de la transcripción se seleccionan del grupo que consiste en secuencias de unión para factores de transcripción de mamífero, sitios de corte y empalme de intrones, sitios de adición de poli(A), y secuencias promotoras, y en la que la molécula de ácido nucleico sintética adicional codifica un polipéptido con al menos un 85% de identidad de secuencias de aminoácidos respecto del polipéptido codificado por la secuencia de ácido nucleico original, y tiene al menos 3 veces menos secuencias reguladoras de la transcripción respecto del número de tales secuencias en la secuencia de ácido nucleico original,

en la que los codones que se alteran son codones empleados más frecuentemente en mamíferos, y seleccionados para dar como resultado la molécula de ácido nucleico sintética y la molécula de ácido nucleico sintética adicional que tienen un número reducido de una combinación de diferentes secuencias de unión para factores de transcripción de mamíferos, y opcionalmente sitios de corte y empalme de intrones, sitios de adición de poli(A), y/o secuencias promotoras respecto de la secuencia de ácido nucleico original.

42. El método de la reivindicación 40 ó 41, en el que la secuencia de ácido nucleico original codifica una luciferasa.

43. El método de la reivindicación 40 ó 41, en el que la molécula de ácido nucleico sintética hibrida en condiciones de hibridación de rigurosidad media a la secuencia de ácido nucleico original.

44. El método de la reivindicación 40 ó 41, en el que los codones que se alteran codifican el mismo aminoácido que los codones correspondientes en la secuencia de ácido nucleico original.

45. Una molécula de ácido nucleico sintética que es la molécula de ácido nucleico sintética adicional preparada mediante el método de la reivindicación 40 ó 41.

46. Un método para preparar al menos dos moléculas de ácido nucleico sintéticas que son versiones de codones distintos de una secuencia de ácido nucleico original que codifica un polipéptido, que comprende:

a) alterar una secuencia de ácido nucleico original para proporcionar una molécula de ácido nucleico sintética que codifica un polipéptido indicador que tiene un número incrementado de una primera diversidad de codones que se emplean más frecuentemente en una célula hospedadora seleccionada respecto del número de esos codones en la secuencia de ácido nucleico original; y

b) alterar una secuencia de ácido nucleico original para proporcionar una molécula de ácido nucleico sintética adicional que codifica un polipéptido indicador que tiene un número incrementado de una segunda diversidad de codones que se emplean más frecuentemente en la célula hospedadora respecto del número de esos codones en la secuencia de ácido nucleico original, en la que la primera diversidad de codones es diferente de la segunda diversidad de codones, y en la que las moléculas de ácido nucleico sintética y sintética adicional codifican el mismo polipéptido; y

c) alterar una diversidad de secuencias reguladoras de la transcripción en la molécula de ácido nucleico sintética, la molécula de ácido nucleico sintética adicional, o ambas, para proporcionar al menos una molécula de ácido nucleico sintética más adicional que tiene al menos 3 veces menos secuencias reguladoras de la transcripción respecto de la molécula de ácido nucleico sintética, la molécula de ácido nucleico sintética adicional, o ambas.

47. El método de la reivindicación 46, que comprende además alterar al menos un codón en la molécula de ácido nucleico sintética para proporcionar una primera secuencia sintética modificada que codifica un polipéptido con al menos una sustitución de aminoácido respecto del polipéptido codificado por la molécula de ácido nucleico sintética.

48. El método de la reivindicación 47, que comprende además alterar al menos un codón en la molécula de ácido nucleico sintética adicional para proporcionar una segunda secuencia sintética modificada, que codifica un polipéptido con al menos una sustitución de aminoácido respecto del polipéptido codificado por la molécula de ácido nucleico sintética.

49. El método de la reivindicación 46, en el que las secuencias sintéticas codifican una luciferasa.

50. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 27, en la que la molécula de ácido nucleico sintética se expresa a un nivel que es al menos un 110% del de la secuencia de ácido nucleico de tipo natural en una célula o extracto celular en condiciones idénticas.

51. La molécula de ácido nucleico sintética de cualquiera de las reivindicaciones 1 a 8, 11, 15 ó 16, en la que el polipéptido codificado por la molécula de ácido nucleico sintética es idéntico en la secuencia de aminoácidos al polipéptido codificado por la secuencia de ácido nucleico de tipo natural.

52. El método de la reivindicación 40 ó 41, que comprende además alterar la molécula de ácido nucleico sintética adicional para codificar un polipéptido que tiene al menos una sustitución de aminoácido respecto del polipéptido codificado por la secuencia de ácido nucleico original.

53. El método de la reivindicación 40 ó 41, en el que la alteración de las secuencias reguladoras de la transcripción no introduce sustituciones de aminoácidos al polipéptido codificado por la molécula de ácido nucleico sintética.

54. La molécula de ácido nucleico sintética de la reivindicación 1, en la que la selección de los codones de mamífero reduce también el número de sitios para endonucleasas de restricción.

55. La molécula de ácido nucleico sintética de la reivindicación 1, en la que la secuencia de ácido nucleico de tipo natural codifica cloranfenicol acetiltransferasa, luciferasa de Renilla, luciferasa de escarabajo, ß-lactamasa, ß-glucuronidasa o ß-galactosidasa.

56. La molécula de ácido nucleico sintética de la reivindicación 1, en la que las secuencias de unión para factores de transcripción de mamífero, los sitios de corte y empalme de intrones, los sitios de adición de poli(A) y las secuencias promotoras se identifican con programas informáticos, en la que los sitios de corte y empalme de intrones identificados se seleccionan de AGGTRAGT, AGGTRAG, GGTRAGT o (Y)nCAGG, los sitios de adición de poli(A) identificados tienen AATAAA, las secuencias promotoras identificadas se seleccionan de TATAAT, o AGGA o GGAG si hay un codón de metionina en 12 bases en 3' del AGGA o GGAG, y las secuencias de unión para factores de transcripción de mamífero identificadas están en una base de datos de secuencias de unión para factores de transcripción, secuencias de unión para factores de transcripción mutantes y secuencias de unión para factores de transcripción consenso, en la que los codones que se seleccionan reducen el número de secuencias o sitios identificados.

57. El método de la reivindicación 40 ó 41, en el que las secuencias de unión para factores de transcripción de mamífero, los sitios de corte y empalme de intrones, los sitios de adición de poli(A) y las secuencias promotoras se identifican con programas informáticos, en el que los sitios de corte y empalme de intrones identificados se seleccionan de AGGTRAGT, AGGTRAG, GGTRAGT o (Y)nCAGG, los sitios de adición de poli(A) identificados tienen AATAAA, las secuencias promotoras identificadas se seleccionan de TATAAT, o AGGA o GGAG si hay un codón de metionina en 12 bases en 3' del AGGA o GGAG, y las secuencias de unión para factores de transcripción de mamífero identificadas están en una base de datos de secuencias de unión para factores de transcripción, secuencias de unión para factores de transcripción mutantes y secuencias de unión para factores de transcripción consenso, en el que los codones que se seleccionan reducen el número de secuencias o sitios identificados.

58. La molécula de ácido nucleico sintética de la reivindicación 1, en la que las secuencias de unión para factores de transcripción de mamífero son aquellas presentes en una base de datos de secuencias de unión para factores de transcripción.


 

Patentes similares o relacionadas:

Expresión de proteína biotecnológica mejorada que usa un activador CHEF1 híbrido, del 17 de Junio de 2020, de AGC Biologics, Inc: Un vector de expresión que comprende ADN regulador de la transcripción del factor 1α de elongación de hámster chino (CHEF1) 5' y un activador de citomegalovirus (CMV) que […]

Ácido nucleico que comprende o codifica para un tallo-bucle de histona y una secuencia poli(A) o una señal de poliadenilación para aumentar la expresión de un antígeno patogénico codificado, del 3 de Junio de 2020, de CureVac AG: Secuencia de ácido nucleico que comprende o codifica en la dirección 5' → 3' para: i) • una región codificante, que codifica para al menos […]

Procedimientos para la administración terapéutica de medicamentos de ácido ribonucleico mensajero, del 13 de Mayo de 2020, de Modernatx, Inc: Un ARN mensajero (ARNm) que codifica un polipéptido de interés, donde el ARNm comprende: (i) al menos un sitio de unión de microARN de miR-142-3p; (ii) al […]

Ácidos ribonucleicos con nucleótidos modificados con 4-tio y procedimientos relacionados, del 15 de Abril de 2020, de Translate Bio, Inc: Una molécula de ARNm que tiene una región codificante y opcionalmente, una o más regiones no codificantes, en donde al menos el 25% de los residuos de nucleótidos del […]

Sistema de expresión bacteriano cistrónico doble, del 25 de Marzo de 2020, de LUPIN LIMITED: Un procedimiento para la producción de un anticuerpo o un fragmento del mismo que comprende las etapas de: (i) transformar una célula hospedadora bacteriana […]

Moléculas de ácido nucleico artificiales para una expresión proteica mejorada, del 19 de Febrero de 2020, de CureVac AG: Molécula de ácido nucleico artificial que comprende a) al menos un marco de lectura abierto (ORF); y b) al menos una región 3'-no traducida (3'-UTR) […]

Ácido nucleico que comprende o codifica para un tallo-bucle de histona y una secuencia poli(A) o una señal de poliadenilación para incrementar la expresión de un antígeno tumoral codificado, del 12 de Febrero de 2020, de CureVac AG: Secuencia de ácido nucleico que comprende o codifica para, en la dirección 5' a 3': i) - una región codificante que codifica al menos un péptido […]

Constructo y secuencia para la expresión genética mejorada, del 15 de Enero de 2020, de ProteoNic Biotechnology IP B.V: Metodo para la transcripcion y/o expresion y, opcionalmente, la purificacion del transcrito y/o proteina o polipeptido de interes producidos que […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .