ADN polimerasas con actividad mejorada.

ADN polimerasa que tiene una mayor eficiencia de transcriptasa inversa, en comparación con una ADN polimerasa de control

, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 522 de la SEC ID Nº: 1 es cualquier aminoácido distinto de E y en la que la ADN polimerasa de control tiene la misma secuencia de aminoácidos que la ADN polimerasa, excepto que el aminoácido de la ADN polimerasa de control correspondiente a la posición 522 de la SEC ID Nº: 1 es E.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2012/003154.

Solicitante: F. HOFFMANN-LA ROCHE AG.

Inventor/es: MYERS,THOMAS W, SUKO,SHAWN, REICHERT,FRED, BAUER,KEITH.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION C — QUIMICA; METALURGIA > BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE;... > MICROORGANISMOS O ENZIMAS; COMPOSICIONES QUE LOS... > Técnicas de mutación o de ingeniería genética;... > C12N15/09 (Tecnología del ADN recombinante)
  • SECCION C — QUIMICA; METALURGIA > BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE;... > MICROORGANISMOS O ENZIMAS; COMPOSICIONES QUE LOS... > Enzimas, p. ej. ligasas (6.; Proenzimas; Composiciones... > C12N9/12 (transfieren grupos que contienen fósforo, p. ej. Quinasas (2.7))
  • SECCION C — QUIMICA; METALURGIA > BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE;... > PROCESOS DE FERMENTACION O PROCESOS QUE UTILIZAN... > Preparación de compuestos que contienen radicales... > C12P19/34 (Polinucleótidos, p. ej. ácidos nucleicos, oligorribonucleótidos)
google+ twitter facebook

Texto extraído del PDF original:

DESCRIPCIÓN

ADN polimerasas con actividad mejorada Campo de la invención La presente invención proporciona ADN polimerasas con actividades mejoradas, incluyendo el aumento de la eficiencia de transcriptasa inversa, así como el uso de tales polimerasas en diversas aplicaciones, incluyendo la extensión y amplificación de polinucleótidos de ácidos nucleicos.

Antecedentes de la invención Las ADN polimerasas son responsables de la replicación y el mantenimiento del genoma, un papel que es básico para transmitir con exactitud la información genética de generación en generación. Las ADN polimerasas funcionan en las células como las enzimas responsables de la síntesis de ADN. Estas polimerizan los desoxirribonucleósidos trifosfato en presencia de un activador metálico, tal como Mg2+, en una orden dictada por el molde de ADN o el molde de polinucleótidos que se copia. In vivo, las ADN polimerasas participan en un espectro de procesos de síntesis de ADN, incluyendo la replicación del ADN, la reparación del ADN, la recombinación y amplificación génica. Durante cada proceso de síntesis de ADN, el molde de ADN se copia una vez o a lo sumo unas pocas veces para producir réplicas idénticas. Por el contrario, in vitro, la replicación del ADN se puede repetir muchas veces tal como, por ejemplo, durante la reacción en cadena de polimerasa (véase, por ejemplo, la Patente US-4.683.202).

En los estudios iniciales con la reacción en cadena de la polimerasa (PCR), la ADN polimerasa se añadía en el inicio de cada ronda de replicación del ADN (ver la Patente US-4.683.202, supra). Posteriormente, se determinó que se podían obtener ADN polimerasas termoestables a partir de bacterias que crecen a temperaturas elevadas, y que estas enzimas tienen que ser añadidas sólo una vez (ver la Patente US- 4.889.818 y la Patente US-4.965.188). A las temperaturas elevadas usadas durante la PCR, estas enzimas no están irreversiblemente inactivadas. Como resultado, se pueden llevar a cabo ciclos repetitivos de reacciones en cadena de la polimerasa sin la adición de enzimas recientes al inicio de cada proceso de adición sintético. Las ADN polimerasas, en particular las polimerasas termoestables, son la clave para un gran número de técnicas en los estudios de ADN recombinante y en el diagnóstico médico de las enfermedades. Para aplicaciones de diagnóstico, en particular, una secuencia de ácido nucleico diana puede ser sólo una pequeña porción del ADN o ARN en cuestión, por lo que puede ser difícil de detectar la presencia de una secuencia de ácido nucleico diana sin amplificación.

El patrón de plegamiento global de las ADN polimerasas se asemeja a la mano derecha del hombre y contiene tres subdominios distintos que correspondería a la palma, los dedos y el pulgar. (véase Beese et al, Science 260: 352- 355, 1.993); Patel et al, Biochemistry 34:5351- 5363, 1995). Mientras que la estructura de los subdominios que corresponden a los dedos y al dedo pulgar varían mucho entre polimerasas que difieren en tamaño y en las funciones celulares, los subdominios catalíticos que corresponden a la palma son superponibles. Por ejemplo, el motivo A, que interactúa con el dNTP entrante y estabiliza el estado de transición durante la catálisis química, es superponible con una desviación media de alrededor de un Å entre las ADN polimerasas de la familia pol α de mamíferos y pol I de procariotas (Wang et al, Cell 89:1087-99, 1997). El motivo A comienza estructuralmente a una hebra β antiparalela que contienen restos predominantemente hidrófobos y continúa a una hélice α. La secuencia primaria de aminoácidos de los sitios activos de la ADN polimerasa está excepcionalmente conservada. En el caso de motivo A, por ejemplo, la secuencia DYSQIELR secuencia (SEC ID Nº: 22) se conserva en polimerasas de organismos separados por muchos millones de años de evolución, incluyendo, por ejemplo, Thermus aquaticus, Chlamydia trachomatis y Escherichia coli.

Además de estar bien conservado, el sitio activo de las ADN polimerasas también se ha demostrado que es relativamente mutable, capaz de acomodar ciertas sustituciones de aminoácidos, sin reducir la actividad de la ADN polimerasa de manera significativa mente. (Véase, por ejemplo, la Patente US-6.602.695). Tales ADN polimerasas mutantes pueden ofrecer diversas ventajas selectivas en, por ejemplo, aplicaciones de diagnóstico y de investigación que comprenden reacciones de síntesis de ácidos nucleicos.

En el proceso de polimerización enzimática del ADN existen por lo menos dos etapas; 1) la incorporación del nucleótido entrante y 2) la extensión del nucleótido recién incorporado. La fidelidad global o “fidelidad” de la ADN polimerasa se considera generalmente como un conglomerado de estas dos actividades enzimáticas, pero las etapas son distintas. Una ADN polimerasa puede incorporar erróneamente el nucleótido entrante, pero si no se amplía de manera eficiente, la tasa de extensión se verá seriamente disminuida y la formación general del producto sería mínima. Alternativamente, es posible que una ADN polimerasa incorpore erróneamente el nucleótido entrante y extienda erróneamente y fácilmente el desapareamiento recién formado. En este caso, la tasa de extensión global sería alta, pero la fidelidad general sería baja. Un ejemplo de este tipo de enzima sería la ADN polimerasa ES112 (ADN polimerasa E683R Z05; ver la Patente US-7.179.590) cuando se utiliza Mn2+ como el activador de ion metálico divalente. La enzima tiene una eficacia muy alta porque a diferencia de las ADN polimerasas típicas que tienden a dudar/parar cuando se encuentra un desapareamiento, la ADN polimerasa ES112 extiende fácilmente el desapareamiento. El fenotipo mostrado en ES112 es más pronunciado durante la etapa de RT, presumiblemente debido a los efectos estructurales del heterodúplex ARN/ADN frente al homodúplex ADN/ADN. Un segundo ejemplo sería si la ADN polimerasa no incorpora fácilmente un desapareamiento (puede ser incluso menos probable que lo incorpore erróneamente), pero sí tiene mayor capacidad para extender erróneamente un desapareamiento. En este caso, la fidelidad no se altera significativamente por el producto global. En general, este tipo de enzimas es más favorable para las reacciones de extensión que las características de ES112 en Mn2+ porque la fidelidad del producto es mayor. Sin embargo este atributo puede utilizarse para permitir que la extensión errónea de un cebador de oligonucleótido desapareado, tal como cuando un cebador de oligonucleótido de una sola secuencia se hibrida con una diana que tiene heterogeneidad de la secuencia (por ejemplo, dianas virales), pero la tasa de incorporación errónea normal o menor permite la terminación de la síntesis de ADN más allá del cebador del oligonucleótido inicial.

Un ejemplo de este tipo de ADN polimerasa es la ADN polimerasa Z05 D580G (véase la Publicación de Patente US- 2009/0148891). Este tipo de actividad se conoce como “tolerante al desapareamiento", porque es más tolerante a los desapareamientos en el cebador de oligonucleótido. Aunque los ejemplos anteriores han descrito reacciones del tipo de extensión del cebador, la actividad puede ser más significativa en las reacciones del tipo RT-PCR y PCR, en donde la extensión del cebador vuelve a ocurrir con frecuencia. Los datos sugieren que aunque las enzimas tales como Z05 D580G son más “tolerantes” a los desapareamientos, también tienen una mayor capacidad para extender los cebadores de oligonucleótidos que contienen bases modificadas (por ejemplo, bases modificadas por t-butil bencilo) o en la presencia de colorantes que se unen a l ADN, tales como el colorante SYBR Verde I (véase Publicación de Patente Nº US-2009/028053).

La reacción en cadena de la polimerasa con transcripción inversa (RT-PCR) es una técnica utilizada en muchas aplicaciones para detectar y/o cuantificar dianas de ARN mediante amplificación. Con el fin de amplificar las dianas de ARN por PCR, es necesario primero transcribir inversamente el molde de ARN en ADNc. Generalmente, los ensayos de RT-PCR se basan en una transcriptasa inversa no termoestable (ADN polimerasa dependiente de ARN), obtenida de un organismo mesófilo, para la etapa de síntesis de ADNc inicial (RT). Se requiere una ADN polimerasa termoestable adicional para la amplificación del ADNc que tolere las temperaturas elevadas necesarias para la desnaturalización del ácido nucleico en la PCR. Hay varias ventajas potenciales de utilizar ADN polimerasas termoactiva o termoestables diseñadas para llevar a cabo la transcripción inversa más eficiente para los ensayos de RT-PCR. La mayor actividad de la transcriptasa inversa unida a la capacidad de utilizar temperaturas de incubación de transcripción inversa superiores, que permiten la relajación de la estructura secundaria del molde de ARN, puede tener como resultado una mayor eficiencia global de la síntesis de ADNc y de la sensibilidad del ensayo. La incubación a temperatura superior también podría aumentar la especificidad mediante la reducción del cebado falso en la etapa de transcripción inversa. Las enzimas con mayor eficiencia de transcripción inversa pueden simplificar el diseño de ensayo al permitir la reducción de los tiempos de incubación RT y/o de concentración de la enzima. Cuando se utiliza dUTP y UNG, los productos de extensión no específicos que contienen dUMP que se forman durante las condiciones establecidas no rigurosas son degradados por UNG y no pueden ser utilizados ya sea como cebadores ni como moldes. Cuando se utiliza una transcriptasa inversa no termostable (ADN polimerasa dependiente de ARN) obtenida de un organismo mesófilo, no es posible utilizar los métodos del dUTP y UNG. (Myers, T.W. et al, Amplification of RNA: High Temperature Reverse Transcription and DNA Amplification with Thermus thermophilus DNA Polymerase, in PCR Strategies, Innis, M.A., Gelfand, D.H., and Sninsky, J.J., Eds., Academic Press, San Diego, CA, 58-68, (1995)). Sin embargo, el uso de una ADN polimerasa termoestable o termoactiva de la invención para la etapa de transcripción inversa permite que la reacción sea completamente compatible con la utilización del sistema dUTP/uracil N-glicosilasa (UNG) para la prevención de la contaminación por arrastre (Longo et al., Use of Uracil DNA Glycosylase to Control Carry-over Contamination in Polymerase Chain Reactions. Gene 93:125-128, (1990). Además de proporcionar el control de la contaminación por arrastre, el uso de dUTP y UNG proporciona un “arranque en caliente” para reducir la amplificación no específica (Innis y Gelfand 1999).

Breve resumen de la invención En la presente memoria se proporcionan ADN polimerasas que tienen actividades mejoradas, incluyendo el aumento de la eficiencia de la transcriptasa inversa, con respecto a la correspondiente polimerasa de control sin modificar, y los métodos de fabricación y uso de tales ADN polimerasas. En algunas realizaciones, el aminoácido de la ADN polimerasa correspondiente a la posición 522 de la SEC ID Nº: 1 es cualquier aminoácido distinto de E y la ADN polimerasa de control tiene la misma secuencia de aminoácidos que la ADN polimerasa, excepto que el aminoácido de la ADN polimerasa de control correspondiente a la posición 522 de la SEC ID Nº: 1 es E. Por ejemplo, en algunas realizaciones, el aminoácido en la posición correspondiente a la posición 522 de la SEC ID Nº: 1 de la polimerasa mejorada se selecciona de G, A , L, M, F, W, P, S, T, C, Y, Q, D, K, R, V, I, N o H. En algunas realizaciones, el aminoácido en la posición correspondiente a la posición 552 de la SEC ID Nº: 1 es un aminoácido que tiene una cadena lateral no polar sin carga (por ejemplo, G, A, L, M, W, P, F, C, V, o I). En algunas realizaciones, el aminoácido en la posición correspondiente a la posición 552 de la SEC ID Nº: 1 es G.

En algunas realizaciones, la ADN polimerasa que tiene una mayor eficiencia de transcriptasa inversa comprende un motivo en el dominio polimerasa que comprende S-T-X1-X2-X3-L4-L-X5-X6-X7-X8-X9-X10-H-X10-I, en la que: X1 es S, R, N o A; X2 es A, I o V; X3 es A, E, S o D; X4 es V o A; X5 es cualquier aminoácido distinto de E; X6 es A, L, E, P o K; X7 es L o I; X8 es R, A o S; X9 es E, G, N, K, D o P; X10 es A, E, H o Y; X11 es P o E (SEC ID Nº: 8).

En algunas realizaciones X5 se selecciona de G, A, L, M, F, W, P, S, T, C, Y, Q, D, K, R, V, I, N o H.

En algunas realizaciones, la ADN polimerasa que tiene una mayor eficiencia de la transcriptasa inversa comprende un motivo en el dominio polimerasa que comprende S-T-X1-X2-X3-V-L-X5-X6-X7-X8-X9-X10-H-X10-I, en la que: X1 es S o R; X2 es A o I; X3 es A o E; X5 es cualquier aminoácido distinto de E; X6 es A, L o E; X7 es L o I; X8 es R o A; X9 es E, G o N; X10 es A o E; X11 es P o E (SEC ID Nº: 9).

En algunas realizaciones, la ADN polimerasa que tiene una mayor eficiencia de transcriptasa inversa comprende un motivo en el dominio polimerasa que comprende S-T-S-A-A-V-L-X5-A-L-R-E-A-H-P-I, en la que: X5 es cualquier aminoácido distinto de E (SEC ID Nº: 10).

En algunas realizaciones, X5 es un aminoácido que tiene una cadena lateral no polar sin carga (por ejemplo, G, A, L, M, W, P, F, C, V, o I) (SEC ID Nº: 29). En algunas realizaciones, X5 es G (SEC ID Nº: 11).

En algunas realizaciones, el aminoácido de la ADN polimerasa correspondiente a la posición 580 de la SEC ID Nº: 1 es cualquier aminoácido distinto de D o E. En algunas realizaciones, el aminoácido de la ADN polimerasa correspondiente a la posición 580 de la SEC ID Nº : 1 es cualquier aminoácido distinto de D. En algunas realizaciones, el aminoácido de la ADN polimerasa correspondiente a la posición 580 de la SEC ID Nº: 1 se selecciona de entre el grupo que consiste en L, G, T, Q, A, S, N, R y K.

Varias ADN polimerasas son susceptibles de mutación de acuerdo con la presente invención. Particularmente adecuadas son las polimerasas termoestables, incluyendo las polimerasas termoestables de tipo silvestre o naturales de diversas especies de bacterias termófilas, así como polimerasas termoestables sintéticas derivadas de tales enzimas de tipo silvestre o naturales enzimas que se producen por sustitución, inserción o deleción de aminoácido, u otra modificación. Ejemplos de formas sin modificar de la polimerasa incluyen, por ejemplo, la ADN polimerasa CS5, CS6 o Z05 o una ADN polimerasa funcional que tiene al menos 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% de identidad en la secuencia de aminoácidos con la misma. En ciertas realizaciones, la identidad de la secuencia de aminoácidos es al menos 80%, preferiblemente al menos 90% y más preferiblemente al menos 95%. Otras polimerasas no modificadas incluyen, por ejemplo, ADN polimerasas de cualquiera de las siguientes especies de bacterias termófilas (o una ADN polimerasa funcional que tiene al menos 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% de identidad de la secuencia de aminoácidos con una polimerasa tal): Thermotoga maritima; Thermus aquaticus; Thermus thermophilus; Thermus flavus; Thermus filiformis; Thermus

Sps17; Thermus sp.Z05; Thermotoga neopolitana; Thermosipho africanus; Thermus caldophilus, Deinococcus radiodurans, Bacillus stearothermophilus o Bacillus caldotenax. En ciertas realizaciones, la identidad de la secuencia de aminoácidos es al menos 80%, preferiblemente al menos 90% y más preferiblemente al menos 95%. Polimerasas adecuadas también incluyen aquellas que tienen la actividad transcriptasa inversa (RT) y/o la capacidad de incorporar nucleótidos no convencionales, tales como ribonucleótidos o nucleótidos modificados en 2'.

Aunque las ADN polimerasas termoestables que poseen actividad de transcripción inversa eficiente son particularmente adecuadas para llevar a cabo la RT-PCR, especialmente la RT-PCR con una sola enzima, las ADN polimerasas termoactivas, pero no termoestables que poseen actividad de transcripción inversa eficiente son susceptibles de mutación de acuerdo con la presente invención .Por ejemplo, los atributos de aumento de la eficiencia de la transcriptasa inversa, la tolerancia al desapareamiento, la tasa de extensión y/o la tolerancia de los inhibidores de RT son importantes para la etapa de RT en una RT-PCR y esta etapa no es necesario realizarla a temperaturas que inactivarían a una ADN polimerasa termoactiva pero no termoestable. Tras la etapa RT, podría añadirse una ADN polimerasa termoestable o bien ya podría estar incluida en la mezcla de reacción para llevar a cabo la etapa de amplificación PCR. Esta segunda metodología se beneficiaría especialmente del uso de una ADN polimerasa termoestable modificada químicamente (u otra tecnología HotStart para inactivar la ADN polimerasa termoestable) de modo que no sería completamente activa durante la etapa de RT. Un ejemplo de una ADN polimerasa termoactiva pero no termoestable que posee actividad de transcripción inversa eficiente es la ADN polimerasa de Carboxydothermus hydrogenoformans (Chy; SEC ID Nº: 40). Véase, por ejemplo, las Patentes US- 6.468.775 y 6.399.320.

En algunas realizaciones, la ADN polimerasa tiene al menos 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93 %, 94%, 95%, 96%, 97%, 98%, 99% de identidad de la secuencia de aminoácidos con una polimerasa seleccionada del grupo que consiste en: (a) una ADN polimerasa de Thermus sp. Z05 (Z05) (SEC ID Nº: 1); (b) una ADN polimerasa de Thermus aquaticus (Taq) (SEC ID Nº: 2); (c) una ADN polimerasa de Thermus filiformis (Tfi) (SEC ID Nº: 3); (d) una ADN polimerasa de Thermus flavus (Tfi) (SEC ID Nº: 4); (e) una ADN polimerasa de Thermus sp. Sps17 (Sps17) (SEC ID Nº: 5); (f) una ADN polimerasa de Thermus thermophilus (Tth) (SEC ID Nº: 6); (g) una ADN polimerasa de Thermus caldophilus (Tca) (SEC ID Nº: 7) y (h) una ADN polimerasa de Carboxydothermus Hydrogenoformans (Chy) (SEC ID Nº: 40).

En ciertas realizaciones, la identidad de secuencia de aminoácidos es al menos 80%, preferiblemente al menos 90% y más preferiblemente al menos 95%.

En algunas realizaciones, la ADN polimerasa es una ADN polimerasa de Thermotoga. Por ejemplo, en algunas realizaciones, la ADN polimerasa tiene al menos 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92 %, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidad de secuencia de aminoácidos con una polimerasa seleccionada del grupo que consiste en: (a) una ADN polimerasa de Thermotoga maritima (Tma) (SEC ID Nº: 34); (b) una ADN polimerasa de Thermotoga neopolitana (Tne) (SEC ID Nº: 35).

En ciertas realizaciones, la identidad de secuencia de aminoácidos es al menos 80%, preferiblemente al menos 90% y más preferiblemente al menos 95%.

En algunas realizaciones, la ADN polimerasa tiene al menos 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidad de secuencia de aminoácidos con SEC ID Nº: 1. En ciertas realizaciones, la identidad de secuencia de aminoácidos es al menos 80%, preferiblemente al menos 90% y más preferiblemente al menos 95%. En algunas realizaciones, la ADN polimerasa es una ADN polimerasa Thermus sp. Z05 (Z05) y el aminoácido en la posición 522 es cualquier aminoácido distinto de E. En algunas realizaciones, la ADN polimerasa es una ADN polimerasa Z05 (es decir, SEC ID Nº: 1) y el aminoácido en la posición 522 es cualquier aminoácido distinto de E. Por ejemplo, en algunas realizaciones, el aminoácido en la posición 522 se selecciona de G, A, L, M, F, W, P, S, T, C, Y, Q, D, K, R, V, I, N, o H. En algunas realizaciones, el aminoácido en la posición correspondiente a la posición 522 de la SEC ID Nº: 1 es un aminoácido que tiene una cadena lateral no polar sin carga (por ejemplo, G, A, L, M, W, P, F, C, V, o I). En algunas realizaciones, la ADN polimerasa es una ADN polimerasa Z05, y el aminoácido en la posición 522 es G. En algunas realizaciones, la ADN polimerasa es una ADN polimerasa Z05 que comprende además una sustitución en la posición 580, y el aminoácido en la posición 580 es cualquier aminoácido distinto de D o E. En algunas realizaciones, la ADN polimerasa es una ADN polimerasa Z05 y el aminoácido en la posición 580 es cualquier aminoácido distinto de D. En algunas realizaciones, la ADN polimerasa es una ADN polimerasa Z05 y el aminoácido en la posición 580 se selecciona entre el grupo que consiste en L, G, T, Q, A, S, N, R y K. En algunas realizaciones, la ADN polimerasa es una ADN polimerasa Z05 y el aminoácido en la posición 580 es G.

Las polimerasas mutantes o mejoradas pueden incluir otras modificaciones, no sustitutivas. Una de dichas modificaciones es una modificación covalente reversible térmicamente que inactiva la enzima, pero que se invierte para activar la enzima tras la incubación a una temperatura elevada, tal como una temperatura generalmente utilizada para la extensión de los polinucleótidos. Reactivos ejemplares para tales modificaciones térmicamente reversibles se describen en la Patente US-5.773.258 y 5.677.152.

En algunas realizaciones, la actividad de transcriptasa inversa se determina mediante la realización de la amplificación por RT-PCR en tiempo real y la detección de un transcrito de virus de la hepatitis C (VHC) generado a partir de las primeras 800 bases de NTR5' del VHC de genotipo Ib en pSP64 poli(A) (Promega). Dos o más mezclas de reacción pueden tener números titulados de copias del transcrito del virus de la Hepatitis C (VHC) (por ejemplo, títulaciones 1:5, titulaciones 1:10, por ejemplo,10.000 copias, 1000 copias, 100 copias, 10 copias, 1 copia, 0 copias en varias mezclas de reacción). La capacidad de transcriptasa inversa de una polimerasa de la invención se puede comparar a la capacidad de transcriptasa inversa de una polimerasa de referencia (por ejemplo, una polimerasa de origen natural o no modificada), en una unidad de tiempo preseleccionada, como se describe en la presente memoria. Las polimerasas con mayor capacidad de transcriptasa inversa amplificarán el transcrito con mayor eficiencia, o requerirán un menor número de ciclos de PCR para amplificar el transcrito (es decir, muestran un valor Cp inferior, tal como se calcula en la presente memoria), en comparación con una polimerasa de origen natural o no modificada. Por otra parte, en algunas realizaciones, las polimerasas con una función RT mejorada también tienen una función de replicación de moldes largos de ARN mejorada (por ejemplo, al menos 500 o 1000 o 2000 o 5000 o más nucleótidos de largo).

En otros aspectos, la presente invención proporciona un ácido nucleico recombinante que codifica para una polimerasa de DNA mutante o mejorada como se describe en la presente memoria, un vector que comprende el ácido nucleico recombinante, y una célula hospedadora transformada con el vector. En ciertas realizaciones, el vector es un vector de expresión. Las células hospedadoras que comprenden dichos vectores de expresión son útiles en los métodos de la invención para la producción de la polimerasa mutante o mejorada mediante el cultivo de las células hospedadoras en condiciones adecuadas para la expresión del ácido nucleico recombinante. Las polimerasas de la invención pueden estar contenidas en mezclas y/o kits de reacción. Las realizaciones de los ácidos nucleicos recombinantes, células hospedadoras, vectores, vectores de expresión, mezclas de reacción y los kits son como se han anteriormente y en la presente memoria.

En aún otro aspecto, se proporciona un método para la realización de la extensión de polinucleótidos. El método generalmente incluye poner en contacto una ADN polimerasa que tiene una mayor eficiencia de transcriptasa inversa, tolerancia al desapareamiento, velocidad de extensión y/o tolerancia de RT e inhibidores de la polimerasa como se describe en la presente memoria con un cebador, un molde de polinucleótidos y nucleósidos trifosfato en condiciones adecuadas para la extensión del cebador, produciendo de esta manera un cebador extendido. El molde de polinucleótidos puede ser, por ejemplo, un molde de ARN o ADN. En ciertas realizaciones el molde es ARN. Los nucleótidos trifosfato pueden incluir nucleótidos no convencionales tales como, por ejemplo, ribonucleótidos y/o nucleótidos marcados. Además, el cebador y/o molde pueden incluir uno o más análogos de nucleótidos. En algunas variaciones, el método de extensión de polinucleótidos es un método para la amplificación de polinucleótidos que incluye poner en contacto la ADN polimerasa mutante o mejorada con un par de cebadores, el molde de polinucleótidos y los nucleósidos trifosfato en condiciones adecuadas para la amplificación de los polinucleótidos. La reacción de extensión de los polinucleótidos puede ser, por ejemplo, PCR, extensión isotérmica, o secuenciación (por ejemplo., reacción de secuenciación 454). En ciertas realizaciones, el método de extensión del cebador comprende una reacción en cadena de la polimerasa (PCR). El molde de polinucleótidos puede ser de cualquier tipo de muestra biológica.

Opcionalmente, la reacción de extensión del cebador comprende un inhibidor real o potencial de una polimerasa de referencia o no modificada. El inhibidor puede inhibir la tasa de extensión del ácido nucleico y/o la eficiencia de transcripción inversa de una polimerasa de referencia o no modificada (control). En algunas realizaciones, el inhibidor es la hemoglobina, o un producto de degradación de la misma. Por ejemplo, en algunas realizaciones, el producto de degradación de la hemoglobina es un producto de degradación heme, tales como hemina, hematoporfirina o bilirrubina. En algunas realizaciones, el inhibidor es un quelante de hierro o un pigmento de color púrpura. En otras realizaciones, el inhibidor es heparina o melanina. En ciertas realizaciones, el inhibidor es un colorante intercalante. En algunas realizaciones, el colorante intercalante es [2-[N-bis-(3-dimetilaminopropil)-amino]- 4-[2,3-dihidro-3-metil-(benzo-1,3-tiazol-2-il)-metiliden]-1-fenil-quinolinio]+. En algunas realizaciones, el colorante intercalante es [2-[N-(3-dimetilaminopropil)-N-propilamino]-4-[2,3-dihidro-3-metil-(benzo-1,3-tiazol-2-il)-metiliden]-1- fenil-quinolinio]+. En algunas realizaciones, el colorante intercalante no es [2-[N-(3-dimetilaminopropil)-N- propilamino]-4-[2,3-dihidro-3-metil-(benzo-1,3-tiiazol-2-il)-metiliden]-1-fenil-quinolinio]+. En algunas realizaciones, las condiciones adecuadas para la extensión comprenden Mg2+. En algunas realizaciones, las condiciones adecuadas para la extensión comprenden Mn2+.

La presente invención también proporciona un kit útil en un método de extensión de polinucleótidos de este tipo. Generalmente, el kit incluye al menos un envase que proporciona una ADN polimerasa mutante o mejorada como se describe en la presente memoria. En ciertas realizaciones, el kit incluye además uno o más envases adicionales que proporcionan uno o más reactivos adicionales. Por ejemplo, en las variaciones específicas, el uno o más envases adicionales proporcionan nucleósidos trifosfato; un tampón adecuado para la extensión de polinucleótidos y/o uno o más polinucleótidos cebadores o sondas de polinucleótidos, hibridables, en las condiciones de extensión de polinucleótidos, con un molde de polinucleótidos predeterminado .El molde de polinucleótidos puede ser de cualquier tipo de muestra biológica.

Se proporcionan además mezclas de reacción que comprenden las polimerasas de la invención. Las mezclas de reacción también pueden contener un molde de ácido nucleico (ADN y/o ARN), uno o más polinucleótidos cebadores o sondas de polinucleótidos, nucleósidos trifosfato (incluyendo, por ejemplo, desoxirribonucleósidos trifosfato, ribonucleósidos trifosfato, nucleósidos trifosfato marcados, nucleósidos trifosfato no convencionales), tampones, sales, marcadores (por ejemplo, fluoróforos). En algunas realizaciones, las mezclas de reacción comprenden un quelante de hierro o un colorante de color púrpura. En ciertas realizaciones, las mezclas de reacción comprenden hemoglobina, o un producto de degradación de la hemoglobina. Por ejemplo, en ciertas realizaciones, los productos de degradación de la hemoglobina incluyen productos de degradación del heme, tales como hemina, hematina, hematoporfirina y bilirrubina. En otras realizaciones, las mezclas de reacción comprenden heparina o una sal de la misma. Opcionalmente, la mezcla de reacción comprende un colorante intercalante (incluyendo pero sin limitarse a los descritos anteriormente o en otra parte de esta memoria). En ciertas realizaciones, la mezcla de reacción contiene un molde de ácido nucleico que se aísla de la sangre. En ciertas realizaciones el molde de polinucleótidos es ARN. En otras realizaciones, el ácido nucleico molde es ARN y la mezcla de reacción comprende heparina o una sal de la misma.

En la presente memoria se describen otras realizaciones de la invención.

DEFINICIONES A menos que se defina lo contrario, todos los términos técnicos y científicos usados en la presente memoria tienen el mismo significado que se entiende comúnmente por un experto ordinario en la técnica a la que pertenece esta invención. Aunque esencialmente cualesquiera métodos y materiales similares a los descritos en la presente memoria se pueden utilizar en la práctica o ensayo de la presente invención, sólo se describen métodos y materiales ilustrativos. Para los propósitos de la presente invención, se definen a continuación los siguientes términos.

Los términos “un”, “una” y "el", “la” incluyen referentes plurales, a menos que el contexto indique claramente lo contrario.

Un “aminoácido” se refiere a cualquier unidad de monómero que se puede incorporar en un péptido, polipéptido o proteína. Tal como se utiliza en la presente memoria, el término “aminoácido” incluye los siguientes veinte alfa- aminoácidos naturales o genéticamente codificados: alanina (Ala o A), arginina (Arg o R), asparagina (Asn o N), ácido aspártico (Asp o D ), cisteína (Cys o C), glutamina (Gln o Q), ácido glutámico (Glu o E), glicina (Gly o G), histidina (His o H), isoleucina (Ile o I), leucina (Leu o L ), lisina (Lys o K), metionina (Met o M), fenilalanina (Phe o F), prolina (Pro o P), serina (Ser o S), treonina (Thr o T), triptófano (Trp o W), tirosina (Tyr o Y) y valina (Val o V). En los casos en que los residuos “X” no están definidos, éstos deben definirse como “cualquier aminoácido”. Las estructuras de estos veinte aminoácidos naturales se muestran en, por ejemplo, Stryer et al., Biochemistry, 5ª ed., Freeman and Company (2002). También pueden codificarse genéticamente aminoácidos adicionales, tales como selenocisteína y pirrolisina, (Stadtman (1996) “Selenocysteine” Annu Rev Biochem. 65: 83-100 e Ibba et al. (2002) “Genetic code: introducing pyrrolysine”, Curr Biol. 12(13):R464-R466). El término “aminoácido” también incluye aminoácidos no naturales, aminoácidos modificados (por ejemplo, que tienen cadenas laterales y/o cadenas principales modificadas) y análogos de aminoácidos. Véase, por ejemplo, Zhang et al. (2004) “Selective incorporation of 5-hydroxytryptophan into proteins in mammalian cells”, Proc. Natl. Acad. Sci. U.S.A. 101 (24): 8882- 8887, Anderson et al. (2004) “An expanded genetic code with a functional quadruplet codon” Proc. Natl. Acad. Sci. U.S.A. 101(20):7566-7571, Ikeda et al. (2003) “Synthesis of a novel histidine analogue and its efficient incorporation into a protein in vivo”, Protein Eng. Des. Sel. 16 (9):699-706, Chin et al. (2003) “An Expanded Eukaryotic Genetic Code”, Science 301 (5635):964-967, James et al. (2001) "Kinetic characterization of ribonuclease S mutants containing photoisomerizable phenylazophenylalanine residues” Protein Eng. Des. Sel. 14(12):983-991, Kohrer et al. (2001) “Import of amber and ochre suppressor tRNAs into mammalian cells: A general approach to site-specific insertion of amino acid analogues into proteins”, Proc. Natl. Acad. Sci. U.S.A. 98(25):14310-14315, Bacher et al.

(2001) “Selection and Characterization of Escherichia coli Variants Capable of Growth on an Otherwise Toxic Tryptophan Analogue”, J. Bacteriol. 183(18):5414-5425, Hamano-Takaku et al. (2000) “A Mutant Escherichia coli Tyrosyl-tRNA Synthetase Utilizes the Unnatural Amino Acid Azatyrosine More Efficiently than Tyrosine”, J. Biol. Chem. 275(51):40324-40328 y Budisa et al. (2001) “Proteins with {beta}-(thienopyrrolyl)alanines as alternative chromophores and pharmaceutically active amino acids” Protein Sci. 10(7): 1281-1292 Como ilustración adicional, un aminoácido es generalmente un ácido orgánico que incluye un grupo amino sustituido o no sustituido, un grupo carboxi sustituido o no sustituido y una o más cadenas laterales o grupos, o análogos de cualquiera de estos grupos. Ejemplos de cadenas laterales incluyen, por ejemplo, tiol, seleno, sulfonilo, alquilo, arilo, acilo, ceto, azido, hidroxilo, hidracina, ciano, halo, hidracida, alquenilo, alquinilo, éter, borato, boronato, fosfo, fosfono, fosfina, heterocíclico, enona, imina, aldehído, éster, tioácido, hidroxilamina, o cualquier combinación de estos grupos. Otros aminoácidos representativos incluyen, pero no se limitan a, aminoácidos que comprenden reticulantes fotoactivables, aminoácidos de unión a metal, aminoácidos con marcaje de espín, aminoácidos fluorescentes, aminoácidos que contienen metal, aminoácidos con grupos funcionales nuevos, aminoácidos que de forma covalente o no covalente interactúan con otras moléculas, aminoácidos fotoenjaulados y/o fotoisomerizables, aminoácidos radiactivos, aminoácidos que comprende biotina o un análogo de biotina, aminoácidos glicosilados, otros aminoácidos modificados co hidratos de carbono modificado, aminoácidos que comprenden polietilenglicol o poliéter, aminoácidos sustituidos con átomos pesados, aminoácidos químicamente escindibles y/o fotoescindibles, aminoácidos que contienen azúcar enlazado a carbono, aminoácidos con actividad redox, amino tioácido aminoácidos que contienen amino tioácido y aminoácidos que comprenden uno o más restos tóxicos.

El término “muestra biológica” abarca una variedad de tipos de muestras obtenidas de un organismo y se puede utilizar en un ensayo de diagnóstico o de control. El término abarca orina, sedimento de orina, sangre, saliva, y otras muestras líquidas de origen biológico, muestras de tejidos sólidos, tales como una muestra de biopsia o cultivos de tejidos o células derivadas de los mismos y la progenie de los mismos. El término abarca muestras que han sido manipuladas de cualquier forma después de su obtención, como por tratamiento con reactivos, solubilización, sedimentación, o enriquecimiento para ciertos componentes. El término abarca una muestra clínica, y también incluye células en cultivo celular, sobrenadantes celulares, lisados celulares, suero, plasma, fluidos biológicos y muestras de tejido.

El término “mutante”, en el contexto de las ADN polimerasas de la presente invención, significa un polipéptido, normalmente recombinante, que comprende una o más sustituciones de aminoácidos con relación a una correspondiente ADN polimerasa, funcional.

El término "forma no modificada," en el contexto de una polimerasa mutante, es un término usado en la presente memoria a efectos de definir una ADN polimerasa mutante de la presente invención: el término “forma no modificada” se refiere a una ADN polimerasa funcional que tiene la secuencia de aminoácidos de la polimerasa mutante, excepto en una o más posición(es) de aminoácidos especificada como la caracterización de la polimerasa mutante. Por lo tanto, la referencia a una ADN polimerasa mutante en términos de (a) su forma no modificada y (b) una o más sustituciones de aminoácidos más especificadas significa que, con la excepción de la sustitución(es) de aminoácidos especificada, la polimerasa mutante tiene de otro modo una secuencia de aminoácidos idéntica a la forma no modificada en el motivo especificado. La “polimerasa no modificada” (y por lo tanto también la forma modificada que tiene una mayor eficiencia transcriptasa inversa, tolerancia al desapareamiento, velocidad de extensión y/o tolerancia de RT e inhibidores de la polimerasa) pueden *contener mutaciones adicionales para proporcionar una funcionalidad deseada, por ejemplo, la mejora de incorporación de dideosxirribonucleótidos, ribonucleótidos, análogos de ribonucleótidos, nucleótidos marcados con colorante, modulación de la actividad 5'- nucleasa, modulación de la actividad 3'-nucleasa (verificación de las secuencias o “proofreading”) o similares. De acuerdo con ello, en la realización de la presente invención como se describe en la presente memoria, la forma no modificada de una ADN polimerasa está predeterminada. La forma no modificada de una ADN polimerasa puede ser, por ejemplo, una ADN polimerasa de tipo silvestre y/o de origen natural, o una ADN polimerasa que ya ha sido modificada intencionadamente. Una forma no modificada de la polimerasa es preferiblemente una ADN polimerasa termoestable, tales como las ADN polimerasas de varias bacterias termófilas, así como variantes funcionales de las mismas que tienen una identidad de secuencia sustancial a una polimerasa termoestable de tipo silvestre o de origen natural. Tales variantes pueden incluir, por ejemplo, ADN polimerasas quiméricas, tales como, por ejemplo, las ADN polimerasas quiméricas descritas en las Patentes US-6.228.628 y 7.148.049. En ciertas realizaciones, la forma no modificada de una polimerasa tiene actividad de transcriptasa inversa (RT).

El término “polimerasa termoestable” se refiere a una enzima que es estable al calor, es resistente al calor, y retiene la actividad suficiente para efectuar reacciones de extensión de polinucleótidos posteriores y no se desnaturalizado (inactiva) irreversiblemente cuando se somete a las temperaturas elevadas durante el tiempo necesario para efectuar la desnaturalización de los ácidos nucleicos de doble cadena. Las condiciones de calentamiento necesarias para la desnaturalización de ácidos nucleicos son bien conocidas en la técnica y se ilustran en, por ejemplo, las Patentes US-4.683.202, 4.683.195 y 4.965.188. Como se utiliza en la presente memoria, una polimerasa termoestable es adecuada para su uso en una reacción de ciclos de temperatura tales como la reacción en cadena de la polimerasa (“PCR”). La desnaturalización irreversible para los propósitos de la presente memoria, se refiere a la pérdida permanente y completa de la actividad enzimática. Para una polimerasa termoestable, la actividad enzimática se refiere a la catálisis de la combinación de los nucleótidos en la manera apropiada para formar los productos de extensión de polinucleótidos que son complementarios a una cadena de ácido nucleico molde. Las ADN polimerasas termoestables de bacterias termófilas incluyen, por ejemplo, ADN polimerasas de Thermotoga maritima, Thermus aquaticus, Thermus thermophilus, Thermus flavus, Thermus filiformis, Thermus especies Sps17, Thermus especies Z05, Thermus caldophilus, Bacillus caldotenax, Thermotoga neopolitana y Thermosipho

africanus.

El término “termoactiva” se refiere a una enzima que mantiene propiedades catalíticas a temperaturas comúnmente usadas para las etapas de transcripción inversa o de hibridación/extensión en las reacciones de RT-PCR y/o de PCR (es decir, de 45-80°C). Las enzimas termoestables son aquellas que no se desnaturalizan (inactivan) irreversiblemente cuando se somete a temperaturas elevadas necesarias para la desnaturalización de los ácidos nucleicos. Las enzimas termoactivas pueden o no pueden ser termoestables. Las ADN polimerasas termoactivas pueden ser dependientes de ADN o de ARN de especies termófilas o de especies mesófilas que incluyen, pero no se limitan a, Escherichia coli, virus de la leucemia murina de Moloney, y el virus de la mioblastosis aviar.

Tal como se usa en la presente memoria, una proteína “quimérico” se refiere a una proteína cuya secuencia de aminoácidos representa un producto de fusión de subsecuencias de las secuencias de aminoácidos de al menos dos proteínas distintas. Una proteína quimérica normalmente no es producida por manipulación directa de las secuencias de aminoácidos, sino, más bien, se expresan a partir de un gen “quimérico” que codifica para la secuencia de aminoácidos quimérica. En ciertas realizaciones, por ejemplo, una forma no modificada de una ADN polimerasa mutante de la presente invención es una proteína quimérica que consiste en una región amino-terminal (N-terminal) derivada de una ADN polimerasa de una especie del género Thermus y una región carboxi-terminal (C- terminal) derivada de la DNA polimerasa Tma. La región N-terminal se refiere a una región que se extiende desde el extremo N-terminal (posición de aminoácido 1) hasta un aminoácido interno. Del mismo modo, la región C-terminal se refiere a una región que se extiende desde un aminoácido interno hasta el extremo C-terminal.

El término “aptámero” se refiere a un ADN monocatenario que reconoce y se une a la ADN polimerasa e inhibe eficazmente la actividad de la polimerasa como se describe en la Patente US-5.693.502. También se discute el uso de aptámero y dUTP/UNG en la RT-PCR, por ejemplo, en Smith, E.S. et al., (Amplification of RNA: High-temperature Reverse Transcription and DNA Amplification with a Magnesium-activated Thermostable DNA Polymerase, in PCR Primer: A Laboratory Manual, 2nd Edition, Dieffenbach, C.W. and Dveksler, G.S., Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 211-219, (2003)).

En el contexto de las ADN polimerasas mutantes, “correspondencia” con otra secuencia (por ejemplo, regiones, fragmentos, nucleótidos o posiciones de aminoácidos, o similares) se basa en la convención de numeración de acuerdo con el número de posición de nucleótidos o aminoácidos y la alineación posterior de las secuencias de una manera que maximice el porcentaje de identidad de secuencia. Un aminoácido “que corresponde a la posición [X] de [secuencia específica]” se refiere a un aminoácido en un polipéptido de interés que se alinea con el aminoácido equivalente de una secuencia especificada. En general, como se describe en la presente memoria, el aminoácido que corresponde a una posición de una polimerasa puede ser determinado usando un algoritmo de alineación tal como BLAST como se describe a continuación. Debido a que no todas las posiciones dentro de una determinada “región de correspondencia” tienen que ser idénticas, las posiciones no coincidentes dentro de una región de correspondencia pueden ser consideradas como “posiciones de correspondencia”. En consecuencia, como se usa en la presente memoria, la referencia a una “posición de aminoácidos correspondiente a la posición del aminoácido [X]” de una ADN polimerasa especificada se refiere a posiciones equivalentes, basado en la alineación, en otras ADN polimerasas y homólogos y familias estructurales. En algunas realizaciones de la presente invención, la “correspondencia” de las posiciones de aminoácidos se determina con respecto a una región de la polimerasa que comprende uno o más motivos de SEC ID Nº: 1, 2, 3, 4, 5, 6, 7, 32 , 33, 34, 35, 36, 37 o 40. Cuando una secuencia de polipéptido de la polimerasa difiere de las SEC ID Nº: 1, 2, 3, 4, 5, 6, 7, 32, 33, 34, 35, 36, 37 o 40 (por ejemplo, por cambios en aminoácidos o adición o deleción de aminoácidos), puede suceder que una mutación particular asociada con una actividad mejorada como se discute en la presente memoria no esté en el mismo número de posición que está en las SEC ID Nº: 1, 2, 3, 4, 5, 6, 7, 32, 33, 34, 35, 36, 37 o 40. Esto se ilustra, por ejemplo, en la Tabla 1.

“Recombinante”, como se usa en la presente memoria, se refiere a una secuencia de aminoácidos o a una secuencia de nucleótidos que ha sido modificada intencionalmente por métodos recombinantes. Con el término “ácido nucleico recombinante” se entiende en la presente memoria un ácido nucleico, formado originalmente in vitro, en general, mediante la manipulación de un ácido nucleico por endonucleasas de restricción, en una forma que no se encuentra normalmente en la naturaleza. Así, una ADN polimerasa de ácido nucleico mutante aislada, en una forma lineal, o un vector de expresión formado in vitro por ligación de moléculas de ADN que normalmente no se unen, se consideran recombinantes para los fines de esta invención. Se entiende que una vez que se crea un ácido nucleico recombinante y se reintroduce en una célula hospedadora, este se replicará de forma no recombinante, es decir, usando la maquinaria celular in vivo de la célula hospedadora en lugar de las manipulaciones in vitro; sin embargo, tales ácidos nucleicos, una vez producidos de forma recombinante, aunque posteriormente se repliquen de forma no recombinante, todavía se consideran recombinantes para los fines de la invención. Una “proteína recombinante” es una proteína producida mediante técnicas recombinantes, es decir, a través de la expresión de un ácido nucleico recombinante como se representa anteriormente.

Un ácido nucleico está “unido operativamente” cuando está colocado en una relación funcional con otra secuencia de ácido nucleico. Por ejemplo, un promotor o potenciador está unido operativamente a una secuencia codificante si afecta a la transcripción de la secuencia; o un sitio de unión al ribosoma está unido operativamente a una secuencia codificante si está colocado de manera que facilita la traducción.

El término “célula hospedadora” se refiere a organismos monocelulares procariotas y eucariotas (por ejemplo, bacterias, levaduras y actinomicetos) y células individuales de plantas o animales de orden superior cuando se cultivan en cultivo celular.

El término “vector” se refiere a un trozo de ADN, normalmente de doble cadena, que puede tener insertado en el mismo un trozo de ADN extraño. El vector puede ser, por ejemplo, de origen plasmídico. Los vectores contienen secuencias de polinucleótidos “replicón” que facilitan la replicación autónoma del vector en una célula hospedadora. El ADN foráneo se define como ADN heterólogo, que es ADN no se encuentra naturalmente en la célula hospedadora, el cual, por ejemplo, replica la molécula de vector, codifica para un marcador seleccionable o rastreable, o codifica para un transgen. El vector se utiliza para transportar el ADN foráneo o heterólogo a una célula hospedadora adecuada. Una vez en la célula hospedadora, el vector puede replicarse independientemente de o coincidentemente con el ADN cromosómico de la célula hospedadora y se pueden generar varias copias del vector y su ADN insertado. Además, el vector también puede contener los elementos necesarios que permiten la transcripción del ADN insertado en una molécula de ARNm o de otro modo provocan la replicación del ADN insertado en múltiples copias de ARN. Algunos vectores de expresión contienen, además, elementos de secuencia adyacentes al ADN insertado que aumentan la vida media del ARNm expresado y/o permitir la traducción del ARNm en una molécula de proteína. De este modo se pueden sintetizar rápidamente muchas moléculas de ARNm y polipéptido codificado por el ADN insertado.

El término “nucleótido”, además de referirse a los monómeros ribonucleótidos o desoxirribonucleótidos de origen natural, en esta memoria se entenderá que se refiere a variantes estructurales relacionadas, incluidos los derivados y análogos, que son funcionalmente equivalentes con respecto al contexto particular en el que el nucleótido está siendo usado (por ejemplo, hibridación con una base complementaria), a menos que el contexto indique claramente lo contrario.

El término “ácido nucleico” o “polinucleótido” se refiere a un polímero que se puede corresponder con un polímero de ácido ribonucleico (ARN) o ácido desoxirribonucleico (ADN) o un análogo del mismo. Esto incluye polímeros de nucleótidos, tales como ARN y ADN, así como las formas sintéticas, modificadas (por ejemplo, química o bioquímicamente modificadas) de los mismos, y polímeros mixtos (por ejemplo, incluyendo tanto subunidades de ARN y ADN). Modificaciones ejemplares incluyen metilación, sustitución de uno o más de los nucleótidos naturales con un análogo, modificaciones internucleótidos tales como uniones sin carga (por ejemplo, fosfonatos de metilo, fosfotriésteres, fosfoamidatos, carbamatos y similares), restos colgantes (por ejemplo, polipéptidos), intercaladores (por ejemplo, acridina, psoraleno y similares), quelantes, alquilantes y enlaces modificados (por ejemplo, ácidos nucleicos anoméricos alfa y similares). También se incluyen moléculas sintéticas que imitan a los polinucleótidos en su capacidad para unirse a una secuencia designada a través de enlaces de hidrógeno y otras interacciones químicas. Generalmente, los monómeros de nucleótidos están conectados a través de enlaces fosfodiéster, aunque las formas sintéticas de ácidos nucleicos pueden comprender otros enlaces (por ejemplo, péptido ácidos nucleicos como se describe en Nielsen et al. (Science 254:1497-1500, 1991). Un ácido nucleico puede ser o puede incluir, por ejemplo, un cromosoma o un segmento cromosómico, un vector (por ejemplo, un vector de expresión), un casete de expresión, un polímero de ADN o ARN desnudo, el producto de una reacción en cadena de la polimerasa (PCR), un oligonucleótido, una sonda y un cebador. Un ácido nucleico puede ser, por ejemplo., de una sola cadena, de doble cadena o de triple cadena y no se limita a cualquier longitud particular. A menos que se indique lo contrario, una secuencia de ácido nucleico particular comprende o codifica secuencias complementarias, además de cualquier secuencia indicada explícitamente.

El término “oligonucleótido” se refiere a un ácido nucleico que incluye al menos dos unidades de monómero de ácido nucleico (por ejemplo, nucleótidos). Un oligonucleótido generalmente incluye desde aproximadamente seis a aproximadamente 175 unidades de monómero de ácido nucleico, más generalmente de aproximadamente ocho a aproximadamente 100 unidades de monómero de ácido nucleico y aún más generalmente de aproximadamente 10 a aproximadamente 50 unidades de monómero de ácido nucleico (por ejemplo, aproximadamente 15, aproximadamente 20, aproximadamente 25, aproximadamente 30, aproximadamente 35 o más unidades de monómero de ácido nucleico). El tamaño exacto de un oligonucleótido dependerá de muchos factores, incluyendo la función o uso del oligonucleótido. Los oligonucleótidos se preparan opcionalmente por cualquier método adecuado, incluyendo, pero sin limitarse a, el aislamiento de una secuencia existente o natural, replicación o amplificación del ADN, transcripción inversa, clonación y digestión de restricción de secuencias apropiadas o síntesis química directa por un método tal como el método del fosfotriéster de Narang et al. (Meth. Enzymol. 68:90-99, 1979); el método del fosfodiéster de Brown et al. (Meth. Enzymol. 68: 109-151, 1979); el método de dietilfosforamidita de Beaucage et al. (Tetrahedron Lett. 22:1859-1862, 1981); el método del triéster de Matteucci et al. (J. Am. Chem. Soc.103:3185-3191, 1981); métodos de síntesis automatizados; o el método de soporte sólido de la Patente US- 4.458.066 u otros métodos conocidos por los expertos en la técnica.

El término “cebador” tal como se utiliza en la presente memoria, se refiere a un polinucleótido capaz de actuar como un punto de iniciación de la síntesis de ácido nucleico dirigida por el molde cuando se coloca en condiciones en las que se inicia la extensión de polinucleótidos (por ejemplo, en condiciones que comprenden la presencia de nucleósidos trifosfato necesarios (según lo dictado por el molde que se copia) y una polimerasa en un tampón apropiado y a una temperatura adecuada o ciclo(s) de las temperaturas (por ejemplo, como en una reacción en cadena de la polimerasa)). Para ilustrar adicionalmente, los cebadores también se pueden utilizar en una variedad de otros procesos de síntesis mediada por oligonucleótidos, incluyendo como iniciadores de la síntesis de novo de ARN y en los procesos relacionados con la transcripción in vitro (por ejemplo, la amplificación basada en la secuencia de ácido nucleico (ABSAN), amplificación mediada por transcripción (AMT), etc.). Un cebador es generalmente un oligonucleótido de cadena sencilla (por ejemplo, oligodesoxirribonucleótido). La longitud apropiada de un cebador depende del uso previsto del cebador pero generalmente varía de 6 a 40 nucleótidos, más generalmente de 15 a 35 nucleótidos. Moléculas de cebador cortas generalmente requieren temperaturas más frías para formar complejos híbridos suficientemente estables con el molde. Un cebador no necesita reflejar la secuencia exacta del molde pero debe ser suficientemente complementario para hibridar con un molde para que se produzca la elongación del cebador. En ciertas realizaciones, el término “par de cebadores” significa un conjunto de cebadores, incluyendo un cebador en sentido 5' (a veces denominado “directo”) que se hibrida con el complemento del extremo 5' de la secuencia de ácido nucleico a amplificar y un cebador 3' antisentido (a veces llamado “inverso”) que se hibrida con el extremo 3' de la secuencia a amplificar (por ejemplo, si la secuencia diana se expresa como ARN o es un ARN). Un cebador puede marcarse, si se desea, mediante la incorporación de un marcador detectable por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos o químicos. Por ejemplo, marcadores útiles incluyen 32P, colorantes fluorescentes, reactivos densos en electrones, enzimas (como se utiliza comúnmente en los ensayos ELISA), biotina, o haptenos y proteínas para los que se disponen antisueros o anticuerpos monoclonales.

El término “convencional” o “natural” cuando se refiere a las bases de ácido nucleico, nucleósidos trifosfato o nucleótidos se refiere a aquellos que existen naturalmente en el polinucleótido que se va a describir (es decir, para el ADN estos son dATP, dGTP, dCTP y dTTP). Además, dITP y 7-deaza-dGTP se utilizan con frecuencia en lugar de dGTP y 7-deaza-dATP se puede utilizar en lugar de dATP en las reacciones de síntesis in vitro de ADN, tal como la secuenciación. Colectivamente, estos pueden ser referidos como dNTPs.

El término “no convencional” o “modificado” cuando se refiere a una base de ácido nucleico, nucleósido o nucleótido o incluye la modificación, derivaciones, o análogos de bases convencionales, nucleósidos, nucleótidos que ocurren naturalmente en un polinucleótido particular. Ciertos nucleótidos no convencionales están modificados en la posición 2' del azúcar ribosa en comparación con los dNTPs convencionales. Así, aunque para el ARN los nucleótidos de origen natural son ribonucleótidos (es decir, ATP, GTP, CTP, UTP, colectivamente rNTP), porque estos nucleótidos tienen un grupo hidroxilo en la posición 2' del azúcar, que, por comparación está ausente en los dNTPs, como se usa en la presente memoria, los ribonucleótidos son nucleótidos no convencionales como sustratos para las ADN polimerasas. Tal como se usa en la presente memoria, los nucleótidos no convencionales incluyen, pero no se limitan a, compuestos usados como terminadores para la secuenciación de ácidos nucleicos. Compuestos terminadores ejemplares incluyen, pero no se limitan a aquellos compuestos que tienen una estructura 2',3' didesoxi y que se denominan como didesoxinucleósidos trifosfato. Los didesoxinucleósidos trifosfato ddATP, ddTTP, ddCTP y ddGTP se conocen colectivamente como ddNTPs. Otros ejemplos de compuestos terminador incluyen análogos 2'- PO4 de ribonucleótidos (véase, por ejemplo, la Publicación de Solicitud Nº 2005/0037991 y 2005/0037398). Otros nucleótidos no convencionales incluyen fosforotioato dNTPs ([α-S]dNTPs), 5'-[ α-borano]-dNTPs, [α]-metil-fosfonato dNTPs y ribonucleósidos trifosfato (rNTPs). Bases no convencionales se pueden marcar con isótopos radiactivos tales como 32P, 33P o 35S; marcadores fluorescentes; marcadores quimioluminiscentes; marcadores bioluminiscentes; marcadores haptenos tales como biotina; o marcadores enzimáticos, tales como estreptavidina o avidina. Los marcadores fluorescentes pueden incluir colorantes que están cargados negativamente, tales como colorantes de la familia de la fluoresceína o colorantes que son de carga neutra, tales como colorantes de la familia de la rodamina, o colorantes que están cargados positivamente, tales como colorantes de la familia de la cianina. Los colorantes de la familia de la fluoresceína incluyen, por ejemplo, FAM, HEX, TET, JOE, NAN y ZOE. Los colorantes de la familia de la rodamina incluyen Texas Red, ROX, R110, R6G y TAMRA. Varios tintes o nucleótidos marcados con FAM, HEX, TET, JOE, NAN, ZOE, ROX, R110, R6G, Texas Red y TAMRA son comercializados por Perkin-Elmer (Boston, MA), Applied Biosystems (Foster City, CA) o sondas Invitrogen/Moleculares (Eugene, OR).

Los colorantes de la familia de la cianina incluyen Cy2, Cy3, Cy5 y Cy7 y son comercializados por GE Healthcare UK Limited (Amersham Place, Little Chalfont, Buckinghamshire, Inglaterra).

Como se usa en la presente memoria, “porcentaje de identidad de secuencia” se determina comparando dos secuencias óptimamente alineadas sobre una ventana de comparación, en el que la porción de la secuencia en la ventana de comparación puede comprender adiciones o deleciones (es decir, brechas) en comparación con la secuencia de referencia (que no comprende adiciones o deleciones) para una alineación óptima de las dos secuencias. El porcentaje se calcula determinando el número de posiciones en las que la base de ácido nucleico o residuo de aminoácido idénticos en ambas secuencias para dar el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes por el número total de posiciones en la ventana de comparación y multiplicando el resultado por 100 para producir el porcentaje de identidad de secuencia.

Los términos “idéntico” o porcentaje de “identidad”, en el contexto de dos o más ácidos nucleicos o secuencias polipeptídicas, se refieren a dos o más secuencias o subsecuencias que son las mismas. Las secuencias son “sustancialmente idénticas” entre sí si tienen un porcentaje especificado de nucleótidos o residuos de aminoácidos que son los mismos (por ejemplo., al menos 20%, al menos 25%, al menos 30%, al menos 35%, al menos 40%, al menos 45%, al menos 50%, al menos 55%, al menos 60%, al menos 65%, al menos 70%, al menos 75%, al menos 80%, al menos 85%, al menos 90%, o al menos 95% de identidad sobre una región determinada)), cuando se comparan y alinean para una correspondencia máxima en una ventana de comparación, o región designada según se mide usando uno de los siguientes algoritmos de comparación de secuencia o mediante alineamiento manual e inspección visual. Las secuencias son “sustancialmente idénticas” entre sí si son al menos 20%, al menos 25%, al menos 30%, al menos 35%, al menos 40%, al menos 45%, al menos 50%, o al menos 55% idénticas. Estas definiciones se refieren también al complemento de una secuencia de prueba. Opcionalmente, la identidad existe en una región que es al menos aproximadamente 50 nucleótidos de longitud, o más generalmente en una región que es de 100 a 500 o 1000 o más nucleótidos de longitud.

Los términos “similitud” o “porcentaje de similitud”, en el contexto de dos o más secuencias polipeptídicas, se refieren a dos o más secuencias o subsecuencias que tienen un porcentaje especificado de residuos de aminoácidos que son o bien el mismo o similares tal como se define mediante sustituciones de aminoácidos conservadoras (por ejemplo., 60% de similitud, opcionalmente 65%, 70%, 75%, 80%, 85%, 90% o 95% similar en una región especificada), cuando se comparan y alinean para una correspondencia máxima en una ventana de comparación o región designada tal como se mide usando uno de los siguientes algoritmos de comparación de secuencia o mediante alineamiento manual e inspección visual. Las secuencias son “sustancialmente similares” entre sí si son al menos 20%, al menos 25%, al menos 30%, al menos 35%, al menos 40%, al menos 45%, al menos 50%, o al menos 55% similares entre sí. Opcionalmente, esto existe de manera similar en una región que es de al menos aproximadamente 50 aminoácidos de longitud, o más generalmente en una región que es de al menos aproximadamente 100 a 500 o 1000 o más aminoácidos de longitud.

Para la comparación de secuencias, generalmente una secuencia actúa como secuencia de referencia, con la cual se comparan las secuencias de ensayo. Cuando se usa un algoritmo de comparación de secuencias, las secuencias de ensayo y de referencia se introducen en un ordenador, se designan coordenadas de subsecuencia, si es necesario, y se designan los parámetros del programa de algoritmo de secuencia. Los parámetros por defecto del programa son de uso común, o los parámetros alternativos pueden ser designados. El algoritmo de comparación de secuencias calcula el porcentaje identidades o similitudes de secuencia de las secuencias de ensayo con respecto a la secuencia de referencia, basándose en los parámetros del programa.

Una “ventana de comparación”, como se usa en la presente memoria, incluye la referencia a un segmento de una cualquiera del número de posiciones contiguas seleccionadas del grupo que consiste en de 20 a 600, por lo general de aproximadamente 50 a aproximadamente 200, más habitualmente de aproximadamente 100 a aproximadamente 150 en las que una secuencia puede compararse con una secuencia de referencia del mismo número de posiciones contiguas después de que las dos secuencias se alinean de manera óptima. Los métodos de alineación de secuencias para comparación son bien conocidos en la técnica. El alineamiento óptimo de secuencias para comparación puede llevarse a cabo, por ejemplo, mediante el algoritmo de homología local de Smith y Waterman (Adv. Appl. Math. 2:482, 1970), mediante el algoritmo de alineamiento de homología de Needleman y Wunsch (J. Mol. Biol. 48:443, 1970), por la búsqueda del método de similitud de Pearson y Lipman (Proc. Natl. Acad. Sci. USA. 85: 2444, 1988), mediante implementaciones informatizadas de estos algoritmos (por ejemplo, GAP, BESTFIT, FASTA y TFASTA en el paquete de software Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Madison, Wis.) o mediante alineamiento manual e inspección visual (véase, por ejemplo, Ausubel et al., Current Protocols in Molecular Biology (suplemento de 1995)).

Ejemplos de un algoritmo que es adecuado para determinar el porcentaje de identidad de secuencia y similitud de secuencia son los algoritmos BLAST y BLAST 2.0, que se describen en Altschul et al. (Nuc. Acids Res. 25:3389-402, 1977) y Altschul et al. (J. Mol. Biol. 215: 403-10, 1990), respectivamente. El software para realizar análisis BLAST está disponible públicamente a través del Centro Nacional de Información Biotecnológica (http://www.ncbi.nlm.nih.gov/). Este algoritmo implica primero identificar pares de secuencias de alta puntuación (HSP) identificando palabras cortas de longitud W en la secuencia problema, que coinciden o satisfacen alguna puntuación umbral T de valor positivo cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. T se denomina como el umbral de puntuación de la palabra vecina (Altschul et al., supra). Estos aciertos de palabra vecina iniciales actúan como semillas para iniciar búsquedas para encontrar HSP más largas que los contienen. Los aciertos de palabras se extienden en ambas direcciones a lo largo de cada secuencia siempre que la puntuación de alineamiento acumulativa se pueda aumentar. Las puntuaciones acumulativas se calculan usando, para secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de restos coincidentes; siempre> 0) y N (puntuación de penalización para residuos no coincidentes; siempre <0). Para secuencias de aminoácidos, se usa una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los aciertos de palabras en cada dirección se detiene cuando: la puntuación de alineamiento acumulativa disminuye en la cantidad X de su valor máximo alcanzado; la puntuación acumulativa llega a cero o menos, debido a la acumulación de una o más alineaciones de residuos de puntuación negativa o se alcanza el final de cualquier secuencia. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) usa por defecto una longitud de palabra (W) de 11, una expectativa (E) o 10, M=5, N=-4 y una comparación de ambas cadenas. Para secuencias de aminoácidos, el programa BLASTP usa por defecto una longitud de palabra de 3, y expectativa (E) de 10 y la matriz de puntuación BLOSUM62 (ver Henikoff y Henikoff, Proc. Natl. Acad. Sci. USA 89: 10915, 1989) alineaciones (B) de 50, expectativa (E) de 10, M=5, N=-4 y una comparación de ambas cadenas.

El algoritmo BLAST también realiza un análisis estadístico de la similitud entre dos secuencias (véase, por ejemplo, Karlin y Altschul, Proc. Natl. Acad. Sci. USA 90: 5873-87, 1993). Una medida de similitud proporcionada por el algoritmo BLAST es la menor probabilidad de suma (P(N)), que proporciona una indicación de la probabilidad por la cual una coincidencia entre dos secuencias de nucleótidos o aminoácidos se produciría por casualidad. Por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la menor probabilidad de suma en una comparación del ácido nucleico de ensayo con el ácido nucleico de referencia es menor de aproximadamente 0,2, generalmente menor que aproximadamente 0,01 y más generalmente menor que aproximadamente 0,001.

El término “eficacia de la transcripción inversa” se refiere a la fracción de moléculas de ARN que son transcritas inversamente como ADNc en una reacción de transcripción inversa dada. En ciertas realizaciones, las ADN polimerasas mutantes de la invención han mejorado la eficiencia de transcripción inversa en relación con las formas no modificadas de estas ADN polimerasas. Es decir, estas ADN polimerasas mutantes transcriben inversamente una mayor fracción de moldes de ARN que sus formas sin modificar en un conjunto particular de condiciones de reacción. La eficacia de la transcripción inversa se puede medir, por ejemplo, mediante la medición del punto de cruce (Cp) de una reacción de PCR utilizando un molde de ARN y comparando el valor de Cp con un valor Cp de una reacción de control en la que un molde de ADN de la misma secuencia (excepto que las U están reemplazadas con T) se amplifica, en el que las amplificaciones de ARN y ADN utilizan conjunto de cebadores comunes y la misma polimerasa, por ejemplo, como se describe en los ejemplos. Una polimerasa de ensayo tiene una mayor eficiencia RT cuando la polimerasa de ensayo tiene un valor Cp disminuido en comparación con una polimerasa de control cuando se utiliza ARN como un molde, pero tiene un valor de Cp sustancialmente sin cambios con respecto a la polimerasa control cuando se usa ADN como un molde. En algunas realizaciones una polimerasa de la invención tiene una eficiencia RT mejorada, de modo que Cp es al menos uno, dos, tres, cuatro, o cinco unidades menos que la polimerasa control correspondiente en el molde de ARN.

El término “tolerancia al desapareamiento” se refiere a la capacidad de una polimerasa para tolerar una secuencia que contiene desapareamiento, cuando se extiende un ácido nucleico (por ejemplo, un cebador u otro oligonucleótido) de una manera dependiente del molde uniendo (por ejemplo, covalentemente) uno o más nucleótidos con el ácido nucleico. El término “tolerancia al desapareamiento 3'” se refiere a la capacidad de una polimerasa para tolerar una secuencia (casi complementaria) que contiene desapareamiento en donde el ácido nucleico a ser extendido (por ejemplo, un cebador u otro oligonucleótido) tiene una falta de coincidencia con su molde en el nucleótido 3' terminal del cebador. Los desapareamientos en el molde también pueden estar situados en el penúltimo nucleótido 3' del cebador, o en otra posición dentro de la secuencia del cebador.

El término “discriminación por desapareamiento” se refiere a la capacidad de una polimerasa para distinguir una secuencia totalmente complementaria de una secuencia que contiene desapareamiento, cuando se extiende un ácido nucleico (por ejemplo, un cebador u otro oligonucleótido) de una manera dependiente del molde uniendo (por ejemplo, covalentemente) uno o más nucleótidos al ácido nucleico. El término “discriminación por desapareamiento 3'” se refiere a la capacidad de una polimerasa para distinguir una secuencia totalmente complementaria de una secuencia (casi complementaria) que contiene desapareamiento en donde el ácido nucleico a ser extendido (por ejemplo, un cebador u otro oligonucleótido) tiene una falta de apareamiento en el extremo 3' terminal comparado con el molde con el que hibrida el ácido nucleico. El término “desapareamiento” se refiere a la existencia de uno o más desapareamientos de bases (u “oposiciones de bases no complementarias”) dentro de un tramo de secuencias que de otro modo son formadoras de dúplex complementarios (o pueden formar dúplex complementarios).

El término “valor de Cp” o valor ·punto de cruce” se refiere a un valor que permite la cuantificación de los ácidos nucleicos diana de entrada. El valor de Cp puede ser determinado de acuerdo con el máximo por el método de la segunda derivada (Van Luu-The, et al., “Improved real-time RT-PCR method for high-throughput measurements using second derivative calculation and double correction” BioTechniques, Vol. 38, Nº 2, Febrero 2005, pp. 287-293).

En el método de la segunda derivada, un Cp corresponde al primer pico de una segunda curva derivada. Este pico corresponde al comienzo de una fase log-lineal. El método de la segunda derivada calcula un segundo valor de la derivada de la curva de intensidad de la fluorescencia en tiempo real, y se obtiene un único valor. El de Cp método original se basa en una aproximación diferenciable definida localmente, de los valores de intensidad, por ejemplo, mediante una función polinómica. A continuación, se calcula la tercera derivada. El valor de Cp es la raíz más pequeña de la tercera derivada. El Cp también puede determinarse utilizando el método de punto de ajuste, en el que el Cp está determinado por la intersección de una paralela con la línea del umbral en la región de log-lineal (Van Luu-La, et al., BioTechniques, vol.38, Nº 2, Febrero de 2005, pp.287-293). El valor de Cp proporcionado por el instrumento LightCycler ofrecido por Roche por cálculo de acuerdo con el método del máximo de la segunda derivada.

El término “eficiencia de la PCR” se refiere a una indicación de la eficiencia de amplificación de un ciclo a otro. La eficiencia de la PCR se calcula para cada condición mediante la ecuación: % de eficiencia de la PCR = (10(-pendiente) - 1) x 100, en el que la pendiente se calculó por regresión lineal con el número de copias representadas en el eje y Cp representado en el eje x. La eficiencia de la PCR se puede medir usando un molde de cebador perfectamente apareado o no apareado.

El término “velocidad de extensión del ácido nucleico” se refiere a la velocidad a la que un biocatalizador (por ejemplo, una enzima, tal como una polimerasa, ligasa, o similares) extiende un ácido nucleico (por ejemplo, un cebador u otro oligonucleótido) de una manera dependiente del molde o de una manera independiente del molde uniendo (por ejemplo, covalentemente) uno o más nucleótidos al ácido nucleico. A modo ilustrativo, ciertas ADN polimerasas mutantes descritas en la presente memoria tienen velocidades de extensión de ácido nucleico mejoradas en relación con las formas no modificadas de estas ADN polimerasas, de tal manera que pueden extender los cebadores a velocidades mayores que estas formas sin modificar en un conjunto dado de condiciones de reacción.

El término “tolerancia de la actividad RT y polimerasa a los inhibidores” se refiere a la capacidad de una polimerasa de mantener la actividad (actividad polimerasa o de transcripción inversa) en presencia de una cantidad de un inhibidor que inhibiría la actividad de la polimerasa o la actividad de transcripción inversa de una polimerasa control. En algunas realizaciones, la mejora de la polimerasa es capaz de llevar a cabo la actividad polimerasa o de transcripción inversa en presencia de una cantidad del inhibidor que esencialmente eliminaría la actividad de la polimerasa control. Una “polimerasa control” se refiere a una polimerasa que comprende un ácido glutámico (E) correspondiente a la posición 522 de la SEC ID Nº: 1, que de otro modo es idéntica a la polimerasa mejorada.

El término “sonda 5'-nucleasa” se refiere a un oligonucleótido que comprende al menos un resto de marcaje que emite luz y que se utiliza en una reacción de 5'-nucleasa para efectuar la detección del ácido nucleico diana. En algunas realizaciones, por ejemplo, una sonda 5'-nucleasa incluye solamente un resto emisor de luz (por ejemplo, un colorante fluorescente, etc.). En ciertas realizaciones, las sondas 5'-nucleasa incluyen regiones de auto- complementariedad de tal manera que las sondas son capaces de formar estructuras de horquilla en condiciones seleccionadas. Para ilustrar aún más este aspecto, en algunas realizaciones una sonda 5'-nucleasa comprende al menos dos restos de marcaje y emite radiación de mayor intensidad después de que uno de los marcajes se escinde o se separa de otro modo del oligonucleótido. En ciertas realizaciones, una sonda 5'-nucleasa se marca con dos colorantes fluorescentes diferentes, por ejemplo, un colorante indicador en el extremo 5' y el colorante o resto extintor de la fluorescencia en el extremo 3'. En algunas realizaciones, las sondas 5'-nucleasa están marcadas en una o más posiciones distintas de, o además de, las posiciones terminales. Cuando la sonda está intacta, la transferencia de energía se produce normalmente entre los dos fluoróforos de tal manera que la emisión fluorescente desde el colorante indicador se inactiva al menos en parte. Durante una etapa de extensión de una reacción en cadena de polimerasa, por ejemplo, una sonda 5'-nucleasa unida a un ácido nucleico molde se escinde por la actividad 5' a 3' nucleasa de, por ejemplo, una Taq polimerasa u otra polimerasa que tiene esta actividad tal que la emisión fluorescente del colorante indicador ya no se extingue. Ejemplos de sondas de 5'-nuclease también se describen en, por ejemplo, la patente US-5.210.015, titulada “Homogeneous assay system using the nuclease activity of a nucleic acid polymerase” concedida el 11 de mayo de 1993 a Gelfand et al., Patente US-5.994.056, titulada “Homogeneous methods for nucleic acid amplification and detection”, concedida el 30 de noviembre de1999 a Higuchi y Patente US-6.171.785, titulada “Methods and devices for homogeneous nucleic acid amplification and detector”, concedida el 9 de enero de 2001 a Higuchi. En otras realizaciones, una sonda 5'-nucleasa puede marcarse con dos o más colorantes indicadores diferentes y un colorante o resto extintor de la fluorescencia en el extremo 3'.

El término “FRET” o “transferencia de energía de resonancia fluorescente” o “transferencia de energía de resonancia Foerster” se refiere a una transferencia de energía entre al menos dos cromóforos, un cromóforo donador y un cromóforo aceptor (denominado extintor de la fluorescencia). El donante generalmente transfiere la energía al aceptor cuando el donante es excitado por la radiación lumínica con una longitud de onda adecuada. El aceptor generalmente re-emite la energía transferida en forma de radiación lumínica con una longitud de onda diferente. Cuando el receptor es un extintor “oscuro”, este disipa la energía transferida en forma distinta a la lumínica. El que un fluoróforo particular actúe como un donante o un aceptor depende de las propiedades del otro miembro del par de FRET. Parejas donante-aceptor usados comúnmente incluyen el par FAM-TAMRA. Los extintores usados comúnmente son DABCYL y TAMRA. Los extintores comúnmente utilizados incluyen BlackHole Quenchers™ (BHQ), (Biosearch Technologies, Inc., Novato, Cal.), Iowa Black™ (Integrated DNA Tech., Inc., Coralville, Iowa) and BlackBerry™ Quencher 650 (BBQ-650) (Berry & Assoc., Dexter, Mich.).

Breve descripción de las figuras La Figura 1 representa una alineación de la secuencia de aminoácidos de una región del dominio polimerasa de ejemplos de ADN polimerasas de diversas especies de bacterias: Thermus species Z05 (Z05) (SEC ID Nº: 12), Thermus aquaticus (Taq) (SEC ID Nº: 13), Thermus filiformus (Tfi) (SEC ID Nº: 14), Thermus flavus (Tfl) (SEC ID Nº: 15), Thermus species Sps17 (Sps17) (SEC ID Nº: 16), Thermus thermophilus (Tth) (SEC ID Nº: 17), Thermus

caldophilus (Tca) (SEC ID Nº: 18), Thermotoga maritima (Tma) (SEC ID Nº: 19), Thermotoga neopolitana (Tne) (SEC ID Nº: 20), Thermosipho africanus (Taf) (SEC ID Nº: 21), Deinococcus radiodurans (Dra) (SEC ID Nº: 23), Bacillus stearothermophilus (Bst) (SEC ID Nº: 24) y Bacillus caldotenax (Bca) (SEC ID Nº: 25). Además, las regiones de polipéptido mostradas comprenden el motivo de consenso de la secuencia de aminoácidos S-T-X1- X2-X3-X4-L-X5-X6-X7-X8-X9-X10-H-X11-I (SEC ID Nº: 26), cuyas posiciones variables se definen adicionalmente en la presente memoria. Este motivo se resalta en negrita para cada secuencia de la polimerasa. Las posiciones de los aminoácidos susceptibles de mutación de acuerdo con la presente invención se indican con un asterisco (*). Los huecos en los alineamientos se indican con un punto (.).

La Figura 2 proporciona identidades de secuencia entre las siguientes enzimas ADN polimerasa I: ADN polimerasa de Thermus sp. Z05 (Z05); ADN polimerasa de Thermus aquaticus (Taq); ADN polimerasa de Thermus filiformis (Tfi); ADN polimerasa de Thermus flavus (Tfl); ADN polimerasa de Thermus sp. Sps17

(Sps17); ADN polimerasa de Thermus thermophilus (Tth); ADN polimerasa de Thermus caldophilus (Tca); ADN polimerasa de Deinococcus radiodurans (Dra); ADN polimerasa de Thermotoga maritima (Tma); ADN polimerasa de Thermotoga neopolitana (Tne); ADN polimerasa de Thermosipho africanus (Taf); ADN polimerasa de Bacillus stearothermophilus (Bst) y ADN polimerasa de Bacillus caldotenax (Bca). (A) identidades de secuencia en toda la enzima polimerasa I (correspondiente a los aminoácidos 1-834 de Z05) y (B) identidades de secuencia en el subdominio de la polimerasa correspondiente a los aminoácidos 420-834 de Z05.

La Figura 3 proporciona identidades de secuencia entre diferentes enzimas ADN polimerasa I de Thermus sp: ADN polimerasa de Thermus sp. Z05 (Z05); ADN polimerasa de Thermus aquaticus (Taq); ADN polimerasa de

Thermus filiformis (Tfi); ADN polimerasa de Thermus flavus (Tfl); ADN polimerasa de Thermus sp. Sps17 (Sps17); ADN polimerasa de Thermus thermophilus (Tth) y ADN polimerasa de Thermus caldophilus (Tca). (A) identidades de secuencia en toda la enzima polimerasa I (correspondiente a los aminoácidos 1-834 de Z05) y (B) identidades de secuencia en el subdominio de la polimerasa correspondiente a los aminoácidos 420-834 de Z05.

Descripción detallada La presente invención proporciona ADN polimerasas mejoradas en las que uno o más aminoácidos en el dominio polimerasa han sido mutados con respecto a una ADN polimerasa funcional. Las ADN polimerasas de la invención son enzimas activas que tienen una mayor eficiencia de transcriptasa inversa (por ejemplo, en presencia de cationes divalentes Mn2+ y Mg2+) en relación a la forma no modificada de la polimerasa. En ciertas realizaciones, las ADN polimerasas mutantes se pueden usar a concentraciones más bajas con un rendimiento superior o equivalente al de las enzimas parentales.

Las ADN polimerasas que realizan de manera más eficiente la transcripción inversa son útiles, por ejemplo, en una variedad de aplicaciones que implican ensayos que emplean RT-PCR para detectar y/o cuantificar dianas de ARN. Las ADN polimerasas son, por lo tanto, útiles en una variedad de aplicaciones que implican la extensión de polinucleótidos, así como la transcripción inversa o la amplificación de moldes de polinucleótidos, incluyendo, por ejemplo, las aplicaciones en los estudios de ADN recombinante y diagnóstico médico de la enfermedad. Las ADN polimerasas mutantes también son particularmente útiles, debido a su tolerancia a los desapareamientos, para detectar dianas que posiblemente tienen secuencias variables (por ejemplo, dianas virales, o cáncer y otros marcadores genéticos de la enfermedad).

En algunas realizaciones, las ADN polimerasas de la invención se pueden caracterizar por tener el siguiente motivo: Ser-Thr-X1-X2-X3-X4-Leu-X5-X6-X7-X8-X9-X10-Su-X11-Ile (también denominado en la presente memoria en el código de una letra como STX1-X2-X3-X4-L-X5-X6-X7-X8-X9-X10-H-X11-I) (SEC ID Nº: 8); en la que X1 es Ser (S), Arg (R), Asn (N) o Ala (A); X2 es Ala (A), Ile (I) o Val (V); X3 es Ala (A), Glu (E), Ser (S) o Asp (D); X4 es Val (V) o Ala (A); X5 es cualquier aminoácido distinto de Glu (E); X6 es Ala (A), Leu (L), Glu (E), Pro (P) o Lys (K); X7 es Leu (L) o Ile (I); X8 es Arg (R), Ala (A) o Ser (S); X9 es Glu (E), Gly (G), Asn (N), Lys (K), Asp (D) o Pro (P); X10 es Ala (A), Glu (E), His (H) o Tyr (Y); X11 es Pro (P) o Glu (E).

En algunas realizaciones, X5 se selecciona de G, A, L, M, F, W, P, S, T, C, Y, Q, D, K, R, V, I, N o H.

En algunas realizaciones, las ADN polimerasas de la invención se pueden caracterizarse por tener el siguiente motivo (correspondiente a Thermus y Thermotoga): Ser-Thr-X1-X2-X3-Val-Leu-X5-X6-X7-X8-X9-X10-Su-X11-Ile (también denominado en la presente memoria en el código de una letra como S-TX1-X2-X3-V-L-X5-X6-X7-X8-X9-X10-H-X11-I) (SEC ID Nº: 9); en la que X1 es Ser (S) o Arg (R); X2 es Ala (A) o Ile (I); X3 es Ala (A) o Glu (E); X5 es cualquier aminoácido distinto de Glu (E); X6 es Ala (A), Leu (L) o Glu (E); X7 es Leu (L) o Ile (I); X8 es Arg (R) o Ala (A); X9 es Glu (E), Gly (G) o Asn (N); X10 es Ala (A) o Glu (E); X11 es Pro (P) o Glu (E).

En algunas realizaciones, las ADN polimerasas de la invención se pueden caracterizar por tener el siguiente motivo: Ser-Thr-Ser-Ala-Ala-Val-Leu-X5-Ala-Leu-Arg-Glu-Ala-His-Pro-Ile (denominado también en la presente memoria en el código de una letra como S-T-S-A-A-V-L-X5-A-L-R-E-A-H-P-I) (SEC ID Nº: 10); en la que X5 es cualquier aminoácido distinto de Glu (E).

En algunas realizaciones, las ADN polimerasas de la invención se pueden caracterizar por tener el siguiente motivo: Ser-Thr-Ser-Ala-Ala-Val-Leu-X5-Ala-Leu-Arg-Glu-Ala-His-Pro-Ile (denominado también en la presente memoria en el código de una letra como S-T-S-A-A-V-L-X5-A-L-R-E-A-H-P-1) (SEC ID Nº: 11); en la que X5 es Gly (G).

Este motivo está presente dentro del dominio “pulgar” de muchas ADN polimerasas dependientes de ADN del tipo Familia A, en particular las ADN polimerasas termoestables de bacterias termófilas (Li et al., EMBO J. 17:7514-7525, 1998). Por ejemplo, la Figura 1 muestra una alineación de la secuencia de aminoácidos de una región del dominio "pulgar" de las ADN polimerasas de varias especies de bacterias: Bacillus caldotenax, Bacillus stearothermophilus, Deinococcus radiodurans, Thermosipho africanus, Thermotoga maritima, Thermotoga neopolitana, Thermus aquaticus, Thermus caldophilus, Thermus filiformus, Thermus flavus, Thermus sp. Sps17, Thermus sp. Z05 y

Thermus thermophilus. Como se muestra, la secuencia nativa correspondiente al motivo anterior está presente en cada una de estas polimerasas, lo que indica una función conservada de esta región de la polimerasa. La Figura 2 proporciona identidades de secuencia entre estas ADN polimerasas.

Por consiguiente, en algunas realizaciones, la invención proporciona una polimerasa que comprende la SEC ID Nº: 8, 9, 10 o 11, que tiene la actividad y/o características mejoradas descritas en la presente memoria y en la que la ADN polimerasa es por lo demás una ADN polimerasa de tipo silvestre o una de origen natural, tal como, por ejemplo, una polimerasa de cualquiera de las especies de bacterias termófilas enumeradas anteriormente, o es sustancialmente idéntica a una ADN polimerasa de tipo silvestre o natural. Por ejemplo, en algunas realizaciones, la polimerasa de la invención comprende la SEC ID Nº: 8, 9, 10, o 11 y es al menos 80%, 85%, 90%, o 95% idéntica a la SEC ID Nº: 1, 2, 3, 4, 5, 6, 7, 32, 33, 34, 35, 36, 37 o 40. En una variación, la forma no modificada de la polimerasa es de una especie del género Thermus. En otras realizaciones de la invención, la polimerasa no modificada es de una especie termófila diferente a Thermus, por ejemplo, Thermotoga. La secuencia de ácido nucleico y aminoácidos completa de numerosas ADN polimerasas termoestables están disponibles. Las secuencias de cada una de las polimerasas de Thermus aquaticus (Taq) (SEC ID Nº: 2), Thermus thermophilus (Tth) (SEC ID Nº: 6), Thermus species Z05 (SEC ID Nº: 1), Thermus species Sps17 (SEC ID Nº: 5), Thermotoga marítima (Tma) (SEC ID Nº: 34) y Thermosipho africanus (Taf) (SEC ID Nº: 33) han sido publicadas en el documento WO 92/06200. La secuencia de la ADN polimerasa de Thermus flavus (SEC ID Nº: 4) ha sido publicada en Akhmetzjanov y Vakhitov (Nucleic Acids Research 20: 5839, 1992). La secuencia de la ADN polimerasa termoestable de Thermus caldophilus (SEC ID Nº: 7) se encuentra en el EMBL/GenBank Nº de acceso U62584. La secuencia de la ADN polimerasa termoestable de Thermus filiformis se puede obtener de la ATCC Nº de depósito 42380 utilizando, por ejemplo, los métodos proporcionados en la Patente US-4.889.818, así como la información de secuencia proporcionada en la Tabla 1. La secuencia de la ADN polimerasa de Thermotoga neapolitana (SEC ID Nº: 35) procede de la base de datos de patentes GeneSeq Nº R98144 y del documento WO 97/09451. La secuencia de la ADN polimerasa termoestable de Bacillus caldotenax (SEC ID Nº: 37 se describe en, por ejemplo, Uemori et al. (J Biochem (Tokyo) 113 (3):401-410, 1993; ver también la base de datos Swiss-Prot, Nº de acceso Q04957 y GenBank, números de acceso D12982 y BAA02361). Ejemplos de formas no modificadas de ADN polimerasas que pueden ser modificadas como se describe en la presente memoria también se describen en, por ejemplo, en las Patentes de los Estados Unidos 6.228.628; 6.346.379; 7.030.220; 6.881.559; 6.794.177; 6.468775; 7.148.049; 7.179.590; 7.410.782; 7.378.262. En el Listado de secuencias también se proporcionan secuencias de polimerasa de longitud completa representativas. Por ejemplo, la ADN polimerasa de Deinococcus radiodurans (Dra) se muestra como SEC ID Nº: 32.

También susceptibles a las mutaciones descritas en la presente memoria son las ADN polimerasas funcionales que se han modificado previamente (por ejemplo, mediante sustitución, adición o deleción de aminoácidos). En algunas realizaciones, tales polimerasas funcionales modificadas conservan el motivo de aminoácidos de la SEC ID Nº: 8 (o un motivo de la SEC ID Nº: 9, 10 o 11) y opcionalmente el motivo de aminoácidos de la SEC ID Nº: 38. Por lo tanto, las ADN polimerasas no modificadas adecuadas incluyen también variantes funcionales de las polimerasas de tipo silvestre o natural. Tales variantes generalmente tendrán una identidad o similitud de secuencia sustancial con la polimerasa de tipo silvestre o natural, generalmente al menos 80% de identidad de secuencia y más generalmente al menos 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia.

En algunas realizaciones, la polimerasa de la invención, además de tener un dominio polimerasa que comprende las SEC ID Nº: 8, 9, 10, o 11 también comprende un dominio nucleasa (por ejemplo, correspondiente a las posiciones 1 a 291 de Z05) En algunas realizaciones, una polimerasa de la invención es una polimerasa quimérica, es decir, que comprende las regiones de polipéptidos de dos o más enzimas. Ejemplos de tales ADN polimerasas quiméricas se describen en, por ejemplo, Patente US- 6.228.628. Particularmente adecuadas son las ADN polimerasas quiméricas de la familia CS, que incluyen las polimerasas CS5 (SEC ID Nº: 27) y CS6 (SEC ID Nº: 28) y variantes de las mismas que tienen una identidad o similitud sustancial en la secuencia de aminoácidos con la SEC ID Nº: 27 o la SEC ID Nº: 28 (generalmente al menos 80% de identidad de secuencia de aminoácidos y más generalmente al menos 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 99% de identidad de la secuencia de aminoácidos) y, por lo tanto, pueden ser modificadas para contener la SEC ID Nº: 8. Las ADN polimerasas CS5 y CS6 son enzimas quiméricas derivadas de las ADN polimerasas de Thermus sp. Z05 y Thermotoga marítima (Tma). Estas comprenden el dominio 5'- nucleasa N-terminal de la enzima de Thermus y los dominios 3'-5'-exonucleasa C-terminal y polimerasa de la enzima

Tma. Estas enzimas tienen actividad de transcriptasa inversa eficiente, pueden extender cebadores que contienen análogos de nucleótidos y pueden incorporar alfa-fosforotioato dNTPs, dUTP, dITP y también dNTPs marcados con marcadores de la familia de la fluoresceína y la cianina. Las polimerasas CS5 y CS6 también son enzimas de PCR activadas con Mg2+ eficientes. Las polimerasas CS5 y CS6 quiméricas se describen adicionalmente en, por ejemplo, la Patente US-7.148.049.

En algunas realizaciones, las sustituciones de aminoácidos son sustituciones de aminoácidos individuales. Las ADN polimerasas proporcionadas en la presente memoria pueden comprender una o más sustituciones de aminoácidos en el sitio activo con respecto a la polimerasa no modificada. En algunas realizaciones, la sustitución(es) de aminoácidos comprenden por lo menos la posición X5 del motivo expuesta en la SEC ID Nº: 8 (o un motivo de la SEC ID Nº: 9, 10 o 11). Una sustitución de aminoácido en esta posición confiere una mayor eficiencia de la transcriptasa inversa, produciendo un ADN polimerasa mutante con una mayor eficiencia de transcriptasa inversa con respecto a la polimerasa no modificada. Generalmente, el aminoácido en la posición X5 está sustituido con un aminoácido que no se corresponde con la secuencia nativa del motivo expuesto en la SEC ID Nº: 8 (o un motivo de la SEC ID Nº: 9, 10 o 11).Por lo tanto, generalmente, el aminoácido en la posición X5, si está sustituido, no es Glu (E) como es el que existe en esta posición en las polimerasas de origen natural (véase, por ejemplo, Figura 1). En ciertas realizaciones, las sustituciones de aminoácidos incluyen G, A, L, M, F, W, P, S, T, C, Y, Q, D, K, R, V, I, N, o H en la posición X5. En ciertas realizaciones, las sustituciones de aminoácidos incluyen glicina (G) en la posición X5.

Otra sustitución(es) de aminoácido adecuada en uno o más de los sitios identificados se puede determinar usando, por ejemplo., métodos conocidos de mutagénesis dirigida al sitio y la determinación del rendimiento en los ensayos de extensión de polinucleótidos descritos con más detalle en la presente memoria o de otra modo conocidos para los expertos en la técnica.

En algunas realizaciones, la polimerasa de la invención comprende la SEC ID Nº: 8, 9, 10, o 11 y además comprende uno o más cambios de aminoácidos adicionales (por ejemplo, por sustitución, adición o deleción de aminoácidos) en comparación con una polimerasa nativa. En algunas realizaciones, tales polimerasas conservan el motivo de aminoácidos de la SEC ID Nº: 8 (o un motivo de la SEC ID Nº: 9, 10 o 11), y además comprenden el motivo de aminoácidos de la SEC ID Nº: 38 (correspondiente a la mutación D580X de Z05 (SEC ID Nº: 1)) como sigue: Thr-Gly-Arg-Leu-Ser-Ser-X7-X8-Pro-Asn-Leu-Gln-Asn (también denominado en este documento en el código de una letra como T-G-R-L-S-S-X7-X8-P-N-L-Q-N) (SEC ID Nº: 38); en la que X7 es Ser (S) o Thr (T); y X8 es cualquier aminoácido distinto de Asp (D) o Glu (E) La mutación caracterizada por la SEC ID Nº: 38 se trata con más detalle en, por ejemplo, la publicación de patente US-2009/0148891.Tales polimerasas variantes funcional generalmente tendrán una identidad o similitud de secuencia sustancial con la de la polimerasa de tipo silvestre o natural (por ejemplo, SEC ID Nº: 1, 2, 3, 4, 5, 6, 7, 32, 33, 34, 35, 36, 37 o 40), generalmente al menos 80% de identidad de secuencia de aminoácidos y más generalmente al menos 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99 % de identidad de secuencia de aminoácidos.

En algunas realizaciones, la ADN polimerasa de la invención comprende una sustitución de aminoácido en la posición X5 (por ejemplo, como en un motivo seleccionado de la SEC ID Nº: 8, 9, 10 o 11) y comprende una sustitución de aminoácidos correspondiente a la SEC ID Nº: 38.

Otras sustitución(es) de aminoácidos adecuadas en uno o más de los sitios identificados se puede determinar usando, por ejemplo, métodos conocidos de mutagénesis dirigida al sitio y la determinación del rendimiento en los ensayos de extensión de polinucleótidos descritos con más detalle en la presente memoria o de otra manera conocidos para los expertos en la técnica, por ejemplo, las sustituciones de aminoácidos descritas en la Publicación de Patente US 2009/0148891 y 2009/0280539.

Debido a que la longitud precisa de las ADN polimerasas varían, las posiciones de los aminoácidos precisas que corresponden a cada uno de X5 de la SEC ID Nº: 8, 9, 10 o 11 o X8 de la SEC ID Nº: 38 puede variar dependiendo de la polimerasa mutante particular utilizada. Los programas de alineación de secuencias de aminoácidos y ácido nucleicos están fácilmente disponibles (véase, por ejemplo, los mencionados más arriba) y, dados los motivos particulares identificados en la presente memoria, sirven para ayudar en la identificación de los aminoácidos exactos (y los codones correspondientes) para la modificación de acuerdo con la presente invención. Las posiciones correspondientes a cada uno de X5 y X8 se muestran en la Tabla 1 para ADN polimerasas termoestables quiméricas representativas y ADN polimerasas termoestables de especies termófilas ilustrativas.

Tabla 1. Posiciones de aminoácidos correspondientes a las posiciones del motivo X5 (por ejemplo, de la SEC ID Nº: 8, 9, 10, y 11) y X8 (de la SEC ID Nº: 38) en las polimerasas ilustrativas Organismo o secuencia quimérica Posición del aminoácido Consenso (SEC ID Nº :) X5 X8 (de la SEC ID Nº: 38)

T. thermophilus (6) 522 580

T. caldophilus (7) 522 580

T.sp. Z05 (1) 522 580

T. aquaticus (2) 520 578

T. flavus (4) 519 577

T. filiformis (3) 518 576

T.sp. Sps17 (5) 518 576

T. marítima (34) 582 640

T. neapolitana (35) 582 640

T. africanus (33) 581 639

B. caldotenax (37) 562 621

B. stearothermophilus (36) 562 620 CS5 (27) 582 640 CS6 (28) 582 640

D. radiodurans (32) 610 668 En algunas realizaciones, la ADN polimerasa de la presente invención es la ADN polimerasa de Thermus sp. Z05 ADN (SEC ID Nº: 1) o una variante de la misma (por ejemplo, portadora de la mutación D580G o similar). Como se ha mencionado anteriormente, en la ADN polimerasa Z05 de Thermus sp., la posición X5 corresponde a ácido glutámico (E) en la posición 522; la posición X8 corresponde a aspartato (D) en la posición 580. Así, en ciertas variaciones de la invención, la polimerasa mutante comprende al menos una sustitución de aminoácidos, respecto a una ADN polimerasa de Thermus sp. Z05, en E522 y/o D580. Por lo tanto, generalmente, el aminoácido en la posición 522 no es E. En algunas realizaciones, el aminoácido en la posición 522 se selecciona de G, A, L, M, F, W, P, S, T, C, Y, Q, D, K, R, V, I, N o H. En algunas realizaciones, el aminoácido en la posición correspondiente a la posición 552 de la SEC ID Nº: 1 es un aminoácido que tiene una cadena lateral no polar sin carga (por ejemplo, G, A, L, M, W, P, F, C, V o I) a pH neutro. En ciertas realizaciones, el residuo de aminoácidos en la posición 522 es G. En ciertas realizaciones, los residuos de aminoácidos en la posición D580 se pueden seleccionar de leucina (L), glicina (G), treonina (T), glutamina (Q), alanina ( A), serina (S), asparagina (N), arginina (R) y lisina (K).

Ejemplos de ADN polimerasa de Thermus sp. Z05 mutantes incluyen los que comprenden la sustitución(es) de aminoácidos E522G y/o D580G. En algunas realizaciones, la ADN polimerasa de Thermus sp. Z05 mutante comprende, por ejemplo., Sustituciones de aminoácidos de residuos E552G y D580G. En ciertas realizaciones, el mutante ADN polimerasa Z05 de Thermus sp comprende, por ejemplo, sustituciones de residuos de aminoácidos independientemente seleccionados entre E522G y/o D580G.

Además de la mutación de los motivos de las SEC ID Nº: 8, 9, 10, 11 y 38 como se describe en la presente memoria, las ADN polimerasas de la presente invención también pueden incluir otra modificación(es), no de sustitución (s). Tales modificaciones pueden incluir, por ejemplo, modificaciones covalentes conocidas en la técnica por conferir una ventaja adicional en las aplicaciones que comprenden la extensión de polinucleótidos. Por ejemplo, una modificación de este tipo es una modificación covalente reversible térmicamente que inactiva la enzima, pero que se invierte para activar la enzima tras la incubación a una temperatura elevada, tal como una temperatura generalmente utilizada para la extensión de polinucleótidos. Reactivos ilustrativos para tales modificaciones térmicamente reversibles se describen en la Patente US-5.773.258 y 5.677.152.

Las ADN polimerasas de la presente invención se pueden construir mediante la mutación de las secuencias de ADN que codifican para la polimerasa no modificada correspondiente (por ejemplo, una polimerasa de tipo silvestre o una variante correspondiente a partir de la cual se deriva la polimerasa de la invención), tal como mediante el uso de técnicas comúnmente conocidas como mutagénesis dirigida al sitio. Las moléculas de ácido nucleico que codifican la forma no modificada de la polimerasa pueden mutarse por una variedad de técnicas de reacción en cadena de la polimerasa (PCR) bien conocidas para un experto normal en la técnica (véase, por ejemplo, PCR Strategies (M. A. Innis, D. H. Gelfand, and J. J. Sninsky eds., 1995, Academic Press, San Diego, CA) en el Capítulo 14; PCR Protocols: A Guide to Methods and Applications (M. A. Innis, D. H. Gelfand, J. J. Sninsky and T. J. White eds., Academic Press, NY, 1990).

A modo de ejemplo no limitativo, el sistema de dos cebadores, utilizado en el kit Transformer Site-Directed Mutagenesis de Clontech, se puede emplear para la introducción de mutantes dirigidos al sitio en un polinucleótido que codifica para una forma no modificada de la polimerasa. Después de la desnaturalización del plásmido diana en este sistema, dos cebadores se hibridan simultáneamente con el plásmido; uno de estos cebadores contiene la mutación dirigida al sitio deseada, el otro contiene una mutación en otro punto del plásmido que da lugar a la eliminación de un sitio de restricción. La síntesis de la segunda cadena se lleva a cabo a continuación, estando estrechamente asociadas estas dos mutaciones, y los plásmidos resultantes se transforma en una cepa mutS de E.

coli. El ADN del plásmido se aísla de las bacterias transformadas, se trata con la correspondiente enzima de restricción (linealizando así los plásmidos no mutados) y luego se retransforma en E. coli. Este sistema permite la generación de mutaciones directamente en un plásmido de expresión, sin la necesidad de subclonación ni de la generación de fagémidos monocatenarios. La fuerte asociación entre las dos mutaciones y la posterior linealización de los plásmidos no mutados dan como resultado una alta eficiencia de mutación y permiten el cribado mínimo.

Después de la síntesis del cebador del sitio de restricción inicial, este método requiere el uso de un sólo nuevo tipo de cebador por sitio de la mutación. En lugar de preparar cada mutante posicional por separado, se puede sintetizar un conjunto de cebadores de oligonucleótidos “degenerados diseñados” con el fin de introducir todas las mutaciones deseadas en un sitio dado de forma simultánea. Los transformantes se pueden seleccionar mediante la secuenciación del ADN del plásmido a través de la región mutagenizada para identificar y ordenar clones mutantes.

Cada ADN mutante puede entonces ser restringido y analizado por electroforesis, tal como, por ejemplo, en un gel de Aumento de la detección de mutaciones (Mallinckrodt Baker, Inc., Phillipsburg, NJ) para confirmar que no se han producido otras alteraciones en la secuencia (por comparación del desplazamiento de banda con control no mutagenizado). Alternativamente, toda la región de ADN puede ser secuenciada para confirmar que no se han producido eventos mutacionales adicionales fuera de la región específica.

Las ADN polimerasas con más de un aminoácido sustituido se pueden generar de varias maneras. En el caso de los aminoácidos situados muy juntos en la cadena polipeptídica, pueden mutarse simultáneamente utilizando un oligonucleótido que codifique para todas las sustituciones de aminoácidos deseadas. Sin embargo, si los aminoácidos están situados a cierta distancia unos de otros (separados por más de diez aminoácidos, por ejemplo) es más difícil generar un único oligonucleótido que codifique todos los cambios deseados. En su lugar, se pueden usar uno de los dos métodos alternativos. En el primer método, se genera un oligonucleótido aislado para cada aminoácido a ser sustituido. Los oligonucleótidos se hibridaron a continuación simultáneamente con el ADN molde monocatenario y la segunda cadena de ADN que se sintetiza a partir del molde codificará todas las sustituciones de aminoácidos deseadas. Un método alternativo implica dos o más rondas de mutagénesis para producir el mutante deseado. La primera ronda es como se describe para los mutantes individuales: el ADN que codifica para la polimerasa no modificada se utiliza para el molde, un oligonucleótido que codifica para la primera sustitución(es) de aminoácidos deseada) se hibrida con este molde y entonces se genera la molécula de ADN heterodúplex. La segunda ronda de mutagénesis utiliza el DNA mutado producido en la primera ronda de mutagénesis como molde. Por lo tanto, esta molde ya contiene una o más mutaciones. El oligonucleótido que codifica para la sustitución(es) de aminoácidos adicional deseadas se hibrida a continuación con este molde y la cadena resultante de ADN codifica ahora para las mutaciones de la primera y segunda rondas de mutagénesis. Este ADN resultante se puede utilizar como un molde en una tercera ronda de mutagénesis, etc. Alternativamente, se pueden utilizar el método de mutagénesis multi-sitio de Seyfang y Jin (Anal. Biochem. 324:285-291. 2004).

En consecuencia, también se proporcionan ácidos nucleicos recombinantes que codifican para cualquiera de las ADN polimerasas de la presente invención. Con un ácido nucleico de la presente invención, que codifica para una ADN polimerasa, se puede usar una variedad de vectores. Cualquier vector que contenga un replicón y secuencias control obtenidas de una especie compatible con la célula hospedadora se pueden utilizar en la práctica de la invención. Generalmente, los vectores de expresión incluyen regiones de ácido nucleico reguladoras de la transcripción y de la traducción unidas operativamente al ácido nucleico que codifica la ADN polimerasa. El término “secuencias de control” se refiere a secuencias de ADN necesarias para la expresión de una secuencia codificante unida operativamente en un organismo hospedador particular. Las secuencias de control que son adecuadas para procariotas, por ejemplo, incluyen un promotor, opcionalmente una secuencia operadora y un sitio de unión al ribosoma. Además, el vector puede contener un elemento positivo retroregulador (PRE) para aumentar la semivida del ARNm transcrito (ver Gelfand et al. Patente US- 4.666.848). Las regiones de ácido nucleico reguladoras de la transcripción y la traducción serán generalmente apropiadas para la célula hospedadora utilizada para expresar la polimerasa. En la técnica, son conocidos numerosos tipos de vectores de expresión apropiados, y secuencias reguladoras adecuadas para una variedad de células hospedadoras. En general, las secuencias reguladoras de la transcripción y la traducción pueden incluir, por ejemplo., secuencias promotoras, sitios de unión ribosomal, secuencias de inicio y fin de la transcripción, secuencias de inicio y fin de la traducción y secuencias potenciadoras o activadoras. En realizaciones típicas, las secuencias reguladoras incluyen un promotor y secuencias de inicio y fin de la transcripción. Los vectores también incluyen generalmente una región de polienlazador que contiene varios sitios de restricción para la inserción de ADN extraño. En ciertas realizaciones, se usan “banderas de fusión” para facilitar la purificación y, si se desea, la posterior eliminación de la secuencia de etiqueta/bandera, por ejemplo, “His- tag”. Sin embargo, éstas son generalmente innecesarias cuando se purifica una proteína termoactiva y/o termoestable de un hospedador mesófilo (por ejemplo, E. coli) donde se puede emplear una “etapa de calor”. La construcción de vectores adecuados que contienen secuencias de replicación que codifican para el ADN, secuencias reguladoras, genes de selección fenotípica y la polimerasa de interés se preparan usando procedimientos de ADN recombinante estándar. Los plásmidos aislados, vectores virales, y fragmentos de ADN se escinden, se adaptan y se ligan juntos en un orden específico para generar los vectores deseados, como es bien conocido en la técnica (véase, por ejemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Nueva York, NY, 2ª ed.1989)).

En ciertas realizaciones, el vector de expresión contiene un gen marcador seleccionable para permitir la selección de células hospedadora transformadas. Los genes de selección son bien conocidos en la técnica y variarán con la célula hospedadora usada. Los genes de selección adecuados pueden incluir, por ejemplo, genes que codifican para la resistencia a la ampicilina y/o tetraciclina, lo que permite a las células transformadas con estos vectores crecer en presencia de estos antibióticos.

En un aspecto de la presente invención, un ácido nucleico que codifica para una ADN polimerasa se introduce en una célula, ya sea solo o en combinación con un vector. Por “se introduce en” o equivalentes gramaticales en la presente memoria se entiende que los ácidos nucleicos entran en las células de una manera adecuada para la posterior integración, amplificación y/o expresión del ácido nucleico. El método de introducción viene determinado en gran medida por el tipo de célula diana. Ejemplos de métodos incluyen precipitación con CaPO4, fusión de liposomas, Lipofectin®, electroporación, infección viral y similares.

En algunas realizaciones, los procariotas se utilizan normalmente como células hospedadoras para las etapas de clonación iniciales de la presente invención. Son particularmente útiles para la producción rápida de grandes cantidades de ADN, para la producción de moldes de ADN de cadena sencilla utilizados para la mutagénesis dirigida al sitio, para el cribado de muchos mutantes simultáneamente y para la secuenciación del ADN de los mutantes generados. Células hospedadoras procariotas adecuadas incluyen E. coli K12 cepa 94 (ATCC nº 31.446), E. coli cepa W3110 (ATCC nº 27325), E. coli K12 cepa DG116 (ATCC nº 53606), E. coli X1776 (ATCC Nº 31537) y E. coli B; sin embargo se pueden usar como hospedadores muchas otras cepas de E. coli, tales como HB101, JM101, NM522, NM538, NM539 y muchas otras especies y géneros de procariotas incluyendo bacilos tales como Bacillus subtilis, otras enterobacterias tales como Salmonella typhimurium o Serratia marcescens y varias especies de

Pseudomonas. Las células hospedadoras procariotas u otras células hospedadoras con paredes celulares rígidas se transforman generalmente usando el método del cloruro de calcio como se describe en la sección 1.82 de Sambrook et al., supra. Alternativamente, la electroporación puede utilizarse para la transformación de estas células. Las técnicas de transformación de procariotas se exponen, por ejemplo, en Dower, en Genetic Engineering, Principles and Methods 12:275-296 (Plenum Publishing Corp., 1990); Hanahan et al., Meth. Enzymol., 204:63, 1991. Los plásmidos usados generalmente para la transformación de E. coli incluyen pBR322, pUCI8, pUCI9, pUCI18, pUC119 y Bluescript M13, todos los cuales se describen en las secciones 1.12-1.20 de Sambrook et al., supra. Sin embargo, también están disponibles muchos otros vectores adecuados.

Las ADN polimerasas de la presente invención se producen generalmente mediante el cultivo de una célula hospedadora transformada con un vector de expresión que contiene un ácido nucleico que codifica para la ADN polimerasa, en las condiciones apropiadas para inducir o causar la expresión de la ADN polimerasa. Métodos de cultivo de células hospedadoras transformadas en condiciones adecuadas para la expresión de proteínas son bien conocidos en la técnica (véase, por ejemplo, Sambrook et al., supra). Las células hospedadoras adecuadas para la producción de las polimerasas de los vectores plasmídicos que contienen el promotor pL del fago lambda incluyen E.

coli cepa DG116 (ATCC nº 53606) (ver Patente ÚS-5.079.352 y Lawyer, F.C. et al., PCR Methods and Applications 2:275-87, 1993). Después de la expresión, la polimerasa se puede cosechar y aislar. Los métodos para purificar la ADN polimerasa termoestable se describen en, por ejemplo, Lawyer et al., supra. Una vez purificada, la capacidad de las ADN polimerasas de tener una mejor eficiencia RT, una mayor tolerancia al desapareamiento, velocidad de extensión y/o tolerancia a los inhibidores de RT y polimerasa se puede ensayar (por ejemplo, como se describe en los ejemplos).

Las ADN polimerasas mejoradas de la presente invención se pueden usar para cualquier propósito en el que tal actividad de la enzima se necesite o se desee. Por consiguiente, en otro aspecto de la invención, se proporcionan métodos de extensión de polinucleótidos (por ejemplo, PCR) usando las polimerasas. Las condiciones adecuadas para la extensión de polinucleótidos son conocidas en la técnica (véase, por ejemplo, Sambrook et al., supra. Ver también Ausubel et al., Short Protocols in Molecular Biology (4ª ed., John Wiley & Sons 1,999). En general, un cebador se hibrida con un ácido nucleico diana para formar un complejo cebador-molde. El complejo cebador-molde se pone en contacto con la ADN polimerasa y nucleósidos trifosfato en un ambiente adecuado para permitir la adición de uno o más nucleótidos al extremo 3' del cebador, produciendo así un cebador extendido complementario al ácido nucleico diana. El cebador puede incluir, por ejemplo, uno o más análogos de nucleótidos. Además, los nucleósido trifosfato pueden ser nucleótidos convencionales, nucleótidos no convencionales (por ejemplo, ribonucleótidos o nucleótidos marcados), o una mezcla de los mismos. En algunas variaciones, la reacción de extensión de polinucleótidos comprende la amplificación de un ácido nucleico diana. Las condiciones adecuadas para la amplificación de ácidos nucleicos utilizando una ADN polimerasa y un par de cebadores también se conocen en la técnica (por ejemplo, métodos de amplificación de PCR). (Véase, por ejemplo, Sambrook et al., supra; Ausubel et al., supra; PCR Applications: Protocols for Functional Genomics (Innis et al. eds., Academic Press 1999). En otras realizaciones, no mutuamente excluyentes, la reacción de extensión de polinucleótidos comprende la transcripción inversa de un molde de ARN (por ejemplo, RT-PCR). En algunas realizaciones, las polimerasas mejoradas se utilizan en la secuenciación de 454 (Margulies, M et al. 2005, Nature, 437, 376-380).

En algunas realizaciones, una polimerasa mejorada de la invención se utiliza en una reacción de transcripción inversa. En algunas realizaciones, la reacción de transcripción inversa se lleva a cabo en una mezcla que contiene el molde de ARN, uno o más cebadores y una ADN polimerasa termoestable de la invención. La mezcla de reacción generalmente contiene los cuatro desoxirribonucleósidos trifosfato (dNTPs) estándar y un tampón que contiene un catión divalente y un catión monovalente. Ejemplos de cationes incluyen, por ejemplo, Mg2+, aunque otros cationes, tales como Mn2+ o Co2+ pueden activar las ADN polimerasas. En otras realizaciones, la reacción de transcripción inversa se lleva a cabo con una ADN polimerasa termoactiva de la invención. En realizaciones particulares, la polimerasa mejorada de la invención permite la amplificación más eficiente de moldes de ARN sin comprometer la amplificación eficiente de un molde de ADN en presencia de Mn2+ o Mg2+ como se describe en los ejemplos.

La actividad RT más eficiente en las ADN polimerasas termoestables se ha logrado usando Mn2+ como el activador de ion metálico divalente. Sin embargo, es bien sabido que cuando Mn2+ está presente en las reacciones, la fidelidad de las ADN polimerasas es menor. A menos que uno esté tratando de generar mutaciones, está generalmente favorecido mantener una fidelidad superior. Afortunadamente, la secuenciación más convencional, las aplicaciones de PCR y RT-PCR, no requieren condiciones de alta fidelidad debido a que los sistemas de detección generalmente están buscando en una población de productos. Con el advenimiento de la secuenciación de próxima generación, PCR digital, etc., la fidelidad del producto es más importante y son fundamentales métodos que permitan una mejor fidelidad de la síntesis de ADN. El logro de una eficiente actividad RT usando Mg2+ como el activador de ion metálico divalente es una excelente manera de aumentar sustancialmente la fidelidad de la ADN polimerasa y permitir la obtención de un copiado más fiable de la diana de ácido nucleico.

Debido a que las polimerasas descritas en la presente memoria también pueden tener una mayor tolerancia al desapareamiento, las polimerasas se pueden utilizar en métodos en los que es probable la variación del molde diana y no obstante se desea su amplificación, independientemente de la variación en el molde diana. Un ejemplo de tales moldes pueden incluir, por ejemplo, secuencias virales, bacterianas u otras secuencias de patógenos. En muchas realizaciones, es deseable determinar simplemente si un individuo (animal humano o no humano) tiene una infección viral u otra infección, independientemente de la variante viral precisa que ha infectado al individuo. Como ejemplo, se puede utilizar un par de cebadores para amplificar el VHC usando una polimerasa de la invención y detectar la presencia del VHC incluso si el virus particular que infecta al individuo tiene una mutación que tiene como resultado una falta de coincidencia en el sitio de hibridación del cebador.

Los ácidos nucleicos diana pueden provenir de una fuente biológica o sintética. La diana, puede ser, por ejemplo, ADN o ARN. En general, cuando se generan amplicones, los amplicones se compondrán de ADN, aunque también se pueden incorporar en el amplicón ribonucleótidos o nucleótidos sintéticos. Cuando se desea detectar un ARN, el proceso de amplificación implicará generalmente implicará el uso de la transcripción inversa, incluyendo, por ejemplo, la PCR con transcripción inversa (RT-PCR).

Las secuencias diana específicas pueden incluir, por ejemplo, ácidos nucleicos virales (por ejemplo, virus de la inmunodeficiencia humana (VIH), virus de la hepatitis B (VHB), (citomegalovirus (CMV), parvovirus B19, virus de Epstein-Barr, virus de la hepatitis C (VHC), virus del papiloma humano (VPH), virus de la encefalitis japonesa (VEJ), virus del Nilo Occidental (VNO), virus de la encefalitis de St. Lous (VESL), virus de la encefalitis de Murray Valley y virus Kunjin), ácidos nucleicos bacterianos (por ejemplo, S. aureus, Neisseria meningitidis, Plasmodium falciparum, Chlamydia muridarum, Chlamydia trachomatis), ácidos nucleicos de micobacterias y hongos o ácidos nucleicos de animales o plantas. En algunas realizaciones, los ácidos nucleicos diana son ácidos nucleicos animales (por ejemplo, humanos) o se obtienen de una muestra de un animal (por ejemplo, del ser humano) (es decir, los ácidos nucleicos virales o de otros organismos patógenos pueden estar presentes en una muestra de una biopsia, muestra de sangre, muestra de orina, muestra fecal, saliva etc. de un animal). En algunas realizaciones, los ácidos nucleicos diana son, por ejemplo, regiones genéticas humanas que pueden incluir variantes asociadas con la enfermedad (por ejemplo, cáncer, diabetes, etc.). Debido a que en algunas realizaciones las polimerasas de la invención tienen tolerancia al desapareamiento, tales enzimas son particularmente útiles, por ejemplo, cuando una diversidad de secuencias relacionadas podría estar en una secuencia diana. A modo de ejemplo, la invención puede ser utilizada para detectar patógenos virales, donde los patógenos virales tienen suficiente variación en sus genomas para hacer difícil o imposible diseñar un solo cebador o un pequeño conjunto de cebadores que amplifiquen la mayoría o todos los posibles genomas virales o en el cáncer u otros marcadores genéticos de enfermedades donde la variación en la secuencia es conocida o es probable que se produzca.

Otros métodos para detectar productos de extensión o productos de amplificación utilizando las polimerasas mejoradas descritas la presente memoria incluyen el uso de colorantes fluorescentes de unión a nucleótidos de doble cadena o colorantes fluorescentes de intercalación entre los nucleótidos de doble cadena. Ejemplos de colorantes fluorescentes de unión a ADN de doble cadena incluyen SYBR-verde (Molecular Probes). Los colorantes de unión a ADN de doble cadena se pueden usar junto con el análisis de la curva de fusión para medir productos de extensión de cebadores y/o productos de amplificación. El análisis de la curva de fusión se puede realizar en un instrumento de PCR en tiempo real, tal como el instrumento ABI 5700/7000 (formato de 96 pocillos) o ABI 7900 (formato de 384 pocillos) con el software instalado (SDS 2.1). Alternativamente, el análisis de la curva de fusión se puede realizar como un análisis de punto final. Ejemplos de métodos de análisis de punto de fusión se describen en la Publicación de Patente US-2006/0172324.

En otro aspecto de la presente invención, se proporcionan kits para su uso en métodos de extensión de cebadores descritos en la presente memoria. En algunas realizaciones, el kit es compartimentado para facilitar su uso y contiene al menos un recipiente que proporciona una ADN polimerasa mejorada de acuerdo con la presente invención. También se pueden incluir uno o más recipientes adicionales que proporcionan reactivo(s) adicional(es). En algunas realizaciones, el kit también puede incluir un tubo de recogida de sangre, un recipiente o unidad que comprende heparina o una sal de la misma, o que libera heparina en solución. La unidad de recogida de sangre puede ser un tubo heparinizado. Tales recipientes adicionales pueden incluir cualquier reactivo u otros elementos reconocidos por el experto en la técnica para uso en procedimientos de extensión del cebador de acuerdo con los métodos descritos anteriormente, incluyendo reactivos para su uso en, por ejemplo, procedimientos de amplificación de ácidos nucleicos (por ejemplo, PCR, RT-PCR), los procedimientos de secuenciación de ADN o procedimientos de marcaje de ADN. Por ejemplo, en ciertas realizaciones, el kit incluye además un recipiente que proporciona un cebador en sentido 5' hibridable, en las condiciones de extensión del cebador, con un molde predeterminado de polinucleótidos, o un par de cebadores que comprende el cebador en sentido 5' y el correspondiente cebador antisentido 3'. En otras variaciones, no mutuamente exclusivas, el kit incluye uno o más recipientes que proporcionan nucleósidos trifosfato (convencionales y/o no convencional). En realizaciones específicas, el kit incluye dNTPs alfa-fosforotioato, dUTP, dITP y/o dNTPs marcados, tales como, por ejemplo, dNTPs de la familia de los colorantes de la fluoresceína o cianina. En otras realizaciones más, no mutuamente excluyentes, el kit incluye uno o más recipientes que proporcionan un tampón adecuado para una reacción de extensión del cebador.

En otro aspecto de la presente invención, se proporcionan mezclas de reacción que comprenden las polimerasas con una mayor eficiencia de transcriptasa inversa, tolerancia al desapareamiento, velocidad de extensión y/o tolerancia a los inhibidores de RT y de polimerasa como se describe en la presente memoria. Las mezclas de reacción pueden comprender además reactivos para su uso en, por ejemplo, los procedimientos de amplificación de ácidos nucleicos (por ejemplo, PCR, RT-PCR), procedimientos de secuenciación de ADN o procedimientos de marcaje de marcaje de ADN. Por ejemplo, en ciertas realizaciones, las mezclas de reacción comprenden un tampón adecuado para una reacción de extensión del cebador. Las mezclas de reacción también pueden contener un ácido nucleico molde (ADN y/o ARN), uno o más polinucleótidos cebador o sonda, nucleósidos trifosfatos (incluyendo, por ejemplo, desoxirribonucleótidos, ribonucleótidos, nucleótidos marcados, nucleótidos no convencionales), sales (por ejemplo, Mn2+, Mg2+), marcadores (por ejemplo, fluoróforos). En algunas realizaciones, las mezclas de reacción contienen un cebador en sentido 5' hibridable, en condiciones de extensión del cebador, a un molde predeterminada de polinucleótidos o a un par de cebadores que comprenden el cebador en sentido 5' y el correspondiente cebador antisentido 3'. En algunas realizaciones, las mezclas de reacción contienen dNTPs alfa-fosforotioato, dUTP, dITP, y/o dNTPs marcados, tales como, por ejemplo, dNTPs de la familia de colorantes de la fluoresceína o la cianina. En algunas realizaciones, las mezclas de reacción comprenden un quelante de hierro o un colorante de color púrpura. En ciertas realizaciones, las mezclas de reacción comprenden hemoglobina o un producto de degradación de la hemoglobina. Por ejemplo, en ciertas realizaciones, los productos de degradación de la hemoglobina incluyen productos de degradación del heme, tales como hemina, hematina, hematoporfirina y bilirrubina. En determinadas realizaciones, las mezclas de reacción comprenden heparina o una sal de la misma. En ciertas realizaciones, la mezcla de reacción contiene un ácido nucleico molde que se aísla de la sangre. En otras realizaciones, el ácido nucleico molde es ARN y la mezcla de reacción comprende heparina o una sal de la misma.

Ejemplos

Los siguientes ejemplos se ofrecen para ilustrar, pero no para limitar la invención reivindicada.

Ejemplo 1: Generación de la biblioteca

En resumen, las etapas de este proceso de selección incluyó la generación de la biblioteca, la expresión y la purificación parcial de las enzimas mutantes, la selección de las enzimas según la propiedades deseadas, la secuenciación del ADN, la purificación clonal y la caracterización adicional de mutantes candidatos seleccionados. A continuación se describe cada una de estas etapas.

Generación clonal de la biblioteca: Un ácido nucleico que codifica para el dominio de la ADN polimerasa de Z05 D580G se sometió a PCR propensa a error (mutagénica) entre los sitios de restricción B1p I y Bgl II de un plásmido incluyendo esta secuencia de ácido nucleico. La secuencia amplificada se proporciona como SEC ID Nº: 39. Los cebadores utilizados se presentan a continuación: Cebador directo: 5'-CTACCTCCTGGACCCCTCCAA-3 '(SEC ID Nº: 30) y, Cebador inverso: 5'-ATAACCAACTGGTAGTGGCGTGTAA-3 '(SEC ID Nº: 31) La PCR se realizó usando un intervalo de concentraciones de Mg2+ de 1,8 a 3,6 mm, con el fin de generar bibliotecas con una gama de tasas de mutación. Las condiciones del tampón eran Bicina 50 mM pH 8,2, KOAc 115 mM 8% p/v de glicerol y 0,2 mM de cada dNTP. Se usó una enzima de PCR GeneAmp® AccuRT Hot Start a 0,15 Uµ/l. Comenzando con 5x105 copias de ADN plasmídico linealizado de Z05 D580G por volumen de reacción de 50 µl, las reacciones se desnaturalizaron usando una temperatura de 94 °C durante 60 segundos, a continuación, se realizaron 30 ciclos de amplificación, utilizando una temperatura de desnaturalización de 94 °C durante 15 segundos, una temperatura de hibridación de 60 °C durante 15 segundos, una temperatura de extensión de 72 °C durante 120 segundos y seguido por una extensión final a una temperatura de 72 °C durante 5 minutos.

El amplicón resultante se purificó con un QIAquick PCR Purification Kit (Qiagen, Inc., Valencia, CA, EE.UU.) y se cortó con Blp I y Bgl II y luego se volvió a purificó con un QIAquick PCR Purification Kit. Un vector plasmídico de Z05 D580G se preparó mediante corte con las mismas dos enzimas de restricción y tratamiento con fosfatasa alcalina, recombinante (RAS, cat # 03359123001) y se purificó con un QIAquick PCR Purification Kit. El vector de corte y el inserto mutado se mezclaron en una proporción de 1:3 y se trataron con ADN ligasa de T4 durante 5 minutos a temperatura ambiente (NEB Quick Ligation™ Kit). Las ligaciones se purificaron con un QIAquick PCR Purification Kit y se transformaron en una cepa hospedadora E. coli mediante electroporación.

Las alícuotas de los cultivos expresados se sembraron en medio selectivo de ampicilina con el fin de determinar el número de transformantes únicos en cada transformación. Las transformaciones se conservaron a -70 °C a -80 °C en presencia de glicerol como un crio-protector.

A continuación, cada biblioteca se extendió sobre placas de agar selectivo para ampicilina de gran formato. Las colonias individuales fueron transferidas a placas de 384 pocillos que contenían caldo Luria 2X con ampicilina y glicerol 10% p/v utilizando un selector automático de colonias (QPix2, Genetix Ltd). Estas placas se incubaron durante la noche a 30 °C para permitir que los cultivos crezcan y luego se conservaron a -70 °C a -80 °C. El glicerol añadido al caldo Luria 2X era lo suficientemente bajo como para permitir el crecimiento del cultivo y, sin embargo, lo suficientemente alto como para proporcionar la crioprotección. Se prepararon varios miles de colonias en varios niveles de mutagénesis (Mg2+) de esta manera para su uso posterior.

Preparación de la biblioteca de extractos. Parte 1-Fermentación: A partir de las bibliotecas clonales descritas anteriormente, se preparó la correspondiente biblioteca de extractos parcialmente purificados adecuados para los propósitos de detección. La primera etapa de este proceso era producir cultivos de expresión a pequeña escala de cada clon. Estos cultivos se cultivaron en formato de 96 pocillos; por lo tanto, había 4 placas de cultivo de expresión para cada placa de biblioteca de 384 pocillos. Se transfirieron 0,5 µl desde cada pocillo de la placa de biblioteca clonal a un pocillo de una placa de siembra de 96 pocillos, que contiene 150 µl de medio A (véase la Tabla 3 siguiente). Esta placa de siembra se agitó durante la noche a 1150 rpm a 30 °C, en un incubador/agitador de placa iEMS (ThermoElectron). Estos cultivos de siembra se utilizaron luego para inocular el mismo medio, inoculando esta vez 20 µl en 250 µl de medio A en placas de 96 pocillos de gran formato (Nunc # 267334). Estas placas se incubaron durante la noche a 37 °C con agitación. El plásmido de expresión contenía elementos de control transcripcional, que permiten la expresión a 37 °C pero no a 30 °C. Después de la incubación durante la noche, los cultivos expresan la proteína clon en generalmente 1.10% de la proteína celular total. Las células de estos cultivos se recogieron por centrifugación. Estas células se congelaron (-20 °C) o se procesaron inmediatamente, como se describe a continuación.

Tabla 2. Medio A (Esterilizado por filtración antes de su uso) MgSO4·7H2O 0,2 g/l Ácido cítrico ·H2O 2 g/l K2HPO4 10 g/l NaNH4PO4·4H2O 3,5 g/l MgSO4 2 mM Casaminoácidos 2,5 g/l Glucosa 2 g/l Tiamina·HCl 10 mg/l Ampicilina 100 mg/l MgSO4·7H2O 0,2 g/l

Preparación de la biblioteca de extractos. Parte 2 - Extracción: Los sedimentos celulares de la etapa de fermentación se resuspendieron en 25 µl de tampón de lisis (Tabla 3 a continuación) y se transfirieron a placas del termociclador de 384 pocillos y se sellaron. Hay que señalar el tampón contenía lisozima para ayudar a la lisis celular y ADNasa para eliminar el ADN del extracto. Para lisar las células, las placas se incubaron a 37 °C durante 15 minutos, se congelaron durante la noche a -20 °C y se incubaron de nuevo a 37 °C durante 15 minutos. Se añadió sulfato de amonio (1,5 µl de una solución 2 M) y las placas se incubaron a 75 °C durante 15 minutos para precipitar e inactivar proteínas contaminantes, incluyendo las nucleasas añadidas exógenamente. Las placas se centrifugaron a 3000 xg durante 15 minutos a 4 °C y los sobrenadantes se transfirieron a una placa del termociclador de 384 pocillos limpia. Estas placas de extracto se congelaron a -20 °C para su uso posterior en cribados. Cada pocillo contenía aproximadamente 0,5-3 µM de la enzima polimerasa mutante de la biblioteca.

Tabla 3. Tampón de lisis Componente Concentración o porcentaje Tris pH 7.5 50 mM EDTA 1 mM MgCl2 6 mM Tween 20 0,5% v/v Lisozima (de polvo) 1 mg/ml ADNasa I 0,05 Unidades/µl

Ejemplo 2: Identificación de ADN polimerasas mutantes con una mayor eficiencia de transcripción inversa

Selección de bibliotecas de extractos en cuanto a una eficiencia de la transcripción reversa mejorada: La biblioteca de extractos se seleccionó mediante la comparación de los valores Cp (punto de cruce) de las curvas de crecimiento generadas por la actividad 5'-nucleasa fluorescente (TaqMan) de extractos de enzima bruta en un sistema de RT- PCR de la amplificación de un amplicón de 240 pares de bases del transcrito JP2-5 del virus de la hepatitis C (VHC ) que contiene las primeras 800 bases del VHC del genotipo Ib 5'NTR en pSP64 poli (A) (Promega).

Las reacciones se llevaron a cabo en un termociclador cinético Roche LC 480 en formato de 384 pocillos, conteniendo cada pocillo 1,5 µl de un extracto de enzima individual diluido 5 veces con tampón que contiene Tris- HCl 20 mM, pH 8, KCl 100 mM, EDTA 0,1 mM y Tween-20 0,1% añadido a 18,5 µl de mezcla maestra de RT-PCR descritos en la Tabla 4. Las condiciones de termociclado fueron: 1 minuto a 65 °C (etapa “RT”); 5 ciclos de 94 °C durante 15 segundos, seguido por 60 °C durante 30 segundos y 45 ciclos de 91 °C durante 15 segundos, seguido por 60 °C durante 30 segundos.

Tabla 4 Componente Concentración Tricina pH 8,3 50 mM KOAc 100 mM Glicerol 5% (v/v) DMSO 2 % (v/v) Cebador 1 200 nM Cebador 2 200 nM Sonda TaqMan 75 nM Aptámero 200 nM dATP 200 µM dCTP 200 µM dGTP 200 µM dUTP 400 µM UNG 0.04 Unidades/µl Diana de ARN 5000 copias/µl Mn(OAc)2 2,1 mM Aproximadamente 5000 clones fueron seleccionados utilizando el protocolo anterior. Veintiún clones fueron seleccionados del pool original para hace una nueva selección basada en los valores de punto de cruce (Cp) iniciales y los valores de meseta fluorescentes por encima de un valor de corte arbitrario calculado mediante el método del máximo de la segunda derivada (Abs Quant/2nd derivative max method). Se extrajeron muestras de los pocillos del cultivo correspondientes a los extractos superiores y se transfirieron a medio de crecimiento fresco y se volvieron a cultivar para producir nuevas placas de cultivo que contienen los mejores mutantes, así como una serie de cultivos parentales Z05 D580X (X = G, K y R) para ser utilizados para las comparaciones. Estas placas de cultivo se utilizaron a continuación para preparar extractos brutos frescos que se cuantificaron y volvieron a seleccionar a concentraciones de 20 nm con las mismas condiciones de mezcla maestra como se describe en la Tabla 4. La Tabla 5 muestra los valores Cp obtenidos a partir del aumento de la señal FAM debido a la escisión de la sonda TaqMan. Los resultados muestran que el clon 0818-M22 amplifica la diana de ARN con mayor eficiencia que la parental Z05 D580G.

Tabla 5.

Clon Cp promedio 0818-M22 19,2 Z05 D580R 24,0 Z05 D580K 24,5 Z05 D580G 27,5 La secuencia de ADN de la región mutada del gen de la polimerasa se secuenció para determinar la mutación o mutaciones que estaban presentes en cualquier clon individual. El clon 0818-M22 fue elegido para realizar más ensayos, por lo que la proteína polimerasa mutante se expresaba en el cultivo en matraz, se purificó hasta homogeneidad y se cuantificó.

Uso del mutante Z05 D580G en la RT-PCR basada en Mn2+: Los resultados de la secuenciación revelaron que el clon 0818-M22 lleva mutaciones E522G, N545Y y T642I, además de la mutación D580G parental. Se comparó el mutante purificado Z05 D580G_E522G_N545Y_T642I (0818-M22) con el D580G Z05 parental en TaqMan RT-PCR basada en Mn2+. Las eficiencias de transcripción inversa y PCR se midieron mediante la comparación de los valores Cp de amplificaciones del transcrito de ARN JP2-5 y del plásmido lineal de ADN JP2-5 digerido con la endonucleasa de restricción EcoRI. Los oligonucleótidos y las condiciones mezcla maestra (Tabla 4) fueron los mismos que se utilizaron en la selección original. Cada reacción tenía ya sea 100.000 copias del transcrito JP2-5, 100.000 copias del ADN del plásmido lineal pJP2-5 o 1.000 copias del ADN del plásmido lineal pJP2-5. Todas las dianas se amplificaron con el cebador 1 y el cebador 2, como se ha descrito anteriormente, en las reacciones duplicadas para generar un amplicón 240 pares de bases. Todas las reacciones se realizaron en el termociclador Roche Light Cycler 480 con un volumen de reacción de 15 µl. Los Puntos de cruce (CPS) fueron calculados mediante el método Abs Quant/2nd derivative max method y se promediaron. Las amplificaciones se llevaron a cabo utilizando un intervalos de concentraciones de la ADN polimerasa de 2,5 NM- 30 nM. Condiciones de termociclado fueron: 1 minuto a 65 °C (etapa “RT”); 5 ciclos de 94 °C durante 15 segundos, seguido por 60 °C durante 30 segundos y 45 ciclos de 91 °C durante 15 segundos, seguido por 60 °C durante 30 segundos. La Tabla 6 muestra los valores Cp obtenidos a partir del aumento de la señal fluorescente debido a la escisión de la sonda TaqMan en la condición de la enzima de 20 nM.

Tabla 6. Valores Cp de la amplificación del ARN JP2-5 del VHC y ADN pJP2-5 Enzima 105 copias de ARN Cp 105 copias de ADN Cp 103 copias de ARN Cp Z05 D580G 31,6 19,7 27,5 Z05 20,7 19,0 26,7 D580G_E522G_N545Y_T642I Los resultados indican que el Z05 D580G_E522G_N545Y_T642I mutante permite la amplificación más eficiente de la diana de ARN sin compromiso de eficiencia de la PCR sobre el ADN diana, en comparación con el parental.

Uso del mutante Z05 D580G en la RT-PCR basada en Mg2+: El mutante purificada Z05 D580G_E522G N545Y_T642I también se comparó con el D580G Z05 parental en cuanto a la capacidad de realizar la TaqMan RT- PCR en presencia de Mg2+. Las condiciones de mezcla maestra utilizadas fueron idénticas a las descritos en la Tabla 4, excepto que la concentración de KOAc se varió de 20 mM a 160 mM y se sustituyó Mn (OAc)2 con Mg(OAc)2 2,1 mM. Cada reacción tenía enzima 30nM y o bien 100.000 copias de transcrito de JP2-5, 100.000 copias de ADN de plásmido lineal pJP2-5 o 1.000 copias de ADN de plásmido lineal pJP2-5. Todas las dianas se ampliaron con el mismo conjunto de cebadores en reacciones duplicadas para generar un amplicón de 240 pares de bases. Las eficiencias de la PCR y la RT-PCR se determinaron mediante la comparación de los valores Cp entre el ADN y el ARN. Todas las reacciones se realizaron en el termociclador Roche Light Cycler 480 con un volumen de reacción de 15 µl. Se calcularon los puntos de cruce (CPS) mediante el método Abs Quant/2nd derivative max method y se promediaron. Las condiciones de termociclado fueron: 65 °C - 5 minutos, 70 °C-5 minutos y 75 °C-5 minutos (etapa “RT” de tres temperaturas); 5 ciclos de 94 °C durante 15 segundos, seguido por 62 °C durante 30 segundos y 45 ciclos de 91 °C durante 15 segundos, seguido por 62 °C durante 30 segundos. La Tabla 7 muestra los valores Cp obtenidos a partir de un aumento de la señal fluorescente debido a la escisión de la sonda TaqMan en la condición de KOAc 40 nM.

Tabla 7. Valores Cp de la amplificación del ARN JP2-5 del VHC y ADN pJP2-5 Enzima 105 copias de ARN 105 copias de ADN Cp 103 copias de ADN Cp Cp Z05 D580G 31,6 19,7 27,5 Z05 20,7 19,0 26,7 D580G_E522G_N545Y_T642I Los resultados indican que el mutante Z05 D580G_E522G_N545Y_T642I realiza la RT-PCR basada en Mg2+ con una eficacia significativamente mayor que Z05 D580G en estas condiciones.

Determinación de la mutación(es) que confieren fenotipo: El mutante 0818-M22 muestra una mejora significativa en la amplificación del ARN parental respecto al D580G Z05 en la selección por RT-PCR. El clon 0818-M22 es un triple mutante que lleva las mutaciones E522G, N545Y y T642I además de la mutación D580G parental. Basándose en la naturaleza del cambio de aminoácido, predijimos que la mutación E522G es responsable del fenotipo observado. Se construyó un mutante Z05 DS80G_E522G mediante subclonación, se purificó, se cuantificó y se comparó con 0818- M22 (Z05 D580G_E522G_N545Y_T642I) y el Z05 D580G parental en TaqMan RT-PCR activada con Mn2+ con diferentes concentraciones de enzima de 5 nM-40 nM. Las condiciones mezcla maestra fueron las mismas que las descritas anteriormente en la Tabla 4, excepto que se utilizó KOAc 90 mM en lugar de 100 mM. Cada reacción tenía ya sea 100.000 copias de transcrito JP2-5, 100.000 copias de ADN de plásmido lineal pJP2-5 o 1000 copias de ADN del plásmido lineal pJP2 ADN. Todas las dianas se amplificaron con el mismo conjunto de cebadores para generar un amplicón de 240 pares de bases. Las eficiencias de PCR y RT-PCR se determinaron mediante la comparación de los valores Cp entre el ADN y el ARN. Todas las reacciones se realizaron en el termociclador Roche Light Cycler 480 con un volumen de reacción de 15 µl. Los Puntos de cruce (CPS) fueron calculados mediante el método Abs Quant/2nd derivative max method y se promediaron. Las condiciones de termociclado fueron: 1 minuto a 65 °C (etapa “RT”); 5 ciclos de 94 °C durante 15 segundos, seguido por 60 °C durante 30 segundos y 45 ciclos de 91 °C durante 15 segundos, seguido por 60 °C durante 30 segundos. La Tabla 8 muestra los valores Cp obtenidos a partir del aumento de la señal fluorescente debido a la escisión de la sonda TaqMan en la condición de la enzima de 20 nM.

Tabla 8. Valores Cp de la amplificación del ARN JP2-5 del VHC y ADN pJP2-5 Enzima 105 copias de ARN Cp 105 copias de ADN Cp 103 copias de ADN Cp Z05 D580G 26,0 18,3 25,7 Z05 21,2 18,1 25,4 D580G_E522G_N545Y_T642I Z05 D580G_E522G 21,6 18,2 25,5 Este ejemplo demuestra que las mutaciones Z05 D580G_E522G_N545Y_T642I y Z05 D580G_E522G tienen valores de Cp similares en ambas dianas de ARN y ADN, lo que demuestra que la mutación E522G confiere la mejora observada en el rendimiento de la RT-PCR.

Ejemplo 3. Aislamiento de mutación E522G: La mutación E522G se subclonó en una estructura de ADN polimerasa Z05 como un único mutante. Después de la expresión y purificación, las eficiencias de la RT-PCR del mutante E522G Z05 se compararon con las ADN polimerasas Z05, Z05 D580G, D580G y Z05 E522G en la TaqMan RT-PCR catalizada con Mn2+. Las condiciones de mezcla maestra fueron las mismas que las descritas anteriormente en la Tabla 4, excepto que la concentración de Mn(OAc)2 fue de 1,5 mM, la concentración de UNG era 0,2U/µl, la concentración de acetato de potasio fue 120 mM y la concentración de la sonda era 100 nM. Cada reacción tenía una concentración de enzima final de 20 nM en un volumen de reacción total de 15 µl. Cada reacción tenía ya sea 100.000 copias de transcrito JP2-5, 100.000 copias de ADN de plásmido lineal pJP2-, o 1000 copias de ADN de plásmido lineal pJP2-5. Todas las dianas se amplificaron con el mismo conjunto de cebadores en réplicas de cuatro reacciones para generar un amplicón de 240 pares de bases. Todas las reacciones se realizaron en el termociclador Roche Light Cycler 480. Los puntos de cruce (Cp) fueron calculados mediante el método Abs Quant/2nd derivative max method y se promediaron. El perfil térmico de la RT-PCR fue: 2 minutos a 50 °C (“etapa UNG”); 55 °C - 1 minuto, 60 °C - 2 minutos y 65 °C - 3 minutos (etapa “RT” de tres temperaturas); 5 ciclos de 94 °C durante 15 segundos, seguido por 62 °C durante 30 segundos y 45 ciclos de 91 °C durante 15 segundos, seguido por 62 °C durante 30 segundos. La Tabla 9 muestra los valores Cp obtenidos a partir de un aumento de la señal fluorescente debido a la escisión de la sonda TaqMan.

Tabla 9. Valores Cp de la amplificación del ARN JP2-5 del VHC y ADN pJP2-5 Enzima 105 copias de ARN 105 copias de ADN 103 copias de ADN Cp Cp Cp Z05 33,6 17,6 25,3 Z05 D580G 20,0 17,2 24,8 Z05 E522G 20,8 17,2 24,9 Z05 D580G E522G 19,5 17,1 25,0 Este ejemplo demuestra que la mutación E522G proporciona una mayor eficiencia de RT-PCR de manera independiente de la mutación D580G. Además, al amplificar un molde de ADN los valores Cp de la enzima E552G fueron similares a los de la enzima ZO5 parental. Por lo tanto, al amplificar un molde de ADN la mutación E522G proporciona una mayor eficiencia de la RT-PCR sin una disminución en la eficiencia de la polimerasa.

Se entiende que los ejemplos y realizaciones descritos en la presente memoria son sólo para fines ilustrativos y que los expertos en la técnica pueden sugerir varias modificaciones o cambios a la luz de los mismos.

LISTADO DE SECUENCIAS <110> F. Hoffmann-La Roche AG Roche Diagnostics GmbH <120> ADN polimerasas con actividad mejorada <130> 27043 WO-HS <140> Aún no asignado <141> Aún no asignado <150> US 61/512.488 <151> 28-07-2011 <160> 40 <170> FastSEQ para windows versión 4.0 <210> 1 <211> 834 <212> PRT <213> Thermus sp.

<220> <223> ADN polimerasa de Thermus sp. Z05 (Z05) <400> 1 <210> 2 <211> 832 <212> PRT <213> Thermus aquaticus

<220> <223> ADN polimerasa de Thermus aquaticus (Taq) <400> 2 <210> 3 <211> 830 <212> PRT <213> Thermus filiformis

<220> <223> ADN polimerasa de Thermus filiformis (Tfi) <400> 3 <210> 4 <211> 831 <212> PRT <213> Thermus flavus

<220> <223> ADN polimerasa de Thermus flavus (Tfl) <400> 4 <210> 5 <211> 830 <212> PRT <213> Thermus sp.

<220> <223> ADN polimerasa de Thermus sp. Sps17 (Sps17) <400> 5 <210> 6 <211> 834 <212> PRT <213> Thermus thermophilus

<220> <223> ADN polimerasa de Thermus thermophilus (Tth) <400> 6 <210> 7 <211> 834 <212> PRT <213> Thermus caldophilus

<220> <223> ADN polimerasa de Thermus caldophilus (Tca) <400> 7 <210> 8 <211> 16 <212> PRT <213> Secuencia artificial <220> <223> motivo del dominio sintético polimerasa de la ADN polimerasa <220> <221> VARIANTE <222> (3)...(3) <223> xaa = Ser, Arg, Asn o Ala <220> <221> VARIANTE <222> (4)...(4) <223> xaa = Ala, Ile o Val <220> <221> VARIANTE <222> (5)...(5) <223> Xaa = Ala, Glu, Ser o Asp <220> <221> VARIANTE <222> (6)...(6) <223> Xaa = Val o Ala <220> <221> VARIANTE <222> (8)...(8) <223> Xaa = cualquier aminoácido distinto a Glu <220><221> VARIANTE<222> (9)...(9)<223> Xaa = Ala, Leu, Glu, Pro o Lys <220> <221> VARIANTE <222> (10)...(10) <223> Xaa = Leu o Ile <220> <221> VARIANTE <222> (11)...(11) <223> Xaa = Arg, Ala o Ser <220> <221> VARIANTE <222> (12)...(12) <223> Xaa = Glu, Gly, Asn, Lys, Asp o Pro <220> <221> VARIANTE <222> (13)...(13) <223> Xaa = Ala, Glu, His o Tyr <220> <221> VARIANTE <222> (15)...(15) <223> Pro o Glu <400> 8 <210> 9 <211> 16 <212> PRT <213> Secuencia artificial <220> <223> motivo del dominio sintético polimerasa de la ADN polimerasa <220> <221> VARIANTE <222> (3)...(3) <223> Xaa = Ser o Arg <220> <221> VARIANTE <222> (4)...(4) <223> Xaa = Ala o Ile <220> <221> VARIANTE <222> (5)...(5) <223> Xaa = Ala o Glu <220> <221> VARIANTE <222> (8)...(8) <223> Xaa = cualquier aminoácido distinto a Glu <220> <221> VARIANTE <222> (9)...(9) <223> Xaa = Ala, Leu o Glu <220> <221> VARIANTE <222> (10)...(10) <223> Xaa = Leu o Ile <220> <221> VARIANTE <222> (11)...(11) <223> Xaa = Arg o Ala <220> <221> VARIANTE <222> (12)...(12) <223> Xaa = Glu, Gly o Asn <220> <221> VARIANTE <222> (13)...(13) <223> Xaa = Ala o Glu <220> <221> VARIANTE <222> (15)...(15) <223> Xaa = Pro o Glu <400> 9 <210> 10 <211> 16 <212> PRT <213> Secuencia artificial <220> <223> motivo del dominio sintético polimerasa de la ADN polimerasa <220> <221> VARIANTE <222> (8)...(8) <223> Xaa = cualquier aminoácido distinto a Glu <400> 10 <210> 11 <211> 16 <212> PRT <213> Secuencia artificial <220> <223> motivo del dominio sintético polimerasa de la ADN polimerasa <400> 11 <210> 12 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Thermus sp. Z05 (Z05) <400> 12 <210> 13 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Thermus aquaticus (Taq) <400> 13 <210> 14 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Thermus filiformus (Tfi) <400> 14 <210> 15 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Thermus flavus (Tfl) <400> 15 <210> 16 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Thermus sp. Sps17 (Sps17) <400> 16 <210> 17 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Thermus thermophilus (Tth) <400> 17 <210> 18 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Thermus caldophilus (Tca) <400> 11 <210> 19 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Thermotoga maritima (Tma) <400> 19 <210> 20 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Thermotoga neopolitana

(Tne) <400> 20 <210> 21 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Thermosipho africanus (Taf) <400> 14 <210> 22 <211> 8 <212> PRT <213> Secuencia artificial <220> <223> motivo A del sitio activo sintético de la ADN polimerasa conservada <400> 22 <210> 23 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Deinococcus radiodurans (Dra) <400> 23 <210> 24 <211> 27 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Bacillus Stearothermophilus (Bst) <400> 24 <210> 25 <211> 28 <212> PRT <213> Secuencia artificial <220> <223> región sintética del dominio “pulgar” de la polimerasa de la ADN polimerasa de Bacillus caldotenax (Bca) <400> 25 <210> 26 <211> 16 <212> PRT <213> Secuencia artificial <220> <223> región sintética conservada del dominio “pulgar” polimerasa de la secuencia consenso de la ADN polimerasa <220> <221> VARIANTE <222> (3)...(3) <223> xaa = Ser, Arg, Asn o Ala <220> <221> VARIANTE <222> (4)...(4) <223> Xaa = Ala, Ile o Val <220> <221> VARIANTE <222> (5)...(5) <223> Xaa = Ala, Glu, Ser o Asp <220> <221> VARIANTE <222> (6)...(6) <223> Xaa = Val o Ala <220> <221> VARIANTE <222> (9)...(9) <223> Xaa = Ala, Leu, Glu, Pro o Lys <220> <221> VARIANTE <222> (10)...(10) <223> Xaa = Leu o Ile <220> <221> VARIANTE <222> (11)...(11) <223> Xaa = Arg, Ala o Ser <220> <221> VARIANTE <222> (12)...(12) <223> Xaa = Glu, Gly, Asn, Lys, Asp o Pro <220> <221> VARIANTE <222> (13)...(13) <223> Xaa = Ala, Glu, His o Tyr <220> <221> VARIANTE <222> (15)...(15) <223> Xaa = Pro o Glu <400> 26 <210> 27 <211> 893 <212> PRT <213> Secuencia artificial <220> <223> ADN polimerasa quimérica CS5 sintética derivada del dominio 5’-nucleasa N-terminal de Thermus sp. Z05 y de los dominios 3’-5’ exonucleasa C-terminal y polimerasa de las ADN polimerasas de Thermotoga maritima

<400> 27 <210> 28 <211> 893 <212> PRT <213> Secuencia artificial <220> <223> ADN polimerasa quimérica CS6 sintética derivada del dominio 5’-nucleasa N-terminal de Thermus sp. Z05 y de los dominios 3’-5’ exonucleasa C-terminal y polimerasa de las ADN polimerasas de Thermotoga maritima

<400> 28 <210> 29 <211> 16 <212> PRT <213> Secuencia artificial <220> <223> motivo del dominio sintético polimerasa de la ADN polimerasa <220> <221> VARIANTE <222> (8)...(8) <223> Xaa = un aminoácido que tiene una cadena lateral no polar, no cargada, por ej. Gly, Ala, Leu, Met, Trp, Pro, Phe, Cys, Val o Ile <400> 29 <210> 30 <211> 21 <212> ADN <213> Secuencia artificial <220> <223> cebador directo para la amplificación por PCR propensa a error (mutagénica) durante la síntesis <400> 30 ctacctcctg gacccctcca a 21 <210> 31 <211> 25 <212> ADN <213> Secuencia artificial <220> <223> cebador inverso para la amplificación por PCR propensa a error (mutagénica) durante la síntesis <400> 31 ataaccaact ggtagtggcg tgtaa 25 <210> 32 <211> 921 <212> PRT <213> Deinococcus radiodurans

<220> <223> ADN polimerasa de Deinococcus radiodurans (Dra) <400> 32 <210> 33 <211> 892 <212> PRT <213> Thermosipho africanus

<220> <223> ADN polimerasa de Thermosipho africanus (Taf) <400> 33 <210> 34 <211> 893 <212> PRT <213> Thermotoga maritima

<220> <223>ADN polimerasa de Thermotoga maritima (Tma) <400> 34 <210> 35 <211> 893 <212> PRT <213> Thermotoga neopolitana

<220> <223> ADN polimerasa de Thermotoga neopolitana (Tne) <400> 35 <210> 36 <211> 876 <212> PRT <213> Bacillus stearothermophilus

<220> <223> ADN polimerasa de Bacillus stearothermophilus (Bst) <400> 36

ES 2 553 400 T3   <210> 37 <211> 877 <212> PRT <213> Bacillus caldotenax

<220> <223> ADN polimerasa de Bacillus caldotenax (Bca)

ES 2 553 400 T3   <400> 37

ES 2 553 400 T3   <210> 38 <211> 13 <212> PRT <213> Secuencia artificial <220> <223> motivo sintético de la polimerasa que corresponde a la mutación D580X de Z05 <220> <221> VARIANTE <222> (7)...(7) <223> Xaa = Ser o Thr <220> <221> VARIANTE <222> (8)...(8) <223> Xaa = cualquier aminoácido distinto a Asp o Glu

ES 2 553 400 T3   <400> 38 <210> 39 <211> 1491 <212> ADN <213> Secuencia artificial <220> <223> amplicón sintético que codifica para el dominio polimerasa de la ADN polimerasa Z05 D580G amplificado por PCR propensa a error (mutagénica) entre los sitios de restricción BlpI y BglII <400> 39 <210> 40 <211> 831 <212> PRT <213> carboxydoThermus hydrogenoformans

<220> <223> ADN polimerasa de Carboxydothermus hydrogenoformans (chy) <400> 40

ES 2 553 400 T3  

ES 2 553 400 T3  

REINVIDICACIONES

1. ADN polimerasa que tiene una mayor eficiencia de transcriptasa inversa, en comparación con una ADN polimerasa de control, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 522 de la SEC ID Nº: 1 es cualquier aminoácido distinto de E y en la que la ADN polimerasa de control tiene la misma secuencia de aminoácidos que la ADN polimerasa, excepto que el aminoácido de la ADN polimerasa de control correspondiente a la posición 522 de la SEC ID Nº: 1 es E.

2. La ADN polimerasa de la reivindicación 1, que comprende un motivo en el dominio de la polimerasa que comprende S-T-X1-X2-X3-L4-L-X5-X6-X7-X8-X9-X10-H-X10-I, en la que: X1 es S, R, N o A; X2 es A, I o V; X3 es A, E, S o D; X4 es V o A; X5 es cualquier aminoácido distinto de E; X6 es A, L, E, P o K; X7 es L o I; X8 es R, A o S; X9 es E, G, N, K, D o P; X10 es A, E, H o Y; X11 es P o E.

3. La ADN polimerasa de cualquiera de las reivindicaciones 1 a 2, que comprende un motivo en el dominio polimerasa que comprende S-T-X1-X2-X3-V-L-X5-X6-X7-X8-X9-X10-H-X10-I, en la que: X1 es S o R; X2 es A o I; X3 es A o E; X5 es cualquier aminoácido distinto de E; X6 es A, L o E; X7 es L o I; X8 es R o A; X9 es E, G o N; X10 es A o E; X11 es P o E.

4. La ADN polimerasa de cualquiera de las reivindicaciones 1 a 3, que comprende un motivo en el dominio polimerasa que comprende S-T-S-A-A-V-L-X5-A-L-R-E-A-H-P-I, en la que: X5 es cualquier aminoácido distinto de E.

5. La ADN polimerasa de la reivindicación 4, que comprende un motivo en el dominio de la polimerasa que comprende S-T-S-A-A-V-L-X5-A-L-R-E-A-H-P-I, en la que X5 es G.

6. La ADN polimerasa de una cualquiera de las reivindicaciones 1 a 5, en la que el aminoácido correspondiente a la posición 580 de la SEC ID Nº: 1 es cualquier aminoácido distinto de D o E.

ES 2 553 400 T3   7. La ADN polimerasa de una cualquiera de las reivindicaciones 1 a 6, en la que el aminoácido correspondiente a la posición 580 de la SEC ID Nº: 1 se selecciona entre el grupo que consiste en L, G, T, Q, A, S, N, R y K.

8. La ADN polimerasa de una cualquiera de las reivindicaciones 1 a 7, en el que la ADN polimerasa tiene por lo menos 80%, preferiblemente al menos 90%, más preferiblemente al menos 95% de identidad de secuencia de aminoácidos con una polimerasa selecciona del grupo que consiste en: (a) SEC ID Nº: 1; (b) SEC ID Nº: 2; (c) SEC ID Nº: 3; (d) SEC ID Nº: 4; (e) SEC ID Nº: 5; (f) SEC ID Nº: 6; (g) SEC ID Nº: 7 (h) SEC ID Nº: 32; (i) SEC ID Nº: 33; (j) SEC ID Nº: 34; (k) SEC ID Nº: 35; (l) SEC ID Nº: 36 y (m) SEC ID Nº: 37.

9. LA ADN polimerasa de una cualquiera de las reivindicaciones 1 a 8, en la que la polimerasa tiene al menos 80%, preferiblemente al menos 90%, más preferiblemente al menos 95% de identidad de secuencia de aminoácidos con la SEC ID Nº: 1.

10. Un ácido nucleico recombinante que codifica para la ADN polimerasa de acuerdo con una cualquiera de las reivindicaciones 1 a 9. 11. Un vector de expresión que comprende el ácido nucleico recombinante de la reivindicación 10.

12. Un método para llevar a cabo la extensión del cebador, que comprende: poner en contacto una ADN polimerasa de acuerdo con una cualquiera de las reivindicaciones 1 a 9 con un cebador, un molde de polinucleótido y nucleósidos trifosfato en condiciones adecuadas para la extensión del cebador, produciendo de esta manera un cebador extendido.

13. Un kit para la producción de un cebador extendido, que comprende al menos un recipiente que proporciona una ADN polimerasa de acuerdo con una cualquiera de las reivindicaciones 1 a 9.

14. El kit según la reivindicación 13, que comprende además uno o más recipientes adicionales seleccionados del grupo que consiste en: (a) un recipiente que proporciona un cebador hibridable, en condiciones de extensión del cebador, con un molde de polinucleótidos predeterminado; (b) un recipiente que proporciona nucleósidos trifosfato y (c) un recipiente que proporciona un tampón adecuado para la extensión del cebador.

15. Una mezcla de reacción que comprende una ADN polimerasa de acuerdo con una cualquiera de las reivindicaciones 1 a 9, al menos un cebador, un molde de polinucleótidos y nucleósidos trifosfato.

ES 2 553 400 T3  

ES 2 553 400 T3  

FIGURA 2

A. Identidades de secuencia en toda la enzima polimerasa I (corrrespondiente a los aminoácidos 1-834 de Z05) Nombre

Z05

Taq

Tfi

Tfl

Sps17

Tth

Tca

Dra

Tma

Tne

Taf

Bst

Bca

Z05

0,864 0,833 0,859 0,839 0,962 0,958 0,459 0,374 0,368 0,359 0,407 0,408

Taq

0,864 0,831 0,854 0,836 0,872 0,864 0,468 0,382 0,368 0,351 0,397 0,397

Tfi

0,833 0,831 0,82 0,991 0,829 0,824 0,45 0,371 0,375 0,353 0,405 0,397

Tfl

0,859 0,854 0,82 0,824 0,853 0,848 0,462 0,381 0,374 0,356 0,397 0,398

Spsl7

0,839 0,836 0,991 0,824 0,835 0,83 0,452 0,375 0,377 0,355 0,407 0,399

Tth

0,962 0,872 0,829 0,853 0,835 0,989 0,463 0,373 0,367 0,358 0,406 0,406

Tca

0,958 0,864 0,824 0,848 0,83 0,989 0,46 0,371 0,365 0,356 0,404 0,404

Dra

0,459 0,468 0,45 0,462 0,452 0,463 0,46 0,334 0,325 0,314 0,338 0,339

Tma

0,374 0,382 0,371 0,381 0,375 0,373 0,371 0,334 0,854 0,567 0,37 0,377

Tne

0,368 0,368 0,375 0,374 0,377 0,367 0,365 0,325 0,854 0,558 0,377 0,376

Taf

0,359 0,351 0,353 0,356 0,355 0,358 0,356 0,314 0,567 0,558 0,356 0,364

Bst

0,407 0,397 0,405 0,397 0,407 0,406 0,404 0,338 0,37 0,377 0,356 0,881

Bca

0,408 0,397 0,397 0,398 0,399 0,406 0,404 0,339 0,377 0,376 0,364 0,881

B. Identidades de secuencia sólo en el subdominio de la polimerasa I (corrrespondiente a los aminoácidos 420-834 de Z05 Nombre

Z05

Taq

Tfi

Tfl

Sps17

Tth

Tea

Dra

Tma

Tne

Taf

Bst

Bca

Z05

0,901 0,845 0,891 0,845 0,975 0,973 0,563 0,483 0,478 0,44 0,498 0,49

Taq

0,901 0,879 0,901 0,877 0,906 0,901 0,561 0,488 0,473 0,44 0,503 0,495

Tfi

0,845 0,879 0,857 0,997 0,853 0,853 0,566 0,495 0,49 0,449 0,512 0,49

Tfl

0,891 0,901 0,857 0,855 0,889 0,889 0,571 0,492 0,48 0,444 0,494 0,485

Spsl7

0,845 0,877 0,997 0,855 0,853 0,853 0,566 0,495 0,49 0,449 0,512 0,49

Tth

0,975 0,906 0,853 0,889 0,853 0,99 0,563 0,478 0,473 0,437 0,496 0,488

Tca

0,973 0,901 0,853 0,889 0,853 0,99 0,563 0,478 0,473 0,437 0,496 0,488

Dra

0,563 0,561 0,566 0,571 0,566 0,563 0,563 0,45 0,448 0,426 0,474 0,454

Tma

0,483 0,488 0,495 0,492 0,495 0,478 0,478 0,45 0,883 0,622 0,474 0,475

Tne

0,478 0,473 0,49 0,48 0,49 0,473 0,473 0,448 0,883 0,615 0,476 0,473

Taf

0,44 0,44 0,449 0,444 0,449 0,437 0,437 0,426 0,622 0,615 0,46 0,473

Bst

0,498 0,503 0,512 0,494 0,512 0,496 0,496 0,474 0,474 0,476 0,46 0,898

Bca

0,49 0,495 0,49 0,485 0,49 0,488 0,488 0,454 0,475 0,473 0,473 0,898

ES 2 553 400 T3  

FIGURA 3

A. Identidades de secuencia en toda la enzima polimerasa I (corrrespondiente a los aminoácidos 1-834 de Z05) Nombre

Z05

Tth

Tfi

Tfl

Tea

Taq

Sps17

Z05

0,962 0,833 0,859 0,958 0,864 0,839

Tth

0,962 0,829 0,853 0,989 0,872 0,835

Tfi

0,833 0,829 0,82 0,824 0,831 0,991

Tfl

0,859 0,853 0,82 0,848 0,854 0,824

Tca

0,958 0,989 0,824 0,848 0,864 0,83

Taq

0,864 0,872 0,831 0,854 0,864 0,836

Sps17

0,839 0,835 0,991 0,824 0,83 0,836

B. Identidades de secuencia sólo en el subdominio de la polimerasa I (corrrespondiente a los aminoácidos 420-834 de Z05) Nombre

Z05

Tth

Tfi

Tfl

Tca

Taq

Sps17

Z05

0,975 0,845 0,891 0,973 0,901 0,845

Tth

0,975 0,853 0,889 0,99 0,906 0,853

Tfi

0,845 0,853 0,857 0,853 0,879 0,997 0,891 0,889 0,857 0,889 0,901 0,855

Tca

0,973 0,99 0,853 0,889 0,901 0,853

Taq

0,901 0,906 0,879 0,901 0,901 0,877

Sps17

0,845 0,853 0,997 0,855 0,853 0,877