Polinucleótidos que codifican polipéptidos antigénicos del VIH tipo C, polipéptidos y usos de los mismos.

Un casete de expresión que comprende:

(a) un polinucleótido que comprende al menos 480 nucleótidos contiguos de SEC ID Nº: 132; o

(b) un polinucleótido que tiene más del 98 % de identidad de secuencias con (a).

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10183206.

Solicitante: NOVARTIS VACCINES AND DIAGNOSTICS, INC..

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 350 Massachusetts Avenue Cambridge, MA 02139 ESTADOS UNIDOS DE AMERICA.

Inventor/es: BARNETT, SUSAN, ZUR MEGEDE,JAN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION C — QUIMICA; METALURGIA > BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE;... > MICROORGANISMOS O ENZIMAS; COMPOSICIONES QUE LOS... > Células no diferenciadas humanas, animales o vegetales,... > C12N5/10 (Células modificadas por introducción de material genético extraño, p. ej. células transformadas por virus)
  • SECCION C — QUIMICA; METALURGIA > QUIMICA ORGANICA > PEPTIDOS (péptidos que contienen β -anillos lactamas... > Péptidos con más de 20 aminoácidos; Gastrinas;... > C07K14/16 (VIH-1)
  • SECCION A — NECESIDADES CORRIENTES DE LA VIDA > CIENCIAS MEDICAS O VETERINARIAS; HIGIENE > PREPARACIONES DE USO MEDICO, DENTAL O PARA EL ASEO... > Preparaciones medicinales que contienen antígenos... > A61K39/21 (Retroviridae, p. ej. virus de la anemia infecciosa equina)
  • SECCION C — QUIMICA; METALURGIA > BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE;... > MICROORGANISMOS O ENZIMAS; COMPOSICIONES QUE LOS... > Técnicas de mutación o de ingeniería genética;... > C12N15/48 (Retroviridae, p. ej. virus de la leucemia bovina, virus de la leucemia felina)
google+ twitter facebook

Texto extraído del PDF original:

Polinucleótidos que codifican polipéptidos antigénicos del VIH tipo C, polipéptidos y usos de los mismos Descripción

CAMPO TÉCNICO Se describen polinucleótidos que codifican polipéptidos antigénicos del VIH tipo C (por ejemplo, Gag, pol, vif, vpr, tat, rev, vpu, env y nef), ya que son usos de estos polinucleótidos y productos de polipéptido en composiciones inmunogénicas. También se describen secuencias de polinucleótidos de variantes sudafricanas del VIH tipo C.

ANTECEDENTES DE LA INVENCIÓN El síndrome de la inmunodeficiencia adquirida (SIDA) es reconocido como una de las mayores amenazas para la salud a las que se enfrenta la medicina moderna. Hasta ahora no hay cura para esta enfermedad. En 1983-1984, tres grupos identificaron independientemente el agente etiológico sospechoso del SIDA. Véanse, por ejemplo, Barre- Sinoussi et al. (1983) Science 220:868-871; Montagnier et al., en Human T-Cell Leukemia Viruses (Gallo, Essex & Gross, eds., 1984); Vilmer et al. (1984) The Lancet 1:753; Popovic et al. (1984) Science 224:497-500; Levy et al. (1984) Science 225:840-842. Estas cepas aisladas se llamaron de las diversas formas virus asociado a linfadenopatía (LAV), virus linfotrópico de linfocitos T humanos tipo III (HTLV-III), o retrovirus asociado al SIDA (ARV). Todas estas cepas aisladas son cepas del mismo virus, y después se llamaron conjuntamente virus de la inmunodeficiencia humana (VIH). Con el aislamiento de un virus causante del SIDA relacionado, las cepas llamadas originalmente VIH ahora se llaman VIH-1 y el virus relacionado se llama VIH-2. Véanse, por ejemplo, Guyader et al. (1987) Nature 326:662-669; Brun-Vezinet et al. (1986) Science 233:343-346; Clavel et al. (1986) Nature 324:691- 695.

Se ha reunido una gran cantidad de información sobre el virus del VIH, sin embargo, hasta la fecha no se ha identificado una vacuna eficaz. Se han examinado varias dianas para el desarrollo de vacunas que incluyen los productos génicos env y Gag codificados por el VIH. Los productos génicos Gag incluyen, pero no se limitan a, Gag- polimerasa y Gag-proteasa. Los productos génicos Env incluyen, pero no se limitan a, polipéptidos gp120 monoméricos, polipéptidos gp140 oligoméricos y polipéptidos gp160. Haas, et al., (Current Biology 6(3):315-324, 1996) sugirieron que el uso de codones selectivos por el VIH-1 pareció explicar una fracción sustancial de la ineficiencia de la síntesis de proteínas virales. Andre, et al., (J. Virol. 72(2):1497-1503, 1998) describieron una elevada respuesta inmunitaria provocada por la vacunación con ADN empleando una secuencia de gp120 sintética con uso de codones modificados. Schneider, et al., (J Virol. 71(7):4892-4903, 1997) tratan la inactivación de elementos inhibidores (o inestabilidad) (INS) localizados dentro de las secuencias codificantes de las secuencias codificantes de Gag y Gag-proteasa. Las proteínas Gag del VIH-1 son necesarias para el ensamblaje de partículas similares a virus. Las proteínas Gag

del VIH-1 participan en muchas etapas del ciclo vital del virus que incluyen ensamblaje, maduración de viriones después de la liberación de partículas, y etapas posteriores a la entrada temprana en la replicación del virus. Las funciones de las proteínas Gag del VIH-1 son numerosas y complejas (Freed, E.O., Virology 251:1-15, 1998). Wolf, et al., (solicitud internacional PCT, documento WO 96/30523, publicada el 3 de octubre de 1996; solicitud de patente europea, publicación Nº 0 449 116 Al, publicada el 2 de octubre de 1991) han descrito el uso de Gag pr55 del VIH-1 que actúa de vehículo de partículas similares a retrovirales no infeccioso, en particular, para la presentación de epítopes inmunológicamente importantes. Wang, et al., (Virology 200:524-534, 1994) describen un sistema para estudiar el ensamblaje de proteínas de fusión de Gag del VIH-β-galactosidasa en viriones. Describen la construcción de secuencias que codifican proteínas de fusión de Gag del VIH-β-galactosidasa, la expresión de tales secuencias en presencia de proteínas Gag del VIH, y el ensamblaje de estas proteínas en partículas de virus. Shiver, et al., (solicitud internacional PCT, documento WO 98/34640, publicada el 13 de agosto de 1998) describieron alterar secuencias codificantes de Gag del VIH-1 (CAM1) para producir moléculas de ADN sintético que codifican Gag del VIH y modificaciones de Gag del VIH. Los codones de las moléculas sintéticas fueron codones preferidos por una célula huésped proyectada. Recientemente, se ha descrito el uso de polipéptidos Env del VIH en composiciones inmunogénicas (véase la patente de EE.UU. Nº 5.846.546 a Hurwitz et al., concedida el 8 de diciembre de 1998, que describe composiciones inmunogénicas que comprenden una mezcla de al menos cuatro virus recombinantes diferentes que expresan cada uno una variante de env del VIH diferente; y la patente de EE.UU. Nº 5.840.313 a Vahlne et al., concedida el 24 de noviembre de 1998, que describe péptidos que se corresponden con epítopes de la proteína gp120 del VIH-1). Además, la patente de EE.UU. Nº 5.876.731 a Sia et al, concedida el 2 de marzo de 1999, describe vacunas candidatas contra el VIH que comprenden una secuencia de aminoácidos de un epítope de linfocitos T de Gag asociada directamente a una secuencia de aminoácidos de un epítope de linfocitos B de la proteína del bucle V3 de una cepa aislada del VIH-1 que contiene la secuencia GPGR. Sigue existiendo la necesidad de polipéptidos antigénicos del VIH, particularmente cepas aisladas de tipo C.

Se han descrito otros polinucleótidos inmunogénicos que codifican Env del VIH en los documentos WO 00/39304, WO 00/39302 y WO 01/60838. RESUMEN DE LA INVENCIÓN

En el presente documento se describen secuencias del VIH tipo C novedosas, por ejemplo, 8_5_TVI_C.ZA, 8_2_TV1_C.ZA y 12-5_1_TV2_C.ZA, polipéptidos codificados por estas secuencias novedosas y casetes de expresión sintéticos generados a partir de estas y otras secuencias del VIH tipo C.

La presente invención proporciona un casete de expresión que comprende (a) un polinucleótido que comprende al menos 480 nucleótidos contiguos de SEC ID Nº: 132; o (b) un polinucleótido que tiene más del 98 % de identidad con (a). La invención también proporciona un sistema de expresión recombinante para su uso en una célula huésped seleccionada que comprende un casete de expresión tal, en el que la secuencia de polinucleótidos comprende además elementos de control capaces de conducir la expresión en la célula huésped seleccionada. La invención también proporciona una célula que comprende un casete de expresión tal, en el que la secuencia de polinucleótidos comprende además elementos de control compatibles con la expresión en la célula seleccionada. La invención también proporciona una composición que comprende un casete de expresión tal para su uso en generar una respuesta inmunológica. La invención también proporciona un polipéptido obtenible proporcionando un casete de expresión tal, que expresa dicho polipéptido en una célula huésped adecuada, y aislar dicho polipéptido, para su uso en un método de generación de una respuesta inmunitaria en un sujeto. La invención también proporciona un polipéptido Env del VIH codificado por un casete de expresión tal. También se desvelan en el presente documento casetes de expresión sintéticos que codifican polipéptidos del VIH tipo C, que incluyen Env, Gag, Pol, Prot, Vpr, Vpu, Vif, Nef, Tat, Rev y/o fragmentos de los mismos. Además, la presente divulgación también se refiere a la expresión mejorada de los polipéptidos del VIH tipo C y a la producción de partículas similares a virus. Se describen casetes de expresión sintéticos que codifican los polipéptidos del VIH (por ejemplo, polipéptidos que contienen Gag, pol, proteasa (prot), transcriptasa inversa, integrasa, RNAsaH, Tat, Rev, Nef, Vpr, Vpu, Vif y/o Env), ya que son usos de los casetes de expresión.

Así, un aspecto de la presente divulgación se refiere a casetes de expresión y polinucleótidos contenidos en ellos. Los casetes de expresión normalmente incluyen una secuencia codificante de polipéptidos del VIH insertada en un esqueleto de vector de expresión. En un caso, un casete de expresión comprende una secuencia de polinucleótidos que codifica uno o más polipéptidos que contienen Pol, en el que la secuencia de polinucleótidos comprende una secuencia que tiene al menos aproximadamente el 85 %, preferentemente aproximadamente el 90 %, más preferentemente aproximadamente el 95 %, y más preferentemente aproximadamente el 98 % de identidad de secuencias (y cualquier número entero entre estos valores) con las secuencias enseñadas en la presente memoria descriptiva. Las secuencias de polinucleótidos que codifican los polipéptidos que contienen Pol incluyen, pero no se limitan a, aquellas mostradas en SEC ID Nº: 30, SEC ID Nº: 31; SEC ID Nº: 32; SEC ID Nº: 62; SEC ID Nº: 103; SEC ID Nº: 58; SEC ID Nº: 60; SEC ID Nº: 64; SEC ID Nº: 66; SEC ID Nº: 68; SEC ID Nº: 70; SEC ID Nº: 76; y SEC ID Nº: 78. Los polinucleótidos que codifican los polipéptidos del VIH de la presente invención también pueden incluir secuencias que codifican polipéptidos adicionales. Tales polinucleótidos adicionales que codifican polipéptidos pueden incluir, por ejemplo, secuencias codificantes para otras proteínas virales (por ejemplo, proteínas de la hepatitis B o C u otras del VIH, tales como secuencias de polinucleótidos que codifican un polipéptido Gag del VIH, secuencias de polinucleótidos que codifican un polipéptido Env del VIH y/o polinucleótidos que codifican uno o más de vif, vpr, tat, rev, vpu y net); citocinas u otros transgenes. En un caso, la secuencia que codifica el (los) polipéptido(s) Pol del VIH puede modificarse por deleciones de regiones codificantes correspondientes a transcriptasa inversa y integrasa.

Tales deleciones en el péptido de polimerasa también pueden hacerse de forma que la secuencia de polinucleótidos preserve epítopes de linfocitos T cooperadores y de CTL. También pueden insertarse otros antígenos de interés en la polimerasa.

En el presente documento también se desvela un casete de expresión que comprende una secuencia de polinucleótidos que codifica un polipéptido que incluye un polipéptido que contiene Gag del VIH, en el que la secuencia de polinucleótidos que codifica el polipéptido Gag comprende una secuencia que tiene al menos aproximadamente el 85 %, preferentemente aproximadamente el 90 %, más preferentemente aproximadamente el 95 %, y lo más preferentemente aproximadamente el 98 % de identidad de secuencias con las secuencias enseñadas en la presente memoria descriptiva. Las secuencias de polinucleótidos que codifican polipéptidos que contienen Gag incluyen, pero no se limitan a, los siguientes polinucleótidos: nucleótidos 844-903 de la Figura 1 (una región principal de homología de Gag) (SEC ID Nº: 1); nucleótidos 841-900 de la Figura 2 (una región principal de homología de Gag) (SEC ID Nº: 2); Figura 24 (SEC ID Nº: 53, una región principal de homología de Gag); la secuencia presentada como la Figura 1 (SEC ID Nº: 3); la secuencia presentada como la Figura 22 (SEC ID Nº: 51); la secuencia presentada como la Figura 70 (SEC ID Nº: 99); y la secuencia presentada como la Figura 2 (SEC ID Nº: 4). Como se observa anteriormente, los polinucleótidos que codifican los polipéptidos que contienen Gag de la presente divulgación también pueden incluir secuencias que codifican polipéptidos adicionales. Un casete de expresión puede comprender una secuencia de polinucleótidos que codifica un polipéptido que incluye un polipéptido que contiene Env del VIH, en el que la secuencia de polinucleótidos que codifica el polipéptido Env

comprende una secuencia que tiene al menos aproximadamente el 85 %, preferentemente aproximadamente el 90 %, más preferentemente aproximadamente el 95 %, y lo más preferentemente aproximadamente el 98 % de identidad de secuencias con las secuencias enseñadas en la presente memoria descriptiva. Las secuencias de polinucleótidos que codifican polipéptidos que contienen Env incluyen, pero no se limitan a, los siguientes polinucleótidos: nucleótidos 1213-1353 de la Figura 3 (SEC ID Nº: 5) (que codifica una región común de Env); la secuencia presentada como la Figura 17 (SEC ID Nº: 46) (que codifica una región común de Env de 97 nucleótidos de longitud); SEC ID Nº: 47 (que codifica una región común de Env de 144 nucleótidos de longitud); nucleótidos 82- 1512 de la Figura 3 (SEC ID Nº: 6) (que codifica un polipéptido gp120); nucleótidos 82-2025 de la Figura 3 (SEC ID Nº: 7) (que codifica un polipéptido gp140); nucleótidos 82-2547 de la Figura 3 (SEC ID Nº: 8) (que codifica un polipéptido gp160); SEC ID Nº: 49 (que codifica un polipéptido gp160); nucleótidos 1-2547 de la Figura 3 (SEC ID Nº: 9) (que codifica un polipéptido gp160 con secuencia señal); nucleótidos 1513-2547 de la Figura 3 (SEC ID Nº: 10) (que codifica un polipéptido gp41); nucleótidos 1210-1353 de la Figura 4 (SEC ID Nº: 11) (que codifica una región común de Env); nucleótidos 73-1509 de la Figura 4 (SEC ID Nº: 12) (que codifica un polipéptido gp120); nucleótidos 73-2022 de la Figura 4 (SEC ID Nº: 13) (que codifica un polipéptido gp140); nucleótidos 73-2565 de la Figura 4 (SEC ID Nº: 14) (que codifica un polipéptido gp160); nucleótidos 1-2565 de la Figura 4 (SEC ID Nº: 15) (que codifica un polipéptido gp160 con secuencia señal); la secuencia presentada como la Figura 20 (SEC ID Nº: 49) (que codifica un polipéptido gp160); la secuencia presentada como la Figura 68 (SEC ID Nº: 97) (que codifica un polipéptido gp160); nucleótidos 1510-2565 de la Figura 4 (SEC ID Nº: 16) (que codifica un polipéptido gp41); nucleótidos 7 a 1464 de la Figura 90 (SEC ID Nº: 119) (que codifica un polipéptido gp120 con secuencia señal no mutante modificada); nucleótidos 7 a 1977 de la Figura 91 (SEC ID Nº: 120) (que codifica un polipéptido gp140 que incluye secuencia señal modificada de 8_2_TV1_C.ZA no mutante (por ejemplo, “secuencia conductora no mutante modificada”)); nucleótidos 7 a 1977 de la Figura 92 (SEC ID Nº: 121) (que codifica un polipéptido gp140 con secuencia señal de 8_2_TV1_C.ZA no mutante modificada); nucleótidos 7 a 2388 de la Figura 93 (SEC ID Nº: 122) (que codifica un polipéptido gp160 con secuencia señal no mutante modificada); nucleótidos 7 a 2520 de la Figura 94 (SEC ID Nº: 123) (que codifica un polipéptido gp160 con secuencia señal de 8_2_TV1_C.ZA no mutante modificada); nucleótidos 7 a 2520 de la Figura 95 (SEC ID Nº: 124) (que codifica un polipéptido gp160 con secuencia señal de 8_2_TV1-C.ZA no mutante modificada); nucleótidos 13 a 2604 de la Figura 96 (SEC ID Nº: 125) (que codifica un polipéptido gp160 con secuencia señal de TPA1); nucleótidos 7 a 2607 de la Figura 97 (SEC ID Nº: 126) (que codifica un polipéptido gp160 con secuencia señal de 8_2_TV1_C.ZA no mutante modificada); nucleótidos 1 a 2049 de la Figura 100 (SEC ID Nº: 131) (que codifica un polipéptido gp140 con secuencia señal de TPA1); nucleótidos 7 a 1607 de la Figura 98 (SEC ID Nº: 126) (que codifica un polipéptido gp160 con secuencia señal de 8_2_TV1_C.ZA no mutante); nucleótidos 7 a 2064 de SEC ID Nº: 132 (que codifica un polipéptido gp140 con secuencia conductora 8_2_TV1_C.ZA no mutante modificada); y nucleótidos 7 a 2064 de SEC ID Nº: 133 (que codifica un polipéptido gp140 con secuencia conductora 8_2_TV1-C.ZA no mutante). En ciertos casos, las secuencias codificantes de Env contendrán modificaciones adicionales, por ejemplo, mutación del sitio de escisión para prevenir la escisión de un polipéptido gp140 en un polipéptido gp120 y un polipéptido gp41 (SEC ID Nº: 121 y SEC ID Nº: 124) o deleción de regiones variables V1 y/o V2 (SEC ID Nº: 119; SEC ID Nº: 120; SEC ID Nº: 121; SEC ID Nº: 122; SEC ID Nº: 123; y SEC ID Nº: 124). En el presente documento también se desvela un casete de expresión que comprende una secuencia de polinucleótidos que codifica un polipéptido que incluye un polipéptido que contiene Nef del VIH, en el que la secuencia de polinucleótidos que codifica el polipéptido Nef comprende una secuencia que tiene al menos aproximadamente el 85 %, preferentemente aproximadamente el 90 %, más preferentemente aproximadamente el 95 %, y lo más preferentemente aproximadamente el 98 % de identidad de secuencias con las secuencias enseñadas en la presente memoria descriptiva. Las secuencias de polinucleótidos que codifican polipéptidos que contienen Nef incluyen, pero no se limitan a, los siguientes polinucleótidos: la secuencia presentada en la Figura 26 (SEC ID Nº: 55); la secuencia presentada en la Figura 72 (SEC ID Nº: 101); la secuencia presentada en la Figura 28 (SEC ID Nº: 57); la secuencia presentada en la Figura 67 (SEC ID Nº: 96); la secuencia presentada en la Figura 103 (SEC ID Nº: 134); y la secuencia presentada en la Figura 104 (SEC ID Nº: 135).

En el presente documento también se desvela un casete de expresión que comprende una secuencia de polinucleótidos que codifica un polipéptido que incluye un polipéptido que contiene Rev del VIH, en el que la secuencia de polinucleótidos que codifica el polipéptido Rev comprende una secuencia que tiene al menos aproximadamente el 85 %, preferentemente aproximadamente el 90 %, más preferentemente aproximadamente el 95 %, y lo más preferentemente aproximadamente el 98 % de identidad de secuencias con las secuencias enseñadas en la presente memoria descriptiva. Las secuencias de polinucleótidos que codifican polipéptidos que contienen Rev incluyen, pero no se limitan a, los siguientes polinucleótidos: la secuencia presentada en la Figura 43 (SEC ID Nº: 72); la secuencia presentada en la Figura 76 (SEC ID Nº: 105); la secuencia presentada en la Figura 45 (SEC ID Nº: 74); la secuencia presentada en la Figura 78 (SEC ID Nº: 107); y la secuencia presentada en la Figura 62 (SEC ID Nº: 91).

En el presente documento también se desvela un casete de expresión que comprende una secuencia de polinucleótidos que codifica un polipéptido que incluye un polipéptido que contiene Tat del VIH, en el que la secuencia de polinucleótidos que codifica el polipéptido Tat comprende una secuencia que tiene al menos aproximadamente el 85 %, preferentemente aproximadamente el 90 %, más preferentemente aproximadamente el 95 %, y lo más preferentemente aproximadamente el 98 % de identidad de secuencias con las secuencias enseñadas en la presente memoria descriptiva. Las secuencias de polinucleótidos que codifican polipéptidos que contienen Tat incluyen, pero no se limitan a, los siguientes polinucleótidos: la secuencia presentada en la Figura 51 (SEC ID Nº: 80); la secuencia presentada en la Figura 80 (SEC ID Nº: 109); la secuencia presentada en la Figura 52 (SEC ID Nº: 81); la secuencia presentada en la Figura 54 (SEC ID Nº: 83); y la secuencia presentada en la Figura 82 (SEC ID Nº: 111).

En el presente documento también se desvela un casete de expresión que comprende una secuencia de polinucleótidos que codifica un polipéptido que incluye un polipéptido que contiene Vif del VIH, en el que la secuencia de polinucleótidos que codifica el polipéptido Vif comprende una secuencia que tiene al menos aproximadamente el 85 %, preferentemente aproximadamente el 90 %, más preferentemente aproximadamente el 95 %, y lo más preferentemente aproximadamente el 98 % de identidad de secuencias con las secuencias enseñadas en la presente memoria descriptiva. Las secuencias de polinucleótidos que codifican polipéptidos que contienen Vif incluyen, pero no se limitan a, los siguientes polinucleótidos: la secuencia presentada en la Figura 56 (SEC ID Nº: 85); y la secuencia presentada en la Figura 84 (SEC ID Nº: 113).

En el presente documento también se desvela un casete de expresión que comprende una secuencia de polinucleótidos que codifica un polipéptido que incluye un polipéptido que contiene Vpr del VIH, en el que la secuencia de polinucleótidos que codifica el polipéptido Vpr comprende una secuencia que tiene al menos aproximadamente el 85 %, preferentemente aproximadamente el 90 %, más preferentemente aproximadamente el 95 %, y lo más preferentemente aproximadamente el 98 % de identidad de secuencias con las secuencias enseñadas en la presente memoria descriptiva. Las secuencias de polinucleótidos que codifican polipéptidos que contienen Vpr incluyen, pero no se limitan a, los siguientes polinucleótidos: la secuencia presentada en la Figura 58 (SEC ID Nº: 87); y la secuencia presentada en la Figura 86 (SEC ID Nº: 115). En el presente documento también se desvela un casete de expresión que comprende una secuencia de polinucleótidos que codifica un polipéptido que incluye un polipéptido que contiene Vpu del VIH, en el que la secuencia de polinucleótidos que codifica el polipéptido Vpu comprende una secuencia que tiene al menos aproximadamente el 85 %, preferentemente aproximadamente el 90 %, más preferentemente aproximadamente el 95 %, y lo más preferentemente aproximadamente el 98 % de identidad de secuencias con las secuencias enseñadas en la presente memoria descriptiva. Las secuencias de polinucleótidos que codifican polipéptidos que contienen Vpu incluyen, pero no se limitan a, los siguientes polinucleótidos: la secuencia presentada en la Figura 60 (SEC ID Nº: 89); y la secuencia presentada en la Figura 88 (SEC ID Nº: 117). Otros casos de la presente divulgación incluyen polinucleótidos purificados de cualquiera de las secuencias descritas en el presente documento. Secuencias de polinucleótidos a modo de ejemplo que codifican polipéptidos que contienen Gag incluyen, pero no se limitan a, los siguientes polinucleótidos: nucleótidos 844-903 de la Figura 1 (SEC ID Nº: 1) (una región principal de homología de Gag); nucleótidos 841-900 de la Figura 2 (SEC ID Nº: 2) (una región principal de homología de Gag); la secuencia presentada Figura 1 (SEC ID Nº: 3); la secuencia presentada como la Figura 2 (SEC ID Nº: 4); la secuencia presentada como la Figura 22 (SEC ID Nº: 51); la secuencia presentada como la Figura 70 (SEC ID Nº: 99); y la secuencia presentada como la Figura 24 (SEC ID Nº: 53) (una región principal de homología de Gag). Secuencias de polinucleótidos a modo de ejemplo que codifican polipéptidos que contienen Env incluyen, pero no se limitan a, los siguientes polinucleótidos: nucleótidos 1213-1353 de la Figura 3 (SEC ID Nº: 5) (que codifica una región común de Env); la secuencia presentada como la Figura 17 (SEC ID Nº: 46) (que codifica una región común de Env de 97 nucleótidos de longitud); SEC ID Nº: 47 (que codifica una región común de Env de 144 nucleótidos de longitud); nucleótidos 82-1512 de la Figura 3 (SEC ID Nº: 6) (que codifica un polipéptido gp120); nucleótidos 82-2025 de la Figura 3 (SEC ID Nº: 7) (que codifica un polipéptido gp140); nucleótidos 82-2547 de la Figura 3 (SEC ID Nº: 8) (que codifica un polipéptido gp160); SEC ID Nº: 49 (que codifica un polipéptido gp160); nucleótidos 1-2547 de la Figura 3 (SEC ID Nº: 9) (que codifica un polipéptido gp160 con secuencia señal); nucleótidos 1513-2547 de la Figura 3 (SEC ID Nº: 10) (que codifica un polipéptido gp41); nucleótidos 1210-1353 de la Figura 4 (SEC ID Nº: 11) (que codifica una región común de Env); nucleótidos 73-1509 de la Figura 4 (SEC ID Nº: 12) (que codifica un polipéptido gp120); nucleótidos 73-2022 de la Figura 4 (SEC ID Nº: 13) (que codifica un polipéptido gp140); nucleótidos 73-2565 de la Figura 4 (SEC ID Nº: 14) (que codifica un polipéptido gp160); nucleótidos 1-2565 de la Figura 4 (SEC ID Nº: 15) (que codifica un polipéptido gp160 con secuencia señal); la secuencia presentada como la Figura 20 (SEC ID Nº: 49) (que codifica un polipéptido gp160); la secuencia presentada como la Figura 68 (SEC ID Nº: 97) (que codifica un polipéptido gp160); nucleótidos 1510-2565 de la Figura 4 (SEC ID Nº: 16) (que codifica un polipéptido gp41); nucleótidos 7 a 1464 de la Figura 90 (SEC ID Nº: 119) (que codifica un polipéptido gp120 con secuencia señal no mutante modificada); nucleótidos 7 a 1977 de la Figura 91 (SEC ID Nº: 120) (que codifica un polipéptido gp140 que incluye secuencia señal modificada de 8_2_TV1_C.ZA no mutante (por ejemplo, “secuencia conductora no mutante modificada”)); nucleótidos 7 a 1977 de la Figura 92 (SEC ID Nº: 121) (que codifica un polipéptido gp140 con secuencia señal de 8_2_TV1_C.ZA no mutante modificada); nucleótidos 7 a 2388 de la Figura 93 (SEC ID Nº: 122) (que codifica un polipéptido gp160 con secuencia señal no mutante modificada); nucleótidos 7 a 2520 de la Figura 94 (SEC ID Nº: 123) (que codifica un polipéptido gp160 con secuencia señal de 8_2_TV1_C.ZA no mutante modificada); nucleótidos 7 a 2520 de la Figura 95 (SEC ID Nº: 124) (que codifica un polipéptido gp160 con secuencia señal de 8_2_TV1_C.ZA no mutante modificada); nucleótidos 13 a 2604 de la Figura 96 (SEC ID Nº: 125) (que codifica un polipéptido gp160 con secuencia señal de TPA1); nucleótidos 7 a 2607 de la Figura 97 (SEC ID Nº: 126) (que codifica un polipéptido gp160 con secuencia señal de 8_2_TV1_C.ZA no mutante modificada); nucleótidos 1 a 2049 de la Figura 100 (SEC ID Nº: 131) (que codifica un polipéptido gp140 con secuencia señal de TPA1); nucleótidos 7 a 1607 de la Figura 98 (SEC ID Nº: 126) (que codifica un polipéptido gp160 con secuencia señal de 8_2_TV1_C.ZA no mutante); nucleótidos 7 a 2064 de SEC ID Nº: 132 (que codifica un polipéptido gp140 con secuencia conductora de 8_2_TV1_C.ZA no mutante modificada); y nucleótidos 7 a 2064 de SEC ID Nº: 133 (que codifica un polipéptido gp140 con secuencia conductora de 8_2_TV1_C.ZA no mutante). Polinucleótidos purificados a modo de ejemplo que codifican polinucleótidos del VIH adicionales incluyen: polinucleótidos que codifican Pol (por ejemplo, SEC ID Nº: 30, SEC ID Nº: 31; SEC ID Nº: 32; SEC ID Nº: 62; SEC ID Nº: 103; SEC ID Nº: 58; SEC ID Nº: 60; SEC ID Nº: 64; SEC ID Nº: 66; SEC ID Nº: 68; SEC ID Nº: 70; SEC ID Nº: 76; y SEC ID Nº: 78); polinucleótidos que codifican Nef (por ejemplo, SEC ID Nº: 55; SEC ID Nº: 101; SEC ID Nº: 57; SEC ID Nº: 96); polinucleótidos que codifican Rev (por ejemplo, SEC ID Nº: 72; SEC ID Nº: 105; SEC ID Nº: 74); SEC ID Nº: 107; SEC ID Nº: 91); polinucleótidos que codifican Tat (por ejemplo, SEC ID Nº: 80; SEC ID Nº: 109; SEC ID Nº: 81; SEC ID Nº: 83; SEC ID Nº: 111); polinucleótidos que codifican Vif (por ejemplo, SEC ID Nº: 85; SEC ID Nº: 113); y polinucleótidos que codifican Vpr (por ejemplo, SEC ID Nº: 87; SEC ID Nº: 115); polinucleótidos que codifican Vpu (por ejemplo, SEC ID Nº: 89; SEC ID Nº: 117). En el presente documento también se desvelan secuencias codificantes de polipéptidos del VIH nativas obtenidas de cepas de tipo C novedosas; fragmentos de estas secuencias nativas; casetes de expresión que contiene estas secuencias no mutante; y usos de estas secuencias, fragmentos y casetes de expresión. Secuencias de longitud completa a modo de ejemplo se muestran en SEC ID Nº: 33 y SEC ID Nº: 45. Fragmentos a modo de ejemplo que codifican diversos productos génicos del VIH incluyen: la secuencia presentada en la Figura 19 (SEC ID Nº: 48) (una secuencia codificante de Env); la secuencia presentada en la Figura 69 (SEC ID Nº: 98) (una secuencia codificante de Env); la secuencia presentada en la Figura 21 (SEC ID Nº: 50) (un polipéptido gp160); la secuencia presentada en la Figura 23 (SEC ID Nº: 52) (un polipéptido Gag); la secuencia presentada en la Figura 71 (SEC ID Nº: 100) (un polipéptido Gag); la secuencia presentada en la Figura 25 (SEC ID Nº: 54) (un polipéptido Gag); la secuencia presentada en la Figura 27 (SEC ID Nº: 56) (un polipéptido Nef); la secuencia presentada en la Figura 73 (SEC ID Nº: 102) (un polipéptido Nef); la secuencia presentada en la Figura 30 (SEC ID Nº: 59) (un polipéptido p15RNAsaH); la secuencia presentada en la Figura 32 (SEC ID Nº: 61) (un polipéptido de la integrasa p31); la secuencia presentada en la Figura 34 (SEC ID Nº: 63) (un polipéptido Pol); la secuencia presentada en la Figura 75 (SEC ID Nº: 104) (un polipéptido Pol); la secuencia presentada en la Figura 36 (SEC ID Nº: 65) (un polipéptido Prot); la secuencia presentada en la Figura 38 (SEC ID Nº: 67) (un polipéptido Prot inactivado); la secuencia presentada en la Figura 40 (SEC ID Nº: 69) (un polipéptido Prot y RT inactivado); la secuencia presentada en la Figura 42 (SEC ID Nº: 71) (un polipéptido Prot y RT); la secuencia presentada en la Figura 44 (SEC ID Nº: 73) (un polipéptido Rev); la secuencia presentada en la Figura 77 (SEC ID Nº: 106) (un polipéptido Rev); la secuencia presentada en la Figura 46 (SEC ID Nº: 75) (un polipéptido Rev); la secuencia presentada en la Figura 79 (SEC ID Nº: 108) (un polipéptido Rev); la secuencia presentada en la Figura 48 (SEC ID Nº: 77) (un polipéptido RT); la secuencia presentada en la Figura 50 (SEC ID Nº: 79) (un polipéptido RT mutado); la secuencia presentada en la Figura 53 (SEC ID Nº: 82) (un polipéptido Tat); la secuencia presentada en la Figura 81 (SEC ID Nº: 110) (un polipéptido Tat); la secuencia presentada en la Figura 55 (SEC ID Nº: 84) (un polipéptido Tat); la secuencia presentada en la Figura 83 (SEC ID Nº: 112) (un polipéptido Tat); la secuencia presentada en la Figura 57 (SEC ID Nº: 86) (un polipéptido Vif); la secuencia presentada en la Figura 85 (SEC ID Nº: 114) (un polipéptido Vif); la secuencia presentada en la Figura 59 (SEC ID Nº: 88) (un polipéptido Vpr); la secuencia presentada en la Figura 82 (SEC ID Nº: 116) (un polipéptido Vpr); la secuencia presentada en la Figura 61 (SEC ID Nº: 90) (un polipéptido Vpu); la secuencia presentada en la Figura 89 (SEC ID Nº: 118) (un polipéptido Vpu); la secuencia presentada en la Figura 63 (SEC ID Nº: 92) (un polipéptido Rev); y la secuencia presentada en la Figura 66 (SEC ID Nº: 95) (un polipéptido Tat). Las secuencias de polinucleótidos nativas y sintéticas que codifican los polipéptidos del VIH de la presente invención tienen el 98 % de identidad de secuencias con las secuencias como se define en las reivindicaciones. Además, en ciertas realizaciones, las secuencias de polinucleótidos que codifican los polipéptidos del VIH de la invención presentarán el 100 % de identidad de secuencias con las secuencias como se define en las reivindicaciones. Los polinucleótidos de la presente invención pueden producirse por técnicas recombinantes, técnicas sintéticas o combinaciones de los mismos.

La presente invención incluye adicionalmente sistemas de expresión recombinante para su uso en células huésped seleccionadas, en la que los sistemas de expresión recombinante emplean uno o más de los polinucleótidos y casetes de expresión de la presente invención. En tales sistemas, las secuencias de polinucleótidos están operativamente enlazadas para controlar elementos compatibles con la expresión en la célula huésped seleccionada. Numerosos elementos de control de la expresión son conocidos para aquellos en la materia, que incluyen, pero no se limitan a, los siguientes: promotores de la transcripción, elementos potenciadores de la transcripción, señales de terminación de la transcripción, secuencias de poliadenilación, secuencias para la optimización del inicio de la traducción, y secuencias de terminación de la traducción. Promotores de la transcripción a modo de ejemplo incluyen, pero no se limitan a, aquellos derivados de CMV, CMV+intrón A, SV40, RSV, VIH-Ltr, MML V-1tr y metalotioneína.

En otro aspecto, la invención incluye células que comprenden uno o más de los casetes de expresión de la presente invención en las que las secuencias de polinucleótidos están operativamente enlazadas a elementos de control compatibles con la expresión en la célula seleccionada. En una realización, tales células son células de mamífero. Células de mamífero a modo de ejemplo incluyen, pero no se limitan a, células BHK, VERO, HT1080,293, RD, COS- 7 y CHO. Otras células, tipos de células, tipos de tejido, etc., que pueden ser útiles en la práctica de la presente invención incluyen, pero no se limitan a, aquellos obtenidos de lo siguiente: insectos (por ejemplo, Trichoplusia ni (Tn5) y Sf9), bacterias, levadura, plantas, células presentadoras de antígeno (por ejemplo, macrófago, monocitos, células dendríticas, linfocitos B, linfocitos T, citoblastos, y células progenitoras de los mismos), células primarias, células inmortalizadas, células derivadas de tumor.

En otro aspecto, la presente invención incluye composiciones para generar una respuesta inmunológica, en la que la composición normalmente comprende al menos uno de los casetes de expresión de la presente invención y puede, por ejemplo, contener combinaciones de casetes de expresión (tales como uno o más casetes de expresión que llevan un polinucleótido que codifica polipéptidos Pol, uno o más casetes de expresión que llevan un polinucleótido que codifica polipéptidos Gag, uno o más casetes de expresión que llevan polinucleótidos que codifican polipéptidos auxiliares (por ejemplo, vpu, vpr, nef, vif, tat, rev nativos o sintéticos), además de uno o más casetes de expresión que llevan un polinucleótido que codifica polipéptidos Env como se define en las reivindicaciones. Tales composiciones pueden contener adicionalmente un adyuvante o adyuvantes. Las composiciones también pueden contener uno o más polipéptidos del VIH tipo C. Los polipéptidos del VIH tipo C pueden corresponderse con los polipéptidos codificados por el (los) casete(s) de expresión en la composición, o pueden ser diferentes de aquellos codificados por los casetes de expresión. Un ejemplo del polinucleótido en el casete de expresión que codifica el mismo polipéptido que está siendo proporcionado en la composición es del siguiente modo: el polinucleótido en el casete de expresión codifica el polipéptido Gag de la Figura 1 (SEC ID Nº: 3) y el polipéptido (SEC ID Nº: 17) es el polipéptido codificado por la secuencia mostrada en la Figura 1. Un ejemplo del polinucleótido en el casete de expresión que codifica un polipéptido diferente del que está siendo proporcionado en la composición es del siguiente modo: un casete de expresión que tiene un polinucleótido que codifica un polipéptido Gag-polimerasa, y el polipéptido proporcionado en la composición puede ser un polipéptido Gag y/o Gag-proteasa. Si las composiciones contienen ambos casetes de expresión (o polinucleótidos) y polipéptidos, diversos casetes de expresión de la presente divulgación pueden mezclarse y/o hacerse coincidir con diversos polipéptidos del VIH tipo C descritos en el presente documento. En otro aspecto, la presente divulgación incluye métodos de inmunización de un sujeto. En el método, cualquiera de las composiciones anteriormente descritas se en el sujeto en condiciones que son compatibles con la expresión del (de los) casete(s) de expresión en el sujeto. En una realización, los casetes de expresión (o polinucleótido) pueden introducirse usando un vector de administración génica. El vector de administración génica puede, por ejemplo, ser un vector no viral o un vector viral. Vectores virales a modo de ejemplo incluyen, pero no se limitan a, vectores derivados del virus de Sindbis, vectores retrovirales y vectores lentivirales. También pueden administrarse composiciones útiles para generar una respuesta inmunológica usando un vehículo en partículas. Además, tales composiciones pueden recubrirse sobre, por ejemplo, partículas de oro o de tungsteno y administrarse las partículas recubiertas al sujeto usando, por ejemplo, una pistola de genes. Las composiciones también pueden formularse como liposomas. El sujeto puede ser un mamífero y puede, por ejemplo, ser un ser humano. En otro aspecto, la divulgación incluye métodos de generación de una respuesta inmunitaria en un sujeto. Cualquiera de los casetes de expresión descritos en el presente documento puede expresarse en una célula adecuada para proporcionar la expresión de polipéptidos del VIH tipo C codificados por los polinucleótidos de la presente divulgación. El (Los) polipéptido(s) se aíslan entonces (por ejemplo, se purifican sustancialmente) y se administran al sujeto en una cantidad suficiente para provocar una respuesta inmunitaria. Los métodos pueden comprender la administración de uno o más de los casetes de expresión o polinucleótidos de la presente divulgación, usando cualquiera de las técnicas de administración génica descritas en el presente documento. Los métodos pueden comprender la co-administración de uno o más de los casetes de expresión o polinucleótidos de la presente divulgación y uno o más polipéptidos, en los que los polipéptidos pueden expresarse a partir de de estos polinucleótidos o pueden ser otros polipéptidos del VIH subtipo C. Por tanto, los métodos pueden comprender la co- administración de múltiples casetes de expresión o polinucleótidos de la presente divulgación. Además, los métodos pueden comprender la co-administración de múltiples polipéptidos, por ejemplo, polipéptidos expresados a partir de los polinucleótidos de la presente divulgación y/u otros polipéptidos del VIH subtipo C. La divulgación incluye adicionalmente métodos de generación de una respuesta inmunitaria en un sujeto, en los que células de un sujeto se transfectan con cualquiera de los casetes de expresión o polinucleótidos anteriormente descritos, en condiciones que permiten la expresión de un polinucleótido seleccionado y la producción de un polipéptido de interés (por ejemplo, codificado por cualquier casete de expresión de la presente divulgación). Por este método se provoca una respuesta inmunológica al polipéptido en el sujeto. La transfección de las células puede realizarse ex vivo y las células transfectadas se reintroducen en el sujeto. Alternativamente, o además, las células pueden transfectarse in vivo en el sujeto. La respuesta inmunitaria puede ser humoral y/o celular (celular). Este método también puede incluir la administración de polipéptidos del VIH tipo C antes, simultáneamente con y/o después de la introducción del casete de expresión en el sujeto.

Estas y otras realizaciones de la presente invención se les ocurrirán fácilmente a aquellos expertos habituales en la materia en vista de la divulgación en el presente documento. BREVE DESCRIPCIÓN DE LAS FIGURAS

La Figura 1 (SEC ID Nº: 3) muestra la secuencia de nucleótidos de un polinucleótido que codifica un polipéptido Gag sintético. La secuencia de nucleótidos mostrada se obtuvo modificando la cepa AF110965 de tipo C e incluye modificaciones adicionales de INS. La Figura 2 (SEC ID Nº: 4) muestra la secuencia de nucleótidos de un polinucleótido que codifica un polipéptido Gag sintético. La secuencia de nucleótidos mostrada se obtuvo modificando la cepa AF110967 de tipo C e incluye modificaciones adicionales de INS. La Figura 3 (SEC ID Nº: 9) muestra la secuencia de nucleótidos de un polinucleótido que codifica un polipéptido Env sintético. La secuencia de nucleótidos representa gp160 (incluyendo un péptido señal) y se obtuvo modificando la cepa AF110968 de tipo C. Las flechas indican las posiciones de diversas regiones del polinucleótido, que incluyen la secuencia que codifica un péptido señal (nucleótidos 1-81) (SEC ID Nº: 18), un polipéptido gp120 (nucleótidos 82-1512) (SEC ID Nº: 6), un polipéptido gp41 (nucleótidos 1513-2547) (SEC ID Nº: 10), un polipéptido gp140 (nucleótidos 82-2025) (SEC ID Nº: 7) y un polipéptido gp160 (nucleótidos 82- 2547) (SEC ID Nº: 8). Los codones que codifican el péptido señal están modificados (como se describe en el presente documento) de la secuencia señal del VIH-1 nativa.

La Figura 4 (SEC ID Nº: 15) muestra la secuencia de nucleótidos de un polinucleótido que codifica un polipéptido Env sintético. La secuencia de nucleótidos representa gp160 (incluyendo un péptido señal) y se obtuvo modificando la cepa AF110975 de tipo C. Las flechas indican las posiciones de diversas regiones del polinucleótido, que incluyen la secuencia que codifica un péptido señal (nucleótidos 1-72) (SEC ID Nº: 19), un polipéptido gp120 (nucleótidos 73-1509) (SEC ID Nº: 12), un polipéptido gp41 (nucleótidos 1510-2565) (SEC ID Nº: 16), un polipéptido gp140 (nucleótidos 73-2022) (SEC ID Nº: 13) y un polipéptido gp160 (nucleótidos 73- 2565) (SEC ID Nº: 14). Los codones que codifican el péptido señal están modificados (como se describe en el presente documento) de la secuencia señal del VIH-1 nativa. La Figura 5 muestra la localización de algunos INS restantes en secuencias de Gag sintéticas derivadas de AF110965. Los cambios hechos a estas secuencias están recuadrados en las figuras. La línea superior representa una secuencia de codones modificada de polipéptidos Gag de las cepas indicadas (SEC ID Nº: 20). El (Los) nucleótido(s) que aparece(n) debajo de la línea en la(s) región (regiones) recuadrada(s) representa(n) cambios hechos para eliminar INS adicionales y se corresponden con la secuencia representada en la Figura 1 (SEC ID Nº: 3). La Figura 6 muestra la localización de algunos INS restantes en secuencias de Gag sintéticas derivadas de AF110967. Los cambios hechos a estas secuencias están recuadrados en las figuras. La línea superior representa una secuencia modificada de polipéptidos Gag de las cepas indicadas (SEC ID Nº: 21). El (Los) nucleótido(s) que aparecen debajo de la línea en la(s) región (regiones) recuadrada(s) representa(n) cambios hechos para eliminar INS adicionales y se corresponden con la secuencia representada en la Figura 2 (SEC ID Nº: 4).

La Figura 7 es un esquema que representa los dominios seleccionados en la región Pol del VIH. La Figura 8 (SEC ID Nº: 30) representa la secuencia de nucleótidos de la construcción sintética designada PR975(+). “(+)” indica que la transcriptasa inversa es funcional. Esta construcción incluye la secuencia de p2 (nucleótidos 16 a 54 de SEC ID Nº: 30); p7 (nucleótidos 55 a 219 de SEC ID Nº: 30); p1/p6 (nucleótidos 220- 375 de SEC ID Nº: 30); prot (nucleótidos 376 a 672 de SEC ID Nº: 30), transcriptasa inversa (nucleótidos 673 a 2352 de SEC ID Nº: 30); y 6 aminoácidos de integrasa mostrada en la Figura 7 (nucleótidos 2353 a 2370 de SEC ID Nº: 30). Además, la construcción contiene un sitio de clonación múltiple (MCS, nucleótidos 2425 a 2463 de SEC ID Nº: 30) para la inserción de un transgén y un casete de epítope YMDD (nucleótidos 2371 a 2424 de SEC ID Nº: 30). La Figura 9 (SEC ID Nº: 31) representa la secuencia de nucleótidos de la construcción sintética designada PR975YM. Como se ilustra en la Figura 7, la región RT incluye una mutación en el centro catalítico (mut. centro cat.). “YM” se refiere a construcciones en las que los nucleótidos codifican los aminoácidos AP en lugar de YMDD en esta región. La transcriptasa inversa no es funcional en esa construcción. Esta construcción incluye la secuencia de p2 (nucleótidos 16 a 54 de SEC ID Nº: 31); p7 (nucleótidos 55 a 219 de SEC ID Nº: 31); p1/p6 (nucleótidos 220 a 375 de SEC ID Nº: 31); prot (nucleótidos 376 a 672 de SEC ID Nº: 31); y transcriptasa inversa (nucleótidos 673 a 2346 de SEC ID Nº: 31) mostrada en la Figura 7, aunque la proteína transcriptasa inversa no es funcional. Además, la construcción contiene un sitio de clonación múltiple (MCS, nucleótidos 2419 a 2457 de SEC ID Nº: 31) para la inserción de un transgén y un casete de epítope YMDD (nucleótidos 2365 a 2418 de SEC ID Nº: 31). La Figura 10 (SEC ID Nº: 32) representa la secuencia de nucleótidos de la construcción sintética designada PR975YMWM. “YM” se refiere a construcciones en las que los nucleótidos codifican los aminoácidos AP en lugar de YMDD en esta región. “WM” se refiere a construcciones en las que los nucleótidos codifican aminoácidos PI en lugar de WMGY en esta región. Esta construcción incluye la secuencia de p2 (nucleótidos 16 a 54 de SEC ID Nº: 32); p7 (nucleótidos 55 a 219 de SEC ID Nº: 32); p1/p6 (nucleótidos 220 a 375 de SEC ID Nº: 32); prot (nucleótidos 376 a 672 de SEC ID Nº: 32); y transcriptasa inversa (nucleótidos 673 a 2340 de SEC ID Nº: 32) mostrada en la Figura 7, aunque la proteína transcriptasa inversa no es funcional. Además, la construcción contiene un sitio de clonación múltiple (MCS, nucleótidos 2413 a 2451 de SEC ID Nº: 32) para la inserción de un transgén y un casete de epítope YMDD (nucleótidos 2359 a 2412 de SEC ID Nº: 32). La Figura 11 (SEC ID Nº: 33) representa la secuencia de nucleótidos de 8_5_TV1_C.ZA. Se muestran diversas regiones en la Tabla A. La Figura 12 (SEC ID Nº: 34) representa la secuencia de nucleótidos no mutante de AF110975 Pol de p2 gag hasta p7 gag. La Figura 13 (SEC ID Nº: 35) representa la secuencia de nucleótidos no mutante de AF110975 Pol de p1 hasta los 6 primeros aminoácidos de la proteína integrasa. La Figura 14 (SEC ID Nº: 36) representa la secuencia de nucleótidos de un casete que codifica Ile178 a Serina 191 de la transcriptasa inversa.

La Figura 15 (SEC ID Nº: 37) muestra la secuencia de aminoácidos que incluye un epítope en la región del centro catalítico de la proteína transcriptasa inversa. La Figura 16 (SEC ID Nº: 45) representa la secuencia de nucleótidos de 12-5_1_TV2_C.ZA. La Figura 17 (SEC ID Nº: 46) representa la secuencia de nucleótidos de un polinucleótido que codifica Env sintético derivado de 8_5 TV1_C.ZA. La secuencia se corresponde con una región común corta (97 pares de bases). La Figura 18 (SEC ID Nº: 47) representa la secuencia de nucleótidos de un polinucleótido que codifica Env sintético derivado de 8_5_TV1_C.ZA. La secuencia se corresponde con una región común en Env. La Figura 19 (SEC ID Nº: 48) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Env. La Figura 20 (SEC ID Nº: 49) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp160 sintético derivado de 8_5_TV1_C.ZA. La Figura 21 (SEC ID Nº: 50) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Env gp160. La Figura 22 (SEC ID Nº: 51) representa la secuencia de nucleótidos de un polinucleótido que codifica Gag sintético derivado de 8_5_TV1_C.ZA.

La Figura 23 (SEC ID Nº: 52) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Gag. La Figura 24 (SEC ID Nº: 53) representa la secuencia de nucleótidos de un polinucleótido que codifica Gag sintético (región principal de homología) derivado de 8_5_TV1_C.ZA. La Figura 25 (SEC ID Nº: 54) representa la secuencia de nucleótidos no mutante de la región principal de homología de Gag 8_5_TV1_C.ZA.

La Figura 26 (SEC ID Nº: 55) representa la secuencia de nucleótidos de un polinucleótido que codifica Nef sintético derivado de 8_5 TV1_C.ZA. La Figura 27 (SEC ID Nº: 56) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Nef. La Figura 28 (SEC ID Nº: 57) representa la secuencia de nucleótidos de un polinucleótido que codifica Nef sintético derivado de 8_5_TV1_C.ZA. La secuencia incluye una mutación en la posición 125 que produce un producto génico no funcional. La Figura 29 (SEC ID Nº: 58) representa la secuencia de nucleótidos de un polinucleótido que codifica RNAsaH sintético derivado de 8_5_TV1_C.ZA. La RNAsaH es un dominio funcional del gen Pol, correspondiente a p15 (Tabla A). La Figura 30 (SEC ID Nº: 59) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA RNAsaH.

La Figura 31 (SEC ID Nº: 60) representa la secuencia de nucleótidos de un polinucleótido que codifica integrasa (Int) sintético derivado de 8_5_TV1_C.ZA. Int es un dominio funcional del gen Pol, correspondiente a p31 (Tabla A). La Figura 32 (SEC ID Nº: 61) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Int. La Figura 33 (SEC ID Nº: 62) representa la secuencia de nucleótidos de un polinucleótido que codifica Pol sintético derivado de 8_5_TV1_C.ZA. La Figura 34 (SEC ID Nº: 63) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Pol. La Figura 35 (SEC ID Nº: 64) representa la secuencia de nucleótidos de un polinucleótido que codifica proteasa (prot) sintético derivado de 8_5_TV1_C.ZA. La Figura 36 (SEC ID Nº: 65) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Prot.

La Figura 37 (SEC ID Nº: 66) representa la secuencia de nucleótidos de un polinucleótido que codifica proteasa (prot) sintético derivado de 8_5_TV1_C.ZA que contiene una mutación en la que se produce inactivación de la proteasa. La Figura 38 (SEC ID Nº: 67) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Prot inactivada.

La Figura 39 (SEC ID Nº: 68) representa la secuencia de nucleótidos de un polinucleótido que codifica proteasa (prot) sintético y un polinucleótido que codifica transcriptasa inversa (RT) sintético, ambos derivados de 8_5_TV1_C.ZA. Las secuencias de Prot y RT contienen ambas una mutación que produce la inactivación del producto génico. La Figura 40 (SEC ID Nº: 69) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Prot inactivada Prot/ RT mutada. La Figura 41 (SEC ID Nº: 70) representa la secuencia de nucleótidos de un polinucleótido que codifica proteasa (prot) sintético y un polinucleótido que codifica transcriptasa inversa (RT) sintético, ambos derivados de 8_5_TV1_C.ZA. La Figura 42 (SEC ID Nº: 71) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Prot y RT. La Figura 43 (SEC ID Nº: 72) representa la secuencia de nucleótidos de un polinucleótido que codifica rev sintético derivado de 8_5_TV1_C.ZA. La secuencia sintética representada se corresponde con el exón 1 de rev. rev no mutante tiene dos exones. La Figura 44 (SEC ID Nº: 73) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA exón 1 de Rev. La Figura 45 (SEC ID Nº: 74) representa la secuencia de nucleótidos de un polinucleótido que codifica rev sintético derivado de 8_5_TV1_C.ZA. La secuencia sintética representada se corresponde con el exón 2 de rev. La Figura 46 (SEC ID Nº: 75) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA exón 2 de Rev. La Figura 47 (SEC ID Nº: 76) representa la secuencia de nucleótidos de un polinucleótido que codifica RT sintético derivado de 8_5_TV1_C.ZA. La Figura 48 (SEC ID Nº: 77) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA RT. La Figura 49 (SEC ID Nº: 78) representa la secuencia de nucleótidos de un polinucleótido que codifica RT sintético derivado de 85_TV1_C.ZA. El polinucleótido sintético incluye una mutación en la secuencia codificante de RT que convierte el producto génico en inactivo.

La Figura 50 (SEC ID Nº: 79) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA RT que incluye una mutación que inactiva el producto génico de RT. La Figura 51 (SEC ID Nº: 80) representa la secuencia de nucleótidos de un polinucleótido que codifica Tat sintético derivado de 8_5_TV1_C.ZA. La secuencia sintética representada se corresponde con el exón 1 de Tat e incluye adicionalmente una mutación que convierte el producto génico de Tat en no funcional. Tat no mutante tiene dos exones. La Figura 52 (SEC ID Nº: 81) representa la secuencia de nucleótidos de un polinucleótido que codifica Tat sintético derivado de 8_5_TV1_C.ZA. La secuencia sintética representada se corresponde con el exón 1 de Tat. La Figura 53 (SEC ID Nº: 82) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA exón 1 de Tat. La Figura 54 (SEC ID Nº: 83) representa la secuencia de nucleótidos de un polinucleótido que codifica Tat sintético derivado de 8_5_TV1_C.ZA. La secuencia sintética representada se corresponde con el exón 2 de Tat. La Figura 55 (SEC ID Nº: 84) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA exón 2 de Tat. La Figura 56 (SEC ID Nº: 85) representa la secuencia de nucleótidos de un polinucleótido que codifica Vif sintético derivado de 8_5_TV1_C.ZA. La Figura 57 (SEC ID Nº: 86) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Vif. La Figura 58 (SEC ID Nº: 87) representa la secuencia de nucleótidos de un polinucleótido que codifica Vpr sintético derivado de 8_5_TV1_C.ZA. La Figura 59 (SEC ID Nº: 88) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Vpr. La Figura 60 (SEC ID Nº: 89) representa la secuencia de nucleótidos de un polinucleótido que codifica Vpu sintético derivado de 8_5_TV1_C.ZA. La Figura 61 (SEC ID Nº: 90) representa la secuencia de nucleótidos no mutante de 8_5_TV1_C.ZA Vpu.

La Figura 62 (SEC ID Nº: 91) representa la secuencia de nucleótidos de un polinucleótido que codifica rev sintético derivado de 8_5_TV1_C.ZA. La secuencia sintética representada se corresponde con los exones 1 y 2 de rev. La Figura 63 (SEC ID Nº: 92) representa la secuencia de nucleótidos no mutante de los exones 1 y 2 de rev derivada de 8_5_TV1_C.ZA.

La Figura 64 (SEC ID Nº: 93) representa la secuencia de nucleótidos de un polinucleótido que codifica Tat sintético derivado de 8_5-TV1_C.ZA. El polinucleótido sintético incluye ambos exones 1 y 2 de Tat e incluye adicionalmente una mutación en el exón 1 que convierte el producto génico en no funcional. La Figura 65 (SEC ID Nº: 94) representa la secuencia de nucleótidos de un polinucleótido que codifica Tat sintético derivado de 8_5_TV1_C.ZA. El polinucleótido sintético incluye ambos exones 1 y 2 de Tat.

La Figura 66 (SEC ID Nº: 95) representa la secuencia de nucleótidos no mutante de los exones 1 y 2 de Tat derivada de 8_5_TV1_C.ZA. La Figura 67 (SEC ID Nº: 96) representa la secuencia de nucleótidos de un polinucleótido que codifica Nef sintético derivado de 8_5_TV1_C.ZA. La secuencia incluye una mutación en la posición 125 que produce un producto génico no funcional y una mutación que elimina el sitio de miristoilación del producto génico Nef.

La Figura 68 (SEC ID Nº: 97) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp 160 sintético derivado de 12-5_1_TV2_C.ZA. La Figura 69 (SEC ID Nº: 98) representa la secuencia de nucleótidos no mutante de Env gp160 derivada de 12- 5_1_TV2_C.ZA. La Figura 70 (SEC ID Nº: 99) representa la secuencia de nucleótidos de un polinucleótido que codifica Gag sintético derivado de 12-5_1_TV2_C.ZA. La Figura 71 (SEC ID Nº: 100) representa la secuencia de nucleótidos no mutante de Gag derivada de 12- 5_1_TV2_C.ZA. La Figura 72 (SEC ID Nº: 101) representa la secuencia de nucleótidos de un polinucleótido que codifica Nef sintético derivado de 12-5_1_TV2_C.ZA. La Figura 73 (SEC ID Nº: 102) representa la secuencia de nucleótidos no mutante de Nef derivada de 12- 5_1_TV2_C.ZA. La Figura 74 (SEC ID Nº: 103) representa la secuencia de nucleótidos de un polinucleótido que codifica Pol sintético derivado de 12-5_1_TV2_C.ZA. La Figura 75 (SEC ID Nº: 104) representa la secuencia de nucleótidos no mutante de Pol derivada de 12- 5_1_TV2_C.ZA.

La Figura 76 (SEC ID Nº: 105) representa la secuencia de nucleótidos de un polinucleótido que codifica Rev sintético derivado del exón 1 de Rev de 12-5_1_TV2_C.ZA. La Figura 77 (SEC ID Nº: 106) representa la secuencia de nucleótidos no mutante del exón 1 de Rev derivada de 12-5_1_TV2_C.ZA. La Figura 78 (SEC ID Nº: 107) representa la secuencia de nucleótidos de un polinucleótido que codifica Rev sintético derivado del exón 2 de Rev de 12-5_1_TV2_C.ZA. La Figura 79 (SEC ID Nº: 108) representa la secuencia de nucleótidos no mutante del exón 2 de Rev derivada de 12-5_1_TV2_C.ZA. La Figura 80 (SEC ID Nº: 109) representa la secuencia de nucleótidos de un polinucleótido que codifica Tat sintético derivado del exón 1 de Tat de 12-5_1_TV2_C.ZA.

La Figura 81 (SEC ID Nº: 110) representa la secuencia de nucleótidos no mutante del exón 1 de Tat derivada de 12-5_1_TV2_C.ZA. La Figura 82 (SEC ID Nº: 111) representa la secuencia de nucleótidos de un polinucleótido que codifica Tat sintético derivado de exón 2 de Tat de 12-5_1_TV2_C.ZA. La Figura 83 (SEC ID Nº: 112) representa la secuencia de nucleótidos no mutante del exón 2 de Tat derivada de 12-5_1_TV2_C.ZA. La Figura 84 (SEC ID Nº: 113) representa la secuencia de nucleótidos de un polinucleótido que codifica Vif sintético derivado de 12-5_1_TV2_C.ZA. La Figura 85 (SEC ID Nº: 114) representa la secuencia de nucleótidos no mutante de Vif derivada de 12- 5_1_TV2_C.ZA.

La Figura 86 (SEC ID Nº: 115) representa la secuencia de nucleótidos de un polinucleótido que codifica Vpr sintético derivado de 12-5_1_TV2_C.ZA. La Figura 87 (SEC ID Nº: 116) representa la secuencia de nucleótidos no mutante de Vpr derivada de 12- 5_1_TV2_C.ZA. La Figura 88 (SEC ID Nº: 117) representa la secuencia de nucleótidos de un polinucleótido que codifica Vpu sintético derivado de 12-5_1_TV2_C.ZA. La Figura 89 (SEC ID Nº: 118) representa la secuencia de nucleótidos no mutante de Vpu derivada de 12- 5_1_TV2__C.ZA. La Figura 90 (SEC ID Nº: 119) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp 120 sintético derivado de 8_2_TV1_C.ZA. La región V2 está delecionada. La secuencia incluye: un sitio de restricción EcoRI (nucleótidos 1 a 6); una secuencia conductora de péptidos señal modificada en los codones (nucleótidos 7 a 87); una secuencia codificante de gp120 (nucleótidos 88 a 1464); un codón de terminación (nucleótidos 1465 a 1467); un sitio de restricción XhoI (nucleótidos 1468 a 1473). La Figura 91 (SEC ID Nº: 120) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp140 sintético derivado de 8_2_TV1_C.ZA. La región V2 está delecionada. La secuencia incluye: un sitio de restricción EcoRI (nucleótidos 1 a 6); una secuencia conductora de péptidos señal modificada (nucleótidos 7 a 87); una secuencia codificante de gp140 (nucleótidos 88 a 1977); un codón de terminación (nucleótidos 1978 a 1980); un sitio de restricción XhoI (nucleótidos 1981 a 1986). La Figura 92 (SEC ID Nº: 121) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp140 sintético derivado de 8_2_TV1_C.ZA. La región V2 está delecionada y la secuencia incluye mutaciones en el sitio de escisión que previenen la escisión de un polipéptido gp140 en un polipéptido gp120 y un polipéptido gp41. La secuencia incluye: un sitio de restricción EcoRI (nucleótidos 1 a 6); una secuencia conductora de péptidos señal modificada (nucleótidos 7 a 87); secuencia codificante de gp140 (nucleótidos 88 a 1977); un codón de terminación (nucleótidos 1978 a 1980); un sitio de restricción XhoI (nucleótidos 1981 a 1986).

La Figura 93 (SEC ID Nº: 122) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp 160 sintético derivado de 8_2_TV1_C.ZA. Las regiones V1/V2 están delecionadas. La secuencia incluye: un sitio de restricción EcoRI (nucleótidos 1 a 6); una secuencia conductora de péptidos señal modificada (nucleótidos 7 a 87); secuencia codificante de gp160 (nucleótidos 88 a 2388); un codón de terminación (nucleótidos 2389 a 2391); un sitio de restricción XhoI (nucleótidos 2392 a 2397).

La Figura 94 (SEC ID Nº: 123) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp160 sintético derivado de 8_2_TV1_C.ZA. La región V2 está delecionada. La secuencia incluye: un sitio de restricción EcoRI (nucleótidos 1 a 6); una secuencia conductora de péptidos señal modificada (nucleótidos 7 a 87); una secuencia codificante de gp160 (nucleótidos 88 a 2520); un codón de terminación (nucleótidos 2521 a 2523); un sitio de restricción XhoI (nucleótidos 2524 a 2529).

La Figura 95 (SEC ID Nº: 124) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp160 sintético derivado de 8_2_TV1_C.ZA. La región V2 está delecionada y el sitio de escisión está mutado.

La secuencia incluye: un sitio de restricción EcoRI (nucleótidos 1 a 6); una secuencia conductora de péptidos señal modificada (nucleótidos 7 a 87); una secuencia codificante de gp160 (nucleótidos 88 a 2520); un codón de terminación (nucleótidos 2521 a 2523); un sitio de restricción XhoI (nucleótidos 2524 a 2529). La Figura 96 (SEC ID Nº: 125) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp160 sintético derivado de 8_2_TV1_C.ZA. La secuencia de nucleótidos incluye una secuencia conductora de TPA1. La secuencia incluye: un sitio de restricción SalI (nucleótidos 1 a 6); una secuencia de Kozak (nucleótidos 7 a 12); una secuencia conductora de péptidos señal de TPA1 (nucleótidos 13 a 87); una secuencia codificante de gp160 (nucleótidos 88 a 2604); un codón de terminación (nucleótidos 2605 a 2607); un sitio de restricción XhoI (nucleótidos 2608 a 2613).

La Figura 97 (SEC ID Nº: 126) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp160 sintético derivado de 8_2_TV1_C.ZA. La secuencia incluye: un sitio de restricción EcoRI (nucleótidos 1 a 6); una secuencia conductora de péptidos señal modificada (nucleótidos 7 a 87); una secuencia codificante de gp160 (nucleótidos 8 a 2607); un codón de terminación (nucleótidos 2608 a 2610); un sitio de restricción XhoI (nucleótidos 2611 a 2616).

La Figura 98 (SEC ID Nº: 127) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp160 sintético derivado de 8_2_TV1_C.ZA. La secuencia de nucleótidos incluye una secuencia conductora no mutante. La secuencia incluye: un sitio de restricción EcoRI (nucleótidos 1 a 6); una secuencia conductora de péptidos señal nativa (sin modificar) (nucleótidos 7 a 87); una secuencia codificante de gp160 (nucleótidos 88 a 2607); un codón de terminación (nucleótidos 2608 a 2610); un sitio de restricción XhoI (nucleótidos 2611 a 2616). La Figura 99 (SEC ID Nº: 128) representa la secuencia de nucleótidos de gp160 no mutante derivada de 8_2_TV1_C.ZA. La Figura 100 (SEC ID Nº: 131) representa la secuencia de nucleótidos de un polinucleótido que codifica Env gp 140 sintético derivado de 8_2_TV1_C.ZA. La secuencia de nucleótidos incluye una secuencia conductora de TPA1 (nucleótidos 1-75); una secuencia codificante de gp140 (nucleótidos 76 a 2049); un codón de terminación (nucleótidos 2050 a 2052). La Figura 101 (SEC ID Nº: 132) representa la secuencia de nucleótidos de un polinucleótido que codifica gp140 sintético derivado de 8_2_TV1_C.ZA. La secuencia de nucleótidos incluye un sitio de restricción EcoRI (nucleótidos 1 a 6); una secuencia conductora modificada de la secuencia conductora no mutante de TV1_C.ZA (nucleótidos 7 a 87); una secuencia codificante de gp140 (nucleótidos 88 a 2064); un codón de terminación (nucleótidos 2065 a 2067); un sitio de restricción XhoI (nucleótidos 2068 a 2073). La Figura 102 (SEC ID Nº: 133) representa la secuencia de nucleótidos de un polinucleótido que codifica gp140 sintético derivado de 8_2_TV1_C.ZA. La secuencia de nucleótidos incluye una secuencia conductora sin modificar de TV1_C.ZA no mutante. La secuencia de nucleótidos incluye un sitio de restricción (nucleótidos 1 a 6); una secuencia conductora no mutante (nucleótidos 7 a 87); una secuencia codificante de gp140 (nucleótidos 88 a 2064); un codón de terminación (nucleótidos 2065 a 2067); un sitio de restricción XhoI (nucleótidos 2068-2073). La Figura 103 (SEC ID Nº: 134) representa la secuencia de nucleótidos de un polinucleótido que codifica Nef sintético derivado de 12-5_1_TV2_C.ZA. La secuencia incluye una mutación en la posición 125 que produce un producto génico no funcional. La Figura 104 (SEC ID Nº: 135) representa la secuencia de nucleótidos de un polinucleótido que codifica Nef sintético derivado de 12-5_1_TV2_C.ZA. El polinucleótido sintético incluye una mutación que elimina el sitio de miristoilación del producto génico Nef. La Figura 105 representa un alineamiento de polipéptidos Env de diversas cepas aisladas del VIH. Las regiones entre las flechas indican regiones (de clones TV1 y TV2) en la(s) región (regiones) de hoja beta y/o de puente que puede(n) delecionarse y/o truncarse. “*” indica los sitios de glicosilación enlazados en N (de clones TV1 y TV2), uno o más de los cuales pueden modificarse (por ejemplo, delecionarse y/o mutarse).

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN

La práctica de la presente invención empleará, a menos que se indique lo contrario, métodos convencionales de química, bioquímica, biología molecular, inmunología y farmacología, dentro de la experiencia de la materia. Tales técnicas se explican completamente en la bibliografía. Véanse, por ejemplo, Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Methods In Enzymology (S. Colowick and N.

Kaplan, eds., Academic Press, Inc.); y Handbook of Experimental Immunology, Vols. I-IV (D.M. Weir and C.C. Blackwell, eds., 1986, Blackwell Scientific Publications); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Short Protocols in Molecular Biology, 4th ed. (Ausubel et al. eds., 1999, John Wiley & Sons); Molecular Biology Techniques: An Intensive Laboratory Course, (Ream et al., eds., 1998, Academic Press); PCR (Introduction to Biotechniques Series), 2nd ed. (Newton & Graham eds., 1997, Springer Verlag).

Como se usa en esta memoria descriptiva y las reivindicaciones adjuntas, las formas en singular “un”, “una”, “el” y “la” incluyen referencias plurales, a menos que el contenido dicte claramente de otro modo. Así, por ejemplo, referencia a “un antígeno” incluye una mezcla de dos o más de tales agentes.

1. DEFINICIONES En la descripción de la presente invención se emplearán los siguientes términos, y pretenden definirse como se indica a continuación.

Secuencias “sintéticas”, como se usa en el presente documento, se refiere a polinucleótidos que codifican polipéptidos del VIH tipo C cuya expresión se ha modificado como se describe en el presente documento, por ejemplo, por sustitución de codones e inactivación de secuencias inhibidoras. Secuencias “no mutantes” o “nativas”, como se usa en el presente documento, se refiere a secuencias codificantes de polipéptidos que son esencialmente como se encuentran en la naturaleza, por ejemplo, secuencias codificantes de Gag, Pol, Vif, Vpr, Tat, Rev, Vpu, Env y/o Nef como se encuentran en cepas aisladas de tipo C, por ejemplo, AF110965, AF110967, AF110968, AF110975, 8_5_TV1_C.ZA, 8_2_TV1_C.ZA o 12-5_1_TV2_C.ZA. Las diversas regiones del genoma del VIH se muestran en la Tabla A, con numeración con respecto a 8_5_TV1_C.ZA (SEC ID Nº: 33). Así, el término “Pol” se refiere a uno o más de los siguientes polipéptidos: polimerasa (p6Pol); proteasa (prot); transcriptasa inversa (p66RT o RT); RNAsaH (p15RNAsaH); y/o integrasa (p31Int o Int). Como se usa en el presente documento, el término “partícula similar a virus” o “VLP” se refiere a una vaina viral no replicante, derivada de cualquiera de varios virus tratados adicionalmente más adelante. Las VLP están generalmente compuestas de una o más proteínas virales, tales como, pero no se limitan a, aquellas proteínas denominadas proteínas de la cápside, cubierta, vaina, superficie y/o de la envuelta, o polipéptidos formadores de partículas derivados de estas proteínas. Las VLP pueden formarse espontáneamente tras la expresión recombinante de la proteína en un sistema de expresión apropiado. Se conocen en la técnica métodos para producir VLP particulares y se tratan más completamente más adelante. La presencia de VLP tras la expresión recombinante de proteínas virales puede detectarse usando técnicas convencionales conocidas en la técnica, tales como por microscopía electrónica, cristalografía de rayos X y similares. Véase, por ejemplo, Baker et al., Biophys. J. (1991) 60:1445-1456; Hagensee et al., J. Viroal. (1994) 68:4503-4505. Por ejemplo, las VLP pueden aislarse por centrifugación en gradiente de densidad y/o identificarse por bandeo de densidad característico. Alternativamente, puede realizarse microscopía crioelectrónica sobre muestras acuosas vitrificadas de la preparación de VLP en cuestión, y se registraron imágenes bajo condiciones de exposición apropiadas.

Por “polipéptido formador de partículas” derivado de una proteína viral particular se indica una proteína viral de longitud completa o próxima a longitud completa, además de un fragmento de la misma, o una proteína viral con deleciones internas, que tiene la capacidad de formar VLP en condiciones que favorecen la formación de VLP. Por consiguiente, el polipéptido puede comprender la secuencia de longitud completa, fragmentos, secuencias truncadas y parciales, además de análogos y formas precursoras de la molécula de referencia. El término, por tanto, está destinado a deleciones, adiciones y sustituciones a la secuencia, mientras que el polipéptido retiene la capacidad para formar un VLP. Así, el término incluye variaciones naturales del polipéptido especificado, ya que variaciones en las proteínas de cubierta frecuentemente se producen entre cepas aisladas virales. El término también incluye deleciones, adiciones y sustituciones que no se producen naturalmente en la proteína de referencia, mientras que la proteína retiene la capacidad para formar una VLP. Sustituciones preferidas son aquellas que son conservativas en la naturaleza, es decir, aquellas sustituciones que tienen lugar dentro de una familia de aminoácidos que están relacionadas en sus cadenas laterales. Específicamente, los aminoácidos se dividen generalmente en cuatro familias: (1) ácidos -- aspartato y glutamato; (2) básicos -- lisina, arginina, histidina; (3) no polares -- alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptófano; y (4) polares sin carga -- glicina, asparagina, glutamina, cisteína, serina treonina, tirosina. Fenilalanina, triptófano y tirosina se clasifican algunas veces como aminoácidos aromáticos. Un “antígeno” se refiere a una molécula que contiene uno o más epítopes (tanto lineales, conformacionales como ambos) que estimularán el sistema inmunitario de un huésped para hacer una respuesta específica de antígeno humoral y/o celular. El término se usa indistintamente con el término “inmunogén”. Normalmente, un epítope de linfocitos B incluirá al menos aproximadamente 5 aminoácidos, pero puede ser tan pequeño como 3-4 aminoácidos. Un epítope de linfocitos T, tal como un epítope de CTL, incluirá al menos aproximadamente 7-9 aminoácidos, y un epítope de linfocitos T cooperadores al menos aproximadamente 12-20 aminoácidos. Normalmente, un epítope incluirá entre aproximadamente 7 y 15 aminoácidos, tales como 9, 10, 12 o 15 aminoácidos. El término “antígeno” indica tanto antígenos de subunidad (es decir, antígenos que están separados y discretos de un organismo completo con el que el antígeno está asociado en la naturaleza), además de bacterias destruidas, atenuadas o inactivadas, virus, hongos, parásitos u otros microbios. Anticuerpos tales como anticuerpos antiidiotípicos, o fragmentos de los mismos, y mimótopes de péptidos sintéticos, que pueden imitar un antígeno o determinante antigénico, también se capturan bajo la definición de antígeno como se usa en el presente documento. Similarmente, un oligonucleótido o polinucleótido que expresa un antígeno o determinante antigénico in vivo, tal como en terapia génica y aplicaciones de inmunización con ADN, también se incluye en la definición de antígeno en el presente documento. Los antígenos pueden derivarse de cualquiera de varios virus, bacterias, parásitos y hongos conocidos, como se describe más completamente más adelante. El término también está destinado a cualquiera de los diversos antígenos de tumor. Además, un “antígeno” se refiere a una proteína que incluye modificaciones, tales como deleciones, adiciones y sustituciones (generalmente conservativas en la naturaleza), a la secuencia nativa, mientras que la proteína mantiene la capacidad para provocar una respuesta inmunológica, como se define en el presente documento. Estas modificaciones pueden ser deliberadas, como mediante mutagénesis dirigida al sitio, o pueden ser accidentales, tal como mediante mutaciones de huéspedes que producen los antígenos.

Una “respuesta inmunológica” a un antígeno o composición es el desarrollo en un sujeto de una respuesta inmunitaria humoral y/o celular a un antígeno presente en la composición de interés. Una “respuesta inmunitaria humoral” se refiere a una respuesta inmunitaria mediada por moléculas de anticuerpo, mientras que una “respuesta inmunitaria celular” es una mediada por linfocitos T y/u otros glóbulos blancos. Un aspecto importante de la inmunidad celular implica una respuesta específica de antígeno por linfocitos T citolíticos (“CTL”). Los CTL tienen especificidad por antígenos de péptido que se presentan en asociación con proteínas codificadas por el complejo mayor de histocompatibilidad (MHC) y expresadas sobre las superficies de células. Los CTL ayudan a inducir y promover la destrucción de microbios intracelulares, o la lisis de células infectadas con tales microbios. Otro aspecto de inmunidad celular implica una respuesta específica de antígeno por linfocitos T cooperadores. Los linfocitos T cooperadores actúan ayudando a estimular la función, y centrar la actividad de, células efectoras no específicas contra células que expresan antígenos de péptido en asociación con moléculas de MHC sobre su superficie. Una “respuesta inmunitaria celular” también se refiere a la producción de citocinas, quimiocinas y otras de tales moléculas producidas por linfocitos T activados y/u otros glóbulos blancos, que incluyen aquellas derivadas de linfocitos T CD4+ y CD8+.

Una composición o vacuna que provoca una respuesta inmunitaria celular puede servir para sensibilizar a un sujeto vertebrado por la presentación de antígeno en asociación con moléculas del MHC en la superficie celular. La respuesta inmunitaria celular se dirige a, o cerca de, células que presentan antígeno en su superficie. Además, los linfocitos T específicos de antígeno pueden generarse para permitir la futura protección de un huésped inmunizado.

La capacidad de un antígeno particular para estimular una respuesta inmunológica celular puede determinarse por varios ensayos, tales como por ensayos de linfoproliferación (activación de linfocitos), ensayos citotóxicos de linfocitos CTL, o ensayando linfocitos T específicos para el antígeno en un sujeto sensibilizado. Tales ensayos son muy conocidos en la técnica. Véase, por ejemplo, Erickson et al., J. Immunol. (1993) 151:4189-4199; Doe et al., Eur. J. Immunol. (1994) 24:2369-2376. Métodos recientes de medición de la respuesta inmunitaria celular incluyen la medición de citocinas intracelulares o la secreción de citocinas por poblaciones de linfocitos T, o por medición de linfocitos T específicos de epítope (por ejemplo, por la técnica de tetrámeros) (revisado por McMichael, A.J., y O'Callaghan, C.A., J. Exp. Med. 187(9)1367-1371, 1998; Mcheyzer-Williams, M.G., et al, Immunol. Rev. 150:5-21, 1996; Lalvani, A., et al, J. Exp. Med. 186:859-865, 1997).

Así, una respuesta inmunológica como se usa en el presente documento puede ser una que estimula la producción de CTL, y/o la producción o activación de linfocitos T cooperadores. El antígeno de interés también puede provocar una respuesta inmunitaria mediada por anticuerpo. Por tanto, una respuesta inmunológica puede incluir uno o más de los siguientes efectos: la producción de anticuerpos por linfocitos B; y/o la activación de linfocitos T supresores y/o linfocitos T γδ dirigidos específicamente a un antígeno o antígenos presentes en la composición o vacuna de interés. Estas respuestas pueden servir para neutralizar la infectividad, y/o mediar en citotoxicidad celular dependiente del complemento del anticuerpo, o del anticuerpo (ADCC) para proporcionar protección a un huésped inmunizado. Tales respuestas pueden determinarse usando inmunoensayos estándar y ensayos de neutralización, muy conocidos en la técnica.

Una “composición inmunogénica” es una composición que comprende una molécula antigénica en la que la administración de la composición a un sujeto produce el desarrollo en el sujeto de una respuesta inmunitaria humoral y/o celular a la molécula antigénica de interés. La composición inmunogénica puede introducirse directamente en un sujeto receptor, tal como mediante inyección, inhalación, administración oral, intranasal y a la mucosa (por ejemplo, intra-rectalmente o intravaginalmente).

Por “vacuna de subunidad” se indica una composición de vacuna que incluye uno o más antígenos seleccionados, pero no todos los antígenos, derivados de u homólogos a, de un antígeno de un patógeno de interés tal como de un virus, bacteria, parásito u hongo. Una composición tal está sustancialmente libre de células patógenas intactas o partículas de patógeno, o el lisado de tales células o partículas. Así, una “vacuna de subunidad” puede prepararse a partir de polipéptidos inmunogénicos al menos parcialmente purificados (preferentemente sustancialmente purificados) del patógeno, o análogos de los mismos. El método de obtención de un antígeno incluido en la vacuna de subunidad puede así incluir técnicas de purificación estándar, producción recombinante o producción sintética. “Sustancialmente purificado” se refiere en general al aislamiento de una sustancia (compuesto, polinucleótido, proteína, polipéptido, composición de polipéptido) de forma que la sustancia comprenda la mayoría del porcentaje de la muestra en la que reside. Normalmente, en una muestra, un componente sustancialmente purificado comprende el 50 %, preferentemente el 80 %-85 %, más preferentemente el 90-95 % de la muestra. Técnicas para purificar polinucleótidos y polipéptidos de interés son muy conocidas en la técnica e incluyen, por ejemplo, cromatografía de intercambio iónico, cromatografía de afinidad y sedimentación según densidad.

Una “secuencia codificante” o una secuencia que “codifica” un polipéptido seleccionado, es una molécula de ácido nucleico que se transcribe (en el caso de ADN) y se traduce (en el caso de ARNm) en un polipéptido in vivo cuando se pone bajo el control de secuencias reguladoras apropiadas (o “elementos de control”). Los límites de la secuencia codificante se determinan por un codón de iniciación en el extremo 5' (amino) y un codón de terminación de la traducción en el extremo 3' (carboxi). Una secuencia codificante puede incluir, pero no se limita a, ADNc de ARNm viral, procariota o eucariota, secuencias de ADN genómico de ADN viral o procariota, e incluso secuencias de ADN sintético. Una secuencia de terminación de la transcripción tal como un codón de terminación puede localizarse 3' con respecto a la secuencia codificante. “Elementos de control” típicos incluyen, pero no se limitan a, promotores de la transcripción, elementos potenciadores de la transcripción, señales de terminación de la transcripción, secuencias de poliadenilación (localizadas 3' con respecto al codón de terminación de la traducción), secuencias para la optimización de la iniciación de la traducción (localizadas 5' con respecto a la secuencia codificante) y secuencias de terminación de la traducción.

Una “secuencia codificante de polinucleótidos” o una secuencia que “codifica” un polipéptido seleccionado es una molécula de ácido nucleico que se transcribe (en el caso de ADN) y se traduce (en el caso de ARNm) en un polipéptido in vivo cuando se pone bajo el control de secuencias reguladoras apropiadas (o “elementos de control”). Los límites de la secuencia codificante se determinan por un codón de iniciación en el extremo 5' (amino) y un codón de terminación de la traducción en el extremo 3' (carboxi). Secuencias codificantes a modo de ejemplo son las secuencias codificantes de polipéptidos virales modificadas de la presente invención. Una secuencia de terminación de la transcripción puede localizarse 3' con respecto a la secuencia codificante. “Elementos de control” típicos incluyen, pero no se limitan a, reguladores de la transcripción, tales como promotores, elementos potenciadores de la transcripción, señales de terminación de la transcripción, y secuencias de poliadenilación; y reguladores de la traducción, tales como secuencias para la optimización de la iniciación de la traducción, por ejemplo, secuencias de Shine-Dalgarno (sitio de unión al ribosoma), secuencias de Kozak (es decir, secuencias para la optimización de la traducción, localizadas, por ejemplo, 5' con respecto a la secuencia codificante), secuencias conductoras, codón de iniciación de la traducción (por ejemplo, ATG) y secuencias de terminación de la traducción. En ciertas realizaciones, una o más secuencias de regulación o iniciación de la traducción (por ejemplo, la secuencia conductora) se derivan de secuencias de iniciación de la traducción no mutantes, es decir, secuencias que regulan la traducción de la región codificante en su estado nativo. Secuencias conductoras no mutantes que han sido modificadas, usando los métodos descritos en el presente documento, también encuentran uso en la presente invención. Los promotores pueden incluir promotores inducibles (en los que la expresión de una secuencia de polinucleótidos operativamente enlazada a un promotor se induce por un analito, cofactor, proteína reguladora, etc.), promotores represibles (en los que la expresión de una secuencia de polinucleótidos operativamente enlazada a un promotor se induce por un analito, cofactor, proteína reguladora, etc.), y promotores constitutivos. Una molécula de “ácido nucleico” puede incluir, pero no se limita a, secuencias procariotas, ARNm eucariota, ADNc de ARNm eucariota, secuencias de ADN genómico de ADN eucariota (por ejemplo, de mamífero), e incluso secuencias de ADN sintético. El término también captura secuencias que incluyen cualquiera de los análogos de bases de ADN y ARN. “Operativamente enlazada” se refiere a una disposición de elementos en la que los componentes así descritos están configurados de manera que realicen su función usual. Así, un promotor operativamente enlazado dado a una secuencia codificante es capaz de efectuar la expresión de la secuencia codificante cuando las enzimas apropiadas están presentes. Un promotor no necesita estar contiguo a la secuencia codificante, mientras que funcione dirigiendo la expresión de la misma. Así, por ejemplo, pueden estar presentes secuencias ya transcritas sin traducir intermedias entre la secuencia promotora y la secuencia codificante y la secuencia promotora puede todavía considerarse “operativamente enlazada” a la secuencia codificante.

“Recombinante”, como se usa en el presente documento para describir una molécula de ácido nucleico, significa un polinucleótido de origen genómico, de ADNc, semisintético, o sintético que, en virtud de su origen o manipulación: (1) no está asociado a todo o una porción del polinucleótido con el que está asociado en la naturaleza; y/o (2) está enlazado a un polinucleótido distinto de aquél con el que está enlazado en la naturaleza. El término “recombinante”, como se usa con respecto a una proteína o polipéptido, significa un polipéptido producido por la expresión de un polinucleótido recombinante. “Células huésped recombinantes”, “células huésped”, “células”, “líneas celulares”, “cultivos celulares”, y otros términos tales, indican microorganismos procariotas o líneas celulares eucariotas cultivadas como entidades unicelulares, se usan indistintamente, y se refieren a células que puede ser, o han sido, usadas como receptores para vectores recombinantes u otro ADN de transferencia, e incluyen la progenie de la célula original que se ha transfectado. Se entiende que la progenie de una única célula parental puede no ser necesariamente completamente idéntica en morfología o en complemento de ADN genómico o total a la parental original, debido a mutación accidental o deliberada. La progenie de la célula parental que es suficientemente similar a la parental que va a caracterizarse por la propiedad relevante, tal como la presencia de una secuencia de nucleótidos que codifica un péptido deseado, está incluida en la progenie prevista por esta definición, y está cubierta por los términos anteriores.

Técnicas para determinar la “similitud” de secuencias de aminoácidos son muy conocidas en la técnica. En general, “similitud” significa la comparación exacta de aminoácido con aminoácido de dos o más polipéptidos en el sitio apropiado, en el que los aminoácidos son idénticos o poseen propiedades químicas y/o físicas similares tales como carga o hidrofobia. Un llamado “porcentaje de similitud” puede determinarse entonces entre las secuencias de polipéptidos comparadas. Técnicas para determinar la identidad de secuencias de ácidos nucleicos y aminoácidos también son muy conocidas en la técnica e incluyen determinar la secuencia de nucleótidos del ARNm para ese gen (normalmente mediante un producto intermedio de ADNc) y determinar la secuencia de aminoácidos así codificada, y comparar ésta con una segunda secuencia de aminoácidos. En general, “identidad” se refiere a una correspondencia exacta de nucleótido con nucleótido o aminoácido con aminoácido de dos polinucleótidos o secuencias de polipéptidos, respectivamente.

Pueden compararse dos o más secuencias de polinucleótidos determinando su “identidad en porcentaje”. Dos o más secuencias de aminoácidos pueden asimismo compararse determinando su “identidad en porcentaje”. La identidad en porcentaje de dos secuencias, tanto secuencias de ácidos nucleicos como de péptidos, se describe generalmente como el número de coincidencias exactas entre dos secuencias alineadas dividido entre la longitud de la secuencia más corta y multiplicado por 100. Un alineamiento aproximado para secuencias de ácidos nucleicos se proporciona por el algoritmo de homología local de Smith y Waterman, Advances in Applied Mathematics 2:482-489 (1981). Este algoritmo puede extenderse para ser usado con secuencias de péptidos usando la matriz de puntuación desarrollada por Dayhoff, Atlas of Protein Sequences and Structure, M.O. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., USA, y normalizado por Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986). Una implementación de este algoritmo para secuencias de ácido nucleico y de péptidos se proporciona por the Genetics Computer Group (Madison, WI) en su aplicación de utilidad BestFit. Los parámetros por defecto para este método se describen en the Wisconsin Sequence Analysis Package Program Manual, versión 8 (1995) (disponible de Genetics Computer Group, Madison, WI). Otros programas igualmente adecuados para calcular la identidad en porcentaje o similitud entre secuencias son generalmente conocidos en la técnica.

Por ejemplo, la identidad en porcentaje de una secuencia de nucleótidos particular con una secuencia de referencia puede determinarse usando el algoritmo de homología de Smith y Waterman con una tabla de puntuaciones por defecto y una penalización por hueco de seis posiciones de nucleótidos. Otro método de establecer la identidad en porcentaje en el contexto de la presente invención es usar el paquete MPSRCH de programas protegidos por derechos de autor por la Universidad de Edimburgo, desarrollado por John F. Collins y Shane S. Sturrok, y distribuido por IntelliGenetics, Inc. (Mountain View, CA). A partir de este paquete de aplicaciones, el algoritmo de Smith-Waterman puede emplearse cuando los parámetros por defecto se usen para la tabla de puntuación (por ejemplo, penalización por apertura de hueco de 12, penalización por extensión de hueco de uno, y un hueco de seis). A partir de los datos generados, el valor “Coincidencia” refleja la “identidad de secuencias”. Otros programas adecuados para calcular la identidad en porcentaje o similitud entre secuencias se conocen generalmente en la técnica, tal como el programa de alineamiento BLAST, que también puede usarse con parámetros por defecto. Por ejemplo, BLASTN y BLASTP pueden usarse usando los siguientes parámetros por defecto: código genético = estándar; filtro = ninguno; cadena = ambas; corte = 60; esperado = 10; matriz = BLOSUM62; descripciones = 50 secuencias; clasificar por = MAYOR PUNTUACIÓN; bases de datos = no redundantes, GenBank + EMBL + DDBJ + PDB + GenBank CDS translations + Swiss protein + Spupdate + PIR. Detalles de estos programas pueden encontrarse en la siguiente dirección de internet: http://www.ncbi.nlm.gov/cgi-bin/BLAST. Un experto en la materia puede determinar fácilmente los parámetros de búsqueda apropiados para usar una secuencia dada, los parámetros basados en Smith-Waterman preferidos a modo de ejemplo se presentan anteriormente. Por ejemplo, los parámetros de búsqueda pueden variar basándose en el tamaño de la secuencia en cuestión. Así, la longitud de la secuencia de polinucleótidos desvelada en el presente documento puede buscarse por comparación con una base de datos seleccionada y compararse con secuencias de esencialmente la misma longitud para determinar la identidad en porcentaje. Por ejemplo, la presente divulgación incluiría un polinucleótido aislado que tiene X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos aproximadamente un nivel seleccionado de identidad en porcentaje con respecto a Y nucleótidos contiguos de las secuencias descritas en el presente documento, y (ii) para fines de búsqueda X es igual a Y, en el que Y es un polinucleótido de referencia seleccionado de longitud definida. Las secuencias de la presente invención incluyen fragmentos de las secuencias, de 480 nucleótidos hasta el número de nucleótidos presente en las secuencias de longitud completa descrita en el presente documento (por ejemplo, véase Listado de secuencias, Figuras y reivindicaciones), que incluyen todos los valores enteros que se encuentran dentro del intervalo anteriormente descrito. Los casetes de expresión sintéticos (y polinucleótidos purificados) de la presente invención incluyen secuencias de polinucleótidos relacionadas que tienen del 98 % hasta el 100 % (incluyendo todos los valores enteros que se encuentran dentro de estos intervalos descritos) de identidad de secuencias con las secuencias del casete de expresión sintético (y polinucleótido purificado) como se define en las reivindicaciones. Dos fragmentos de ácido nucleico se consideran que se “hibridan selectivamente”, como se describe en el presente documento. El grado de identidad de secuencias entre dos moléculas de ácidos nucleicos afecta la eficiencia y fuerza de los eventos de hibridación entre tales moléculas. Una secuencia de ácidos nucleicos parcialmente idéntica inhibirá al menos parcialmente que una secuencia completamente idéntica se hibride con una molécula diana. La inhibición de la hibridación de la secuencia completamente idéntica puede evaluarse usando ensayos de hibridación que son muy conocidos en la técnica (por ejemplo, transferencia Southern, transferencia Northern, hibridación en disolución, o similares, véase Sambrook, et al., arriba o Ausubel et al., arriba). Tales ensayos pueden realizarse usando grados variables de selectividad, por ejemplo, usando condiciones variables de baja a alta rigurosidad. Si se emplean condiciones de baja rigurosidad, la ausencia de unión no específica puede evaluarse usando una sonda secundaria que carece de incluso un grado parcial de identidad de secuencias (por ejemplo, una sonda que tiene menos de aproximadamente el 30 % de identidad de secuencias con la molécula diana), de forma que, en ausencia de eventos de unión no específica, la sonda secundaria no se hibridará con la diana.

Si se utiliza un sistema de detección basado en hibridación, se elige una sonda de ácido nucleico que es complementaria a una secuencia de ácidos nucleicos diana, y entonces por selección de condiciones apropiadas la sonda y la secuencia diana “se hibridan selectivamente”, o se unen, entre sí para formar una molécula híbrida. Una molécula de ácido nucleico que es capaz de hibridarse selectivamente con una secuencia diana bajo “moderadamente rigurosas” normalmente se hibrida en condiciones que permiten la detección de una secuencia de ácidos nucleicos diana de al menos aproximadamente 10-14 nucleótidos de longitud que tiene al menos aproximadamente el 70 % de identidad de secuencias con la secuencia de la sonda de ácido nucleico seleccionada. Condiciones de hibridación rigurosas normalmente permiten la detección de secuencias de ácidos nucleicos diana de al menos aproximadamente 10-14 nucleótidos en longitud que tienen una identidad de secuencias superior a aproximadamente el 90-95 % con la secuencia de la sonda de ácido nucleico seleccionada. Condiciones de hibridación útiles para la hibridación de sonda/diana en las que la sonda y diana tienen un grado específico de identidad de secuencias pueden determinarse como se conoce en la técnica (véase, por ejemplo, Nucleic Acid Hybridization: A Practical Approach, editors B.D. Hames and S.J. Higgins, (1985) Oxford; Washington, DC; IRL Press).

Con respecto a las condiciones de rigurosidad para la hibridación, es muy conocido en la técnica que pueden emplearse numerosas condiciones equivalentes para establecer una rigurosidad particular variando, por ejemplo, los siguientes factores: la longitud y naturaleza de las secuencia de la sonda y diana, composición de bases de las diversas secuencias, concentraciones de sales y otros componentes de la disolución de hibridación, la presencia o ausencia de agentes de bloqueo en las disoluciones de hibridación (por ejemplo, formamida, sulfato de dextrano y polietilenglicol), temperatura de la reacción de hibridación y parámetros de tiempo, además de condiciones de lavado variables. La selección de un conjunto particular de condiciones de hibridación se selecciona siguiendo métodos convencionales en la materia (véase, por ejemplo, Sambrook, et al., arriba, o Ausubel et al., arriba).

Un primer polinucleótido se “deriva de” un segundo polinucleótido si tiene la misma secuencia de pares de bases o sustancialmente la misma que una región del segundo polinucleótido, su ADNc, complementos de los mismos, o si muestra identidad de secuencias como se ha descrito anteriormente. Un primer polipéptido se “deriva de” un segundo polipéptido si (i) está codificado por un primer polinucleótido derivado de un segundo polinucleótido, o (ii) muestra identidad de secuencias con los segundos polipéptidos como se ha descrito anteriormente. Generalmente, un polipéptido viral se “deriva de” un polipéptido particular de un virus (polipéptido viral) si (i) está codificado por un marco de lectura abierto de un polinucleótido de ese virus (polinucleótido viral), o (ii) muestra identidad de secuencias con polipéptidos de ese virus como se ha descrito anteriormente. “Codificado por” se refiere a una secuencia de ácidos nucleicos que codifica una secuencia de polipéptidos, en la que la secuencia de polipéptidos o una porción de la misma contiene una secuencia de aminoácidos de al menos 3 a 5 aminoácidos, más preferentemente al menos 8 a 10 aminoácidos, e incluso más preferentemente al menos 15 a aminoácidos de un polipéptido codificado por la secuencia de ácidos nucleicos. También están englobadas secuencias de polipéptidos que son inmunológicamente identificables con un polipéptido codificado por la secuencia. Además, pueden construirse poliproteínas fusionando en marco dos o más secuencias de polinucleótidos que codifican productos de polipéptido o de péptido. Además, pueden producirse secuencias codificantes policistrónicas disponiendo dos o más secuencias de polinucleótidos que codifican productos de polipéptido adyacentes entre sí, normalmente bajo el control de un promotor, en las que cada secuencia codificante de polipéptidos puede modificarse para incluir secuencias para sitios internos de unión al ribosoma. “Polinucleótido purificado” se refiere a un polinucleótido de interés o fragmento del mismo que está esencialmente libre, por ejemplo, contiene menos de aproximadamente el 50 %, preferentemente menos de aproximadamente el 70 %, y más preferentemente menos de aproximadamente el 90 %, de la proteína con la que el polinucleótido está naturalmente asociado. Técnicas para purificar polinucleótidos de interés son muy conocidas en la técnica e incluyen, por ejemplo, rotura de la célula que contiene el polinucleótido con un agente caotrópico y separación del (de los) polinucleótido(s) y proteínas por cromatografía de intercambio iónico, cromatografía de afinidad y sedimentación según densidad.

Por “inmunización con ácidos nucleicos” se indica la introducción de una molécula de ácido nucleico que codifica uno o más antígenos seleccionados en una célula huésped, para la expresión in vivo de un antígeno, antígenos, un epítope, o epítopes. La molécula de ácido nucleico puede introducirse directamente en un sujeto receptor, tal como mediante inyección, inhalación, administración oral, intranasal y a la mucosa, o similares, o puede introducirse ex vivo, en células que se han extraído del huésped. En el último caso, las células transformadas se reintroducen en el sujeto en el que puede organizarse una respuesta inmunitaria contra el antígeno codificado por la molécula de ácido nucleico. “Transferencia génica” o “administración génica” se refiere a métodos o sistemas para insertar de forma fiable ADN de interés en una célula huésped. Tales métodos pueden producir la expresión transitoria de ADN transferido no integrado, replicación extracromosómica y expresión de replicones transferidos (por ejemplo, episomas), o integración de material genético transferido en el ADN genómico de células huésped. Los vectores de expresión de administración génica incluyen, pero no se limitan a, vectores derivados de alfavirus, virus de la viruela y virus de la variolovacuna. Cuando se usan para inmunización, tales vectores de expresión de administración génica pueden denominarse vacunas o vectores de vacuna.

“Linfocitos T” son linfocitos no productores de anticuerpos que constituyen una parte del brazo celular del sistema inmunitario. Los linfocitos T surgen de linfocitos inmaduros que migran de la médula ósea al timo, en el que experimentan un proceso de maduración bajo la dirección de hormonas tímicas. Aquí, los linfocitos maduros se dividen rápidamente, aumentando a números muy grandes. Los linfocitos T en maduración se vuelven inmunocompetentes basándose en su capacidad para reconocer y unirse a un antígeno específico. La activación de linfocitos T inmunocompetentes se provoca cuando un antígeno se une a los receptores de la superficie del linfocito. El término “transfección” se usa para referirse a la captación de ADN foráneo por una célula. Una célula ha sido “transfectada” cuando el ADN foráneo se ha introducido dentro de la membrana celular. Varias técnicas de transfección se conocen generalmente en la técnica. Véanse, por ejemplo, Graham et al. (1973) Virology, 52:456, Sambrook et al. (1989) Molecular Cloning, a Laboratory manual, Cold Spring Harbor Laboratories, New York, Davis et al. (1986) Basic Methods in Molecular Biology, Elsevier, and Chu et al. (1981) Gene 13:197. Tales técnicas pueden usarse para introducir uno o más restos de ADN foráneo en células huésped adecuadas. El término se refiere a tanto la captación estable como transitoria de material genético, e incluye captación de ADN asociado a péptidos o anticuerpos. Un “vector” es capaz de transferir secuencias de genes a células diana (por ejemplo, vectores virales, vectores no virales, vehículos en partículas y liposomas). Normalmente, “construcción de vector”, “vector de expresión” y “vector de transferencia génica” significan cualquier construcción de ácidos nucleicos capaz de dirigir la expresión de un gen de interés y que pueden transferir secuencias de genes a células diana. Así, el término incluye la clonación y expresión de vehículos, además de vectores virales. La transferencia de un “gen suicida” (por ejemplo, un gen con susceptibilidad por un fármaco) a una célula diana convierte la célula en sensible a compuestos o composiciones que son relativamente no tóxicos para células normales. Moolten, F.L. (1994) Cancer Gene Ther. 1:279-287. Ejemplos de genes suicidas son timidina cinasa del virus del herpes simple (HSV-tk), citocromo P450 (Manome et al. (1996) Gene Therapy 3:513-520), desoxicitidina cinasa humana (Manome et al. (1996) Nature Medicine 2(5):567-573) y la enzima bacteriana citosina desaminasa (Dong et al. (1996) Human Gene Therapy 7:713-720). Células que expresan estos genes se vuelven sensibles a los efectos de los profármacos relativamente no tóxicos ganciclovir (HSV-tk), ciclofosfamida (citocromo P450 2B1), citosina arabinósido (desoxicitidina cinasa humana) o 5-fluorocitosina (citosina desaminasa bacteriana). Culver et al. (1992) Science 256:1550-1552, Huber et al. (1994) Proc. Natl. Acad. Sci. USA 91:8302-8306. Un “marcador de selección” o “marcador indicador” se refiere a una secuencia de nucleótidos incluida en un gen vector de transferencia que no tiene actividad terapéutica, sino que se incluye para permitir una preparación, fabricación, caracterización o prueba más simple del gen vector de transferencia. Un “agente de unión específica” se refiere a un miembro de un par de moléculas de unión específica en el que una de las moléculas se une específicamente a la segunda molécula mediante medios químicos y/o físicos. Un ejemplo de un agente de unión específica es un anticuerpo dirigido contra un antígeno seleccionado.

Por “sujeto” se indica cualquier miembro del subfilo de los cordados, que incluye, sin limitación, seres humanos y otros primates, que incluyen primates no humanos tales como chimpancés y otros simios superiores y especies de mono; animales de granja tales como ganado vacuno, ovejas, cerdos, cabras y caballos; mamíferos domésticos tales como perros y gatos; animales de laboratorio que incluyen roedores tales como ratones, ratas y cobayas; aves, que incluyen aves domésticas, salvajes y de caza tales como pollos, pavos y otras aves gallináceas, patos, gansos y similares. El término no indica una edad particular. Así, pretenden cubrirse tanto individuos adultos como recién nacidos. El sistema descrito anteriormente está previsto para su uso en cualquiera de las especies de vertebrado anteriores, ya que los sistemas inmunitarios de todos estos vertebrados operan similarmente.

Por “farmacéuticamente aceptable” o “farmacológicamente aceptable” se indica un material que no es biológicamente o de otro modo no deseable, es decir, el material puede administrarse a un individuo en una formulación o composición sin causar ningún efecto biológico no deseable o interacción en un modo perjudicial con cualquiera de los componentes de la composición en la que está contenido. Por “pH fisiológico” o un “pH en el intervalo fisiológico” se indica un pH en el intervalo de aproximadamente 7,2 a 8,0, ambos incluidos, más normalmente en el intervalo de aproximadamente 7,2 a 7,6, ambos incluidos. Como se usa en el presente documento, “tratamiento” se refiere a cualquiera de (I) la prevención de la infección o reinfección, como en una vacuna tradicional, (ii) la reducción o eliminación de síntomas, y (iii) la eliminación sustancial o completa del patógeno en cuestión. El tratamiento puede efectuarse profilácticamente (antes de la infección) o terapéuticamente (tras la infección). Por “co-administración” se indica la administración de más de una composición o molécula. Así, la co-administración incluye la administración concurrente o administración secuencial (en cualquier orden), mediante las mismas vías de administración o diferentes. Ejemplos no limitantes de pautas de co-administración incluyen co-administración de ácido nucleico y polipéptido; co-administración de diferentes ácidos nucleicos (por ejemplo, diferentes casetes de expresión como se describe en el presente documento y/o diferentes vectores de administración génica); y co- administración de diferentes polipéptidos (por ejemplo, diferentes polipéptidos del VIH y/o diferentes adyuvantes). El término también engloba múltiples administraciones de una de las moléculas o composiciones co-administradas (por ejemplo, múltiples administraciones de uno o más de los casetes de expresión descritos en el presente documento, seguidas de una o más administraciones de una composición que contiene polipéptidos). En casos en los que las moléculas o composiciones se administran secuencialmente, el tiempo entre cada administración puede determinarse fácilmente por un experto en la materia en vista de las enseñanzas en el presente documento. “Vector lentiviral”, y “vector lentiviral recombinante”, se refieren a una construcción de ácidos nucleicos que lleva, y dentro de ciertas realizaciones, es capaz de dirigir la expresión de una molécula de ácido nucleico de interés. El vector lentiviral incluye al menos un promotor/potenciador de la transcripción o elemento(s) que definen(n) el locus, u otros elementos que controlan la expresión génica por otros medios tales como corte y empalme alternativo, exportación de ARN nuclear, modificación post-traduccional del mensajero, o modificación post-transcripcional de proteína. Tales construcciones de vector también deben incluir una señal de encapsidación, repeticiones terminales largas (LTR) o porción de las mismas, y sitios de unión al cebador de hebra positiva y negativa apropiados para el retrovirus usado (si estos no están todavía presentes en el vector retroviral). Opcionalmente, el vector lentiviral recombinante también puede incluir una señal que dirige la poliadenilación, marcadores de selección tales como Neo, TK, higromicina, fleomicina, histidinol, o DHFR, además de uno o más sitios de restricción y una secuencia de terminación de la traducción. A modo de ejemplo, tales vectores normalmente incluyen una 5' LTR, un sitio de unión a ARNt, una señal de encapsidación, un origen de la síntesis de ADN de la segunda hebra, y una 3'LTR o una porción de los mismos “Partícula de vector lentiviral” se refiere a un lentivirus que lleva al menos un gen de interés. El retrovirus también puede contener un marcador de selección. El lentivirus recombinante es capaz de transcribir de forma inversa su material genético (ARN) en ADN e incorporar este material genético en el ADN de una célula huésped tras la infección. Las partículas de vector lentiviral pueden tener una envoltura lentiviral, una envoltura no lentiviral (por ejemplo, una envoltura anfo o VSV-G), o una envoltura quimérica. “Vector de expresión de ácido nucleico” o “casete de expresión” se refiere a un ensamblaje que es capaz de dirigir la expresión de una secuencia o gen de interés. El vector de expresión de ácido nucleico incluye un promotor que está operativamente enlazado a las secuencias o gen(es) de interés. También pueden estar presentes otros elementos de control. Los casetes de expresión descritos en el presente documento pueden estar contenidos dentro de una construcción de plásmido. Además de los componentes del casete de expresión, la construcción de plásmido también puede incluir un origen de replicación bacteriano, uno o más marcadores de selección, una señal que permite que la construcción de plásmido exista como ADN monocatenario (por ejemplo un origen de replicación M13), un sitio de clonación múltiple y un origen de replicación “de mamífero” (por ejemplo, un origen de replicación SV40 o de adenovirus). “Célula de encapsidación” se refiere a una célula que contiene aquellos elementos necesarios para la producción de retrovirus recombinantes infecciosos que están ausentes en un vector retroviral recombinante. Normalmente, tales células de encapsidación contienen uno o más casetes de expresión que son capaces de expresar proteínas que codifican proteínas Gag, pol y env. “Célula productora” o “célula productora de vector” se refiere a una célula que contiene todos los elementos necesarios para la producción de partículas de vector retroviral recombinante. 2. MODOS DE LLEVAR A CABO LA INVENCIÓN Antes describir la presente invención en detalle, debe entenderse que la presente invención no se limita a formulaciones o parámetros de proceso particulares ya que tales pueden, por supuesto, variar. También debe entenderse que la terminología usada en el presente documento es con el fin de describir realizaciones particulares de la invención solo, y no pretende ser limitante. Aunque pueden usarse varios métodos y materiales similares o equivalentes a aquellos descritos en el presente documento en la práctica de la presente invención, los materiales y métodos preferidos se describen en el presente documento. 2.1. EL GENOMA DEL VIH El genoma del VIH y diversas regiones que codifican polipéptidos se muestran en la Tabla A. Las posiciones de nucleótido se facilitan con respecto a 8_5_TV1_C.ZA (SEC ID Nº: 33, Figura 11). Sin embargo, será rápidamente evidente para un experto habitual en la materia en vista de las enseñanzas de la presente divulgación cómo determinar regiones correspondientes en otras cepas o variantes del VIH (por ejemplo, cepas aisladas VIHIIIb, VIHSF2' VIH-1SFI62, VIH-1SF170, VIHLAV, VIHLAI, VIHMN, VIH-1CM235, VIH-1US4, otras cepas del VIH-1 de diversos subtipos (por ejemplo, subtipos A a G, y O), cepas del VIH-2 y diversos subtipos (por ejemplo, VIH-2UC1 y VIH-2UC2), y virus de la inmunodeficiencia simia (SIV) (véase, por ejemplo, Virology, 3ª Edición (W.K. Joklik ed. 1988); Fundamental Virology, 2ª Edición (B.N. Fields y D.M. Knipe, eds. 1991); Virology, 3ª Edición (Fields, BN, DM Knipe, PM Howley, Editors, 1996, Lippincott-Raven, Philadelphia, PA; para una descripción de estos y otros virus relacionados), usando por ejemplo, programas de comparación de secuencias (por ejemplo, BLAST y otros descritos en el presente documento) o identificación y alineamiento de características estructurales (por ejemplo, un programa tal como el programa “ALB” descrito en el presente documento que puede identificar las diversas regiones).

Tabla A: Regiones del genoma del VIH con respecto a 8_5_TV1_C.ZA

Posición en secuencia de polinucleótidos Señal Poly A

p7 región de unión, señal de

empaquetamiento (continuación) Posición en secuencia de polinucleótidos Ciclofilina A bdg.

Desplazamiento de marco Región hidrofílica Oligomerización Anfipático α-hélice

5823-6038 y 8417-8509

Dominio Terminal N Dominio Trans-activación Dominio Transducción

y

Sitio de alta afinidad bdg.

Dominio efector Leu-rico Dominio trasnmembrana Dominio citoplásmico Péptido señal (continuación) Posición en secuencia de polinucleótidos Unión CD4 Péptido fusión Dominio Oligomerización Repetir heptad N-Terminal Repetir heptad C-Terminal Región Immunodominate Miriistolazión Unión SH3 Tracto de polipurina Unión SH3 Será rápidamente evidente que un experto en la materia puede alinear fácilmente cualquier secuencia con la mostrada en la Tabla A para determinar localizaciones relativas de cualquier gen del VIH particular. Por ejemplo, usando uno de los programas de alineamiento descritos en el presente documento (por ejemplo, BLAST), otras secuencias del VIH tipo C pueden alinearse con 8_5_TV1_C.ZA (Tabla A) y determinarse localizaciones de genes. Pueden alinearse similarmente secuencias de polipéptidos. Por ejemplo, la Figura 103 muestra el alineamiento de secuencias de polipéptidos Env de diversas cepas, con respecto a SF-162. Como se describe en detalle en el documento del mismo solicitante WO/39303, polipéptidos Env (por ejemplo, gp120, gp140 y gp160) incluyen una “hoja de puente” que comprende 4 cadenas β antiparalelas (β-2, β-3, β-20 y β-21) que forman una hoja β. La extrusión a partir de un par de las hebras de β (β-2 y β-3) son dos bucles, V1 y V2. La hoja β-2 se produce en aproximadamente el residuo de aminoácido 113 (Cys) al residuo de aminoácido 117 (Thr) mientras que β-3 se produce en aproximadamente el residuo de aminoácido 192 (Ser) al residuo de aminoácido 194 (Ile), con respecto a SF-162 (véase, Figura 103). La “región V1/V2” se produce en aproximadamente las posiciones de aminoácidos 120 (Cys) al residuo 189 (Cys), con respecto a SF-162. La extrusión del segundo par de hebras β (β-20 y β-21) es una estructura de “bucle pequeño”, también denominada en el presente documento “el bucle pequeño de hoja de puente”. Las localizaciones de tanto el bucle pequeño como el bucle pequeño de hoja de puente pueden determinarse con respecto a HXB-2 siguiendo las enseñanzas en el presente documento y en el documento WO/39303. También se muestra por las flechas en la Figura 103A-C sitios aproximados para las deleciones de secuencia de la región de hoja beta. “*” indica sitios de N-glicosilación que pueden mutarse siguiendo las enseñanzas de la presente memoria descriptiva.

2.2 CASETES DE EXPRESIÓN SINTÉTICOS 2.2.1 MODIFICACIÓN DE SECUENCIAS CODIFICANTES DEL ÁCIDO NUCLEICO POL, PROT, RT, INT, GAG, ENV, TAT, REV, NEF, RNASA H, VIF, VPR Y VPU DEL VIH-1 TIPO C

Un aspecto de la presente divulgación es la generación de secuencias codificantes del VIH-1 tipo C, y secuencias relacionadas, que tienen expresión mejorada con respecto a las secuencias no mutantes correspondientes. 2.2.1.1. MODIFICACIÓN DE SECUENCIAS CODIFICANTES DEL ÁCIDO NUCLEICO GAG

Un aspecto a modo de ejemplo de la presente divulgación se ilustra en el presente documento modificando las secuencias no mutantes de la proteína Gag obtenida de las cepas AF 110965 y AF 110967 del VIH-1, subtipo C (véanse, por ejemplo, Korber et al. (1998) Human Retroviruses and Aids, Los Alamos, New Mexico: Los Alamos National Laboratory; Novitsky et al. (1999) J. Virol. 73(5):4427-4432, para la clonación molecular de diversos clones del subtipo C de Botswana). También se ilustra en el presente documento la modificación de secuencias no mutantes de cepas aisladas novedosas 8_5_TV1_C.ZA (también llamada TV001 o TV1) y 12-5_1_TV2_C.ZA (también llamada TV002 o TV2). SEC ID Nº: 52 muestra la secuencia no mutante de Gag de 8_5_TV1_C.ZA y SEC ID Nº: 54 muestra la secuencia no mutante de la región principal de homología de Gag (nucleótidos 1632-1694 de la Tabla A) de la misma cepa. SEC ID Nº: 100 muestra la secuencia no mutante de Gag de 12-5_1_TV2_C.ZA. La secuencia de Gag obtenida de otras variantes del VIH-1 tipo C puede manipularse de modo similar siguiendo las enseñanzas de la presente memoria descriptiva. Tales otras variantes incluyen, pero no se limitan a, secuencias codificantes de proteínas Gag obtenidas de las cepas aisladas del VIH-1 tipo C, por ejemplo, como se describe en Novitsky et al., (1999), arriba; Myers et al., abajo; Virology, 3ª Edición (W.K. Joklik ed. 1988); Fundamental Virology, 2ª Edición (B.N. Campos y D.M. Knipe, eds. 1991); Virology, 3ª Edición (Fields, BN, DM Knipe, PM Howley, Editors, 1996, Lippincott-Raven, Philadelphia, PA y en la malla mundial (internet), por ejemplo, en http://hiv-web.lanl.gov/cgi- bin/hivDB3/public/wdb/ssampublic y http://hiv-web.lanl.gov. Primero, se modificó el patrón de uso de codones del VIH-1 de manera que la secuencia codificante de ácidos nucleicos resultante fuera comparable al uso de codones encontrado en genes humanos altamente expresados (Ejemplo 1). El uso de codones del VIH-1 refleja un alto contenido de los nucleótidos A o T del triplete de codones. El efecto del uso de codones del VIH-1 es un alto contenido de AT en la secuencia de ADN que produce una disminución en la capacidad de traducción e inestabilidad del ARNm. En comparación, codones humanos altamente expresados prefieren los nucleótidos G o C. Las secuencias codificantes de Gag se modificaron para ser comparables al uso de codones encontrado en genes humanos altamente expresados.

Segundo, hay elementos inhibidores (o de inestabilidad) (INS) localizados dentro de las secuencias codificantes de las secuencias codificantes de Gag. El RRE es una estructura de ARN secundaria que interacciona con la proteína Rev codificada por el VIH para vencer la expresión de efectos de regulación por disminución de los INS. Para vencer los mecanismos de activación post-transcripcional de RRE y Rev, los elementos de inestabilidad pueden inactivarse introduciendo múltiples mutaciones puntuales que no alteran el marco de lectura de las proteínas codificadas.

Las secuencias codificantes de Gag del subtipo C que tienen sitios RRE inactivados se muestran, por ejemplo, en las Figuras 1 (SEC ID Nº: 3), 2 (SEC ID Nº: 4), 5 (SEC ID Nº: 20) y 6 (SEC ID Nº: 26). Similarmente, otros polinucleótidos sintéticos derivados de otras cepas del subtipo C pueden modificarse para inactivar los sitios de RRE.

La modificación de las secuencias codificantes de polipéptidos Gag produce una mejora de la expresión con respecto a las secuencias codificantes no mutantes en varias líneas celulares de mamífero (además de otros tipos de líneas celulares, que incluyen, pero no se limitan a, células de insecto). Además, la expresión de las secuencias produce la producción de partículas similares a virus (VLP) por estas líneas celulares (véase más adelante).

2.2.1.2 MODIFICACIÓN DE SECUENCIAS CODIFICANTES DEL ÁCIDO NUCLEICO ENV Similarmente, la presente divulgación también incluye polinucleótidos que codifican Env sintéticos y proteínas Env modificadas. Se obtienen secuencias de Env no mutantes de las cepas AF110968 y AF110975, además de las cepas novedosas 8_5_TV1_C.ZA (SEC ID Nº: 33) y 12-5_1_TV2_C.ZA (SEC ID Nº: 45) del VIH-1, tipo C (véase, por ejemplo, Novitsky et al. (1999) J. Virol. 73(5):4427-4432, para la clonación molecular de diversos clones del subtipo C de Botswana). Se muestran secuencias de Env no mutantes de 8_5_TV1_C.ZA, por ejemplo, en SEC ID Nº: 48 (región común de Env no mutante, nucleótidos 7486-7629 como se muestra en la Tabla A); y SEC ID Nº: 50 (gp160 no mutante, nucleótidos 6244-8853 como se muestra en la Tabla A). Env gp160 no mutante de 12-5_1_TV2_C.ZA se muestra en SEC ID Nº: 98. Será rápidamente evidente de la divulgación en el presente documento que los polinucleótidos que codifican fragmentos de Env gp160 (por ejemplo, gp120, gp41, gp140) pueden obtenerse fácilmente a partir de las secuencias de longitud completa más grandes desveladas en el presente documento. También será rápidamente evidente que pueden prepararse otras modificaciones, por ejemplo, deleción de regiones tales como la región V1 y/o V2; mutación del sitio de escisión y similares (véase, Ejemplo 1). Secuencias a modo de ejemplo de tal modificación se muestran en SEC ID Nº: 119 a 127.

Además, las secuencias de Env obtenidas de otras variantes del VIH-1 de tipo C pueden manipularse de modo similar siguiendo las enseñanzas de la presente memoria descriptiva. Tales otras variantes incluyen, pero no se limitan a, secuencias codificantes de la proteína Env obtenidas de las cepas aisladas de VIH-1 tipo C, descritas anteriormente.

El patrón de uso de codones para Env se modificó como se ha descrito anteriormente para Gag, de manera que la secuencia codificante de ácidos nucleicos resultante fuera comparable al uso de codones encontrado en genes humanos altamente expresados. Experimentos realizados en apoyo de la presente invención muestran que las secuencias de Env sintéticas fueron capaces de mayor nivel de producción de proteínas con respecto a las secuencias de Env nativas.

La modificación de las secuencias codificantes del polipéptido Env produce una mejora de la expresión con respecto a las secuencias codificantes no mutantes en varias líneas celulares de mamífero (además de otros tipos de líneas celulares, que incluyen, pero no se limitan a, células de insecto). Secuencias codificantes del polipéptido Env similares pueden obtenerse, modificarse y probarse para una mejora de la expresión de una variedad de cepas aisladas, que incluyen aquellas descritas anteriormente para Gag. Otras modificaciones de Env incluyen, pero no se limitan a, generar polinucleótidos que codifican polipéptidos Env que tienen mutaciones y/o deleciones en su interior. Por ejemplo, las regiones hipervariables, V1 y/o V2, pueden delecionarse como se describe en el presente documento. Adicionalmente, también pueden realizarse otras modificaciones, por ejemplo, a la región de la hoja de puente y/o a sitios de N-glicosilación dentro de Env, siguiendo las enseñanzas de la presente memoria descriptiva (véanse la Figura 103A-C y documento WO/39303). Pueden emplearse diversas combinaciones de estas modificaciones para generar casetes de expresión sintéticos como se describe en el presente documento.

2.2.1.3 MODIFICACIÓN DE SECUENCIAS QUE INCLUYEN SECUENCIAS CODIFICANTES DEL ÁCIDO NUCLEICO POL DEL VIH-1 La presente divulgación también incluye casetes de expresión que incluyen secuencias de Pol sintéticas. Como se observa anteriormente, “Pol” incluye, pero no se limita a, las regiones codificantes de proteína mostradas en la Figura 7, por ejemplo, polimerasa, proteasa, transcriptasa inversa y/o secuencias que contienen integrasa. Las regiones mostradas en la Figura 7 se describen, por ejemplo, en Wan et al (1996) Biochem. J. 316:569-573; Kohl et al. (1988) PNAS USA 85:4686-4690; Krausslich et al. (1988) J. Virol. 62:4393-4397; Coffin, “Retroviridae and their Replication” en Virology, pp1437-1500 (Raven, New York, 1990); Patel et. al. (1995) Biochemistry 34:5351-5363. Así, los casetes de expresión sintéticos ejemplificados en el presente documento incluyen una o más de estas regiones y uno o más cambios a las secuencias de aminoácidos resultantes. Se obtuvieron secuencias de Pol no mutantes de las cepas AF110975, 8_5_TVI_C.ZA y 12-5_1_TV2_C.ZA del VIH- 1, tipo C (véase, por ejemplo, Novitsky et al. (1999) J. Virol. 73(5):4427-4432, para la clonación molecular de diversos clones del subtipo C de Botswana). SEC ID Nº: 34 muestra la secuencia no mutante de AF110975 de la región p2 a p7 de Pol (véase, Figura 7 y Tabla A). SEC ID Nº: 35 muestra la secuencia no mutante de AF110975 de p1 a los 6 primeros aminoácidos de integrasa (véase, Figura 7 y Tabla A). SEC ID Nº: 63 y SEC ID Nº: 104 muestran secuencias no mutantes de Pol de 8_5_TVI_C.ZA y 12-5_1_TV2_C.ZA, respectivamente (véase, por tanto, la Tabla A).

La secuencia obtenida de otras variantes del VIH-1 de tipo C puede manipularse de modo similar siguiendo las enseñanzas de la presente memoria descriptiva. Tales otras variantes incluyen, pero no se limitan a, secuencias codificantes de proteínas Pol obtenidas de las cepas aisladas del VIH-1 tipo C descritas en el presente documento. El patrón de uso de codones para Pol se modificó como se ha descrito anteriormente para Gag y Env de manera que la secuencia codificante de ácidos nucleicos resultante fuera comparable al uso de codones encontrado en genes humanos altamente expresados. La Tabla B muestra las posiciones de nucleótidos de diversas regiones encontradas en las construcciones de Pol ejemplificadas en el presente documento (por ejemplo, SEC ID Nº: 30-32).

Tabla B

Posición en secuencia de polinucleótidos en construcción sitio restricción Codón de iniciazión Mutación de inserción en el marco Protasa Centro de región catalítica (YMDD) Imprimador de región de agarre (WMGY) Integrasa Casete epítopo (sitio de clonación múltiple) (sitio restricción) Como se muestra en la Tabla B, se modificaron construcciones a modo de ejemplo de diversas formas. Por ejemplo, las construcciones de expresión ejemplificadas en el presente documento incluyen la secuencia que codifica los 6 primeros aminoácidos del polipéptido integrasa. Se cree que esta región de 6 aminoácidos proporciona un sitio de reconocimiento de la escisión reconocido por proteasa del VIH (véase, por ejemplo, McCornack et al. (1997) FEBS Letts 414:84-88). Como se observa anteriormente, ciertas construcciones ejemplificadas en el presente documento incluyen un sitio de clonación múltiple (MCS) para la inserción de uno o más transgenes, normalmente en el extremo 3' de la construcción. Además, un casete que codifica un epítope del centro catalítico derivado del centro catalítico en RT normalmente se incluye 3' de la secuencia que codifica los 6 aminoácidos de la integrasa. Este casete (SEC ID Nº: 36) codifica Ile178 a serina 191 de RT (aminoácidos 3 a 16 de SEC ID Nº: 37) y se añadió para mantener esta región bien conservada como un posible epítope de CTL. Además, las construcciones contienen mutaciones de inserción (posición 225 de SEC ID Nº: 30 a 32) para preservar el marco de lectura (véase, por ejemplo, Park et al. (1991) J. Virol. 65:5111).

En ciertas realizaciones, se modifican el centro catalítico y/o la región de agarre del cebador de RT. El centro catalítico y las regiones de agarre del cebador de RT se describen, por ejemplo, en Patel et al. (1995) Biochem. 34:5351 y Palaniappan et al. (1997) J. Biol. Chem. 272(17): 11157. Por ejemplo, en la construcción designada PR975YM (SEC ID Nº: 31), la secuencia no mutante que codifica los aminoácidos YMDD en las posiciones 183-185 de RT p66, numeradas con respecto a AF 110975, se sustituyen por la secuencia que codifica los aminoácidos “AP”.

En la construcción designada PR975YMWM (SEC ID Nº: 32), se hace la misma mutación en YMDD y, además, la región de agarre del cebador (aminoácidos WMGY, residuos 229-232 de p66RT, numerados con respecto a AF110975) se sustituyen por la secuencia que codifica los aminoácidos “PI”. Para la secuencia de Pol, los cambios en el uso de codones normalmente están limitados a las regiones hasta el desplazamiento de marco -1 y empezando de nuevo al final del marco de lectura de Gag; sin embargo, también pueden modificarse regiones dentro de la región de traducción del marco. Finalmente, también pueden alterarse los elementos inhibidores (o de inestabilidad) (INS) localizados dentro de las secuencias codificantes de la secuencia codificante del polipéptido proteasa. Pueden realizarse experimentos en ayuda de la presente divulgación para mostrar que las secuencias de Pol sintéticas fueron capaces de mayor nivel de producción de proteínas con respecto a las secuencias de Pol nativas. La modificación de las secuencias codificantes del polipéptido Pol produce una mejora de la expresión con respecto a las secuencias codificantes no mutantes en varias líneas celulares de mamífero (además de otros tipos de líneas celulares, que incluyen, pero no se limitan a, células de insecto). Secuencias codificantes del polipéptido Pol similares pueden obtenerse, modificarse y probarse para una mejora de la expresión de una variedad de cepas aisladas, que incluyen aquellas descritas anteriormente para Gag y Env. 2.2.1.4 MODIFICACIÓN DE OTRAS SECUENCIAS DEL VIH La presente divulgación también incluye casetes de expresión que incluyen secuencias sintéticas del VIH tipo C derivadas de genes del VIH distintos de Gag, Env y Pol, que incluyen, pero no se limitan a, regiones dentro de Gag, Env, Pol, además de, vif, vpr, tat, rev, vpu y nef, por ejemplo, de 8_5_TV1_C.ZA (SEC ID Nº: 33) o 12- 5_1_TV2_C.ZA (SEC ID Nº: 45). Las secuencias obtenidas de otras cepas pueden manipularse de modo similar siguiendo las enseñanzas de la presente memoria descriptiva.

Como se observa anteriormente, el patrón de uso de codones se modifica como se ha descrito anteriormente para Gag, Env y Pol de manera que la secuencia codificante de ácidos nucleicos resultante sea comparable al uso de codones encontrado en genes humanos altamente expresados. Pueden realizarse experimentos en soporte de la presente divulgación para mostrar que estas secuencias sintéticas fueron capaces de mayor nivel de producción de proteínas con respecto a las secuencias nativas y que la modificación de las secuencias codificantes de polipéptidos no mutantes produce una mejora de la expresión con respecto a las secuencias codificantes no mutantes en varias líneas celulares de mamífero (además de otros tipos de líneas celulares, que incluyen, pero no se limitan a, células de insecto). Además, la secuencia de ácidos nucleicos también puede modificarse para introducir mutaciones en una o más regiones del gen, por ejemplo, para convertir el producto génico en no funcional y/o para eliminar el sitio de miristoilación en Nef.

Los casetes de expresión sintéticos ejemplificados en el presente documento incluyen SEC ID Nº: 49 y SEC ID Nº: 97 (secuencias codificantes de Env gp160, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12- 5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 51 y SEC ID Nº: 99 (secuencias codificantes de Gag, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12-5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 53 (región principal de homología de Gag, modificada basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 55 y SEC ID Nº: 101 (secuencias codificantes de Nef, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12- 5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 57 y SEC ID Nº: 134 (secuencias codificantes de Nef con una mutación en la posición 125 que producen un producto génico no funcional, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12-5_1_TV2_C.ZA, respectivamente); SEC ID Nº: 58 (secuencias codificantes de RNAsaH, modificadas basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 60 (secuencias codificantes de integrasa, modificadas basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 62 y SEC ID Nº: 103 (secuencias codificantes de Pol, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12-5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 64 (secuencias codificantes de proteasa, modificadas basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 66 (secuencias codificantes de proteasa inactivada, modificadas basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 68 (secuencias mutadas de proteasa inactivada y RT, modificadas basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 70 (secuencias codificantes de proteasa y de transcriptasa inversa, modificadas basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 72 y SEC ID Nº: 105 (exón 1 de Rev, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12-5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 74 y SEC ID Nº: 107 (exón 2 de Rev, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12- 5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 76 (secuencias codificantes de transcriptasa inversa, modificadas basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 78 (transcriptasa inversa mutada, modificada basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 80 (exón 1 de Tat que incluye una mutación que produce Tat no funcional, modificada basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 81 y SEC ID Nº: 109 (exón 1 de Tat, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12-5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 83 y SEC ID Nº: 111 (exón 2 de Tat, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12- 5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 85 y SEC ID Nº: 113) (secuencias codificantes de Vif, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12-5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 87 y SEC ID Nº: 115 (secuencias codificantes de Vpr, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12-5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 89 y SEC ID Nº: 117 (secuencias codificantes de Vpu, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12-5_1_TV2_C.ZA no mutante, respectivamente); SEC ID Nº: 91 (secuencias de exones 1 y 2 de Rev, modificadas basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 93 (secuencias del exón 1 mutado de Tat y el exón 2 de Tat, en las que la mutación del exón 1 produce Tat no funcional, modificadas basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 94 (secuencias de exones 1 y 2 de Tat, modificadas basándose en 8_5_TV1_C.ZA no mutante); SEC ID Nº: 96 y SEC ID Nº: 135 (secuencias codificantes de Nef que incluyen una mutación para eliminar el sitio de miristoilación, modificadas basándose en 8_5_TV1_C.ZA no mutante y 12-5_1_TV2_C.ZA, respectivamente).

2.2.1.5 OTRA MODIFICACIÓN DE SECUENCIAS QUE INCLUYEN SECUENCIAS CODIFICANTES DE ÁCIDOS NUCLEICOS DEL VIH-1

Los casetes de expresión que codifican polipéptidos del VIH tipo C descritos en el presente documento también pueden contener una o más secuencias adicionales que codifican, por ejemplo, uno o más transgenes. Secuencias adicionales (por ejemplo, transgenes) útiles en la práctica de la presente invención incluyen, pero no se limitan a, secuencias adicionales son aquellas que codifican otros epítopes/antígenos virales {que incluyen, pero no se limitan a, antígenos del VHC (por ejemplo, E1, E2; Houghton, M., et al., patente de EE.UU. Nº 5.714.596, concedida el 3 de febrero de 1998; Houghton, M., et al., patente de EE.UU. Nº 5.712.088, concedida el 27 de enero de 1998; Houghton, M., et al., patente de EE.UU. Nº 5.683.864, concedida el 4 de noviembre de 1997; Weiner, A.J., et al., patente de EE.UU. Nº 5.728.520, concedida el 17 de marzo de 1998; Weiner, A.J., et al., patente de EE.UU. Nº 5.766.845, concedida el 16 de junio de 1998; Weiner, A.J., et al., patente de EE.UU. Nº 5.670.152, concedida el 23 de septiembre de 1997), antígenos del VIH (por ejemplo, derivados de tat, rev, nef y/o env); y secuencias que codifican antígenos de tumor/epítopes. Otras secuencias también pueden derivarse de fuentes no virales, por ejemplo, secuencias que codifican citocinas tales como interleucina-2 (IL-2), factor de citoblastos (SCF), interleucina 3 (IL-3), interleucina 6 (IL-6), interleucina 12 (IL-12), G-CSF, factor estimulante de colonias de granulocitos- macrófagos (GM-CSF), interleucina-1 alfa (IL-1I), interleucina-11 (IL-11), MIP-1I, factor de necrosis tumoral (TNF), factor inhibidor de la leucemia (LIF), ligando c-kit, trombopoyetina (TPO) y ligando flt3, comercialmente disponibles de varios proveedores tales como, por ejemplo, Genzyme (Framingham, MA), Genentech (South San Francisco, CA), Amgen (Thousand Oaks, CA), R&D Systems e Immunex (Seattle, WA). Secuencias adicionales se describen más adelante, por ejemplo, en la Sección 2.3. Por tanto, variaciones sobre la orientación de las secuencias codificantes de Gag y otras, las unas con respecto a las otras, se describen más adelante.

Las secuencias codificantes de polipéptidos del VIH pueden obtenerse de otras cepas aisladas del VIH tipo C, véanse, por ejemplo, Myers et al., Los Alamos Database, Los Alamos National Laboratory, Los Alamos, New Mexico (1992); Myers et al., Human Retroviruses and Aids, 1997, Los Alamos, New Mexico: Los Alamos National Laboratory. Pueden generarse casetes de expresión sintéticos usando tales secuencias codificantes como material de partida siguiendo las enseñanzas de la presente memoria descriptiva (por ejemplo, véase el Ejemplo 1).

Además, los casetes de expresión sintéticos de la presente divulgación incluyen secuencias de polipéptidos relacionadas que tienen más del 85 %, preferentemente más del 90 %, más preferentemente más del 95 %, y lo más preferentemente más del 98 % de identidad de secuencias con las secuencias del casete de expresión sintéticas desveladas en el presente documento (por ejemplo, (SEC ID Nº: 30-32; SEC ID Nº: 3, 4, 20 y 21 y SEC ID Nº: 5-17).

Diversas regiones codificantes se indican en las Figuras 3 y 4, por ejemplo, en la Figura 3 (AF1 10968), los nucleótidos 1-81 (SEC ID Nº: 18); los nucleótidos 82-1512 (SEC ID Nº: 6) codifican un polipéptido gp120, los nucleótidos 1513 a 2547 (SEC ID Nº: 10) codifican un polipéptido gp41, los nucleótidos 82-2025 (SEC ID Nº: 7) codifican un polipéptido gp140 y los nucleótidos 82-2547 (SEC ID Nº: 8) codifican un polipéptido gp160. Similarmente, en la Figura 98 (SEC ID Nº: 127, cepa 8_2_TV1_C.ZA), los nucleótidos 1-6 son un sitio de restricción EcoRl; los nucleótidos 7-87 codifican un péptido señal conductor no mutante (de 8_2_TV1_C.ZA); los nucleótidos 88 a 1563 codifican un polipéptido gp120; los nucleótidos 88 a 2064 codifican un polipéptido gp140; los nucleótidos 88 a 2607 codifican un polipéptido gp160. 2.2.3 EXPRESIÓN DE SECUENCIAS SINTÉTICAS QUE CODIFICAN VIH-1 SUBTIPO C Y POLIPÉPTIDOS

RELACIONADOS Las secuencias codificantes del VIH sintéticas (casetes de expresión) de la presente divulgación pueden clonarse en varios vectores de expresión diferentes para evaluar niveles de expresión y, en el caso de Gag, la producción de VLP. Los fragmentos de ADN sintéticos para polipéptidos del VIH pueden clonarse en vectores de expresión eucariotas, que incluyen un vector de expresión transitorio, vectores de mamífero basados en promotores del CMV, y un vector lanzadera para su uso en sistemas de expresión de baculovirus. También pueden clonarse secuencias no mutantes correspondientes en los mismos vectores. Estos vectores pueden entonces transfectarse en varios tipos diferentes de células, que incluyen una variedad de líneas celulares de mamífero (293, RD, COS-7 y CHO, líneas celulares disponibles, por ejemplo, de la A.T.C.C.). Las líneas celulares se cultivan entonces bajo condiciones apropiadas y los niveles de cualquier producto de polipéptido apropiado pueden evaluarse en sobrenadantes (véanse la Tabla A y el Ejemplo 2). Por ejemplo, puede usarse p24 para evaluar la expresión de Gag; pueden usarse gp160, gp140 o gp120 para evaluar la expresión de Env; puede usarse p6pol para evaluar la expresión de Pol; puede usarse prot para evaluar proteasa; p15 para RNAsaH; p31 para integrasa; y otros polipéptidos apropiados para Vif, Vpr, Tat, Rev, Vpu y Nef. Además, también pueden usarse polipéptidos modificados, por ejemplo, otros polipéptidos Env incluyen, pero no se limitan a, por ejemplo, gp160 nativo, gp140 oligomérico, gp120 monomérico, además de secuencias modificadas y/o sintéticas de estos polipéptidos. Los resultados de estos ensayos demuestran que la expresión de secuencias codificantes de polipéptidos del VIH sintéticas son significativamente superiores a secuencias no mutantes correspondientes.

Además, pueden usarse análisis de transferencia Western para mostrar que las células que contienen el casete de expresión sintético producen la proteína esperada a mayores concentraciones por célula que las células que contienen el casete de expresión nativo. Las proteínas del VIH pueden observarse en tanto lisados celulares como sobrenadantes. Los niveles de producción son significativamente mayores en sobrenadantes de células para células transfectadas con los casetes de expresión sintéticos de la presente divulgación.

Puede usarse fraccionamiento de los sobrenadantes de células de mamífero transfectadas con el casete de expresión sintético para mostrar que los casetes proporcionan producción superior de proteínas del VIH y, en el caso de Gag, VLP, con respecto a las secuencias no mutantes. La eficaz expresión de estos polipéptidos que contienen VIH en líneas celulares de mamífero proporciona los siguientes beneficios: los polipéptidos están libres de contaminantes de baculovirus; producción por métodos establecidos autorizados por la FDA; elevada pureza; mayor rendimiento (con respecto a secuencias codificantes nativas); y un método novedoso de producción de polipéptidos que contienen VIH subtipo C en células CHO que no es factible en ausencia de la elevada expresión obtenida usando las construcciones de la presente invención. Líneas celulares de mamífero a modo de ejemplo incluyen, pero no se limitan a, BHK, VERO, HT1080, 293, 293T, RD, COS-7, CHO, Jurkat, HUT, SUPT, C8166, MOLT4/clon 8, MT-2, MT-4, H9, PM1, CEM y CEMX174, tales líneas celulares están disponibles, por ejemplo, de la A.T.C.C. Un casete de expresión de Gag sintético también presentará altos niveles de expresión y producción de VLP cuando se transfecte en células de insecto. Los casetes de expresión sintéticos descritos en el presente documento también demuestran altos niveles de expresión en células de insecto. Además, además de un mayor rendimiento de proteína total, el producto final de los polipéptidos sintéticos contiene coherentemente menores cantidades de proteínas contaminantes de baculovirus que el producto final de las secuencias de tipo C nativas. Además, también pueden introducirse casetes de expresión sintéticos de la presente divulgación en vectores de levadura que, a su vez, pueden transformarse en y expresarse eficazmente por células de levadura (Saccharomyces cerevisiae; usando vectores como se describen en Rosenberg, S. y Tekamp-Olson, P., patente de EE.UU. Nº RE35.749, concedida el 17 de marzo de 1998). Además de los vectores de mamífero y de insecto, los casetes de expresión sintéticos de la presente divulgación pueden incorporarse en una variedad de vectores de expresión usando elementos de control de la expresión seleccionados. Los vectores y elementos de control apropiados para cualquier tipo de célula dada pueden seleccionarse por un experto habitual en la materia en vista de las enseñanzas de la presente memoria descriptiva e información conocida en la técnica sobre vectores de expresión.

Por ejemplo, puede insertarse un casete de expresión sintético en un vector que incluye elementos de control operativamente enlazados a la secuencia codificante deseada, que permiten la expresión del gen en un tipo de célula seleccionada. Por ejemplo, promotores típicos para la expresión en células de mamífero incluyen el promotor temprano del SV40, un promotor del CMV tal como el promotor temprano inmediato del CMV (un promotor del CMV puede incluir el intrón A), RSV, VIH-Ltr, el promotor LTR del virus del tumor mamario de ratón (MMLV-Ltr), un promotor tardío principal del adenovirus (Ad MLP), y el promotor del virus del herpes simple, entre otros. Otros promotores no virales, tales como un promotor derivado del gen de la metalotioneína murina, también encontrarán uso para la expresión de mamíferos. Normalmente, las secuencias de terminación de la transcripción y de poliadenilación también estarán presentes, localizadas 3' con respecto al codón de terminación de la traducción. Preferentemente, también está presente una secuencia para la optimización de la iniciación de la traducción, localizada 5' con respecto a la secuencia codificante. Ejemplos de señales terminadoras de la transcripción/ de poliadenilación incluyen aquellas derivadas del SV40, como se describe en Sambrook, et al., arriba, además de una secuencia terminadora de la hormona de crecimiento bovina. También pueden diseñarse intrones, que contienen sitios donantes y aceptores de corte y empalme, en las construcciones para su uso con la presente invención (Chapman et al., Nuc. Acids Res. (1991) 19:3979-3986).

También pueden usarse elementos potenciadores en el presente documento para aumentar los niveles de expresión de las construcciones de mamífero. Ejemplos incluyen el potenciador del gen temprano del SV40, como se describe en Dijkema et al., EMBO J. (1985) 4:761, el potenciador/promotor derivado de la repetición terminal larga (LTR) del virus del sarcoma de Rous, como se describe en Gorman et al., Proc. Natl. Acad. Sci. USA (1982b) 79:6777 y elementos derivados del CMV humano, como se describen en Boshart et al., Cell (1985) 41:521, tal como elementos incluidos en la secuencia del intrón A del CMV (Chapman et al., Nuc. Acids Res. (1991) 19:3979-3986). Las secuencias codificantes de polipéptidos sintéticas deseadas pueden clonarse en cualquier número de vectores comercialmente disponibles para generar la expresión del polipéptido en un sistema de huésped apropiado. Estos sistemas incluyen, pero no se limitan a, los siguientes: expresión en baculovirus {Reilly, P.R., et al., BACULOVIRUS EXPRESSION VECTORS: A LABORATORY MANUAL (1992); Beames, et al., Biotechniques 11:378 (1991); Pharmingen; Clontech, Palo Alto, CA)}, expresión en variolovacuna {Earl, P. L., et al., “Expression of proteins in mammalian cells using vaccinia” en Current Protocols in Molecular Biology (F. M. Ausubel, et al. Eds.), Greene Publishing Associates & Wiley Interscience, New York (1991); Moss, B., et al., patente de EE.UU. número 5.135.855, concedida el 4 de agosto de 1992}, expresión en bacterias {Ausubel, F.M., et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley and Sons, Inc., Media PA; Clontech}, expresión en levadura {Rosenberg, S.

and Tekamp-Olson, P., patente de EE.UU. Nº RE35.749, concedida el 17 de marzo de 1998; Shuster, J.R., patente de EE.UU. Nº 5.629.203, concedida el 13 de mayo de 1997; Gellissen, G., et al., Antonie Van Leeuwenhoek, 62(1- 2):79-93 (1992); Romanos, M.A., et al., Yeast 8(6):423-488 (1992); Goeddel, D.V., Methods in Enzymology 185 (1990); Guthrie, C., y G.R. Fink, Methods in Enzymology 194 (1991)}, expresión en células de mamífero {Clontech; Gibco-BRL, Ground Island, NY; por ejemplo, líneas celulares de ovarios de hámster chino (CHO) (Haynes, J., et al., Nuc. Acid. Res. 11:687-706 (1983); 1983, Lau, Y.F., et al., Mol. Cell. Biol. 4:1469-1475 (1984); Kaufman, R. J., “Selection and coamplification of heterologous genes in mammalian cells”, en Methods in Enzymology, vol. 185, pp537-566. Academic Press, Inc., San Diego CA (1991)} y expresión en células de planta {vectores de clonación en plantas, Clontech Laboratories, Inc., Palo Alto, CA, y Pharmacia LKB Biotechnology, Inc., Pistcataway, NJ; Hood, E., et al., J. Bacteriol. 168:1291-1301 (1986); Nagel, R., et al., FEMS Microbiol. Lett. 67:325 (1990); An, et al., “Binary Vectors”, y otros en Plant Molecular Biology Manual A3:1-19 (1988); Miki, B.L.A., et al., pp.249-265, y otros en Plant ADN Infectious Agents (Hohn, T., et al., eds.) Springer-Verlag, Wien, Austria, (1987); Plant Molecular Biology: Essential Techniques, P.G. Jones y J.M. Sutton, New York, J. Wiley, 1997; Miglani, Gurbachan Dictionary of Plant Genetics and Molecular Biology, New York, Food Products Press, 1998; Henry, R. J., Practical Application of Plant Molecular Biology, New York, Chapman & Hall, 1997}. También se desvela un vector de expresión, que contiene secuencias codificantes y elementos de control de la expresión que permiten la expresión de las regiones codificantes en un huésped adecuado. Los elementos de control generalmente incluyen un promotor, codón de iniciación de la traducción y secuencias de terminación de la traducción y transcripción, y un sitio de inserción para introducir el inserto en el vector. Los elementos de control de la traducción han sido revisados por M. Kozak (por ejemplo, Kozak, M., Mamm. Genome 7(8):563-574, 1996; Kozak, M., Biochimie 76(9):815-821, 1994; Kozak, M., J Cell Biol 108(2):229-241, 1989; Kozak, M., y Shatkin, A.J., Methods Enzymol 60:360-375, 1979).

La expresión en sistemas de levadura tiene la ventaja de producción comercial. La producción de proteínas recombinantes por variolovacuna y línea celular de la CHO tienen la ventaja de ser sistemas de expresión en mamífero. Además, la expresión en virus de la variolovacuna tiene varias ventajas que incluyen las siguientes: (i) su amplio intervalo de huéspedes; (ii) fiel modificación post-transcripcional, procesamiento, plegamiento, transporte, secreción y ensamblaje de proteínas recombinantes; (iii) expresión de alto nivel de proteínas recombinantes relativamente solubles; y (iv) una gran capacidad para acomodar ADN foráneo. Los polipéptidos recombinantemente expresados de casetes de expresión que codifican polipéptidos del VIH sintéticos normalmente se aíslan de células lisadas o medios de cultivo. La purificación puede llevarse a cabo por métodos conocidos en la técnica que incluyen fraccionamiento por sales, cromatografía de intercambio iónico, filtración en gel, cromatografía de exclusión por tamaño, fraccionamiento por tamaño y cromatografía de afinidad. Puede emplearse cromatografía de inmunoafinidad usando anticuerpos generados basándose en, por ejemplo, antígenos del VIH. Ventajas de expresar las proteínas de la presente divulgación usando células de mamífero incluyen, pero no se limitan a, las siguientes: protocolos bien establecidos para aumentar la producción; la capacidad para producir VLP; líneas celulares son adecuados para cumplir las normas de los buenos procesos de fabricación (GMP); condiciones de cultivo para células de mamífero se conocen en la técnica. Pueden combinarse diversas formas de las diferentes realizaciones de la invención, descritas en el presente documento. 2.3 PRODUCCIÓN DE PARTÍCULAS SIMILARES A VIRUS Y USO DE LAS CONSTRUCCIONES DE LA PRESENTE DIVULGACIÓN PARA CREAR LÍNEAS CELULARES DE ENCAPSIDACIÓN

Los antígenos específicos de grupo (Gag) del virus de la inmunodeficiencia humana tipo I (VIH-I) se auto-ensamblan en partículas similares a virus (VLP) no infecciosas que son liberadas de diversas células eucariotas por gemación (revisado por Freed, E.O., Virology 251:I-I5, 1998). Los casetes de expresión sintéticos de la presente divulgación proporcionan medios eficaces para la producción de partículas similares a virus (VLP) de Gag del VIH usando una variedad de diferentes tipos de células, que incluyen, pero no se limitan a, células de mamífero.

Pueden usarse partículas virales como matriz para la apropiada presentación de un antígeno atrapado o asociado a la misma al sistema inmunitario del huésped. 2.3.1 PRODUCCIÓN DE VLP USANDO LOS CASETES DE EXPRESIÓN SINTÉTICOS DE LA PRESENTE

DIVULGACIÓN Pueden realizarse experimentos en soporte de la presente divulgación para demostrar que los casetes de expresión sintéticos de la presente divulgación proporcionan producción superior de tanto proteínas Gag como VLP, con respecto a secuencias codificantes de Gag nativas. Además, la evaluación por microscopio electrónico de la producción de VLP puede mostrar que partículas de virus inmaduras libres y en gemación del tamaño esperado se producen por células que contienen los casetes de expresión sintéticos.

Usando los casetes de expresión sintéticos de la presente divulgación, en vez de secuencias codificantes de Gag nativas, para la producción de partículas similares a virus se proporcionan varias ventajas. Primera, las VLP pueden producirse en cantidad potenciada haciendo el aislamiento y purificación de las VLP más fácil. Segunda, las VLP pueden producirse en una variedad de tipos de células usando los casetes de expresión sintéticos, en particular, pueden usarse líneas celulares de mamífero para la producción de VLP, por ejemplo, células CHO. La producción usando células CHO proporciona (i) formación de VLP; (ii) miristoilación y gemación correctas; (iii) ausencia de contaminantes de células no de mamífero (por ejemplo, virus de insecto y/o células); y (iv) facilidad de purificación. Los casetes de expresión sintéticos de la presente divulgación también son útiles para la potenciada expresión en tipos de células distintos de líneas celulares de mamífero. Por ejemplo, la infección de células de insecto con vectores de baculovirus que codifican los casetes de expresión sintéticos produce mayores niveles de rendimiento de proteína Gag total y mayores niveles de producción de VLP (con respecto a secuencias codificantes no mutantes). Además, el producto final de las células de insecto infectadas con los casetes de expresión sintéticos de Gag de baculovirus contiene coherentemente menores cantidades de proteínas de insecto contaminantes que el producto final cuando se usan secuencias codificantes no mutantes. Las VLP pueden formarse espontáneamente cuando el polipéptido formador de partículas de interés se expresa recombinantemente en una célula huésped apropiada. Así, las VLP producidas usando los casetes de expresión sintéticos de la presente divulgación se preparan convenientemente usando técnicas recombinantes. Como se trata más adelante, el polipéptido Gag que codifica casetes de expresión sintéticos de la presente divulgación puede incluir otras secuencias codificantes de polipéptidos de interés (por ejemplo, proteasa del VIH, polimerasa del VIH, núcleo del HCV; Env; Env sintética; véase el Ejemplo 1). La expresión de tales casetes de expresión sintéticos da VLP que comprenden el polipéptido Gag, además del polipéptido de interés.

Una vez se han aislado o sintetizado las secuencias codificantes para los polipéptidos formadores de partículas deseados, pueden clonarse en cualquier vector adecuado o replicón para la expresión. Numerosos vectores de clonación son conocidos para aquellos expertos en la materia, y la selección de un vector de clonación apropiado es una cuestión de elección. Véase, generalmente, Sambrook et al, arriba. El vector se usa entonces para transformar una célula huésped apropiada. Sistemas de expresión recombinante adecuados incluyen, pero no se limitan a, sistemas de expresión bacterianos, de mamífero, baculovirus/insecto, variolovacuna, virus del bosque de Semliki (SFV), alfavirus (tales como Sindbis, encefalitis equina venezolana (VEE)), de mamífero, levadura y Xenopus, muy conocidos en la técnica. Sistemas de expresión particularmente preferidos son líneas celulares de mamífero, sistemas de variolovacuna, Sindbis, insecto y levadura.

Por ejemplo, se conocen en la técnica varias líneas celulares de mamífero e incluyen líneas celulares inmortalizadas disponibles de la Colección Americana de Cultivos Tipo (A.T.C.C.), tales como, pero no se limitan a, células de ovario de hámster chino (CHO), células HeLa, células de riñón de hámster bebé (BHK), células de riñón de mono (COS), además de otras. Similarmente, huéspedes bacterianos tales como E. coli, Bacillus subtilis y Streptococcus spp., encontrarán uso con las presentes construcciones de expresión. Huéspedes de levadura útiles en la presente divulgación incluyen, entre otros, Saccharomyces cerevisiae, Candida albicans, Candida maltosa, Hansenula polymorpha,

Kluyveromyces

fragilis,

Kluyveromyces

lactis,

Pichia

guillerimondii,

Pichia

pastoris,

Schizosaccharomyces pombe y Yarrowia lipolitica. Células de insecto para su uso con vectores de expresión de baculovirus incluyen, entre otras, Aedes aegypti, Autographa californica, Bombyx mori, Drosophila melanogaster, Spodoptera frugiperda y Trichoplusia ni. Véase, por ejemplo, Summers y Smith, Texas Agricultural Experiment Station Bulletin No. 1555 (1987). Pueden usarse vectores virales para la producción de partículas en células eucariotas, tales como aquellas derivadas de la familia de virus de la viruela, que incluyen virus de la variolovacuna y virus de la viruela aviar.

Adicionalmente, un sistema de infección/transfección basado en la variolovacuna, como se describe en Tomei et al., J. Viral. (1993) 67:4017-4026 y Selby et al., J. Gen. Viral. (1993) 74:1103-11 13, también encontrará uso con la presente divulgación. En este sistema, las células se infectan primero in vitro con un virus de la variolovacuna recombinante que codifica ARN polimerasa del bacteriófago T7. Esta polimerasa expresa una exquisita especificidad porque solo transcribe moldes que llevan promotores T7. Tras la infección, las células se transfectan con el ADN de interés, conducido por un promotor T7. La polimerasa expresada en el citoplasma del virus de la variolovacuna recombinante transcribe el ADN transfectado en ARN, que luego se traduce en proteína por la maquina traduccional del huésped. Alternativamente, puede añadirse T7 como una proteína purificada o enzima como en el sistema “Progenitor” (Studier y Moffatt, J. Mol. Biol. (1986) 189:113-130). El método proporciona producción citoplásmica transitoria de alto nivel de grandes cantidades de ARN y su(s) producto(s) de traducción.

Dependiendo del sistema de expresión y el huésped seleccionado, las VLP se producen cultivando células huésped transformadas por un vector de expresión en condiciones por las cuales se expresa el polipéptido formador de partículas y pueden formarse VLP. La selección de las condiciones de crecimiento apropiadas está dentro de la experiencia de la materia. Si las VLP se forman intracelularmente, las células se rompen entonces, usando medios químicos, físicos o mecánicos, que lisan las células manteniendo todavía las VLP sustancialmente intactas. Tales métodos son conocidos para aquellos expertos en la materia y se describen en, por ejemplo, Protein Purification Applications: A Practical Approach, (E.L.V. Harris and S. Angal, Eds., 1990). Las partículas se aíslan entonces (o se purifican sustancialmente) usando métodos que preservan la integridad de las mismas, tales como por centrifugación en gradiente, por ejemplo, cloruro de cesio (CsCl), gradientes de sacarosa, peletización y similares (véase, por ejemplo, Kimbauer et al. J. Virol. (1993) 67:6929-6936), además de técnicas de purificación estándar que incluyen, por ejemplo, intercambio iónico y cromatografía de filtración en gel. Las VLP producidas por células que contienen los casetes de expresión sintéticos de la presente divulgación pueden usarse para provocar una respuesta inmunitaria cuando se administran a un sujeto. Una ventaja de la presente divulgación es que las VLP pueden producirse por células de mamífero que llevan los casetes de expresión sintéticos a niveles previamente no posibles. Como se trata anteriormente, las VLP pueden comprender una variedad de antígenos, además del polipéptido Gag (por ejemplo, Gag-proteasa, Gag-polimerasa, Env, Env sintético, etc.). Las VLP purificadas, producidas usando los casetes de expresión sintéticos de la presente divulgación, pueden administrarse a un sujeto vertebrado, normalmente en forma de composiciones de vacuna. También pueden usarse vacunas de combinación, en las que tales vacunas contienen, por ejemplo, una proteína de subunidad adyuvante (por ejemplo, Env). La administración puede tener lugar usando las VLP formuladas solas o formuladas con otros antígenos. Además, las VLP pueden administrarse antes de, simultáneamente con, o posteriores a, la administración de los casetes de expresión sintéticos para la inmunización con ADN (véase más adelante) y/o administración de otras vacunas. Por tanto, el sitio de administración de VLP puede ser el mismo o diferente de otras composiciones de vacuna que están siendo administradas. La administración génica puede llevarse a cabo por varios métodos que incluyen, pero no se limitan a, inmunización con ADN, vectores de alfavirus, vectores del virus de la viruela y vectores del virus de la variolovacuna.

Las composiciones inmunoestimulantes de VLP (o de vacuna) pueden incluir diversos excipientes, adyuvantes, vehículos, sustancias auxiliares, agentes moduladores y similares. Las composiciones inmunoestimulantes incluirán una cantidad de VLP/antígeno suficiente para organizar una respuesta inmunológica. Una cantidad eficaz apropiada puede determinarse por un experto en la materia. Una cantidad tal se encontrará en un intervalo relativamente ancho que puede determinarse mediante ensayos rutinarios y generalmente será una cantidad en el orden de aproximadamente 0,1 µg a aproximadamente 1000 µg, más preferentemente aproximadamente 1 µg a aproximadamente 300 µg, de VLP/antígeno. Un vehículo está opcionalmente presente, que es una molécula que por sí misma no induce la producción de anticuerpos perjudiciales para el individuo que recibe la composición. Vehículos adecuados normalmente son macromoléculas grandes lentamente metabolizadas tales como proteínas, polisacáridos, ácidos polilácticos, ácidos poliglicólicos, aminoácidos poliméricos, copolímeros de aminoácido, agregados de lípidos (tales como gotitas de aceite o liposomas), y partículas de virus inactivos. Ejemplos de vehículos en partículas incluyen aquellos derivados de polímeros de poli(metacrilato de metilo), además de micropartículas derivadas de poli(lactidas) y poli(lactida-co- glicolidas), conocidas como PLG. Véanse, por ejemplo, Jeffery et al., Pharm. Res. (1993) 10:362-368; McGee JP, et al., J Microencapsul. 14(2):197-210, 1997; O'Hagan DT, et al., Vaccine 11(2):149-54, 1993. Tales vehículos son muy conocidos para aquellos expertos habituales en la materia. Adicionalmente, estos vehículos pueden servir de agentes inmunoestimulantes (“adyuvantes”). Además, el antígeno puede conjugarse con un toxoide bacteriano, tal como toxoide de la difteria, tétanos, cólera, etc., además de toxinas derivadas de E. coli.

También pueden usarse adyuvantes para potenciar la eficacia de las composiciones. Tales adyuvantes incluyen, pero no se limitan a: (1) sales de aluminio (alumbre), tales como hidróxido de aluminio, fosfato de aluminio, sulfato de aluminio, etc., (2) formulaciones de emulsión de aceite en agua (con o sin otros agentes inmunoestimulantes específicos tales como muramil péptidos (véase más adelante) o componentes de la pared celular bacteriana), tales como, por ejemplo, (a) MF59 (publicación internacional Nº WO 90/14837), que contiene 5 % de escualeno, 0,5 % de Tween 80 y 0,5 % de Span 85 (que contiene opcionalmente diversas cantidades de MTP-PE (véase más adelante), aunque no se requiere) formulado en partículas submicrométricas usando un microfluidizador tal como el microfluidizador modelo 110Y (Microfluidics, Newton, MA), (b) SAF, que contiene 10 % de escualano, 0,4 % de Tween 80, 5 % de polímero L121 de bloques de Pluronic y thr-MDP (véase más adelante) tanto microfluidizado en una emulsión submicrométrica como sometido a vórtice para generar una emulsión con un mayor tamaño de partícula, y (c) el sistema adyuvante RibiTM (RAS), (Ribi Immunochem, Hamilton, MT) que contiene 2 % de escualeno, 0,2 % de Tween 80 y uno o más componentes de la pared celular bacteriana del grupo que consiste de monofosforil lípido A (MPL), dimicolato de trehalosa (TDM) y el esqueleto de la pared celular (CWS), preferentemente MPL + CWS (DetoxTM); (3) pueden usarse adyuvantes de saponina, tales como StimulonTM (Cambridge Bioscience, Worcester, MA), o partículas generadas a partir del mismo tales como ISCOM (complejos inmunoestimulantes); (4) adyuvante completo de Freund (CFA) y adyuvante incompleto de Freund (IFA); (5) citocinas, tales como interleucinas (por ejemplo, IL-1, IL-2, etc.), factor estimulante de colonias de macrófagos (M- CSF), factor de necrosis de tumor (TNF), etc.; (6) oligonucleótidos o moléculas poliméricas que codifican motivos CpG inmunoestimulantes (Davis, H.L., et al., J. Immunology 160:870-876, 1998; Sato, Y. et al., Science 273:352- 354, 1996) o complejos de antígenos/oligonucleótidos {moléculas poliméricas incluyen ARN y ADN doble y monocatenario, y modificaciones del esqueleto de los mismos, por ejemplo, enlaces metilfosfonato; o (7) mutantes desintoxicados de una toxina ribosilante de ADP bacteriana tal como una toxina del cólera (CT), una toxina de pertussis (PT), o una toxina lábil al calor de E. coli (LT), particularmente LT-K63 (en la que el aminoácido no mutante se sustituye con lisina en la posición 63) LT-R72 (en la que el aminoácido no mutante se sustituye con arginina en la posición 72), CT-S109 (en la que el aminoácido no mutante se sustituye con serina en la posición 109), y PT- K9/G129 (en la que el aminoácido no mutante se sustituye con lisina en la posición 9 y glicina sustituida en la posición 129) (véanse, por ejemplo, las publicaciones internacionales Nº WO93/13202 y WO92/19265); y (8) otras sustancias que actúan de agentes inmunoestimulantes para potenciar la eficacia de la composición. Además, tales moléculas poliméricas incluyen estructuras de esqueleto de polímero alternativas tales como, pero no se limitan a, esqueletos de polivinilo (Pitha, Biochem Biophys Acta, 204:39, 1970a; Pitha, Biopolymers, 9:965, 1970b) y esqueletos de morfolino (Summerton, J., et al., patente de EE.UU. Nº 5.142.047, concedida el 25/08/92; Summerton, J., et al., patente de EE.UU. Nº 5.185.444 concedida 09/02/93). Se ha informado de una variedad de otros análogos de polinucleótidos cargados y sin carga. Se conocen en la técnica numerosas modificaciones de esqueletos, que incluyen, pero no se limitan a, enlaces sin carga (por ejemplo, metil fosfonatos, fosfotriésteres, fosfoamidatos y carbamatos) y enlaces cargados (por ejemplo, fosforotioatos y fosforoditioatos)}; y (7) otras sustancias que actúan de agentes inmunoestimulantes para potenciar la eficacia de la composición inmunoestimulante de VLP (o de vacuna). Se prefieren alumbre, oligonucleótidos CpG y MF59. Muramil péptidos incluyen, pero no se limitan a, N-acetil-muramil-L-treonil-D-isoglutamina (thr-MDP), N-acetil- normuramil-L-alanil-D-isoglutamina (nor-MDP), N-acetilmuramil-L-alanil-D-isoglutaminil-L-alanina-2-(1'-2'-dipalmitoil-

sn-glicero-3-hidroxifosforiloxi)-etilamina (MTP-PE), etc. El tratamiento de dosificación con la composición de VLP puede ser un programa de dosis única o un programa de múltiples dosis. Un programa dosis de múltiples es uno en el que un ciclo primario de vacunación puede ser con 1- 10 dosis separadas, seguido de otras dosis administradas a intervalos de tiempo posteriores, elegidas para mantener y/o reforzar la respuesta inmunitaria, por ejemplo, 1-4 meses para una segunda dosis, y si se necesita, dosis(s) posterior(es) después de varios meses. La pauta de dosificación también se determinará, al menos en parte, por la necesidad del sujeto y será dependiente del criterio del médico. Si se desea prevención de la enfermedad, las VLP que llevan antígeno se administran generalmente antes de la infección primaria con el patógeno de interés. Si se desea tratamiento, por ejemplo, la reducción de síntomas o reapariciones, las composiciones de VLP se administran generalmente posterior a la infección primaria. 2.3.2 USO DE LOS CASETES DE EXPRESIÓN SINTÉTICOS PARA CREAR LÍNEAS CELULARES DE ENCAPSIDACIÓN

Se han desarrollado varios sistemas basados en virus para su uso como vectores de transferencia génica para células huésped de mamífero. Por ejemplo, los retrovirus (en particular vectores lentivirales) proporcionan una plataforma conveniente para los sistemas de administración génica. Una secuencia codificante de interés (por ejemplo, una secuencia útil para aplicaciones de terapia génica) puede insertarse en un vector de administración génica y encapsidarse en partículas retrovirales usando técnicas conocidas en la técnica. Entonces pueden aislarse y administrarse virus recombinantes a células del sujeto tanto in vivo como ex vivo. Se han descrito varios sistemas retrovirales, que incluyen, por ejemplo, los siguientes: (patente de EE.UU. Nº 5.219.740; Miller et al. (1989) BioTechniques 7:980; Miller, A.D. (1990) Human Gene Therapy 1:5; Scarpa et al. (1991) Virology 180:849; Burns et al. (1993) Proc. Natl. Acad. Sci. USA 90:8033; Boris-Lawrie et al. (1993) Cur. Opin. Genet. Develop. 3:102; documentos GB 2200651; EP 0415731; EP 0345242; WO 89/02468; WO 89/05349; WO 89/09271; WO 90/02806; WO 90/07936; WO 90/07936; WO 94/03622; WO 93/25698; WO 93/25234; WO 93/11230; WO 93/10218; WO 91/02805; en U.S. 5.219.740; U.S. 4.405.712; U.S. 4.861.719; U.S. 4.980.289 y U.S. 4.777.127; en EE.UU. Nº de serie 07/800.921; y en Vile (1993) Cancer Res 53:3860-3864; Vile (1993) Cancer Res 53:962-967; Ram (1993) Cancer Res 53:83-88; Takamiya (1992) J Neurosci Res 33:493-503; Baba (1993) J Neurosurg 79:729-735; Mann (1983) Cell 33:153; Cane (1984) Proc Natl Acad Sci USA 81;6349; y Miller (1990) Human Gene Therapy 1. En otras realizaciones, pueden construirse vectores de transferencia génica para codificar una citocina u otra molécula inmunomoduladora. Por ejemplo, pueden obtenerse secuencias de ácidos nucleicos que codifican IL-2 nativa e interferón gamma como se describe en las patentes de EE.UU. Nº 4.738.927 y 5.326.859, respectivamente, mientras que pueden obtenerse muteínas útiles de estas proteínas como se describe en la patente de EE.UU. Nº 4.853.332. Secuencias de ácidos nucleicos que codifican las formas cortas y largas de mCSF pueden obtenerse como se describe en las patentes de EE.UU. Nº 4.847.201 y 4.879.227, respectivamente. En aspectos particulares, pueden producirse vectores retrovirales que expresan genes de citocina o inmunomoduladores como se describe en el presente documento (por ejemplo, empleando las líneas celulares de encapsidación de la presente divulgación) y en la solicitud internacional Nº PCT US 94/02951, titulada “Compositions and Methods for Cancer Immunotherapy”. Ejemplos de moléculas inmunomoduladoras adecuadas para su uso en el presente documento incluyen las siguientes: IL-1 y IL-2 (Karupiah et al. (1990) J. Immunology 144:290-298, Weber et al. (1987) J. Exp. Med. 166:1716-1733, Gansbacher et al. (1990) J. Exp. Med. 172:1217-1224, y patente de EE.UU. Nº 4.738.927); IL-3 y IL- 4 (Tepper et al. (1989) Cell 57:503-512, Golumbek et al. (1991) Science 254:713-716, y patente de EE.UU. Nº 5.017.691); IL-5 y IL-6 (Brakenhof et al. (1987) J. Immunol. 139:4116-4121, y publicación internacional Nº WO 90/06370); IL-7 (patente de EE.UU. Nº 4.965.195); IL-8, IL-9, IL-10, IL-11, IL-12 e IL-13 (Cytokine Bulletin, Summer 1994); IL-14 e IL-15; interferón alfa (Finter et al. (1991) Drugs 42:749-765, patentes de EE.UU. Nº 4.892.743 y 4.966.843, publicación internacional Nº WO 85/02862, Nagata et al. (1980) Nature 284:316-320, Familletti et al. (1981) Methods in Enz. 78:387-394, Twu et al. (1989) Proc. Natl. Acad. Sci. USA 86:2046-2050, y Faktor et al.

(1990) Oncogene 5:867-872); interferón beta (Seif et al. (1991) J. Virol. 65:664-671); interferones gamma (Radford et al. (1991) The American Society of Hepatology 20082015, Watanabe et al. (1989) Proc. Natl. Acad. Sci. USA 86:9456-9460, Gansbacher et al. (1990) Cancer Research 50:7820-7825, Maio et al. (1989) Can. Immunol. Immunother. 30:34-42, y patentes de EE.UU. Nº 4.762.791 y 4.727.138); G-CSF (patentes de EE.UU. Nº 4.999.291 y 4.810.643); GM-CSF (publicación internacional Nº WO 85/04188).

Factores inmunomoduladores también pueden ser agonistas, antagonistas, o ligandos para estas moléculas. Por ejemplo, formas solubles de receptores pueden frecuentemente comportarse como antagonistas para estos tipos de factores, ya que pueden ser formas mutadas de los propios factores.

Las moléculas de ácidos nucleicos que codifican las sustancias anteriormente descritas, además de otras moléculas de ácidos nucleicos que son ventajosas para su uso dentro de la presente divulgación, pueden obtenerse fácilmente de una variedad de fuentes, que incluyen, por ejemplo, depósitos tales como la Colección Americana de Cultivos Tipo, o de fuentes comerciales tales como British BioTechnology Limited (Cowley, Oxford Inglaterra). Ejemplos representativos incluyen BBG 12 (que contiene el gen GM-CSF que codifica la proteína madura de 127 aminoácidos), BBG 6 (que contiene secuencias que codifican interferón gamma), depósito de A.T.C.C. Nº 39656 (que contiene secuencias que codifican TNF), depósito de A.T.C.C. Nº 20663 (que contiene secuencias que codifican interferón alfa), depósitos de A.T.C.C. Nº 31902, 31902 y 39517 (que contienen secuencias que codifican interferón beta), depósito de A.T.C.C. Nº 67024 (que contiene una secuencia que codifica interleucina-1b), depósitos de A.T.C.C. Nº 39405, 39452, 39516, 39626 y 39673 (que contienen secuencias que codifican interleucina-2), depósitos de A.T.C.C. Nº 59399, 59398 y 67326 (que contienen secuencias que codifican interleucina-3), depósito de A.T.C.C. Nº 57592 (que contiene secuencias que codifican interleucina-4), depósitos de A.T.C.C. Nº 59394 y 59395 (que contienen secuencias que codifican interleucina-5) y depósito de A.T.C.C. Nº 67153 (que contiene secuencias que codifican interleucina-6).

Plásmidos que contienen genes de citocina o genes inmunomoduladores (publicaciones internacionales Nº WO 94/02951 y WO 96/21015) pueden digerirse con enzimas de restricción apropiadas, y fragmentos de ADN que contienen el gen particular de interés pueden insertarse en un vector de transferencia génica usando técnicas de biología molecular estándar (véase, por ejemplo, Sambrook et al., arriba., o Ausbel et al. (eds) Current Protocolos in Molecular Biology, Greene Publishing y Wiley-Interscience).

Pueden obtenerse secuencias de polinucleótidos que codifican las moléculas anteriormente descritas usando métodos recombinantes, tales como cribando bibliotecas de ADNc y genómicas de células que expresan el gen, o derivando el gen de un vector conocido por incluir el mismo. Por ejemplo, pueden obtenerse plásmidos que contienen secuencias que codifican productos celulares alterados de un depósito tal como la A.T.C.C., o de fuentes comerciales. Los plásmidos que contienen las secuencias de nucleótidos de interés pueden digerirse con enzimas de restricción apropiadas, y los fragmentos de ADN que contienen las secuencias de nucleótidos pueden insertarse en un vector de transferencia génica usando técnicas de biología molecular estándar. Alternativamente, las secuencias de ADNc para su uso con la presente invención pueden obtenerse de células que expresan o contienen las secuencias, usando técnicas estándar, tales como extracción con fenol y PCR de ADNc o ADN genómico. Véase, por ejemplo, Sambrook et al., arriba, para una descripción de técnicas usadas para obtener y aislar ADN. Brevemente, el ARNm de una célula que expresa el gen de interés puede transcribirse de forma inversa con transcriptasa inversa usando oligo-dT o cebadores aleatorios. El ADNc monocatenario puede entonces amplificarse por PCR (véanse las patentes de EE.UU. Nº 4.683.202, 4.683.195 y 4.800.159, véase también PCR Technology: Principles and Applications for ADN Amplification, Erlich (ed.), Stockton Press, 1989)) usando cebadores de oligonucleótidos complementarios a secuencias sobre cualquier lado de las secuencias deseadas. La secuencia de nucleótidos de interés también puede producirse sintéticamente, en vez de clonarse, usando un sintetizador de ADN (por ejemplo, un sintetizador de ADN modelo 392 de Applied Biosystems, disponible de ABI, Foster City, California). La secuencia de nucleótidos puede diseñarse con los codones apropiados para el producto de expresión deseado. La secuencia completa se ensambla a partir de oligonucleótidos que se solapan preparados por métodos convencionales y ensamblados en una secuencia codificante completa. Véanse, por ejemplo, Edge (1981) Nature 292:756; Nambair et al. (1984) Science 223:1299; Jay et al. (1984) J. Biol. Chem. 259:6311.

Los casetes de expresión sintéticos de la presente divulgación pueden emplearse en la construcción de líneas celulares de encapsidación para su uso con vectores retrovirales. Un tipo de retrovirus, el virus de la leucemia murina, o “MLV”, se ha utilizado ampliamente para aplicaciones de terapia génica (véase generalmente Mann et al. (Cell 33:153, 1993), Cane y Mulligan (Proc. Nat'l. Acad. Sci. USA 81:6349, 1984) y Miller et al., Human Gene Therapy 1:5-14,1990.

Los vectores lentivirales normalmente comprenden una LTR lentiviral en 5', un sitio de unión a ARNt, una señal de encapsidación, un promotor operativamente enlazado a uno o más genes de interés, un origen de la síntesis de ADN de la segunda hebra y una LTR lentiviral en 3', en los que el vector lentiviral contiene un elemento de transporte nuclear. El elemento de transporte nuclear puede localizarse tanto aguas arriba (5') como aguas abajo (3') de una secuencia codificante de interés (por ejemplo, un casete de expresión de Gag o Env sintético de la presente divulgación). El elemento de transporte nuclear puede ser no RRE. Dentro de un aspecto, la señal de encapsidación es un señal de encapsidación prolongada. Dentro de otros aspectos, el promotor es un promotor específico de tejido, o, alternativamente, un promotor tal como CMV. Dentro de otros aspectos, el vector lentiviral comprende además un sitio interno de entrada al ribosoma.

Puede utilizarse una amplia variedad de lentivirus dentro del contexto de la presente invención, que incluyen, por ejemplo, lentivirus seleccionados del grupo que consiste en VIH, VIH-1, VIH-2, FIV y SIV. En un caso de la presente divulgación, se proporcionan casetes de expresión de Gag-polimerasa sintéticos que comprenden un promotor y una secuencia que codifica Gag-polimerasa sintética y al menos uno de vpr, vpu, nef o vif, en el que un promotor está operativamente enlazado a Gag-polimerasa y vpr, vpu, nef o vif. Dentro de otro aspecto más de la divulgación, se proporcionan células huésped (por ejemplo, líneas celulares de encapsidación) que contienen cualquiera de los casetes de expresión descritos en el presente documento. Las líneas celulares de encapsidación pueden comprender un casete de expresión que comprende una secuencia que codifica Gag-polimerasa sintética, y un elemento de transporte nuclear, en las que un promotor está operativamente enlazado a la secuencia que codifica Gag-polimerasa. Las líneas celulares de encapsidación pueden comprender además un promotor y una secuencia que codifica tat, rev, o una envoltura, en la que un promotor está operativamente enlazado a la secuencia que codifica tat, rev, Env o secuencias que codifican versiones modificadas de estas proteínas. La línea celular de encapsidación puede comprender además una secuencia que codifica una cualquiera o más de nef, vif, vpu o vpr (no mutante o sintética). En un aspecto, el casete de expresión está establemente integrado. La línea celular de encapsidación, tras la introducción de un vector lentiviral, normalmente produce partículas. Un promotor que regula la expresión del casete de expresión sintético puede ser inducible. Normalmente, la línea celular de encapsidación, tras la introducción de un vector lentiviral, produce partículas que están esencialmente libres de virus competente para la replicación. Se proporcionan líneas celulares de encapsidación que comprenden un casete de expresión que dirige la expresión de un gen Gag-polimerasa sintético o que comprende un casete de expresión que dirige la expresión de genes Env sintéticos descritos en el presente documento (véase, por tanto, Andre, S., et al., Journal of Virology 72(2):1497- 1503, 1998; Haas, J., et al., Current Biology 6(3):315-324, 1996) para una descripción de otras secuencias de Env modificadas). Un vector lentiviral se introduce en la línea celular de encapsidación para producir una línea celular productora de vector. Como se observa anteriormente, pueden diseñarse vectores lentivirales para llevar o expresar un gen(es) seleccionado(s) o secuencias de interés. Pueden construirse fácilmente vectores lentivirales a partir de una amplia variedad de lentivirus (véase Tumor Viruses, Second Edition, Cold Spring Harbor Laboratory, 1985). Ejemplos representativos de lentivirus incluyeron VIH, VIH-1, VIH-2, FIV y SIV. Tales lentivirus pueden tanto obtenerse de cepas aisladas del paciente, como, más preferentemente, de depósitos o colecciones tales como la Colección Americana de Cultivos Tipo, o aislarse de fuentes conocidas usando técnicas disponibles.

Porciones de los vectores de administración de genes lentivirales (o vehículos) pueden derivarse de diferentes virus. Por ejemplo, en un vector lentiviral recombinante dado, pueden derivarse LTR de un VIH, una señal de encapsidación de SIV, y un origen de la síntesis de la segunda hebra de HrV-2. Las construcciones de vector lentiviral pueden comprender LTR lentivirales en 5', un sitio de unión a ARNt, una señal de encapsidación, una o más secuencias heterólogas, un origen de la síntesis de ADN de la segunda hebra y una LTR en 3', en el que dicho vector lentiviral contiene un elemento de transporte nuclear que no es RRE. Brevemente, las repeticiones terminales largas (“LTR”) se subdividen en tres elementos, designados U5, R y U3. Estos elementos contienen una variedad de señales que son responsables de la actividad biológica de un retrovirus, que incluyen, por ejemplo, elementos promotores y potenciadores que se localizan dentro de U3. Las LTR pueden identificarse fácilmente en el provirus (forma de ADN integrada) debido a su precisa duplicación en cualquier extremo del genoma. Como se utiliza en el presente documento, debe entenderse que una LTR en 5' incluye un elemento promotor en 5' y secuencia de LTR suficiente para permitir la transcripción inversa e integración de la forma de ADN del vector. Debe entenderse que LTR en 3' incluye una señal de poliadenilación, y secuencia de LTR suficiente para permitir la transcripción inversa e integración de la forma de ADN del vector.

El sitio de unión a ARNt y el origen de la síntesis de ADN de la segunda hebra también son importantes para que un retrovirus sea biológicamente activo, y puede identificarse fácilmente por un experto en la materia. Por ejemplo, el ARNt retroviral se une a un sitio de unión a ARNt por apareamiento de bases de Watson-Crick, y es llevado con el genoma de retrovirus en una partícula viral. Entonces, el ARNt se utiliza como cebador para la síntesis de ADN por transcriptasa inversa. El sitio de unión a ARNt puede identificarse fácilmente basándose en su localización justo en la dirección 3’ desde 5' LTR. Similarmente, el origen de la síntesis de ADN de la segunda hebra es, como su nombre implica, importante para la síntesis de ADN de la segunda hebra de un retrovirus. Esta región, que también se denomina el tramo de poli-purina, se localiza justo en la dirección 5' de 3' LTR. Además de 5' y 3' LTR, sitio de unión a ARNt y origen de la síntesis de ADN de la segunda hebra, las construcciones de vector retroviral recombinante también pueden comprender una señal de encapsidación, además de uno o más genes o secuencias codificantes de interés. Además, los vectores lentivirales tienen un elemento de transporte nuclear que, en realizaciones preferidas no es RRE. Ejemplos representativos de elementos de transporte nuclear adecuados incluyen el elemento en el virus del sarcoma de Rous (Ogert, et al., J Virol 70, 3834-3843, 1996), el elemento en el virus del sarcoma de Rous (Liu & Mertz, Genes & Dev., 9, 1766-1789, 1995) y el elemento en el genoma de retrovirus simio tipo I (Zolotukhin, et al., J Virol. 68, 7944-7952, 1994). Otros posibles elementos incluyen los elementos en el gen histona (Kedes, Annu. Rev. Biochem. 48, 837-870, 1970), el gen interferón a (Nagata et al., Nature 287, 401-408, 1980), el gen del receptor -adrenérgico (Koilka, et al., Nature 329, 75-79, 1987) y el gen c-Jun (Hattorie, et al., Proc. Natl. Acad. Sci. USA 85, 9148-9152, 1988).

Las construcciones de vector lentiviral recombinante normalmente carecen de tanto secuencias codificantes de Gag- polimerasa como de Env. El vector lentiviral recombinante normalmente contiene menos de 20, preferentemente 15, más preferentemente 10, y lo más preferentemente 8 nucleótidos consecutivos encontrados en genes Gag- polimerasa y Env. Una ventaja es que los casetes de expresión de Gag-polimerasa sintéticos, que pueden usarse para construir líneas celulares de encapsidación para las construcciones de vector lentiviral recombinante, tienen poca homología con secuencias de Gag-polimerasa no mutantes y así reducen o eliminan considerablemente la posibilidad de recombinación homóloga entre las secuencias sintéticas y no mutantes. Los vectores lentivirales también pueden incluir promotores específicos de tejido para conducir la expresión de uno o más genes o secuencias de interés. Las construcciones de vector lentiviral pueden generarse de forma que se exprese más de un gen de interés. Esto puede llevarse a cabo mediante el uso de casetes di- u oligo-cistrónicos (por ejemplo, en los que las regiones codificantes están separadas por 80 nucleótidos o menos, véase generalmente Levin et al., Gene 108:167-174, 1991), o mediante el uso de sitios internos de entrada al ribosoma (“IRES”). Líneas celulares de encapsidación adecuadas para su uso con las construcciones de vector retroviral recombinante anteriormente descritas pueden prepararse fácilmente dada la divulgación proporcionada en el presente documento. Brevemente, la línea celular parental de la que se deriva la línea celular de encapsidación puede seleccionarse de una variedad de líneas celulares de mamífero, que incluyen, por ejemplo, células 293, RD, COS-7, CHO, BHK, VERO, HT1080 y de mieloma.

Después de la selección de una célula huésped adecuada para la generación de una línea celular de encapsidación, uno o más casetes de expresión se introducen en la línea celular con el fin de complementar o suministrar en trans componentes del vector que se han delecionado. Ejemplos representativos de casetes de expresión adecuados se han descrito en el presente documento e incluyen casetes de expresión de Env sintéticos, Gag sintéticos, Gag-proteasa sintéticos y Gag-polimerasa sintéticos, que comprenden un promotor y una secuencia que codifica, por ejemplo, Gag-polimerasa y al menos uno de vpr, vpu, nef o vif, en los que un promotor está operativamente enlazado a Gag-polimerasa y vpr, vpu, nef o vif. Como se ha descrito anteriormente, las secuencias codificantes nativas y/o sintéticas también pueden utilizarse en estos casetes de expresión.

Utilizando los casetes de expresión anteriormente descritos, puede generarse una amplia variedad de líneas celulares de encapsidación. Por ejemplo, dentro de un aspecto se proporcionan líneas celulares de encapsidación que comprenden un casete de expresión que comprende una secuencia que codifica Gag-polimerasa sintética, y un elemento de transporte nuclear, en el que un promotor está operativamente enlazado a la secuencia que codifica Gag-polimerasa. Dentro de otros aspectos, se proporcionan líneas celulares de encapsidación que comprenden un promotor y una secuencia que codifica tat, rev, Env, u otros antígenos o epítopes del VIH derivados de los mismos, en los que un promotor está operativamente enlazado a la secuencia que codifica tat, rev, Env, o el antígeno o epítope del VIH. En casos adicionales, la línea celular de encapsidación puede comprender una secuencia que codifica una cualquiera o más de nef, vif, vpu o vpr. Por ejemplo, la línea celular de encapsidación puede contener solo nef, vif, vpu, o vpr solo, nef y vif, nef y vpu, y vpr, vvir vpu y vpr, o, los cuatro de nef, vif, vpu y vpr. En un aspecto, el casete de expresión está establemente integrado. Dentro de otro aspecto, la línea celular de encapsidación, tras la introducción de un vector lentiviral, produce partículas. Dentro de otros aspectos, un promotor es inducible. Dentro de ciertos aspectos preferidos de la invención, la línea celular de encapsidación, tras la introducción de un vector lentiviral, produce partículas que están libres de virus competentes para la replicación. Los casetes sintéticos que contienen secuencias codificantes modificadas se transfectan en una línea celular seleccionada. Se seleccionan células transfectadas que (i) llevan, normalmente, integradas copias estables de las secuencias codificantes del VIH, y (ii) están expresando niveles aceptables de estos polipéptidos (la expresión puede evaluarse por métodos conocidos en el estado de la técnica, por ejemplo, véanse los Ejemplos 1-4). También puede verificarse la capacidad de la línea celular para producir VLP.

Una secuencia de interés se construye en un vector viral adecuado como se trata anteriormente. Este virus defectuoso se transfecta entonces en la línea celular de encapsidación. La línea celular de encapsidación proporciona las funciones virales necesarias para producir partículas similares a virus en las que el genoma viral defectuoso, que contiene la secuencia de interés, están encapsidadas. Estas VLP se aíslan entonces y pueden usarse, por ejemplo, en administración génica o terapia génica. Además, tales líneas celulares de encapsidación también pueden usarse para producir VLP solas, que pueden, por ejemplo, usarse como adyuvantes para la administración con otros antígenos o en composiciones de vacuna. Por tanto, la co-expresión de una secuencia seleccionada de interés que codifica un polipéptido (por ejemplo, un antígeno) en la línea celular de encapsidación también puede producir el atrapamiento y/o asociación del polipéptido seleccionado en/con las VLP. Pueden combinarse diversas formas de los diferentes aspectos de la presente divulgación (por ejemplo, construcciones). 2.4 INMUNIZACIÓN CON ADN Y ADMINISTRACIÓN GÉNICA Puede usarse una variedad de antígenos de polipéptidos del VIH, particularmente antígenos del VIH tipo C, en la práctica de la presente divulgación. Los antígenos del VIH pueden incluirse en construcciones de inmunización con ADN que contienen, por ejemplo, un casete de expresión de Gag sintético fusionado en marco con una secuencia codificante para el antígeno de polipéptido (sintético o no mutante), en el que la expresión de la construcción produce VLP que presentan el antígeno de interés.

Los antígeno del VIH de particular interés que van a usarse en la práctica de la presente divulgación incluyen tat, rev, nef, vif, vpu, vpr, y otros antígenos o epítopes del VIH derivados de los mismos. Estos antígenos pueden ser sintéticos (como se describe en el presente documento) o no mutantes. Además, la línea celular de encapsidación puede contener solo nef, y VIH-1 (también conocido como HTLV-III, LAV, ARY, etc.), que incluyen, pero no se limitan a, antígenos tales como gp120, gp41, gp160 (tanto nativos como modificados); Gag; y pal de una variedad de cepas aisladas que incluyen, pero no se limitan a, VIHIIIb VIHSF2, VIH-1SF162, VIH-1SF170, VIHLAV, VIHLAI, VIHMN, VIH-1CM235, VIH-1US4, otras cepas del VIH-1 de diversos subtipos (por ejemplo, subtipos A a G, y 0), cepas del VIH-2 y diversos subtipos (por ejemplo, VIH-2UC1 y VIH-2UC2). Véanse, por ejemplo, Myers, et al., Los Alamos Database, Los Alamos National Laboratory, Los Alamos, New Mexico; Myers, et al., Human Retroviruses and Aids, 1990, Los Alamos, New Mexico: Los Alamos National Laboratory.

Para evaluar la eficacia, la inmunización con ADN usando casetes de expresión sintéticos de la presente divulgación puede realizarse, por ejemplo, como se describe en el Ejemplo 4. Los ratones se inmunizan con tanto el casete de expresión sintético de Gag (y/o Env) como el casete de expresión no mutante de Gag (y/o Env). Las inmunizaciones de ratón con ADN de plásmido mostrarán que los casetes de expresión sintéticos proporcionan una clara mejora de la inmunogenicidad con respecto a los casetes de expresión nativos. Por tanto, la segunda inmunización por refuerzo inducirá una respuesta inmunitaria secundaria, por ejemplo, después de aproximadamente dos semanas. Además, los resultados de ensayos de CTL mostrarán elevada potencia de casetes de expresión de Gag (y/o Env) sintéticos para la inducción de respuestas de linfocitos T citotóxicos (CTL) por inmunización con ADN.

Es fácilmente evidente que la divulgación objeto puede usarse para organizar una respuesta inmunitaria a una amplia variedad de antígenos y, por tanto, para tratar o prevenir una infección por el VIH, particularmente infección por el VIH tipo C. 2.4.1 ADMINISTRACIÓN DE LOS CASETES DE EXPRESIÓN SINTÉTICOS DE LA PRESENTE INVENCIÓN

Las secuencias de polinucleótidos que codifican las moléculas anteriormente descritas pueden obtenerse usando métodos recombinantes, tales como cribando bibliotecas de ADNc y genómicas de células que expresan el gen, o derivando el gen de un vector conocido por incluir el mismo. Además, el gen deseado puede aislarse directamente de células y tejidos que contienen las mismas, usando técnicas estándar, tales como extracción con fenol y PCR de ADNc o ADN genómico. Véase, por ejemplo, Sambrook et al., arriba, para una descripción de técnicas usadas para obtener y aislar ADN. El gen de interés también puede producirse sintéticamente, en vez de clonarse. La secuencia de nucleótidos puede diseñarse con los codones apropiados para la secuencia de aminoácidos particular deseada. En general, se seleccionarán codones preferidos para el huésped previsto en los que se expresará la secuencia. La secuencia completa se ensambla a partir de oligonucleótidos que se solapan preparados por métodos convencionales y se ensambla en una secuencia codificante completa. Véanse, por ejemplo, Edge, Nature (1981) 292:756; Nambair et al., Science (1984) 223:1299; Jay et al., J. Biol. Chem. (1984) 259:6311; Stenuner, W.P.C., (1995) Gene 164:49- 53. A continuación, la secuencia génica que codifica el antígeno deseado puede insertarse en un vector que contiene un casete de expresión sintético de la presente divulgación. En ciertos casos, el antígeno se inserta en la secuencia codificante de Gag sintética de forma que cuando la secuencia combinada se exprese, produzca la producción de VLP que comprenden el polipéptido Gag y el antígeno de interés, por ejemplo, Env (nativa o modificada) u otro(s) antígeno(s) (nativos o modificados) derivados del VIH. Pueden hacerse inserciones dentro de la secuencia codificante o en cualquier extremo de la secuencia codificante (5', extremo amino del polipéptido Gag expresado; o 3', extremo carboxi del polipéptido Gag expresado) (Wagner, R., et al., Arch Virol. 127:117- 137, 1992; Wagner, R., et al., Virology 200:162-175, 1994; Wu, X., et al., J. Viral. 69(6):3389-3398, 1995; Wang, C-T., et al., Virology 200:524-534, 1994; Chazal, N., et al., Virology 68(1):111-122, 1994; Griffiths, J.C., et al., J. Virol. 67(6):3191-3198, 1993; Reicin, A.S., et al., J. Viral. 69(2):642-650, 1995). Hasta el 50 % de las secuencias codificantes de gag p55 pueden delecionarse sin afectar el ensamblaje a partículas similares a virus y la eficiencia de expresión (Borsetti, A., et al, J. Virol. 72(11):9313-9317, 1998; Gamier, L., et al., J Viral 72(6):4667-4677, 1998; Zhang, Y., et al., J Virol 72(3):1782-1789, 1998; Wang, C., et al., J Virol 12(10): 7950- 7959, 1998). En un aspecto de la presente divulgación, la inmunogenicidad del alto nivel que expresa casetes de expresión de Gag sintéticos puede aumentarse por la inserción de diferentes antígenos del VIH estructurales o no estructurales, casetes de multiepítope, o secuencias de citocinas en regiones delecionadas de la secuencia de Gag.

Tales deleciones pueden generarse siguiendo las enseñanzas de la presente divulgación e información disponible para un experto habitual en la materia. Una posible ventaja de este enfoque, con respecto a usar secuencias de longitud completa fusionadas con polipéptidos heterólogos, puede ser la mayor eficiencia de expresión/secreción del producto de expresión.

Cuando las secuencias se añaden al extremo amino de Gag, el polinucleótido puede contener secuencias codificantes en el extremo 5' que codifican una señal para la adición de un resto mirístico al polipéptido que contiene Gag (por ejemplo, secuencias que codifican Met-Gly). La capacidad de las construcciones de polipéptidos que contienen Gag para formar VLP puede determinarse empíricamente siguiendo las enseñanzas de la presente memoria descriptiva. Los casetes de expresión sintéticos también pueden incluir elementos de control operativamente enlazados a la secuencia codificante, que permiten la expresión del gen in vivo en las especies objeto. Por ejemplo, promotores típicos para la expresión en células de mamífero incluyen el promotor temprano del SV40, un promotor del CMV tal como el promotor temprano inmediato del CMV, el promotor LTR del virus del tumor mamario de ratón, un promotor tardío principal del adenovirus (Ad MLP), y el promotor del virus del herpes simple, entre otros. Otros promotores no virales, tales como un promotor derivado del gen de la metalotioneína murina, también encontrarán uso para la expresión de mamíferos. Normalmente, las secuencias de terminación de la transcripción y de poliadenilación también estarán presentes, localizadas 3' con respecto al codón de terminación de la traducción. Preferentemente, también está presente una secuencia para la optimización de la iniciación de la traducción, localizada 5' con respecto a la secuencia codificante. Ejemplos de señales terminadoras de la transcripción/ de poliadenilación incluyen aquellas derivadas del SV40, como se describe en Sambrook, et al., arriba, además de una secuencia terminadora de la hormona de crecimiento bovina.

También pueden usarse elementos potenciadores en el presente documento para aumentar los niveles de expresión de las construcciones de mamífero. Ejemplos incluyen el potenciador del gen temprano del SV40, como se describe en Dijkema et al., EMBO J. (1985) 4:761, el potenciador/promotor derivado de la repetición terminal larga (LTR) del virus del sarcoma de Rous, como se describe en Gorman et al., Proc. Natl. Acad. Sci. USA (1982b) 79:6777 y elementos derivados del CMV humano, como se describen en Boshart et al., Cell (1985) 41:521, tal como elementos incluidos en la secuencia del intrón A del CMV. Además, pueden construirse plásmidos que incluyen secuencias de genes que codifican antígenos quiméricas, que codifican, por ejemplo, múltiples antígenos/epítopes de interés, por ejemplo, derivados de más de una cepa aislada viral.

Normalmente, las secuencias codificantes de antígeno preceden o siguen a la secuencia sintética codificante y la unidad de transcripción quimérica tendrá un único marco de lectura abierto que codifica tanto el antígeno de interés como las secuencias codificantes sintéticas. Alternativamente, pueden construirse casetes multi-cistrónicos (por ejemplo, casetes bi-cistrónicos) que permiten la expresión de múltiples antígenos de un único ARNm usando EMCV IRES, o similares. Una vez completas, las construcciones se usan para la inmunización con ácido nucleico usando protocolos de administración génica estándar. Los métodos para la administración génica se conocen en la técnica. Véanse, por ejemplo, las patentes de EE.UU. Nº 5.399.346, 5.580.859, 5.589.466. Los genes pueden administrarse tanto directamente al sujeto vertebrado como, alternativamente, administrarse ex vivo, a células derivadas del sujeto y reimplantarse las células en el sujeto. Se han desarrollado varios sistemas basados en virus para la transferencia génica en células de mamífero. Por ejemplo, los retrovirus proporcionan una plataforma conveniente para los sistemas de administración génica. Pueden insertarse secuencias seleccionadas en un vector y encapsidarse en partículas retrovirales usando técnicas conocidas en la técnica. Entonces, el virus recombinante puede aislarse y administrarse a células del sujeto tanto in

vivo como ex vivo. Se han descrito varios sistemas retrovirales (patente de EE.UU. Nº 5.219.740; Miller y Rosman, BioTechniques (1989) 7:980-990; Miller, A.D., Human Gene Therapy (1990) 1:5-14; Scarpa et al., Virology (1991) 180:849-852; Burns et al., Proc. Natl. Acad. Sci. USA (1993) 90:8033-8037; y Boris-Lawrie y Temin, Cur. Opin. Genet. Develop. (1993) 3:102-109.

También se han descrito varios vectores de adenovirus. A diferencia de los retrovirus que se integran en el genoma del huésped, los adenovirus persisten extracromosómicamente, minimizando así los riesgos asociados a la mutagénesis de inserción (Haj-Ahmad y Graham, J. Virol. (1986) 57:267-274; Bett et al., J. Virol. (1993) 67:5911- 5921; Mittereder et al., Human Gene Therapy (1994) 5:717-729; Seth et al., J. Virol. (1994) 68:933-940; Barr et al., Gene Therapy (1994) 1:51-58; Berkner, K.L. BioTechniques (1988) 6:616-629; y Rich et al., Human Gene Therapy (1993) 4:461-476). Adicionalmente, se han desarrollado diversos sistemas de vector de virus adeno-asociados (AAV) para administración génica. Los vectores de AAV pueden construirse fácilmente usando técnicas muy conocidas en la técnica. Véanse, por ejemplo, las patentes de EE.UU. Nº 5.173.414 y 5.139.941; publicaciones internacionales Nº WO 92/01070 (publicada el 23 de enero de 1992) y WO 93/03769 (publicada el 4 de marzo de 1993); Lebkowski et al., Molec. Cell. Biol. (1988) 8:3988-3996; Vincent et al., Vaccines 90 (1990) (Cold Spring Harbor Laboratory Press); Carter, B.J. Current Opinion in Biotechnology (1992) 3:533-539; Muzyczka, N. Current Topics in Microbiol. and Immunol. (1992) 158:97-129; Kotin, R.M. Human Gene Therapy (1994) 5:793-801; Shelling and Smith, Gene Therapy (1994) 1:165-169; y Zhou et al., J. Exp. Med. (1994) 179:1867-1875. Otro sistema de vector útil para administrar los polinucleótidos de la presente invención es las vacunas del virus de la viruela recombinante entéricamente administradas descritas por Small, Jr., P.A., et al. (patente de EE.UU. Nº 5.676.950, concedida el 14 de octubre de 1997).

Vectores virales adicionales que encontrarán uso para administrar las moléculas de ácidos nucleicos que codifican los antígenos de interés incluyen aquellos derivados de la familia de virus de la viruela, que incluyen virus de la variolovacuna y virus de la viruela aviar. A modo de ejemplo, pueden construirse virus de la variolovacuna recombinantes que expresan los genes del siguiente modo. El ADN que codifica la secuencia codificante de polipéptidos del VIH subtipo C sintética particular se inserta primero en un vector apropiado de manera que esté adyacente a un promotor de la variolovacuna y secuencias de ADN de la variolovacuna flanqueantes, tales como la secuencia que codifica timidina cinasa (TK). Este vector se usa entonces para transfectar células que se infectan simultáneamente con variolovacuna. La recombinación homóloga sirve para insertar el promotor de la variolovacuna más el gen que codifica las secuencias codificantes de interés en el genoma viral. La TK recombinante resultante puede seleccionarse cultivando las células en presencia de 5-bromodesoxiuridina y recogiendo placas virales resistentes a la misma. Alternativamente, también pueden usarse virus avipox, tales como los virus de la viruela aviar y de la viruela del canario, para administrar los genes. Los virus avipox recombinantes, que expresan inmunógenos de patógenos de mamífero, son conocidos por conferir inmunidad protectora cuando se administran a especies no aviares. El uso de un vector de avipox es particularmente deseable en especies humanas y otras de mamífero, ya que miembros del género avipox pueden solo replicarse productivamente en especies aviares susceptibles y, por tanto, no son infecciosos en células de mamífero. Métodos para producir virus avipox recombinantes se conocen en la técnica y emplean recombinación genética, como se ha descrito anteriormente con respecto a la producción del virus de la variolovacuna. Véanse, por ejemplo, los documentos WO 91/12882; WO 89/03429; y WO 92/03545. También pueden usarse vectores de conjugado molecular, tales como los vectores quiméricos de adenovirus descritos en Michael et al., J. Biol. Chem. (1993) 268:6866-6869 y Wagner et al., Proc. Natl. Acad. Sci. USA (1992) 89:6099-6103, para administración génica.

Miembros del género alfavirus, tales como, pero no se limitan a, vectores derivados de los virus de Sindbis, del bosque de Semliki y de la encefalitis equina venezolana, también encontrarán uso como vectores virales para administrar los polinucleótidos de la presente invención. Para una descripción de vectores derivados del virus de Sindbis útiles para la práctica de los presentes métodos véanse Dubensky et al., J. Virol. (1996) 70:508-519; y las publicaciones internacionales Nº WO 95/07995 y WO 96/17072; además de, Dubensky, Jr., T.W., et al., patente de EE.UU. Nº 7.843.723, concedida el 1 de diciembre de 1998, y Dubensky, Jr., T.W., patente de EE.UU. Nº 5.789.245, concedida el 4 de agosto de 1998. Puede usarse convenientemente un sistema de infección/transfección basado en la variolovacuna para proporcionar la expresión transitoria inducible de las secuencias codificantes de interés en una célula huésped. En este sistema, las células se infectan primero in vitro con un virus de la variolovacuna recombinante que codifica ARN polimerasa del bacteriófago T7. Esta polimerasa expresa una exquisita especificidad porque solo transcribe moldes que llevan promotores T7. Tras la infección, las células se transfectan con el polinucleótido de interés, conducido por un promotor T7. La polimerasa expresada en el citoplasma del virus de la variolovacuna recombinante transcribe el ADN transfectado en ARN, que luego se traduce en proteína por la maquina traduccional del huésped. El método proporciona producción citoplásmica transitoria de alto nivel de grandes cantidades de ARN y sus productos de traducción. Véanse, por ejemplo, Elroy-Stein y Moss, Proc. Natl. Acad. Sci. USA (1990) 87:6743-6747; Fuerst et al., Proc. Natl. Acad. Sci. USA (1986) 83:8122-8126. Como un enfoque alternativo a la infección con virus recombinantes de la variolovacuna o avipox, o a la administración génica usando otros vectores virales, puede usarse un sistema de amplificación que conducirá a expresión de alto nivel tras la introducción en células huésped. Específicamente, puede manipularse un promotor de ARN polimerasa T7 que precede a la región codificante para ARN polimerasa T7. La traducción de ARN derivada de este molde generará ARN polimerasa T7, que a su vez transcribirá más molde. Concomitantemente, habrá un ADNc cuya expresión esté bajo el control del promotor T7. Así, algo de la ARN polimerasa T7 generada a partir de la traducción del ARN molde de amplificación conducirá a la transcripción del gen deseado. Debido a que se requiere algo de la ARN polimerasa T7 para iniciar la amplificación, la ARN polimerasa T7 puede introducirse en células junto con el (los) molde(s) para cebar la reacción de transcripción. La polimerasa puede introducirse como una proteína o sobre un plásmido que codifica la ARN polimerasa. Para otra discusión de sistemas de T7 y su uso para transformar células véanse, por ejemplo, la publicación internacional Nº WO 94/26911; Studier y Moffatt, J. Mol. Biol. (1986) 189:113-130; Deng y Wolff, Gene (1994) 143:245-249; Gao et al., Biochem. Biophys. Res. Commun. (1994) 200:1201-1206; Gao y Huang, Nuc. Acids Res. (1993) 21:2867-2872; Chen et al., Nuc. Acids Res. (1994) 22:2114- 2120; y la patente de EE.UU. Nº 5.135.855. También pueden administrarse casetes de expresión sintéticos de interés sin un vector viral. Por ejemplo, el casete de expresión sintético puede envasarse en liposomas antes de la administración al sujeto o a células derivadas del mismo. La encapsulación en lípidos se realiza generalmente usando liposomas que son capaces de unirse establemente o atrapar y retener el ácido nucleico. La relación de preparación de ADN condensado con respecto a lípido puede variar, pero generalmente será aproximadamente 1:1 (mg de ADN:micromoles de lípido), o más de lípido. Para una revisión del uso de liposomas como vehículos para la administración de ácidos nucleicos véanse Hug y Sleight, Biochim. Biophys. Acta. (1991) 1097:1-17; Straubinger et al., en Methods in Enzymology (1983), Vol. 101, pp. 512-527. Preparaciones de liposomas para su uso en la presente invención incluyen preparaciones catiónicas (positivamente cargadas), aniónicas (negativamente cargadas) y neutras, siendo los liposomas catiónicos particularmente preferidos. Se ha mostrado que los liposomas catiónicos median en la administración intracelular de ADN de plásmido (Felgner et al., Proc. Natl. Acad. Sci. USA (1987) 84:7413-7416); ARNm (Malone et al., Proc. Natl. Acad. Sci. USA (1989) 86:6077-6081); y factores de transcripción purificados (Debs et al., J. Biol. Chem. (1990) 265:10189- 10192), en forma funcional.

Los liposomas catiónicos están fácilmente disponibles. Por ejemplo, están disponibles liposomas de N[1-2,3- dioleiloxi)propil]-N,N,N-trietilamonio (DOTMA) bajo la marca registrada Lipofectin, de GIBCO BRL, Grand Island, NY. (véase, por tanto, Felgner et al., Proc. Natl. Acad. Sci. USA (1987) 84:7413-7416). Otros lípidos comercialmente disponibles incluyen (DDAB/DOPE) y DOTAP/DOPE (Boehringer). Otros liposomas catiónicos pueden prepararse a partir de materiales fácilmente disponibles usando técnicas muy conocidas en la técnica. Véanse, por ejemplo, Szoka et al., Proc. Natl. Acad. Sci. USA (1978) 75:4194-4198; publicación PCT Nº WO 90/11092 para una descripción de la síntesis de liposomas de DOTAP (1,2-bis(oleoiloxi)-3-(trimetilamonio)propano). Similarmente, están fácilmente disponibles liposomas aniónicos y neutros, tales como de Avanti Polar Lipids (Birmingham, AL), o pueden prepararse fácilmente usando materiales fácilmente disponibles. Tales materiales incluyen fosfatidilcolina, colesterol, fosfatidiletanolamina, dioleoilfosfatidilcolina (DOPC), dioleoilfosfatidilglicerol (DOPG), dioleoilfosfatidiletanolamina (DOPE), entre otros. Estos materiales también puede mezclarse con los materiales de partida DOTMA y DOTAP en relaciones apropiadas. Métodos para preparar liposomas usando estos materiales son muy conocidos en la técnica.

Los liposomas pueden comprender vesículas multilaminares (MLV), vesículas unilaminares pequeñas (SUV) o vesículas unilaminares grandes (LUV). Los diversos complejos liposoma-ácido nucleico se preparan usando métodos conocidos en la técnica. Véanse, por ejemplo, Straubinger et al., en METHODS OF IMMUNOLOGY (1983), Vol. 101, pp. 512-527; Szoka et al., Proc. Natl. Acad. Sci. USA (1978) 75:4194-4198; Papahadjopoulos et al., Biochim. Biophys. Acta (1975) 394:483; Wilson et al., Cell (1979) 17:77); Deamer and Bangham, Biochim. Biophys.

Acta (1976) 443:629; Ostro et al., Biochem. Biophys. Res. Commun. (1977) 76:836; Fraley et al., Proc. Natl. Acad. Sci. USA (1979) 76:3348); Enoch and Strittmatter, Proc. Natl. Acad. Sci. USA (1979) 76:145); Fraley et al., J. Biol. Chem. (1980) 255:10431; Szoka y Papahadjopoulos, Proc. Natl. Acad. Sci. USA (1978) 75:145; y Schaefer-Ridder et al., Science (1982) 215:166.

El ADN y/o antígeno(s) de proteína también pueden administrarse en composiciones de lípido de cocleato similares a aquellas descritas por Papahadjopoulos et al., Biochem. Biophys. Acta. (1975) 394:483-491. Véanse, por tanto, las patentes de EE.UU. Nº 4.663.161 y 4.871.488. El casete de expresión sintético de interés también puede encapsularse, adsorberse a, o asociarse a, vehículos en partículas. Tales vehículos presentan múltiples copias de un antígeno seleccionado para el sistema inmunitario y promueven el atrapamiento y la retención de antígenos en ganglios linfáticos locales. Las partículas pueden ser fagocitadas por macrófagos y pueden potenciar la presentación del antígeno mediante la liberación de citocinas. Ejemplos de vehículos en partículas incluyen aquellos derivados de polímeros de poli(metacrilato de metilo), además de micropartículas derivadas de poli(lactidas) y poli(lactida-co-glicolidas), conocidas como PLG. Véanse, por ejemplo, Jeffery et al., Pharm. Res. (1993) 10:362-368; McGee JP, et al., J Microencapsul. 14(2):197-210, 1997; O'Hagan DT, et al., Vaccine 11(2):149-54, 1993. También pueden fabricarse micropartículas adecuadas en presencia de detergentes cargados, tales como detergentes aniónicos o catiónicos, para dar micropartículas con una superficie que tiene una carga negativa neta o una positiva neta. Por ejemplo, micropartículas fabricadas con detergentes aniónicos, tales como bromuro de hexadeciltrimetilamonio (CTAB), es decir, micropartículas de CTAB- PLG, adsorben macromoléculas negativamente cargadas, tales como ADN (véase, por ejemplo, la solicitud internacional número PCT/US99/17308). Además, pueden usarse otros sistemas en partículas y polímeros para la administración in vivo o ex vivo del gen de interés. Por ejemplo, polímeros tales como polilisina, poliarginina, poliornitina, espermina, espermidina, además de conjugados de estas moléculas, son útiles para transferir un ácido nucleico de interés. Similarmente, transfección mediada por dextrano DEAE, precipitación con fosfato de calcio o precipitación usando otras sales inorgánicas insolubles, tales como fosfato de estroncio, silicatos de aluminio que incluyen bentonita y caolín, óxido crómico, silicato de magnesio, talco, y similares, encontrarán uso con los presentes métodos. Véase, por ejemplo Felgner, P.L., Advanced Drug Delivery Reviews (1990) 5:163-187, para una revisión de sistemas de administración útiles para transferencia génica. También pueden usarse peptoides (Zuckerman, R.N., et al., patente de EE.UU. Nº 5.831.005, concedida el 3 de noviembre de 1998) para la administración de una construcción de la presente invención. Adicionalmente, sistemas de administración biolística, que emplean vehículos en partículas tales como oro y tungsteno, son especialmente útiles para administrar los casetes de expresión sintéticos de la presente invención. Las partículas están recubiertas con el (los) casete(s) de expresión sintético(s) que van a administrarse y se aceleran a alta velocidad, generalmente bajo una atmósfera reducida, usando una descarga de polvo de pistola de una “pistola de genes”. Para una descripción de tales técnicas, y aparatos útiles, por tanto, véanse, por ejemplo, las patentes de EE.UU. Nº 4.945.050; 5.036.006; 5.100.792; 5.179.022; 5.371.015; y 5.478.744. Por tanto, pueden usarse sistemas de inyección sin aguja (Davis, H.L., et al, Vaccine 12:1503-1509, 1994; Bioject, Inc., Portland, OR).

Los vectores recombinantes que llevan un casete de expresión sintético de la presente invención se formulan en composiciones para la administración al sujeto vertebrado. Estas composiciones pueden tanto ser profilácticas (para prevenir la infección) como terapéuticas (para tratar la enfermedad después de la infección). Las composiciones comprenderán una “cantidad terapéuticamente eficaz” del gen de interés de tal forma que pueda producirse una cantidad del antígeno in vivo de manera que se genere una respuesta inmunitaria en el individuo al que se administra. La cantidad exacta necesaria variará dependiendo del sujeto que está tratándose; la edad y condición general del sujeto que va a tratarse; la capacidad del sistema inmunitario del sujeto para sintetizar anticuerpos; el grado de protección deseado; la gravedad de la afección que está tratándose; el antígeno particular seleccionado y su modo de administración, entre otros factores. Una cantidad eficaz apropiada puede determinarse fácilmente por un experto en la materia. Así, una “cantidad terapéuticamente eficaz” se encontrará en un intervalo relativamente ancho que puede determinarse mediante ensayos rutinarios. Las composiciones generalmente incluirán uno o más “excipientes o vehículos farmacéuticamente aceptables”, tales como agua, solución salina, glicerol, polietilenglicol, ácido hialurónico, etanol, etc. Adicionalmente, sustancias auxiliares, tales como agentes humectantes o emulsionantes, sustancias de tamponamiento del pH, y similares, pueden estar presentes en tales vehículos. También pueden incluirse ciertos facilitadores de la captación y/o expresión de ácidos nucleicos en las composiciones o co-administrarse, tales como, pero no se limitan a, bupivacaína, cardiotoxina y sacarosa. Una vez formuladas, las composiciones de la invención pueden administrarse directamente al sujeto (por ejemplo, como se ha descrito anteriormente) o, alternativamente, administrarse ex vivo, a células derivadas del sujeto, usando métodos tales como aquellos descritos anteriormente. Por ejemplo, métodos para la administración ex vivo y reimplantación de las células transformadas en un sujeto se conocen en la técnica y pueden incluir, por ejemplo, transfección mediada por dextrano, precipitación de fosfato de calcio, transfección mediada por polibreno, transfección mediada por lipofectamina y LT-1, fusión de protoplastos, electroporación, encapsulación de polinucleótido(s) (con o sin el antígeno correspondiente) en liposomas, y microinyección directa del ADN en núcleos. La administración directa de las composiciones de casete de expresión sintético in vivo generalmente se llevará a cabo con o sin vectores virales, como se ha descrito anteriormente, mediante inyección usando tanto una jeringa convencional como una pistola de genes, tal como el sistema de administración génico Accell® (PowderJect Technologies, Inc., Oxford, Inglaterra). Las construcciones pueden inyectarse tanto subcutáneamente, epidérmicamente, intradérmicamente, intramucosamente tal como nasalmente, rectalmente y vaginalmente, intraperitonealmente, intravenosamente, por vía oral o intramuscularmente. La administración de ADN en células de la epidermis es particularmente preferida ya que este modo de administración proporciona acceso a células linfoides asociadas a la piel y proporciona una presencia transitoria de ADN en el receptor. Otros modos de administración incluyen administración oral y pulmonar, supositorios, inyección sin aguja, administración transcutánea y transdérmica. El tratamiento de dosificación puede ser un programa de dosis única o un programa de múltiples dosis. La administración de ácidos nucleicos también puede combinarse con la administración de péptidos u otras sustancias. 2.4.2 ADMINISTRACIÓN EX VIVO DE LOS CASETES DE EXPRESIÓN SINTÉTICOS DE LA PRESENTE

INVENCIÓN En una realización, pueden usarse linfocitos T, y tipos de células relacionadas (que incluyen, pero no se limitan a, células presentadoras de antígeno, tales como macrófagos, monocitos, células linfoides, células dendríticas, linfocitos B, linfocitos T, citoblastos, y células progenitoras de los mismos), para la administración ex vivo de los casetes de expresión sintéticos de la presente invención. Los linfocitos T pueden aislarse de linfocitos de sangre periférica (PBL) mediante una variedad de procedimientos conocidos para aquellos expertos en la materia. Por ejemplo, las poblaciones de linfocitos T pueden “enriquecerse” de una población de PBL mediante la eliminación de linfocitos accesorios y B. En particular, el enriquecimiento de linfocitos T puede llevarse a cabo por la eliminación de no linfocitos T usando anticuerpos monoclonales anti-MHC de clase II. Similarmente, pueden usarse otros anticuerpos para agotar las poblaciones específicas de no linfocitos T. Por ejemplo, pueden usarse moléculas de anticuerpo anti-Ig para agotar los linfocitos B y pueden usarse moléculas de anticuerpo anti-MacI para agotar macrófagos. Los linfocitos T pueden fraccionarse adicionalmente en varias subpoblaciones diferentes por técnicas conocidas para aquellos expertos en la materia. Pueden aislarse dos subpoblaciones importantes basándose en su expresión diferencial de los marcadores de la superficie celular CD4 y CD8. Por ejemplo, tras el enriquecimiento de linfocitos T como se ha descrito anteriormente, las células CD4+ pueden enriquecerse usando anticuerpos específicos para CD4 (véase Coligan et al., arriba). Los anticuerpos pueden acoplarse a un soporte sólido, tal como perlas magnéticas. En cambio, las células CD8+ pueden enriquecerse mediante el uso de anticuerpos específicos para CD4 (para eliminar células CD4+), o pueden aislarse por el uso de anticuerpos para CD8 acoplados a un soporte sólido. Los linfocitos CD4 de pacientes infectados por el VIH-1 pueden expandirse ex vivo, antes o después de la transducción como se describe por Wilson et. al. (1995) J. Infect. Dis. 172:88. Tras la purificación de linfocitos T, puede realizarse una variedad de métodos de modificación genética conocidos para aquellos expertos en la materia usando vectores de transferencia génica no virales o basados en virus construidos como se ha descrito en el presente documento. Por ejemplo, un enfoque tal implica la transducción de la población de linfocitos T purificados con sobrenadante que contiene vector de cultivos derivados de células productoras de vector. Un segundo enfoque implica el co-cultivo de una monocapa irradiada de células productoras de vector con los linfocitos T purificados. Un tercer enfoque implica un enfoque de co-cultivo similar; sin embargo, los linfocitos T purificados se pre-estimulan con diversas citocinas y se cultivan 48 horas antes del co-cultivo con las células productoras de vector irradiadas. La pre-estimulación antes de tal transducción aumenta la transferencia génica eficaz (Nolta et al. (1992) Exp. Hematol. 20:1065). La estimulación de estos cultivos para proliferar también proporciona elevadas poblaciones de células para la re-infusión en el paciente. Posterior al co-cultivo, los linfocitos T se recogen de la monocapa de células productoras de vector, se expanden y se congelan en nitrógeno líquido.

Los vectores de transferencia génica, que contienen uno o más casetes de expresión sintéticos de la presente invención (asociados a elementos de control apropiados para la administración a los linfocitos T aislados), pueden ensamblarse usando métodos conocidos.

También pueden usarse marcadores de selección en la construcción de vectores de transferencia génica. Por ejemplo, puede usarse un marcador que confiere a una célula de mamífero transducida con el vector de transferencia génica resistencia a un agente citotóxico. El agente citotóxico puede ser, pero no se limita a, neomicina, aminoglucósido, tetraciclina, cloranfenicol, sulfonamida, actinomicina, netropsina, distamicina A, antraciclina o pirazinamida. Por ejemplo, la neomicina fosfotransferasa II confiere resistencia al análogo de neomicina geneticina (G418). Los linfocitos T también pueden mantenerse en un medio que contenga al menos un tipo de factor de crecimiento antes de ser seleccionados. Se conocen en la técnica una variedad de factores de crecimiento que sustentan el crecimiento de un tipo de célula particular. Ejemplos de tales factores de crecimiento son mitógenos de citocinas tales como rIL-2, IL-10, IL-12 y IL-15, que promueven el crecimiento y la activación de linfocitos. Ciertos tipos de células se estimulan por otros factores de crecimiento tales como hormonas, que incluyen gonadotropina coriónica humana (hCG) y hormona de crecimiento humana. La selección de un factor de crecimiento apropiado para una población de células particular se realiza fácilmente por un experto en la materia.

Por ejemplo, los glóbulos blancos tales como células progenitoras diferenciadas y citoblastos se estimulan mediante una variedad de factores de crecimiento. Más particularmente, IL-3, IL-4, IL-5, IL-6, IL-9, GM-CSF, M-CSF y G-CSF, producidos por TH activados y macrófagos activados, estimulan citoblastos mieloides, que luego se diferencian en citoblastos pluripotentes, progenitores de granulocitos-monocitos, progenitores de eosinófilos, progenitores de basófilos, megacariocitos y progenitores eritroides. La diferenciación se modula por factores de crecimiento tales como GM-CSF, IL-3, IL-6, IL-11 y EPO.

Los citoblastos pluripotentes se diferencian entonces en citoblastos linfoides, células del estroma de la médula ósea, progenitores de linfocitos T, progenitores de linfocitos B, timocitos, células TH, células TC y linfocitos B. Esta diferenciación se modula por factores de crecimiento tales como IL-3, IL-4, IL-6, IL-7, GM-CSF, M-CSF, G-CSF, IL-2 y IL-5.

Los progenitores de granulocitos-monocitos se diferencian en monocitos, macrófagos y neutrófilos. Tal diferenciación se modula por los factores de crecimiento GM-CSF, M-CSF e IL-8. Los progenitores de eosinófilos se diferencian en eosinófilos. Este proceso se modula por GM-CSF e IL-5.

La diferenciación de progenitores de basófilos en mastocitos y basófilos se modula por GM-CSF, IL-4 e IL-9. Los megacariocitos producen plaquetas en respuesta a GM-CSF, EPO e IL-6. Las células progenitoras eritroides se diferencian en glóbulos rojos en respuesta a EPO. Así, durante la activación por el agente de unión a CD3, los linfocitos T también pueden ponerse en contacto con un mitógeno, por ejemplo, una citocina tal como IL-2. En realizaciones particularmente preferidas, IL-2 se añade a la población de linfocitos T a una concentración de aproximadamente 50 a 100 µg/ml. La activación con el agente de unión a CD3 puede llevarse a cabo durante 2 a 4 días. Una vez adecuadamente activados, los linfocitos T se modifican genéticamente poniendo en contacto los mismos con un vector de transferencia génica adecuado en condiciones que permiten la transfección de los vectores en los linfocitos T. La modificación genética se lleva a cabo cuando la densidad celular de la población de linfocitos T es entre aproximadamente 0,1 x 106 y 5 x 106, preferentemente entre aproximadamente 0,5 x 106 y 2 x 106. Se han descrito varios vectores de transferencia génica viral y basados en no virales adecuados para su uso en el presente documento.

Después de la transducción, las células transducidas se seleccionan lejos de las células no transducidas usando técnicas conocidas. Por ejemplo, si el vector de transferencia génica usado en la transducción incluye un marcador de selección que confiere resistencia a un agente citotóxico, las células pueden ponerse en contacto con el agente citotóxico apropiado, por lo que las células no transducidas pueden seleccionarse negativamente lejos de las células transducidas. Si el marcador de selección es un marcador de la superficie celular, las células pueden ponerse en contacto con un agente de unión específico para el marcador de la superficie celular particular, por lo que las células transducidas pueden seleccionarse positivamente lejos de la población. La etapa de selección también puede implicar técnicas de citometría de flujo activada por fluorescencia (FACS), tales como cuando se usa FACS para seleccionar células de la población que contiene un marcador de superficie particular, o la etapa de selección puede conllevar el uso de partículas magnéticamente sensibles como soportes recuperables para la captura de células diana y/o eliminación de fondo. Más particularmente, la selección positiva de las células transducidas puede realizarse usando un clasificador de células FACS (por ejemplo, un clasificador de células FACSVantage™, Becton Dickinson Immunocitometry Systems, San Jose, CA) para clasificar y recoger células transducidas que expresan un marcador de selección de la superficie celular. Tras la transducción, las células se tiñen con moléculas marcadas con anticuerpo fluorescente dirigidas contra el marcador de la superficie celular particular. La cantidad de anticuerpo unido sobre cada célula puede medirse pasando gotitas que contienen las células a través del clasificador de células. Confiriendo una carga electromagnética a las gotitas que contienen las células teñidas, las células transducidas pueden separarse de otras células. Las células positivamente seleccionadas se recogen entonces en recipientes de recogida estériles. Estos procedimientos de clasificación de células se describen en detalle, por ejemplo, en the FACSVantage™ Training Manual, con particular referencia a las secciones 3-11 a 3-28 y 10-1 a 10-17. Las selección positiva de las células transducidas también puede realizarse usando separación magnética de células basada en la expresión o un marcador de la superficie celular particular. En tales técnicas de separación, las células que van a seleccionarse positivamente se ponen primero en contacto con agente de unión específico (por ejemplo, un anticuerpo o reactivo que interacciona específicamente con el marcador de la superficie celular). Las células se ponen en contacto entonces con partículas recuperables (por ejemplo, partículas magnéticamente sensibles) que se acoplan con un reactivo que se une al agente de unión específica (que se ha unido a las células positivas). El complejo de célula-agente de unión-partícula puede entonces separarse físicamente de células no marcadas, por ejemplo, usando el campo magnético. Si se usan partículas magnéticamente sensibles, las células marcadas pueden ser retenidas en un recipiente usando un campo magnético mientras que se eliminan las células negativas. Estos procedimientos de separación y similares son conocidos para aquellos expertos habituales en la materia.

La expresión del vector en las células transducidas seleccionadas puede evaluarse por varios ensayos conocidos para aquellos expertos en la materia. Por ejemplo, pueden emplearse transferencia Western o análisis Northern dependiendo de la naturaleza de la secuencia de nucleótidos insertada de interés. Una vez se ha establecido la expresión y los linfocitos T transformados se han probado para la presencia del casete de expresión sintético seleccionado, ya están listas para la infusión en un paciente mediante la corriente sanguínea periférica.

Se desvela un kit para la modificación genética de una población ex vivo de células de mamífero primarias. El kit normalmente contiene un vector de transferencia génica que codifica al menos un marcador de selección y al menos un casete de expresión sintético contenido en uno o más recipientes, reactivos o herramientas auxiliares, e instrucciones para el uso del kit.

2.4.3 OTRAS PAUTAS DE ADMINISTRACIÓN Cualquiera de los polinucleótidos (por ejemplo, casetes de expresión) o polipéptidos descritos en el presente documento (administrados por cualquiera de los métodos descritos anteriormente) también puede usarse en combinación con otros sistemas de administración de ADN y/o sistemas de administración de proteínas. Ejemplos no limitantes incluyen la co-administración de estas moléculas, por ejemplo, en métodos de sensibilización-refuerzo en los que una o más moléculas se administran en una etapa de “sensibilización” y, posteriormente, una o más moléculas se administran en una etapa de “refuerzo”. En ciertos aspectos, la administración de una o más composiciones que contienen ácido nucleico va seguida de la administración de una o más composiciones que contienen ácido nucleico y/o una o más composiciones que contienen polipéptido (por ejemplo, polipéptidos que comprenden antígenos del VIH). En otros aspectos, múltiples “sensibilizaciones” con ácido nucleico (de las mismas moléculas de ácidos nucleicos o diferentes) pueden ir seguidas de múltiples “refuerzos” con polipéptidos (de los mismos polipéptidos o diferentes). Otros ejemplos incluyen múltiples administraciones de ácido nucleico y múltiples administraciones de polipéptido.

En cualquier método que implica la co-administración, las diversas composiciones pueden administrarse en cualquier orden. Así, en aspectos que incluyen la administración de múltiples composiciones o moléculas diferentes, los ácidos nucleicos no necesitan ser todos administrados antes de los polipéptidos. Por ejemplo, la etapa de sensibilización puede incluir la administración de uno o más polipéptidos y el refuerzo comprende la administración de uno o más ácidos nucleicos y/o uno más polipéptidos. Múltiples administraciones de polipéptidos pueden ir seguidas de múltiples administraciones de ácidos nucleicos, o las administraciones de polipéptidos y ácidos nucleicos pueden realizarse en cualquier orden. En cualquiera de los aspectos descritos en el presente documento, las moléculas de ácidos nucleicos pueden codificar todos, algunos o ninguno de los polipéptidos. Así, una o más de las moléculas de ácidos nucleicos (por ejemplo, casetes de expresión) descritas en el presente documento y/o uno o más de los polipéptidos descritos en el presente documento pueden co-administrarse en cualquier orden y mediante cualquier vía de administración. Por tanto, cualquier combinación de polinucleótidos y/o polipéptidos descrita en el presente documento puede usarse para generar provocar una reacción inmunitaria. EXPERIMENTAL

A continuación están ejemplos de realizaciones específicas para llevar a cabo la presente invención. Los ejemplos se ofrecen para fines ilustrativos solo, y no pretenden limitar el alcance de la presente invención de ningún modo. Se han hecho esfuerzos por garantizar la exactitud con respecto a los números usados (por ejemplo, cantidades, temperaturas, etc.), pero, por supuesto, debe permitirse algún error experimental y desviación.

Ejemplo 1 Generación de casetes de expresión sintéticos A. Modificación de secuencias codificantes de ácidos nucleicos Env, Gag, Pol del VIH-1 Se seleccionaron secuencias codificantes de Pol de la cepa tipo C AF110975. Las secuencias codificantes de Gag se seleccionaron de las cepas tipo C AF110965 y AT110967. Las secuencias codificantes de Env se seleccionaron de las cepas tipo C AF110968 y AF110975. Estas secuencias se manipularon para maximizar la expresión de sus productos génicos. Primero, se modificó el patrón de uso de codones del VIH-1 de manera que la secuencia codificante de ácidos nucleicos resultante fuera comparable al uso de codones encontrado en genes humanos altamente expresados. El de uso de codones del VIH-1 refleja un alto contenido de los nucleótidos A o T del triplete de codones. El efecto del uso de codones del VIH-1 es un alto contenido de AT en la secuencia de ADN que produce una disminución en la capacidad de traducción e inestabilidad del ARNm. En comparación, codones humanos altamente expresados prefieren los nucleótidos G o C. Las secuencias codificantes se modificaron para ser comparables al uso de codones encontrado en genes humanos altamente expresados.

Segundo, hay elementos inhibidores (o de inestabilidad) (INS) localizados dentro de las secuencias codificantes de las secuencias codificantes de Gag y de proteasa de Gag (Schneider R, et al., J Virol. 71(7):4892-4903, 1997). El RRE es una estructura de ARN secundaria que interacciona con la proteína Rev codificada por el VIH para vencer la expresión de efectos de regulación por disminución de los INS. Para vencer los mecanismos de activación post- transcripcional de RRE y Rev, los elementos de inestabilidad se inactivan introduciendo múltiples mutaciones puntuales que no alteran el marco de lectura de las proteínas codificadas. Las Figuras 5 y 6 (SEC ID Nº: 3, 4, 20 y 21) muestran la localización de algunos INS restantes en secuencias sintéticas derivadas de las cepas AF110965 y AF110967. Los cambios hechos a estas secuencias están recuadrados en las figuras. En las Figuras 5 y 6, la línea superior representa una secuencia modificada de polipéptidos Gag de las cepas indicadas. El (Los) nucleótido(s) que aparecen debajo de la línea en la(s) región (regiones) recuadrada(s) representa(n) cambios hechos para eliminar INS. Así, cuando se hacen los cambios indicados en las regiones recuadradas, las secuencias resultantes se corresponden con las secuencias representadas en las Figuras 1 y 2, respectivamente. Las secuencias codificantes sintéticas se ensamblan por métodos conocidos en la técnica, por ejemplo, por empresas tales como the Midland Certified Reagent Company (Midland, Texas).

En un caso, secuencias que codifican polipéptidos Pol están incluidas con las secuencias de Gag o Env sintéticas con el fin de aumentar el número de epítopes para partículas similares a virus expresadas por el casete de expresión de Gag/Env modificado sintético. Debido a que Pol del VIH-1 sintético expresa las enzimas funcionales transcriptasa inversa (RT) e integrasa (INT) (además de las proteínas estructurales y proteasa), puede ser útil en algunos casos inactivar las funciones de RT y INT. Pueden hacerse varias deleciones o mutaciones en las regiones codificantes de RT e INT para lograr enzimas no funcionales catalíticas con respecto a su actividad de RT e INT {Jay. A. Levy (Editor) (1995) The Retroviridae, Plenum Press, New York. ISBN 0-306-45033X. Páginas 215-20; Grimison, B. y Laurence, J. (1995), Journal Of Acquired Immune Deficiency Syndromes and Human Retrovirology 9(1):58- 68; Wakefield, J. K., et al., (1992) Journal Of Virology 66(11) :6806-6812; Esnouf, R., et al., (1995) Nature Structural Biology 2(4):303-308; Maignan, S., et al., (1998) Journal Of Molecular Biology 282(2):359-368; Katz, R. A. and Skalka, A. M. (1994) Annual Review Of Biochemistry 73 (1994); Jacobo-Molina, A., et al., (1993) Proceedings Of the National Academy Of Sciences Of the United States Of America 90(13):6320-6324; Hickman, A. B., et al., (1994) Journal Of Biological Chemistry 269(46):29279-29287; Goldgur, Y., et al., (1998) Proceedings Of the National Academy Of Sciences Of the United States Of America 95(16):9150-9154; Goette, M., et al., (1998) Journal Of Biological Chemistry 273(17):10139-10146; Gorton, J. L., et al., (1998) Journal of Virology 72(6):5046- 5055; Engelman, A., et al., (1997) Journal Of Virology 71(5):3507-3514; Dyda, F., et al., Science 266(5193):1981- 1986; Davies, J. F., et al., (1991) Science 252(5002): 88-95; Bujacz, G., et al., (1996) Febs Letters 398(2-3):175- 178; Beard, W. A., et al., (1996) Journal Of Biological Chemistry 271(21):12213-12220; Kohlstaedt, L. A., et al., (1992) Science 256(5065): 1783-1790;Krug, M. S. and Berger, S. L. (1991) Biochemistry 30(44):10614-10623; Mazumder, A., et al., (1996) Molecular Pharmacology 49(4):621-628; Palaniappan, C., et al., (1997) Journal Of Biological Chemistry 272(17): 11157..11164; Rodgers, D. W., et al., (1995) Proceedings Of the National Academy Of Sciences Of the United States Of America 92(4):1222-1226; Sheng, N. and Dennis, D. (1993) Biochemistry 32(18):4938-4942; Spence, R. A., et al., (1995) Science 267(5200):988-993}. Además, pueden añadirse epítopes de linfocitos B y/o T seleccionados a las construcciones de Pol (por ejemplo, 3' de INT truncado o dentro de las deleciones de la secuencia codificante de RT y INT) para sustituir y aumentar cualquier epítope delecionado por las modificaciones funcionales de RT y INT. Alternativamente, epítopes de linfocitos B y T seleccionados (incluyendo epítopes de CTL) de RT e INT pueden incluirse en una VLP mínima formada por la expresión del casete de Gag sintético o de Pol sintético, descritos anteriormente (para descripciones de epítopes de linfocitos B y T del VIH conocidos véase HIV Molecular Immunology Database CTL Search Interface; Los Alamos Sequence Compendia, 1987-1997; dirección de internet: http://hiv-web.lan1.gov/immunology/index.html) Las secuencias codificantes modificadas resultantes se presentan como un casete de expresión de Env sintético; un casete de expresión de Gag sintético; un casete de expresión de Pol sintético. Una región de Gag común (Gag común) se extiende de la posición de nucleótido 844 a la posición 903 (SEC ID Nº: 1), con respecto a AF110965 (o de aproximadamente los residuos de aminoácidos 282 a 301 de SEC ID Nº: 17) y de la posición de nucleótido 841 a la posición 900 (SEC ID Nº: 2), con respecto a AF110967 (o de aproximadamente residuos de aminoácidos 281 a 300 de SEC ID Nº: 22). Una región de Env común (Env común) se extiende de la posición de nucleótido 1213 a la posición 1353 (SEC ID Nº: 5) y las posiciones de aminoácidos 405 a 451 de SEC ID Nº: 23, con respecto a AF110968 y de la posición de nucleótido 1210 a la posición 1353 (SEC ID Nº: 11) y las posiciones de aminoácidos 404-451 (SEC ID Nº: 24), con respecto a AF110975. Los fragmentos de ADN sintéticos para Pol, Gag y Env se clonan en los siguientes vectores de expresión eucariotas: pCMVKm2, para ensayos de expresión transitoria y estudios de inmunización con ADN, el vector pCMVKm2 se deriva de pCMV6a (Chapman et al., Nuc. Acids Res. (1991) 19:3979-3986) y comprende un marcador de selección de kanamicina, un origen de replicación ColE1, un promotor del potenciador del CMV e intrón A, seguido de un sitio de inserción para las secuencias sintéticas descritas más adelante, seguido de una señal de poliadenilación derivada de hormona de crecimiento bovina – el vector pCMVKm2 se diferencia del vector de enlace pCMV solo en que un sitio de policonector se inserta en pCMVKm2 para generar enlace de pCMV; pESN2dhfr y pCMVPLEdhfr, para la expresión en células de ovario de hámster chino (CHO); y, pAcC13, un vector lanzadera para su uso en el sistema de expresión de baculovirus (pAcC13, se deriva de pAcC12 que se describe por Munemitsu S., et al., Mol Cell Biol. 10(11):5977-5982, 1990). Brevemente, la construcción de pCMVPLEdhfr fue del siguiente modo.

Para construir un casete DHFR, el conductor de EMCV IRES (sitio interno de entrada al ribosoma) se amplificó por PCR a partir de pCite-4a+ (Novagen, Inc., Milwaukee, WI) y se insertó en pET-23d (Novagen, Inc., Milwaukee, WI) como un fragmento Xba-Nco para dar pET-EMCV. El gen dhfr se amplificó por PCR a partir de pESN2dhfr para dar un producto con un espaciador Gly-Gly-Gly-Ser en lugar del codón de terminación de la traducción y se insertó como un fragmento Nco-BamH1 para dar pET-E-DHFR. A continuación, el gen neo atenuado se amplificó por PCR a partir de un derivado de pSV2Neo (Clontech, Palo Alto, CA) y se insertó en el sitio BamH1 único de pET-E-DHFR para dar pETE-DHFR/Neo(m2). Finalmente, el terminador de hormona de crecimiento bovina de pcADN3 (Invitrogen, Inc., Carlsbad, CA) se insertó en la dirección 3’ del gen neo para dar pET-E-DHFR/Neo(m2)BGHt. Se preparó el fragmento del casete del marcador de selección de EMCV-dhfr/neo por escisión de pET-E-DHFR/Neo(m2)BGHt. El potenciador/promotor del CMV más el intrón A se transfirió de pCMV6a (Chapman et al., Nuc. Acids Res. (1991) 19:3979-3986) como un fragmento HindIII-Sal1 a pUC19 (New England Biolabs, Inc., Beverly, MA). El esqueleto del vector de pUC19 se delecionó de los sitios Nde1 a Sap1. El casete DHFR anteriormente descrito se añadió a la construcción de forma que el EMCV IRES siguió un promotor del CMV. El vector también contuvo un gen ampr y un origen de replicación del SV40.

B. Definición de la región principal de homología (MHR) de p55 gag del VIH-1 La región principal de homología (MHR) de p55 (Gag) del VIH-1 se localiza en la secuencia p24-CA de Gag. Es un estiramiento conservado de aproximadamente 20 aminoácidos. La posición en la proteína Gag AF110965 no mutante es de 282-301 (SEC ID Nº: 25) y abarca una región de 844-903 (SEC ID Nº: 26) para la secuencia de ADN de Gag. La posición en la proteína Gag sintética también es de 282-301 (SEC ID Nº: 25) y abarca una región de 844-903 (SEC ID Nº: 1) para la secuencia de ADN de Gag sintética. La posición en la proteína Gag AF110967 no mutante y sintética es de 281-300 (SEC ID Nº: 27) y abarca una región de 841-900 (SEC ID Nº: 2) para la secuencia de ADN de Gag modificada. Mutaciones o deleciones en MHR pueden alterar gravemente la producción de partículas (Borsetti, A., et al., J. Virol. 72(11):9313-9317, 1998; Mammano, F., et al., J Virol 68(8):4927-4936, 1994la). La identidad en porcentaje con esta secuencia puede determinarse, por ejemplo, usando el algoritmo de búsqueda de Smith-Waterman (Time Logic, Incline Village, NV), con los siguientes parámetros a modo de ejemplo: matriz de peso = nuc4x4hb; penalización por abertura de hueco = 20, penalización por extensión de hueco = 5.

C. Definición de la región común de secuencia de Env del VIH-1 La región común de secuencia (CSR) de Env del VIH-1 se localiza en la secuencia C4 de Env. Es un estiramiento conservado de aproximadamente 47 aminoácidos. La posición en la proteína Env AF 110968 no mutante y sintética es de aproximadamente el residuo de aminoácido 405 a 451 (SEC ID Nº: 28) y abarca una región de 1213 a 1353 (SEC ID Nº: 5) para la secuencia de ADN de Env. La posición en la proteína Env AF110975 no mutante y sintética es de aproximadamente el residuo de aminoácido 404 a 451 (SEC ID Nº: 29) y abarca una región de 1210 a 1353 (SEC ID Nº: 11) para la secuencia de ADN de Env.

La identidad en porcentaje con esta secuencia puede determinarse, por ejemplo, usando el algoritmo de búsqueda de Smith-Waterman (Time Logic, Incline Village, NV), con los siguientes parámetros a modo de ejemplo: matriz de peso = nuc4x4hb; penalización por abertura de hueco = 20, penalización por extensión de hueco = 5. Pueden combinarse diversas formas de las diferentes realizaciones de la invención, descritas en el presente documento. D. Secuencias del VIH a modo de ejemplo derivadas de cepas del VIH tipo C sudafricanas Se obtuvieron secuencias codificantes del VIH de novedosas cepas aisladas de tipo C. Las secuencias codificantes de polipéptidos se manipularon para maximizar la expresión de sus productos génicos. Como se ha descrito anteriormente, el patrón de uso de codones del VIH-1 se modificó de manera que la secuencia codificante de ácidos nucleicos resultante fuera comparable al uso de codones encontrado en genes humanos altamente expresados. El uso de codones del VIH-1 refleja un alto contenido de los nucleótidos A o T del triplete de codones. El efecto del uso de codones del VIH-1 es un alto contenido de AT en la secuencia de ADN que produce una disminución en la capacidad de traducción e inestabilidad del ARNm. En comparación, codones humanos altamente expresados prefieren los nucleótidos G o C. Las secuencias codificantes se modificaron para ser comparables al uso de codones encontrado en genes humanos altamente expresados.

A continuación se muestran en la Tabla C a modo de ejemplo secuencias no mutantes y sintéticas derivadas de una novedosa cepa aislada del VIH tipo C sudafricana, clon 8_5_TV1_C.ZA. La Tabla D muestra secuencias de Env sintéticas a modo de ejemplo derivadas de una novedosa cepa aislada del VIH tipo C sudafricana, clon 8_2_TV1_C.ZA. La Tabla E muestra secuencias no mutantes y sintéticas derivadas de la cepa del VIH tipo C sudafricana 12-5_1_TV2_C.ZA.

Tabla C

Nombre

SEQ ID

Descripción

C4_Env_TV1_C_ZA_opt short 46 secuencia sintética de corta Env "región común" C4_Env_TV1_C_ZA_opt 47 secuencia sinté tica de Env "región común" C4_Env_TV1_C_ZA_wt 48 tipo salvaje sec uencia 8_5_TV1_C.ZA Env Envgp160_TV1_C_ZAopt 49 gp160 sintético Env Envgp160_TV1_C_ZAwt tipo salvaje sec uencia gp160 8_5_TV1_C.ZA Env Gag_TV1_C_ZAopt 51 secuencia sinté tica de la mordaza Gag_TV1_C_ZAwt 52 tipo salvaje sec uencia 8_5_TV1_C.ZA Gag Gag_TV1_ZA_MHRopt 53 secuencia sinté tica de Gag principales regiones de homología Gag_TV1_ZA_MHRwt 54 Gag_TV1_ZA_ MHRwt 54 de tipo salvaje 8_5_TV1_C.ZA Gag importante sec uencia de la región Nef_TV1_C_ZAopt secuencia sinté tica de Nef Nef_TV1_C_ZAwt 56 tipo salvaje sec uencia 8_5_TV1_C.ZA Nef NefD125G_TVI_C_ZAopt 57 secuencia sint ética de Nef, incluyendo mutación en la posición 125 resultante en pr oducto del gen no funcional p15RNaseH_TV1_C_ZAopt 58 secuencia sintética de RNAseH (p15 de Pol) p15RNaseH_TV1_C_ZAwt 59 tipo salvaje secuencia 8_5_TV1_C.ZA RNAseH p31Int_TV1_C_ZAopt secuencia sintética de la integrasa (p31 de Pol) p31Int_TV1_C_ZAwt 61 tipo salvaje secuencia 8_5_TV1_C.ZA integrasa Po1_TV1_C_ZAopt 62 secuencia sintética de Pol Pol_TV1_C_ZAwt 63 tipo salvaje secuencia 8_5_TV1_C.ZA Pol Prot_TV1_C_ZAopt 64 secuencia sintética de Prot Prot_TV1_C_ZAwt tipo salvaje secuencia 8_5_TV1_C.ZA Prot Protina_TV1_C_ZAopt 66 secuencia sintética de Prot incluyendo mutación que resulta en la inactivación de la proteasa Protma_TV1_C_ZAwt 67 tipo salvaje secuencia 8_5_TV1_C.ZA Prot, incluyendo la mutación que resulta en la inactivación de la proteasa.

ProtinaRTmut_TV1_C_ZAo p 68 secuencia sinté tica de Prot y la transcriptasa inversa (RT), incluyendo la mutación que r esulta en la inactivación de la proteasa y la mutación que resulta en la in activación de RT.

ProtinaRTmut_TV1_C_ZA wt 69 tipo salvaje 8_5 _TV1_C.ZA Prot y RT, la mutación que resulta en la inactivación de la proteasa y la mutación que resulta en la inactivación de RT.

ProtwtRTwt_TV1_C_ZAopt secuencias sint éticas de Prot y RT ProtwtRTwt_TV1_C_ZAwt 71 tipo salvaje 8_5 _TV1_C.ZA Prot y RT RevExon1_TV1_C_ZAopt 72 secuencia sinté tica del exón 1 de Rev RevExon1_TV1_C_ZAwt 73 tipo salvaje 8_5 _TV1_C.ZA del exón 1 de Rev RevExon2_TV1_C_ZAopt-2 74 secuencia sinté tica del exón 2 de Rev RevExon2_TV1_C_ZAwt 75 tipo salvaje 8_5 _TV1_C.ZA del exón 2 de Rev RT_TV1_C_ZAopt 76 secuencia sinté tica de RT RT_TV1_C_ZAwt 77 tipo salvaje 8_5 _TV1_C.ZA RT RTmut_TV1_C_ZAopt 78 secuencia sint ética de RT, incluyendo la mutación que resulta en la inactivación de RT RTmut_TV1_C_ZAwt 79 tipo salvaje 8_5_TV1_C.ZA RT, incluyendo la mutación que resulta en la inactivación de RT TatC22Exon1_TV1_C_ZAo pt 80 secuencia sintética del exón 1 de Tat, incluyendo la mutación que resulta en producto del gen Tat no funcional TatExon1_TV1_C_ZAopt 81 secuencia sintética del exón 1 de Tat TatExon1_TV1_C_ZAwt 82 tipo salvaje 8_5_TV1_C.ZA exón 1 de Tat TatExon2_TV1_C_ZAopt 83 secuencia sintética del exón 2 de Tat TatExon2_TV1_C_ZAwt 84 tipo salvaje 8_5_TV1_C.ZA exón 2 de Tat Vif_TV1_C_ZAopt 85 secuencia sintética de Vif VifTV1_C_ZAwt 86 tipo salvaje 8_5_TV1_C.ZA Vif Vpr_TV1_C_ZAopt 87 secuencia sintética de VPR Vpr_TV1_C_ZAwt 88 tipo salvaje 8_5 _TV1_C.ZA VPR Vpu_TV1_C_ZAopt 89 secuencia sinté tica de Vpu Vpu_TV1_C_ZAwt 90 tipo salvaje 8_5 _TV1_C.ZA Vpu revexon1_2 TV1 C ZAopt 91 secuencia sinté tica de los exones 1 y 2 de Rev RevExon1_2_TV1_C_ZAwt 92 tipo salvaje 8_5 _TV1_C.ZA Rev (exones 1 y 2) TatC22Exon1_2_TV1_C_Z 93 secuencia sinté tica de los exones 1 y 2 de Tat, incluyendo la mutación Aopt en el exón 1 qu e resulta en producto del gen Tat no funcional (continuación)

Nombre

SEQ ID

Descripció n

TatExon1_2_TV1_C_ZAopt 94 secuencia sintética de los exones 1 y 2 de Tat TatExon1_2_TV1_C_ZAwt 95 tipo salvaje 8_5_TV1_C.ZA Tat (exones 1 y 2) NefD125G-Myr_TV1_C_ZAopt 96 secuencia sintética de Nef, incluyendo la eliminación de la mutación sitio de miri stoilación.

Tabla D

Nombre

SEQ ID

Descrip

ción

gp120mod.TV1.delV2 119 secuenci a sintética de gp120 Env, incluido el borrado V2 y secuenci as líder modificados derivados de secuencias 8_2_TV1 _C.ZA de tipo salvaje gp140mod.TV1.delV2 120 secuenci a sintética de gp140 Env, incluido el borrado V2 y secuenci as líder modificados derivados de secuencias 8_2_TV1 _C.ZA de tipo salvaje gp140mod.TV1.mut7.delV2 121 secuenci a sintética de gp140 Env, incluido el borrado V2 y mutación en sitio de corte y secuencias líder modificados derivado s de secuencias 8_2_TV1_C.ZA de tipo salvaje gp160mod.TV1.delV1V2 122 secuenci a sintética de Env gp160, incluyendo V1 / V2 eliminaci ón y líder modificado derivado de secuencias 8_2_TV1 _C.ZA de tipo salvaje gp160mod.TV1.delV2 123 secuenci a sintética de gp160 Env, incluido el borrado V2 y secuenci as líder modificados derivados de secuencias 8_2_TV1 _C.ZA de tipo salvaje gp160mod.TV1.mut7.delV2 124 secuenci a sintética de Env gp 160, incluido el borrado V2; una mutación en sitio de escisión; y secuencias líder modificados derivado s de secuencias 8_2_TV1_C.ZA de tipo salvaje gp160mod.TV1.tpa1 125 secuenci a sintética de Env gp160, líder TPA1 gp160mod.TV1 126 Secuenci a sintética de Env gp160, TPA1 Líder gp160mod.TV1.wtLnative 127 secuenci a sintética de Env gp160, incluyendo tipo salvaje 8_2_TV1 _C.ZA (sin modificar) líder gp140.mod.TV1.tpa1 131 secuencia sintética de Env gp140, líder TPA1 gp140mod.TV1 132 secuencia sintética de gp140 Env, incluyendo secuencias líder modificados derivados de secuencias 8_2_TV1_C.ZA de tipo salvaje gp140mod.TV1.wtLnative 133 secuencia sintética de Env gp120, incluyendo tipo salvaje 8_2_TV1_C.ZA (sin modificar) secuencia líder.

Como se observa anteriormente, las construcciones que codifican Env pueden prepararse usando cualquiera de la longitud completa de las construcciones de gp160. Por ejemplo, se preparó una forma de gp140 (SEC ID Nº: 132) truncando gp160 (SEC ID Nº: 126) en el nucleótido 2064; se preparó gp120 truncando gp160 (SEC ID Nº: 126) en el nucleótido 1551 (SEC ID Nº: 126). Pueden prepararse formas de gp140 y gp120 adicionales usando los métodos descritos en el presente documento. Normalmente se añaden uno o más codones de terminación (por ejemplo, nucleótidos 2608 a 2610 de SEC ID Nº: 126). Además, la secuencia conductora no mutante puede modificarse y/o sustituirse con otras secuencias conductoras (por ejemplo, secuencias conductoras de TPA1).

Así, el polipéptido gp160 incluye las secuencias codificantes para gp120 y gp41. El polipéptido gp41 comprende varios dominios que incluyen un dominio de oligomerización (OD) y un dominio que atraviesa la membrana de un lado a otro (TM). En la envuelta nativa, el dominio de oligomerización se requiere para la asociación no covalente de tres polipéptidos gp41 para formar una estructura trímera: mediante interacciones no covalentes con el trímero gp41 (y consigo mismo), los polipéptidos gp120 también están organizados en una estructura trimérica. Existe un sitio de escisión (o sitios de escisión) aproximadamente entre las secuencias de polipéptidos para gp 120 y las secuencias de polipéptidos correspondientes a gp41. Este (Estos) sitio(s) de escisión puede(n) mutarse para prevenir la escisión en el sitio. El polipéptido resultante gp140 se corresponde con una forma truncada de gp160 en la que se ha delecionado el dominio que atraviesa la membrana de un lado a otro de gp41. Este polipéptido gp140 puede existir en tanto formas monoméricas como oligoméricas (es decir, trímeras) en virtud de la presencia del dominio de oligomerización en el resto de gp41. En la situación en la que el sitio de escisión se ha mutado para prevenir la escisión y la porción transmembranaria de gp41 se ha delecionado, el producto de polipéptido resultante se designa gp140 “mutado” (por ejemplo, gp140.mut). Como será evidente para aquellos en el campo, el sitio de escisión puede mutarse en una variedad de formas. En las construcciones a modo de ejemplo descritas en el presente documento (por ejemplo, SEC ID Nº: 121 y SEC ID Nº: 124), la mutación en el sitio de escisión de gp120/gp41 cambia la secuencia de aminoácidos no mutante IKR_R_WQREKR (SEC ID Nº: 129) a ISSWQSEKS (SEC ID Nº: 130).

En todavía otros aspectos, se delecionaron región (regiones) hipervariable(s), se eliminaron sitios de N-glicosilación y/o se mutaron sitios de escisión. Construcciones a modo de ejemplo que tienen deleciones de la región variable (V1 y/o V2), se construyeron deleciones V2 delecionando nucleótidos de aproximadamente 499 a aproximadamente 593 (con respecto a SEC ID Nº: 128) y se construyeron deleciones V1/V2 delecionando nucleótidos de aproximadamente 375 a aproximadamente 602 (con respecto a SEC ID Nº: 128). Las localizaciones relativas de las regiones V1 y/o V2 también pueden determinarse fácilmente por el alineamiento con las regiones mostradas en la Tabla A. La Tabla E muestra secuencias no mutantes y sintéticas derivadas de la cepa del VIH tipo C sudafricana 12-5_1_TV2_C.ZA.

Tabla E

Nombre

SEQ ID

Descripción

Envgp160_TV2_C_ZAopt 97 secuencia sintética de gp160 Env Envgp160_TV2_C_ZAwt 98 tipo salvaje 12-5_1_TV2_C.ZA Env gp160.

Gag_TV2_C_ZAopt 99 secuencia sintética de la mordaza Gag_TV2_C_ZAwt 100 tipo salvaje 12-5_1_TV2_C.ZA Gag Nef _V2_C_ZAopt 101 secuencia sintética de Nef Nef_TV2_C_ZAwt 102 tipo salvaje 12-5_1_TV2_C.ZA Nef Pol_TV2_C_ZAopt 103 secuencia sintética de Pol Pol_TV2_C_ZAwt 104 tipo salvaje 12-5_1_TV2_C.ZA de Pol RevExon1TV2_C_ZAopt 105 secuencia sintética del exón 1 de Rev RevExonl_TV2_C_ZAwt 106 tipo salvaje 12-5_1_TV2_C.ZA del exón 1 de Rev RevExon2_TV2_C_ZAopt 107 secuencia sintética del exón 2 de Rev RevExon2_TV2_C_ZAwt 108 tipo salvaje 12-5_1_TV2_C.ZA del exón 2 de Rev TatExon1_TV2_C_ZAopt 109 secuencia sintética del exón 1 de Tat TatExon1_TV2_C_ZAwt 110 tipo salvaje 12-5_1_TV2_C.ZA del exón 1 de Tat TatExon2_TV2_C_ZAopt 111 secuencia sintética del exón 2 de Tat TatExon2_TV2_C_ZAwt 112 tipo salvaje 12-5_1_TV2_C.ZA del exón 2 de Tat Vif_TV2_C_ZAopt 113 secuencia sintética de Vif Vif_TV2_C_ZAwt 114 tipo salvaje 12-5_1_TV2_C.ZA de Vif Vpr_TV2_C_ZAopt 115 secuencia sintética de VPR Vpr_TV2_C_ZAwt 116 tipo salvaje 12-5_1_TV2_C.ZA de VPR Vpu_TV2_C_ZAopt 117 secuencia sintética de Vpu Vpu_TV2_C_ZAwt 118 tipo salvaje 12-5_1_TV2_C.ZA de Vpu Será rápidamente evidente que pueden modificarse secuencias derivadas de cualquier cepa del VIH tipo C o clon como se describe en el presente documento con el fin de lograr modificaciones deseables en esa cepa. Adicionalmente, pueden construirse poliproteínas fusionando en marco dos o más secuencias de polinucleótidos que codifican productos de polipéptido o de péptido. Además, pueden producirse secuencias codificantes policistrónicas disponiendo dos o más secuencias de polinucleótidos que codifican productos de polipéptido adyacentes entre sí, normalmente bajo el control de un promotor, en las que cada secuencia codificante de polipéptidos puede modificarse para incluir secuencias para sitios internos de unión a ribosoma.

Las secuencias de la presente divulgación, por ejemplo, las secuencias de polinucleótidos (sintéticas) modificadas que codifican polipéptidos del VIH, pueden modificarse por deleciones, mutaciones puntuales, sustituciones, desplazamiento del marco, y/u otras modificaciones genéticas (por ejemplo, mutaciones que conducen a la inactivación de una actividad asociada a un polipéptido, por ejemplo, mutaciones que inactivan proteasa, tat, o actividad de transcriptasa inversa). Tales modificaciones se enseñan generalmente en la materia y pueden aplicarse en el contexto de las enseñanzas de la presente invención. Por ejemplo, sitios correspondientes a las “Regiones del genoma del VIH” enumeradas en la Tabla A pueden modificarse en las regiones correspondientes de las novedosas secuencias desveladas en el presente documento con el fin de lograr modificaciones deseables. Además, las secuencias de polinucleótidos (sintéticas) modificadas de la presente invención puede combinarse para su uso, por ejemplo, en una composición para generar una respuesta inmunitaria en un sujeto, en una variedad de formas, que incluyen, pero no se limitan a, las siguientes formas: múltiples casetes de expresión individuales que comprenden cada uno una secuencia de polinucleótidos de la presente invención (por ejemplo, un casete de expresión de gag, un casete de expresión de env y un casete de expresión de rev, o un casete de expresión de pol, un casete de expresión de vif y un casete de expresión de vpr, etc.); poliproteínas producidas por fusiones en el marco de múltiples polinucleótidos de la presente invención, y polinucleótidos policistrónicos producidos usando múltiples polinucleótidos de la presente divulgación. Ejemplo 2 Ensayos de expresión para las secuencias codificantes sintéticas A. Secuencias codificantes del VIH tipo C

Se clonan las secuencias codificantes del VIH subtipo C no mutantes (por ejemplo, de AF110965, AF110967, AF110968, AF110975, además de novedosas cepas sudafricanas 8_5_TV1_C.ZA, 8_2_TV1_C.ZA y 12- 5_1_TV2_C.ZA) en vectores de expresión que tienen las mismas características que los vectores en los que se clonan las secuencias sintéticas. Las eficiencias de expresión para diversos vectores que llevan las secuencias no mutantes y sintéticas se evalúan del siguiente modo. Células de varias líneas celulares de mamífero (293, RD, COS-7 y CHO; todas obtenidas de la Colección Americana de Cultivos Tipo, 10801 University Boulevard, Manassas, VA 20110-2209) se transfectan con 2 µg de ADN en reactivo de transfección LT1 (PanVera Corporation, 545 Science Dr., Madison, WI). Las células se incuban durante 5 horas en medio de suero reducido (Opti-MEM, Gibco-BRL, Gaithersburg, MD). El medio se sustituye entonces por medio normal del siguiente modo: células 293, IMDM, 10 % de suero de ternero fetal, 2 % de glutamina (BioWhittaker, Walkersville, MD); células RD y COS-7, D-MEM, 10 % de suero de ternero fetal, 2 % de glutamina (Opti-MEM, Gibco-BRL, Gaithersburg, MD); y células CHO, Ham's F-12, 10 % de suero de ternero fetal, 2 % de glutamina (Opti-MEM, Gibco-BRL, Gaithersburg, MD). Las células se incuban durante tanto 48 como 60 horas. Se recogen los lisados celulares como se describe más adelante en el Ejemplo 3. Se recogen los sobrenadantes y se filtran a través de filtros de jeringa de 0,45 µm. Los sobrenadantes se evalúan usando placas de 96 pocillos recubiertas con un anticuerpo monoclonal murino dirigido contra el antígeno del VIH, por ejemplo, un ensayo p24 de Coulter (Coulter Corporation, Hialeah, FL, US). El antígeno del VIH-1 se une a los pocillos recubiertos. Anticuerpos biotinilados contra el VIH reconocen el antígeno unido. La estreptavidina-peroxidasa de rábano picante conjugada reacciona con la biotina. El color se desarrolla de la reacción de peroxidasa con el sustrato TMB. La reacción se termina mediante la adición de H2SO4 4 N. La intensidad del color es directamente proporcional a la cantidad de antígeno del VIH en una muestra.

Casetes de expresión del VIH tipo C sintéticos proporcionan un espectacular aumento en la producción de sus productos de proteína, con respecto a las secuencias nativas (subtipo C no mutante), cuando se expresan en una variedad de líneas celulares. B. Secuencias conductoras del péptido señal

Se probó la capacidad de diversas secuencias conductoras para conducir la expresión transfectando células con casetes de expresión que codifican Env no mutantes o sintéticos operativamente enlazados a diferentes secuencias conductoras y evaluar la expresión del polipéptido Env por ELISA o transferencia Western. La secuencia de aminoácidos y de nucleótidos de diversas secuencias conductoras de péptido señal se muestran en la Tabla 4.

Tabla 4

Líder

Secuencia de Aminoácidos

Secuencia ADN

WTnative MRVMGTQKNCQQWWIWGILGFWMLMIC (8_2_TV 1_C.ZA) WTmod MRVMGTQKNCQQWWIWGILGFWMLMIC (8_2_TV 1_C.ZA) Tpa1 MDAMKRGLCCVLLLCGAVFVSPS AS Tpa2 MDAMKRGLCCVLLLCGAVFVSPS Se transfectaron células 293 transitoriamente usando métodos convencionales con construcciones nativas y modificadas en la secuencia que codifican las formas de gp120 y gp140 de la envoltura de 8_2_TV1_C.ZA (TV1c8.2). La proteína Env se midió en lisados celulares y sobrenadantes usando un ELISA de captura de Env interno. Los resultados se muestran en la Tabla 5 más adelante e indican que la secuencia conductora de péptido señal no mutante de TV1c8.2 puede usarse para expresar eficazmente la proteína de la envuelta codificada a niveles que son mejores o comparables a aquellos observados usando las secuencias conductoras de tpa heterólogo. Además, el conductor TV1c8.2 trabaja en sus formas nativas o modificadas en la secuencia y puede usarse con genes env nativos o modificados en la secuencia. Todas las construcciones se probaron después de clonar los casetes de gen en los sitios EcoR1 y Xho1 del vector de expresión pCMVlink.

Tabla 5 TV1c8.2 Supernatante (ng)

Lisata Total Se subclonaron los casetes del gen de variante de la envoltura TV1c8.2 modificado en la secuencia en un vector de expresión pCMV de Chiron para la derivación de líneas celulares de mamífero estables. Se derivaron líneas celulares CHO estables que expresan las proteínas de la envuelta TV1c8.2 usando métodos estándar de transfección, amplificación con metotrexato y cribado. Se encontró que estas líneas celulares secretaban niveles de proteína de la envuelta que fueron comparables a aquellos observados para proteínas expresadas usando las secuencias conductoras de tpa. Resultados representativos se muestran en la Tabla 6 para dos clones de la línea celular que expresan gp120 TV1c8.2; se comparan con dos clones de referencia que expresan gp120 subtipo B SF162 derivado de un modo similar, pero usando el conductor tpa. Las concentraciones de proteína se determinaron siguiendo densitometría de geles escaneados de proteínas semi-purificadas. Se generaron curvas patrón usando una preparación altamente purificada y bien caracterizada de la proteína gp120 SF2 y se determinaron las concentraciones de las proteínas de prueba.

Tabla 6

Línea celular CHO

Clon #

Expresión (ng/ml)

gp120 SF162 Clon 65 921 Clon 71 972 gp120TV1.C8.2 Clon 159 1977 Clon 210 1920 Los resultados también se confirmaron por análisis de transferencia Western, esencialmente como se describe en el Ejemplo 3. Ejemplo 3 Análisis de transferencia Western de la expresión A. Secuencias codificantes del VIH tipo C Se transfectan células 293 humanas como se describe en el Ejemplo 2 con vectores basados en pCMV que contienen casetes de expresión del VIH tipo C nativos o sintéticos. Las células se cultivan durante 60 horas después de la transfección. Se preparan sobrenadantes como se ha descrito. Se preparan lisados celulares del siguiente modo. Las células se lavan una vez con solución salina tamponada con fosfato, se lisan con detergente [1 % de NP40 (Sigma Chemical Co., St. Louis, MO) en Tris-HCl 0,1 M, pH 7,5], y el lisado se transfiere a tubos nuevos. Se cargan geles de SDS-poliacrilamida (pre-colado 8-16 %; Novex, San Diego, CA) con 20 µl de sobrenadante o 12,5 µl de lisado celular. También se carga un patrón de proteína (5 µl, patrón de intervalo de tamaño ancho; BioRad Laboratories, Hercules, CA). Se lleva a cabo electroforesis y las proteínas se transfieren usando una cámara de transferencia de BioRad (BioRad Laboratories, Hercules, CA) a membranas Immobilon P (Millipore Corp., Bedford, MA) usando el tampón de transferencia recomendado por el fabricante (Millipore), en el que la transferencia se realiza a 100 voltios durante 90 minutos. Las membranas se exponen a suero de pacientes humanos positivo para el VIH-1 y se inmunotiñe usando diclorhidrato de o-fenilendiamina (OPD; Sigma).

El análisis de inmunotransferencia muestra que las células que contienen el casete de expresión sintético producen la proteína esperada a mayores concentraciones por célula que las células que contienen el casete de expresión nativo. Las proteínas se observan en tanto lisados celulares como sobrenadantes. Los niveles de producción son significativamente mayores en sobrenadantes de células para células transfectadas con los casetes de expresión sintéticos de la presente invención. Además, los sobrenadantes de las células 293 transfectadas se fraccionan sobre gradientes de sacarosa. Se transfieren alícuotas del sobrenadante a tubos de ultracentrífuga Polyclear™ (Beckman Instruments, Columbia, MD), se coloca una subcapa con una disolución de 20 % (peso/peso) de sacarosa, y se somete a 2 horas de centrifugación a 28.000 rpm en un rotor SW28 de Beckman. El sedimento resultante se suspende en PBS y se estratifica sobre un gradiente de sacarosa al 20-60 % (peso/peso) y se somete a 2 horas centrifugación a 40.000 rpm en un rotor SW41ti de Beckman. Entonces, el gradiente se fracciona en aproximadamente 10 alícuotas x 1 ml (empezando arriba, 20 % final, del gradiente). Se toman muestras de las fracciones 1-9 y se someten a electroforesis sobre 8-16 % de geles de SDS- poliacrilamida. Los sobrenadantes de células 293/sintéticas dan bandas mucho más fuertes que los sobrenadantes de células 293/nativas. Ejemplo 4 (para ilustración solo) Inmunogenicidad in vivo de casetes de expresión del VIH tipo C sintéticos A. Inmunización

Para evaluar la inmunogenicidad posiblemente mejorada en los casetes de expresión del VIH tipo C sintéticos, se realiza un estudio en ratones. El ADN de plásmido, pCMVKM2 que lleva el casete de expresión de Gag sintético, se diluye a las siguientes concentraciones finales en un volumen de inyección total de 100 µl: 20 µg, 2 µg, 0,2 µg, 0,02 y 0,002 µg. Para vencer posibles efectos de dilución negativa del ADN diluido, la concentración de ADN total en cada muestra se lleva hasta 20 µg usando el vector (pCMVKM2) solo. Como control, el ADN de plásmido del casete de expresión de Gag nativo se manipula del mismo modo. Se inmunizan intramuscularmente doce grupos de cuatro a diez ratones Balb/c (Charles River, Boston, MA) (50 µl por pata, inyección intramuscular en la tibia anterior) según el programa en la Tabla 1.

Tabla 1 Grupo

Gag o Env Expresión Casete

La concentración de ADN Imnunizado tiempo plásmido Gag o Env (µg)

(semanas) 1 Sintético 01,4 2 Sintético 2 0.4 3 Sintético 0.2 0.4 4 Sintético 0.02 0.4 5 Sintético 0.002 0.4 6 Sintético 7 Sintético 2 8 Sintético 0.2 9 Sintético 0.02 10 Sintético 0.002 11 Nativo 0.4 12 Nativo 2 0.4 13 Nativo 0.2 0.4 14 Nativo 0.02 0.4 15 Nativo 0.002 0.4 16 Nativo 17 Nativo 2 18 Nativo 0.2 19 Nativo 0.02 20 Nativo 0.002 1 = inmunización inicial en "semana 0" Se extrae sangre de los grupos 1-5 y 11-15 en la semana 0 (antes de la inmunización), semana 4, semana 6, semana 8 y semana 12. Se extrae sangre de los grupos 6-20 y 16-20 en la semana 0 (antes de la inmunización) y en la semana 4. B. Respuesta inmunitaria humoral

La respuesta inmunitaria humoral se comprueba con ELISA de anticuerpos anti-VIH (enzimoinmunoanálisis de adsorción) de los sueros de ratones 0 y 4 semanas después de la inmunización (grupos 5-12) y, además, 6 y 8 semanas después de la inmunización, respectivamente, 2 y 4 semanas después de la segunda inmunización (grupos 1-4).

Los títulos de anticuerpos de los sueros se determinan usando ELISA de anticuerpos anti-polipéptidos VIH apropiados (por ejemplo, anti-Pol, anti-Gag, anti-Env, anti-Vif, anti-Vpu, etc.). Brevemente, sueros de ratones inmunizados se criban para anticuerpos dirigidos contra las proteínas del VIH (por ejemplo, proteína Gag p55, una proteína Env, por ejemplo, gp160 o gp120 o una proteína Pol, por ejemplo, p6, prot o RT, etc). Se recubren placas de microtitulación de ELISA con 0,2 µg de proteína del VIH por pocillo durante la noche y se lavan cuatro veces; posteriormente, el bloqueo se hace con PBS-0,2 % de Tween (Sigma) durante 2 horas. Después de eliminar la disolución de bloqueo, se añaden 100 µl de suero de ratón diluido. Lo sueros se prueban a 1/25 diluciones y por diluciones triples sucesivas, a partir de aquí. Las placas de microtitulación se lavan cuatro veces y se incuban con un anticuerpo secundario anti-IgG de ratón acoplado a peroxidasa (Pierce, Rockford, IL). Las placas de ELISA se lavan y se añade 100 µl de 3,3',5,5'-tetrametilbencidina (TMB; Pierce) por pocillo. La densidad óptica de cada pocillo se mide después de 15 minutos. Los títulos informados son el recíproco de la dilución de suero que dieron una densidad óptica al 50 % (D.O.). Los casetes de expresión sintéticos proporcionarán una clara mejora de la inmunogenicidad con respecto a los casetes de expresión nativos.

C. Respuesta inmunitaria celular La frecuencia de linfocitos T citotóxicos específicos (CTL) se evalúa por un ensayo de liberación de cromo estándar de células CD4 (Balb/c, CB6F1 y/o C3H) de ratón pulsadas con péptidos. Se usan células CD-8 infectadas con virus de la variolovacuna que expresan polipéptidos del VIH (por ejemplo, Pol, Gag o Env) como control positivo. Brevemente, se obtienen células del bazo (células efectoras, E) de los ratones inmunizados como se ha descrito anteriormente, se cultivan, se re-estimulan y se ensayan para actividad de CTL contra células diana pulsadas con péptidos Gag como se ha descrito (Doe, B., y Walker, C.M., AIDS 10(7):793-794, 1996). La actividad citotóxica se mide en un ensayo de liberación de 51Cr patrón. Se cultivan células diana (T) con células efectoras (E) a diversas relaciones E:T durante 4 horas y se usan las cpm promedio de los pocillos por duplicado para calcular el porcentaje de liberación de 51Cr específica.

La actividad de los linfocitos T citotóxicos (CTL) se mide en esplenocitos recuperados de los ratones inmunizados con Gag del VIH o ADN de Env. Las células efectoras de los animales inmunizados con Gag o ADN de Env presentan lisis específica de células diana SV-BALB (del mismo MHC) pulsadas con polipéptidos del VIH, indicativas de una respuesta de CTL. No se lisan las células diana que son pulsadas con péptidos y se derivan de una cepa de ratón sin coincidir con el MHC (MC57). Así, los casetes de expresión sintéticos presentan elevada potencia para la inducción de respuestas de linfocitos T citotóxicos (CTL) por inmunización con ADN.

Ejemplo 5 (para ilustración solo) Inmunización con ADN de primates no humanos usando un casete de expresión del VIH tipo C sintético

Se inmunizan primates no humanos múltiples veces (por ejemplo, semanas 0, 4, 8 y 24) intradérmicamente, mucosamente o bilateralmente, intramuscularmente, en el cuádriceps usando diversas dosis (por ejemplo, 1-5 mg) y diversas combinaciones de plásmidos del VIH tipo C sintéticos. Se extrae sangre de los animales dos semanas después de cada inmunización y se realiza ELISA con plasma aislado. El ELISA se realiza esencialmente como se ha descrito en el Ejemplo 4, excepto que el segundo conjugado de anticuerpo es un conjugado de peroxidasa específico de anti-cadena g de IgG humana (Sigma Chemical Co., St. Louis, MD 63178) usado a una dilución de 1:500. Se añaden cincuenta µg/ml de extracto de levadura a las diluciones de muestras de plasma y conjugado de anticuerpo para reducir el fondo no específico debido a anticuerpos de levadura pre-existentes en los primates no humanos.

Además, también pueden evaluarse respuestas linfoproliferativas al antígeno después de la inmunización, indicativo de la inducción de funciones de linfocitos T cooperadores. Se espera que el ADN de plásmido sintético sea inmunogénico en primates no humanos.

Ejemplo 6 (para ilustración solo) Expresión in vitro de ARN y ADN de Sindbis recombinante que contiene el casete de expresión del VIH tipo C sintético

Para evaluar la eficiencia de expresión del casete de expresión de Pol, Env y Gag sintético en vectores de alfavirus, el casete de expresión sintético seleccionado se subclona en tanto vectores de virus Sindbis basado en ADN de plásmido como basados en partículas de vector recombinante. Específicamente, una construcción de vector de ADNc para la transcripción in vitro de replicones de vectores de ARN de virus de Sindbis (pRSIN-luc; Dubensky, et al., J Virol. 70:508-519, 1996) se modifica para contener un sitio PmeI para la linealización de plásmidos y un policonector para la inserción de genes heterólogos. Se genera un policonector usando dos oligonucleótidos que contienen los sitios XhoI, PmlI, ApaI, NarI, XbaI y NotI (XPANXNF y XPANXNR). El plásmido pRSIN-luc (Dubensky et al., arriba) se digiere con XhoI y NotI para eliminar el inserto del gen de luciferasa, se hace romo en los extremos usando Klenow y dNTP y se purifica a partir de un gel de agarosa usando GeneCleanII (Biol01, Vista, CA). Los oligonucleótidos se hibridan entre sí y se ligan en el plásmido. La construcción resultante se digiere con NotI y Sacl para eliminar la secuencia del extremo 3' de Sindbis mínima y el tramo A40, y se ligó con un fragmento de aproximadamente 0,4 kbp de PKSSIN1-BV (documento WO 97/38087). Este fragmento de 0,4 kbp se obtiene por digestión de pKSSIN1-BV con NotI y SacI, y purificación después del fraccionamiento del tamaño de un gel de agarosa. El fragmento contiene el extremo 3' del virus de Sindbis completo, un tramo A40 y un sitio PmeI para linealización. Esta nueva construcción de vector se designa SINBVE. Las secuencias codificantes del VIH sintéticas se obtienen del plásmido parental por digestión con EcoRI, haciendo romos los extremos con Klenow y dNTP, purificación con GeneCleanII, digestión con SalI, fraccionamiento del tamaño sobre un gel de agarosa, y purificación del gel de agarosa usando GeneCleanII. El fragmento codificante de polipéptidos del VIH sintético se liga en el vector SINBVE que se digiere con XhoI y PmtI. El vector resultante se purifica usando GeneCleanII y se designa SINBVGag. Los replicones de ARN de vector pueden transcribirse in vitro (Dubensky et al., arriba) a partir de SINBVGag y usarse directamente para la transfección de células. Alternativamente, los replicones pueden encapsidarse en partículas de vector recombinante por co-transfección con ARN cooperadores defectuosos o usando una línea celular de encapsidación de alfavirus.

El vector de virus de Sindbis basado en ADN pDCMVSIN-beta-gal (Dubensky, et al., J Virol. 70:508-519, 1996) se digiere con SalI y XbaI, para eliminar el inserto del gen de beta-galactosidasa, y se purifica usando GeneCleanII después del fraccionamiento del tamaño en gel de agarosa. El gen Gag o Env del VIH se inserta en pDCMVSIN- beta-gal por digestión de SINBVGag con SalI y XhoI, purificación usando GeneCleanII del fragmento que contiene Gag después del fraccionamiento del tamaño en gel de agarosa, y ligación. La construcción resultante se designa pDSIN-Gag, y puede usarse directamente para administración in vivo o formularse usando cualquiera de los métodos descritos en el presente documento. Se transfectan células BHK y 293 con ARN y ADN de Sindbis recombinante, respectivamente. Los sobrenadantes y lisados celulares se prueban con el ELISA de captura Coulter (Ejemplo 2).

Se transfectan células BHK por electroporación con ARN de Sindbis recombinante. Se transfectan células 293 usando LT-1 (Ejemplo 2) con ADN de Sindbis recombinante. Se usan plásmidos que contienen Gag y/o Env sintéticos como controles positivos. Los sobrenadantes y lisados se recogen 48 h después de la transfección. Las proteínas del VIH tipo C pueden expresarse eficazmente a partir de sistemas de vector de Sindbis basados tanto en ADN como ARN usando los casetes de expresión sintéticos.

Ejemplo 7 Inmunogenicidad in vivo de vectores de replicón de Sindbis recombinante que contienen casetes de expresión de Pol, Gag y/o Env sintéticos (para ilustración solo) A. Inmunización Para evaluar la inmunogenicidad de casetes de expresión del VIH tipo C sintéticos recombinantes en replicones de Sindbis, se realiza un estudio en ratón. Los casetes de expresión sintéticos que llevan vector de ADN de virus de Sindbis (Ejemplo 6) se diluyen a las siguientes concentraciones finales en un volumen de inyección total de 100 µl: µg, 2 µg, 0,2 µg, 0,02 y 0,002 µg. Para vencer posibles efectos de dilución negativos del ADN diluido, la concentración de ADN total de cada muestra se lleva hasta 20 µg usando el ADN de vector de replicón de Sindbis solo. Se inmunizan intramuscularmente doce grupos de cuatro a diez ratones Balb/c (Charles River, Boston, MA) (50 µl por pata, inyección intramuscular en la tibia anterior) según el programa en la Tabla 2. Alternativamente, se preparan partículas virales de Sindbis a las siguientes dosis: 103 ufp, 105 ufp y 107 ufp en 100 µl, como se muestra en la Tabla 3. Se administran preparaciones de partículas de polipéptidos del VIH de Sindbis a ratones usando vías intramusculares y subcutáneas (50 µl por sitio).

Tabla 2 Grupo

Gag o Env Expresión Casete

La concentración de ADN Imnunizado tiempo plásmido Gag o Env (µg)

(semanas) 1 Sintético 20 01,4 2 Sintético 2 0.4 3 Sintético 0.2 0.4 4 Sintético 0.02 0.4 Sintético 0.002 0.4 6 Sintético 20 7 Sintético 2 8 Sintético 0.2 9 Sintético 0.02 Sintético 0.002 1 = inmunización inicial en "semana 0" Tabla 3 Grupo

Gag o Env secuencia

Concentración de partícula Imnunizado tiempo viral (pfu)

(semanas) 1 Sintético 103 01,4 2 Sintético 105 0.4 3 Sintético 107 0.4 8 Sintético 103 9 Sintético 105 Sintético 107 1 = inmunización inicial en "semana 0" Se extrae sangre de los grupos y se realiza evaluación de tanto humoral como celular (por ejemplo, frecuencia de CTL específicos), esencialmente como se describe en el Ejemplo 4. Ejemplo 8 Identificación y secuenciación de una novedosa variante de VIH del tipo C (para ilustración solo) Se aisló y secuenció un clon de longitud completa, llamado 8_5_TV1_C.ZA, que codifica un VIH tipo C. Brevemente, se aisló ADN genómico de pacientes sudafricanos infectados con el VIH-1 subtipo C de CMSP (células mononucleares de sangre periférica) por lisis alcalina y columnas de intercambio aniónico (Quiagen). Para conseguir el genoma de clones de longitud completa, se amplificaron dos mitades, que podrían después unirse juntas en el marco dentro de la región Pol usando un único sitio Sal 1 en ambos fragmentos. Para la amplificación, se añadieron 200-800 ng de ADN genómico al tampón y mezcla de enzimas de Expand Long Template PCR System siguiendo el protocolo del fabricante (Boehringer Mannheim). El cebador se diseñó después de los alineamientos de secuencias de longitud completa conocidas. Para la mitad de 5' se usaron una mezcla de cebadores de 2 cebadores directos que contenían tanto timidina (S1FCSacTA 5'-GTTTCTTGAGCTCTGGAAGGGTTAATTTAC TCCAAGAA-3', SEC ID Nº: 38) como citosina en la posición 20 (S1FTSacTA 5'-GTTTCTTGAGCTCTGGAAGGGTTAATTTACTCTAAGAA, SEC ID Nº: 39) más sitio Sal 1. El cebador inverso también fue una mezcla de dos cebadores con tanto timidina como citosina en la posición 13 (S145RTSalTA 5'-GTTTCTTGTCGACTTGTCCATGTATGGCTTCCCC T-3', SEC ID Nº: 40 y S145RCSalTA 5'-GTTTCTTGTCGACTTGTCCATGCATGGCTTCCCT-3' SEC ID Nº: 41) y contuvo un sitio Sal 1. El cebador directo para la mitad de 3' también fue una mezcla de dos cebadores (S245FASalTA 5'- GTTTCTTGTCGACTGTAGTCCAGGaATATGGCAAT TAG-3' SEC ID Nº: 42 y S245FGSalTA 5'- GTTTCTTGTCGACTGTAGTCCAGGgATATG GCAA TTAG-3' SEC ID Nº: 43) con sitio Sal 1 y adenina o guanina en la posición 12. El cebador inverso tuvo un sitio Not 1 (S2_FullNotTA 5'-GTTTCTTGCGGCCGCTGCTAGA GATTTTCCACACTACCA-3' SEC ID Nº: 44). Después de la amplificación, los productos de PCR se purificaron usando un 1 % de gel de agarosa y se clonaron en el vector pCR-XL-TOPO mediante clonación TA (Invitrogen). Se comprobaron las colonias por análisis de restricción y se verificaron las secuencias. Para la secuencia de longitud completa se combinaron las secuencias de la mitad de 5' y de 3'. La secuencia se muestra en SEC ID Nº: 33. Además, dominios importantes se muestran en la Tabla A.

También se secuenció otro clon, designado 12-5_1_TV2_C.ZA, y se muestra en SEC ID Nº: 45. Los dominios pueden determinarse fácilmente en vista de las enseñanzas de la memoria descriptiva, por ejemplo, alineando la secuencia con aquellos mostrados en la Tabla A para encontrar las regiones correspondientes en el clon 12- 5_1_TV2_C.ZA.

Como se ha descrito anteriormente (Ejemplo 1, Tabla C), se generaron casetes de expresión sintéticos usando una o más secuencias de polinucleótidos obtenidas de 8_5_TV1_C.ZA o 12-5_1_TV2 C.ZA. Los polinucleótidos descritos en el presente documento se han depositado todos en Chiron Corporation, Emeryville, CA. Algunos aspectos de la presente divulgación se describen en los párrafos numerados a continuación: 1. Un casete de expresión que comprende una secuencia de polinucleótidos que codifica un polipéptido que incluye un polipéptido Pol del VIH, en el que la secuencia de polinucleótidos que codifica dicho polipéptido Pol comprende una secuencia que tiene al menos el 90 % de identidad de secuencias con la secuencia presentada de la Figura 8 (SEC ID Nº: 30); Figura 9 (SEC ID Nº: 31) o Figura 10 (SEC ID Nº: 32). 2. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 46, (ii) X es igual a Y, y (iii) Y es al menos 97. 3. El casete de expresión del párrafo 2, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 47, (ii) X es igual a Y, y (iii) Y es al menos 144. 4. El casete de expresión del párrafo 3, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 49 o SEC ID Nº: 97, (ii) X es igual a Y, y (iii) Y es al menos 300. 5. El casete de expresión del párrafo 4, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 49, (ii) X es igual a Y, y (iii) Y es 2610.

6. El casete de expresión del párrafo 4, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 97, (ii) X es igual a Y, y (iii) Y es 2565. 7. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 51 (ii) X es igual a Y, y (iii) Y es 1494. 8. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 99, (ii) X es igual a Y, y (iii) Y es 1491. 9. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 55; SEC ID Nº: 57; SEC ID Nº: 101; SEC ID Nº: 96; SEC ID Nº: 134 o SEC ID Nº: 135, (ii) X es igual a Y, y (iii) Y es al menos 60. 10. El casete de expresión del párrafo 9, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 55; SEC ID Nº: 57; SEC ID Nº: 101; SEC ID Nº: 96; SEC ID Nº: 134 o SEC ID Nº: 135, (ii) X es igual a Y, y (iii) Y es 624. 11. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 58; (ii) X es igual a Y, y (iii) Y es 354. 12. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 60; (ii) X es igual a Y, y (iii) Y es 876. 13. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 62; (ii) X es igual a Y, y (iii) Y es 3015.

14. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 103; (ii) X es igual a Y, y (iii) Y es 3009. 15. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 64 o SEC ID Nº: 66; (ii) X es igual a Y, y (iii) Y es 297. 16. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 68, (ii) X es igual a Y, y (iii) Y es 1965. 17. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 70; (ii) X es igual a Y, y (iii) Y es 1977. 18. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 72 o SEC ID Nº: 105, (ii) X es igual a Y, y (iii) Y es al menos 30.

19. El casete de expresión del párrafo 18, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 72 o SEC ID Nº: 105; (ii) X es igual a Y, y (iii) Y es 75. 20. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 74 o SEC ID Nº: 107, (ii) X es igual a Y, y (iii) Y es al menos 30. 21. El casete de expresión del párrafo 20, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 74 o SEC ID Nº: 107; (ii) X es igual a Y, y (iii) Y es 246. 22. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 76; (ii) X es igual a Y, y (iii) Y es 1680. 23. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 78 ; (ii) X es igual a Y, y (iii) Y es 1668.

24. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 80, SEC ID Nº: 81 o SEC ID Nº: 109; (ii) X es igual a Y, y (iii) Y es 216. 25. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 83; (ii) X es igual a Y, y (iii) Y es 93. 26. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 111; (ii) X es igual a Y, y (iii) Y es 90. 27. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 85, o SEC ID Nº: 113; (ii) X es igual a Y, y (iii) Y es 579. 28. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 87 ; (ii) X es igual a Y, y (iii) Y es 288.

29. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 115; (ii) X es igual a Y, y (iii) Y es 287. 30. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 89 o SEC ID Nº: 117; (ii) X es igual a Y, y (iii) Y es al menos 30.

31. El casete de expresión del párrafo 30 que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 89; (ii) X es igual a Y, y (iii) Y es 267. 32. El casete de expresión del párrafo 30 que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 117; (ii) X es igual a Y, y (iii) Y es 261. 33. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 91; (ii) X es igual a Y, y (iii) Y es al menos 30. 34. El casete de expresión del párrafo 33 que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 91; (ii) X es igual a Y, y (iii) Y es 321. 35. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 93 o SEC ID Nº: 94; (ii) X es igual a Y, y (iii) Y es 309.

36. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 96; (ii) X es igual a Y, y (iii) Y es al menos 60. 37. El casete de expresión del párrafo 36 que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº : 96; (ii) X es igual a Y, y (iii) Y es 624. 38. Un casete de expresión que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 119, SEC ID Nº : 120; SEC ID Nº : 121 ; SEC ID Nº : 122; SEC ID Nº : 123; SEC ID Nº: 124; SEC ID Nº : 125; SEC ID Nº : 126; SEC ID Nº : 127; SEC ID Nº : 131 ; SEC ID Nº: 132 o SEC ID Nº : 133, (ii) X es igual a Y, y (iii) Y es al menos 60. 39. El casete de expresión del párrafo 38, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 119, SEC ID Nº : 120; SEC ID Nº : 121 ; SEC ID Nº : 122; SEC ID Nº : 123; SEC ID Nº: 124; SEC ID Nº : 125; SEC ID Nº : 126; SEC ID Nº : 127; SEC ID Nº : 131 ; SEC ID Nº: 132 o SEC ID Nº: 133, (ii) X es igual a Y, y (iii) Y es al menos 300. 40. El casete de expresión del párrafo 39, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 123 o SEC ID Nº: 124, (ii) X es igual a Y, y (iii) Y es 2433. 41. El casete de expresión del párrafo 39, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 122, (ii) X es igual a Y, y (iii) Y es 2301. 42. El casete de expresión del párrafo 39, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 125; (ii) X es igual a Y, y (iii) Y es 2517.

43. El casete de expresión del párrafo 39, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 126 o SEC ID Nº: 127, (ii) X es igual a Y, y (iii) Y es 2520. 44. El casete de expresión del párrafo 39, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 119, (ii) X es igual a Y, y (iii) Y es 1377. 45. El casete de expresión del párrafo 39, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 120 o SEC ID Nº: 121, (ii) X es igual a Y, y (iii) Y es 1839. 46. El casete de expresión del párrafo 39, que comprende un polinucleótido que comprende X nucleótidos contiguos, en el que (i) los X nucleótidos contiguos tienen al menos el 90 % de identidad en porcentaje con Y nucleótidos contiguos de SEC ID Nº: 132 o SEC ID Nº: 133, (ii) X es igual a Y, y (iii) Y es 1890. 47. Un polinucleótido que comprende la secuencia representada en SEC ID Nº: 33 o fragmentos derivados de la misma. 48. El polinucleótido del párrafo 47, en el que dichos fragmentos comprenden la secuencia codificante para los productos génicos seleccionados del grupo que consiste en Gag, Pol, Vif, Vpr, Tat, Rev, Vpu, Env y Nef. 49. El polinucleótido del párrafo 48, en el que el fragmento comprende un producto génico de Gag. 50. El polinucleótido del párrafo 48, en el que el fragmento comprende un producto génico de Env. 51. El polinucleótido del párrafo 50, en el que el producto génico de Env es gp160, gp140 o gp120. 52. Un polinucleótido que comprende la secuencia representada en SEC ID Nº: 45 o fragmentos derivados de la misma. 53. El polinucleótido del párrafo 52, en el que dichos fragmentos comprenden la secuencia codificante para los productos génicos seleccionados del grupo que consiste en Gag, Pol, Vif, Vpr, Tat, Rev, Vpu, Env y Nef. 54. El polinucleótido del párrafo 53, en el que el fragmento comprende un producto génico de Gag. 55. El polinucleótido del párrafo 53, en el que el fragmento comprende un producto génico de Env. 56. El polinucleótido del párrafo 55, en el que el producto génico de Env es gp160, gp140 o gp120.

57. Un polinucleótido que comprende la secuencia representada en SEC ID Nº: 128 o fragmentos derivados de la misma. 58. El polinucleótido del párrafo 57, en el que los fragmentos comprenden la secuencia codificante para los productos génicos de Env gp160, gp140 o gp120. 59. El casete de expresión de cualquiera de los párrafos 1 a 46, que comprende además uno o más ácidos nucleicos que codifican uno o más polipéptidos o antígenos virales. 60. El casete de expresión del párrafo 59, en el que el polipéptido o antígeno viral está seleccionado del grupo que consiste en Gag, Env, vif, vpr, tat, rev, vpu, nef y combinaciones de los mismos. 61. El casete de expresión de cualquiera de los párrafos 1 a 46, que comprende además uno o más ácidos nucleicos que codifican una o más citocinas.

62. Un sistema de expresión recombinante para su uso en una célula huésped seleccionada, que comprende, un casete de expresión de cualquiera de los párrafos 1 a 46, y en el que dicha secuencia de polinucleótidos comprende además elementos de control capaces de conducir la expresión en la célula huésped seleccionada. 63. El sistema de expresión recombinante del párrafo 62, en el que dichos elementos de control están seleccionados del grupo que consiste en un promotor de la transcripción, un elemento potenciador de la transcripción, una señal de terminación de la transcripción, secuencias de poliadenilación, secuencias para la optimización de la iniciación de la traducción y secuencias de terminación de la traducción. 64. El sistema de expresión recombinante del párrafo 62, en el que dicho promotor de la transcripción está seleccionado del grupo que consiste en CMV, CMV+intrón A, SV40, RSV, VIH-Ltr, MMLV-ltr y metalotioneína. 65. Una célula que comprende un casete de expresión de cualquiera de los párrafos 1 a 46, y en la que dicha secuencia de polinucleótidos comprende además elementos de control compatibles con la expresión en la célula seleccionada. 66. La célula del párrafo 65, en la que la célula está seleccionada del grupo que consiste en una célula de mamífero, una célula de insecto, una célula bacteriana, una célula de levadura, una planta, una célula presentadora de antígeno, una célula primaria, una célula inmortalizada y una célula derivada de tumor.

67. La célula del párrafo 66, en la que la célula está seleccionada del grupo que consiste en células BHK, VERO, HT1080, 293, RD, COS-7 y CHO. 68. La célula del párrafo 67, en la que dicha célula es una célula CHO. 69. La célula del párrafo 66, en la que la célula es Trichoplusia ni (Tn5) o células de insecto Sf9. 70. La célula del párrafo 66, en la que la célula presentadora de antígeno es una célula linfoide seleccionada del grupo que consiste en macrófago, monocitos, células dendríticas, linfocitos B, linfocitos T, citoblastos y células progenitoras de los mismos. 71. Una composición para generar una respuesta inmunológica, que comprende un casete de expresión de cualquiera de los párrafos 1 a 46. 72. La composición del párrafo 71, que comprende además uno o más polipéptidos Pol.

73. La composición del párrafo 72, que comprende además un adyuvante. 74. Una composición para generar una respuesta inmunológica, que comprende un casete de expresión del párrafo 52. 75. La composición del párrafo 74, que comprende además un polipéptido Pol. 76. La composición del párrafo 74, que comprende además uno o más polipéptidos codificados por las moléculas de ácidos nucleicos del párrafo 60. 77. La composición del párrafo 76, que comprende además un adyuvante. 78. Un método de inmunización de un sujeto, que comprende introducir una composición del párrafo 71 en dicho sujeto en condiciones que son compatibles con la expresión de dicho casete de expresión en dicho sujeto.

79. El método del párrafo 78, en el que dicho casete de expresión se introduce usando un vector de administración génica. 80. El método del párrafo 79, en el que el vector de administración génica es un vector no viral. 81. El método del párrafo 79, en el que dicho vector de administración génica es un vector viral. 82. El método del párrafo 79, en el que dicho vector de administración génica está seleccionado del grupo que consiste en un vector adenoviral, un vector viral de la variolovacuna, un vector de AAV, un vector retroviral, un vector lentiviral y un vector alfaviral. 83. El método del párrafo 82, en el que dicho vector de administración génica es un vector derivado de virus de Sindbis. 84. El método del párrafo 82, en el que dicho vector de administración génica es un vector de ADNc.

85. El método del párrafo 82, en el que dicho vector de administración génica es un sistema de iniciación viral en capas eucariota (ELVIS). 86. El método del párrafo 79, en el que dicha composición se administra usando un vehículo en partículas. 87. El método del párrafo 79, en el que dicha composición está recubierta sobre una partícula de oro o de tungsteno y dicha partícula recubierta se administra a dicho sujeto usando una pistola de genes.

88. El método del párrafo 79, en el que dicha composición está encapsulada en una preparación de liposoma. 89. El método del párrafo 79, en el que dicho sujeto es un mamífero.

90. El método del párrafo 89, en el que dicho mamífero es un ser humano. 91. Un método de generación de una respuesta inmunitaria en un sujeto, que comprende: proporcionar un casete de expresión de cualquiera de los párrafos 1 a 46, que expresa dicho polipéptido en una célula huésped adecuada, aislar dicho polipéptido, y administrar dicho polipéptido al sujeto en una cantidad suficiente para provocar una respuesta inmunitaria. 92. Un método de generación de una respuesta inmunitaria en un sujeto, que comprende introducir en células de dicho sujeto un casete de expresión de uno cualquiera de los párrafos 1 a 46, en condiciones que permiten la expresión de dicho polinucleótido y la producción de dicho polipéptido, provocando así una respuesta inmunológica a dicho polipéptido.

93. El método del párrafo 92, en el que el método comprende además la co-administración de un polipéptido del VIH. 94. El método del párrafo 93, en el que la co-administración del polipéptido al sujeto se lleva a cabo antes de introducir dicho casete de expresión. 95. El método del párrafo 93, en el que la co-administración del polipéptido al sujeto se lleva a cabo simultáneamente con introducir dicho casete de expresión. 96. El método del párrafo 93, en el que la co-administración del polipéptido al sujeto se lleva a cabo después de introducir dicho casete de expresión. 97. El casete de expresión del párrafo 59, en el que el polipéptido o antígeno viral está seleccionado del grupo que consiste en polipéptidos derivados de la hepatitis B, hepatitis C y combinaciones de los mismos.

Listado de secuencias <110> NOVARTIS VACCINE AND DIAGNOSTICS, INC. et al.

<120> POLINUCLEÓTIDOS QUE CODIFICAN POLIPÉPTIDOS ANTIGÉNICOS DEL VIH TIPO C, POLIPÉPTIDOS Y USOS DE LOS MISMOS <130> P055223EP <140> PCT/US01/21241 <141> 2001-07-05 <150> 09/610,313 <151> 2000-07-05 <160> 135 <170> PatentIn Ver. 2.0 <210> 1 <211> 60 <212> ADN <213> Inmunodeficiencia Humana virus <400> 1 gacatcaagc agggccccaa ggagcccttc cgcgactacg tggaccgctt cttcaagacc 60 <210> 2 <211> 60 <212> ADN <213> Inmunodeficiencia Humana virus <400> 2 gacatccgcc agggccccaa ggagcccttc cgcgactacg tggaccgctt cttcaagacc 60 <210> 3 <211> 1479 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Gag sintético de la cepa de VIH AF110965 <400> 3 <210> 4 <211> 1509 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Gag sintética de AF110967 cepa de VIH <400> 4 <210> 5 <211> 141 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Env región común de AF110968 cepa de VIH <400> 5 <210> 6 <211> 1431 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: región codificante gp120 sintético de AF110968 cepa de VIH <400> 6

ES 2 553 575 T3  

<210> 7 <211> 1944 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: región codificante gp140 sintético de AF110968 cepa de VIH <400> 7

ES 2 553 575 T3   <210> 8 <211> 2466 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: región codificante gp160 sintético de AF110968 cepa de VIH <400> 8

ES 2 553 575 T3   <210> 9 <211> 2547 <212> ADN <213> Secuencia Artificial <220> <223> Región de secuencia señal sintética y gp160 de codificación de AF110968 cepa de VIH: Descripción de Secuencia Artificial <400> 9

ES 2 553 575 T3   <210> 10 <211> 1035 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: una región de codificación gp41 sintético de la cepa de VIH AF110968 <400> 10

ES 2 553 575 T3   <210> 11 <211> 144 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: región común sintética Env de AF110975 cepa de VIH <400> 11 <210> 12 <211> 1437 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: región codificante gp120 sintético de AF110975 cepa de VIH <400> 12

ES 2 553 575 T3   <210> 13 <211> 1950 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: región codificante gp140 sintético de AF110975 cepa de VIH <400> 13

ES 2 553 575 T3   <210> 14 <211> 2493 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: región codificante gp160 sintético de AF110975 cepa de VIH <400> 14

ES 2 553 575 T3   <210> 15 <211> 2565 <212> ADN <213> Secuencia Artificial <220> <223> Región de secuencia señal sintética y gp160 de codificación de AF110975 cepa de VIH: Descripción de Secuencia Artificial <400> 15

ES 2 553 575 T3   <210> 16 <211> 1056 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: una región de codificación gp41 sintético de la cepa de VIH AF110975 <400> 16

ES 2 553 575 T3  

<210> 17 <211> 492 <212> PRT <213> Inmunodeficiencia Humana virus <400> 17

ES 2 553 575 T3   <210> 18 <211> 81 <212> ADN <213> Secuencia Artificial

ES 2 553 575 T3   <220> <223> Descripción de la secuencia artificial: secuencia señal sintética de AF110968 cepa de VIH <400> 18 <210> 19 <211> 72 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: secuencia señal sintética de AF110975 cepa de VIH <400> 19 <210> 20 <211> 1479 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: secuencia de codificación Gag sintética de AF110965 cepa de VIH <400> 20

ES 2 553 575 T3   <210> 21 <211> 1509 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: secuencia de codificación Gag sintética de AF110967 cepa de VIH <400> 21 <210> 22 <211> 502 <212> PRT <213> Inmunodeficiencia Humana virus <400> 22

ES 2 553 575 T3  

ES 2 553 575 T3   <210> 23 <211> 849 <212> PRT <213> Inmunodeficiencia Humana virus <400> 23

ES 2 553 575 T3  

ES 2 553 575 T3   <210> 24 <211> 855 <212> PRT <213> Inmunodeficiencia Humana virus <400> 24

ES 2 553 575 T3  

ES 2 553 575 T3   <210> 25 <211> 20 <212> PRT <213> Inmunodeficiencia Humana virus <400> 25

ES 2 553 575 T3   <210> 26 <211> 60 <212> ADN <213> Inmunodeficiencia Humana virus <400> 26 gacataaaac aaggaccaaa agagcccttt agagactatg tagaccggtt ctttaaaacc 60 <210> 27 <211> 20 <212> PRT <213> Inmunodeficiencia Humana virus <400> 27 <210> 28 <211> 47 <212> PRT <213> Inmunodeficiencia Humana virus <400> 28 <210> 29 <211> 48 <212> PRT <213> Inmunodeficiencia Humana virus <400> 29

ES 2 553 575 T3   <210> 30 <211> 2469 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: PR975 (+) <400> 30

ES 2 553 575 T3   <210> 31 <211> 2463 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: PR975YM <400> 31

ES 2 553 575 T3   <210> 32 <211> 2457 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: PR975YMWM <400> 32 <210> 33 <211> 9781 <212> ADN <213> Inmunodeficiencia Humana virus

ES 2 553 575 T3   <400> 33

ES 2 553 575 T3  

ES 2 553 575 T3   <210> 34 <211> 203 <212> ADN <213> Inmunodeficiencia Humana virus <400> 34 <210> 35 <211> 2151 <212> ADN <213> Inmunodeficiencia Humana virus <400> 35

ES 2 553 575 T3   <210> 36 <211> 54 <212> ADN <213> Inmunodeficiencia Humana virus <400> 36 ggcggcatcg tgatctacca gtacatggac gacctgtacg tgggcagcgg cggc 54 <210> 37 <211> 18 <212> PRT <213> Inmunodeficiencia Humana virus <400> 37

ES 2 553 575 T3   <210> 38 <211> 38 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: cebador S1FCSacTA <400> 38 gtttcttgag ctctggaagg gttaatttac tccaagaa 38 <210> 39 <211> 38 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: cebador SlFTSacTA <400> 39 gtttcttgag ctctggaagg gttaatttac tctaagaa 38 <210> 40 <211> 35 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: cebador S145RTSalTA <400> 40 gtttcttgtc gacttgtcca tgtatggctt cccct 35 <210> 41 <211> 34 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: cebador S145RCSalTA <400> 41 gtttcttgtc gacttgtcca tgcatggctt ccct 34 <210> 42 <211> 38 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: cebador S245FASalTA <400> 42 gtttcttgtc gactgtagtc caggaatatg gcaattag 38 <210> 43 <211> 38 <212> ADN

ES 2 553 575 T3   <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: cebador S245FGSalTA <400> 43 gtttcttgtc gactgtagtc cagggatatg gcaattag 38 <210> 44 <211> 39 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: cebador S2FullNotTA <400> 44 gtttcttgcg gccgctgcta gagattttcc acactacca 39 <210> 45 <211> 9738 <212> ADN <213> Inmunodeficiencia Humana virus <400> 45

ES 2 553 575 T3  

ES 2 553 575 T3   <210> 46 <211> 97 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C Env Optimizado región común a corto <400> 46 <210> 47 <211> 144 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C Env Optimizado región común <400> 47

ES 2 553 575 T3   <210> 48 <211> 144 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C Env región común de tipo salvaje <400> 48 <210> 49 <211> 2610 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C Envgp160 optimizado <400> 49

ES 2 553 575 T3   <210> 50 <211> 2610 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C Envgp160 tipo salvaje <400> 50

ES 2 553 575 T3   <210> 51 <211> 1494 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C Gag optimizado <400> 51

ES 2 553 575 T3   <210> 52 <211> 1494 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH Gag Tipo Salvaje <400> 52

ES 2 553 575 T3   <210> 53 <211> 60 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH Gag Major homología Región optimizado <400> 53 gacatcaagc agggccccaa ggagcccttc cgcgactacg tggaccgctt cttcaagacc 60 <210> 54 <211> 60 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH Gag Major homología geográfica Tipo Salvaje <400> 54 gacataaaac aagggccaaa agaacccttt agagactatg tagaccggtt ctttaaaacc 60 <210> 55 <211> 624 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C Nef Optimizada <400> 55

ES 2 553 575 T3   <210> 56 <211> 624 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH Nef Tipo Salvaje <400> 56 <210> 57 <211> 624 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C NefD125G optimizado <400> 57 <210> 58 <211> 354 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C p15RNaseH optimizado <400> 58

ES 2 553 575 T3   <210> 59 <211> 354 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH p15RNaseH Tipo Salvaje <400> 59 <210> 60 <211> 876 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C p31Int optimizado <400> 60 <210> 61 <211> 876 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH p31Int Tipo Salvaje <400> 61

ES 2 553 575 T3   <210> 62 <211> 3015 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C Pol Optimizado <400> 62

ES 2 553 575 T3  

ES 2 553 575 T3   <210> 63 <211> 3015 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo VIH C Pol Tipo Salvaje <400> 63

ES 2 553 575 T3   <210> 64 <211> 297 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C de la proteasa del VIH Optimizada <400> 64 <210> 65 <211> 297 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C de la proteasa del VIH tipo salvaje <400> 65 <210> 66 <211> 297 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C inactivada VIH proteasa optimizado <400> 66 <210> 67 <211> 297 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C inactivada VIH proteasa tipo salvaje <400> 67

ES 2 553 575 T3   <210> 68 <211> 1965 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C inactivada VIH proteasa mutado transcriptasa inversa optimizado <400> 68 <210> 69 <211> 1965 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C inactivada VIH proteasa mutada de la transcriptasa reversa Tipo Salvaje

ES 2 553 575 T3   <400> 69 <210> 70 <211> 1977 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: VIH Tipo C de la proteasa y transcriptasa inversa optimizado <400> 70

ES 2 553 575 T3   <210> 71 <211> 1977 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: VIH Tipo C de la proteasa y la transcriptasa inversa Tipo Salvaje <400> 71

ES 2 553 575 T3   <210> 72 <211> 75 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C RevExon1 optimizado <400> 72 <210> 73 <211> 76 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH RevExon1 Tipo Salvaje <400> 73

ES 2 553 575 T3   <210> 74 <211> 246 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C RevExon2 optimizado <400> 74 <210> 75 <211> 248 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH RevExon2 Tipo Salvaje <400> 75 <210> 76 <211> 1680 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Tipo C transcriptasa inversa del VIH optimizado <400> 76

ES 2 553 575 T3   <210> 77 <211> 1680 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C de la transcriptasa reversa del VIH tipo salvaje <400> 77

ES 2 553 575 T3   <210> 78 <211> 1668 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C mutado transcriptasa inversa del VIH optimizado <400> 78

ES 2 553 575 T3   <210> 79 <211> 1668 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH mutada de la transcriptasa reversa Tipo Salvaje <400> 79 <210> 80 <211> 216 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C TatC22Exon1 optimizado <400> 80 <210> 81 <211> 216 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C TatExon1 optimizado

ES 2 553 575 T3   <400> 81 <210> 82 <211> 216 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH TatExon1 Tipo Salvaje <400> 82 <210> 83 <211> 93 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C TatExon2 optimizado <400> 83 <210> 84 <211> 93 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH TatExon2 Tipo Salvaje <400> 84 <210> 85 <211> 579 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C Vif Optimized <400> 85

ES 2 553 575 T3   <210> 86 <211> 579 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH Vif Tipo Salvaje <400> 86 <210> 87 <211> 288 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C VPR Optimizada <400> 87 <210> 88 <211> 288 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH VPR Tipo Salvaje <400> 88

ES 2 553 575 T3   <210> 89 <211> 267 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: VIH Tipo C Vpu Optimizada <400> 89 <210> 90 <211> 267 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH Vpu Tipo Salvaje <400> 90 <210> 91 <211> 321 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C RevExon VIH 1 y 2 Optimizado <400> 91

ES 2 553 575 T3   <210> 92 <211> 324 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C RevExon VIH 1 y 2 Tipo Salvaje <400> 92 <210> 93 <211> 309 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Tipo de VIH C TatC22 Exon 1 y 2 optimizado <400> 93 <210> 94 <211> 309 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Tipo C Tat del VIH Exon 1 y 2 optimizado <400> 94 <210> 95 <211> 309 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH Tat exón 1 y 2 Tipo Salvaje

ES 2 553 575 T3   <400> 95 <210> 96 <211> 624 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de la secuencia artificial: Tipo C VIH NefD125g Modificación Optimizada de Miristalización <400> 96

<210> 97 <211> 2565 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Envgp160_TV2_C_ZAopt <400> 97

ES 2 553 575 T3   <210> 98 <211> 2565 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Envgp160_TV2_C_ZAwt <400> 98

ES 2 553 575 T3   <210> 99 <211> 1491 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Gag_TV2_C_ZAopt <400> 99

ES 2 553 575 T3   <210> 100 <211> 1491 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Gag_TV2_C_ZAwt <400> 100

ES 2 553 575 T3  

<210> 101 <211> 624 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Nef_TV2_C_ZAopt <400> 101 <210> 102 <211> 624 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Nef_TV2_C_ZA_wt <400> 102 <210> 103 <211> 3009 <212> ADN <213> Secuencia Artificial

ES 2 553 575 T3   <220> <223> Descripción de Secuencia Artificial: Pol_TV2_C_ZAopt <400> 103

ES 2 553 575 T3   <210> 104 <211> 3009 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Pol_TV2_C_ZAwt <400> 104

ES 2 553 575 T3   <210> 105 <211> 75 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: RevExon1_TV2_C_ZAopt <400> 105 <210> 106 <211> 76 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: RevExon1_TV2_C_ZAwt <400> 106 <210> 107 <211> 246 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: RevExon2_TV2_C_ZAopt <400> 107 <210> 108 <211> 248 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: RevExon2_TV2_C_ZAwt <400> 108

ES 2 553 575 T3   <210> 109 <211> 216 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: TatExon1_TV2_C_ZAopt <400> 109 <210> 110 <211> 216 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: TatExon1_TV2_C_ZAwt <400> 110 <210> 111 <211> 90 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: TatExon2_TV2_C_ZAopt <400> 111

<210> 112 <211> 90 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: TatExon2_TV2_C_ZAwt <400> 112 <210> 113 <211> 579 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Vif_TV2_C_ZAopt

ES 2 553 575 T3   <400> 113 <210> 114 <211> 579 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Vif_TV2_C_ZAwt <400> 114 <210> 115 <211> 288 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Vpr_TV2_C_ZAopt <400> 115 <210> 116 <211> 288 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Vpr_TV2_C_ZAwt <400> 116

ES 2 553 575 T3   <210> 117 <211> 261 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Vpu_TV2_C_ZAopt <400> 117 <210> 118 <211> 261 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Vpu_TV2_C_ZAwt <400> 118 <210> 119 <211> 1473 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp120mod.TV1.delV2 <400> 119

ES 2 553 575 T3   <210> 120 <211> 1986 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp140mod.TV1.delV2 <400> 120

ES 2 553 575 T3   <210> 121 <211> 1986 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp140mod.TV1.mut7.delV2 <400> 121

ES 2 553 575 T3   <210> 122 <211> 2397 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp160mod.TV1.delV1V2 <400> 122

ES 2 553 575 T3   <210> 123 <211> 2529 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp160mod.TV1.delV2 <400> 123

ES 2 553 575 T3   <210> 124 <211> 2529 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp160mod.TV1.mut7.delV2 <400> 124

ES 2 553 575 T3   <210> 125 <211> 2613 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp160mod.TV1.tpa1 <400> 125

ES 2 553 575 T3   <210> 126 <211> 2616 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp160mod.TV1 <400> 126

ES 2 553 575 T3   <210> 127 <211> 2616 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp160mod.TV1.wtLnative <400> 127

ES 2 553 575 T3   <210> 128 <211> 2604 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Tipo salvaje Env gp160 (8_2_ZA) <400> 128

ES 2 553 575 T3   <210> 129 <211> 10 <212> PRT <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Secuencia de aminoácidos de tipo salvaje cambiado por mutación en gp120 / gp41 sitio de escisión <400> 129

ES 2 553 575 T3   <210> 130 <211> 10 <212> PRT <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: Secuencia de aminoácidos de tipo salvaje cambiado por mutación en gp120 / gp41 sitio de escisión <400> 130 <210> 131 <211> 2052 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp140mod.TV1.tpa1 <400> 131

ES 2 553 575 T3   <210> 132 <211> 2073 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp140mod.TV1 <400> 132 <210> 133 <211> 2073 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: gp140mod.TV1.wtLnative <400> 133

ES 2 553 575 T3   <210> 134 <211> 624 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: NefD125G_TV2_C_ZAopt <400> 134

ES 2 553 575 T3   <210> 135 <211> 624 <212> ADN <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: NefD125G-Myr_TV2_C_ZAopt <400> 135

ES 2 553 575 T3  

Reivindicaciones 1. Un casete de expresión que comprende: (a) un polinucleótido que comprende al menos 480 nucleótidos contiguos de SEC ID Nº: 132; o (b) un polinucleótido que tiene más del 98 % de identidad de secuencias con (a).

2. El casete de expresión según la reivindicación 1, en el que el polinucleótido comprende los nucleótidos 7 a 2064 de SEC ID Nº: 32.

3. El casete de expresión según la reivindicación 2, en el que el polinucleótido comprende SEC ID Nº: 132. 4. El casete de expresión según la reivindicación 1, en el que el polinucleótido comprende los nucleótidos 88 a 1563 de SEC ID Nº: 127, nucleótidos 88 a 2064 de SEC ID Nº: 127, o nucleótidos 88 a 2607 de SEC ID Nº: 127.

5. El casete de expresión según la reivindicación 1, en el que el polinucleótido es un polinucleótido que codifica Env que comprende una deleción de la región variable V2. 6. El casete de expresión según la reivindicación 5, en el que el polinucleótido comprende los nucleótidos 7 a 1977 de SEC ID Nº: 121; nucleótidos 7 a 2520 de SEC ID Nº: 124; o nucleótidos 7 a 1464 de SEC ID Nº: 119. 7. El casete de expresión según la reivindicación 6, en el que el polinucleótido comprende SEC ID Nº: 121, SEC ID Nº: 124 o SEC ID Nº: 119.

8. El casete de expresión de cualquiera de las reivindicaciones 1 a 7, que comprende además uno o más ácidos nucleicos que codifican uno o más polipéptidos o antígenos virales. 9. El casete de expresión de cualquiera de las reivindicaciones 1 a 7, que comprende además uno o más ácidos nucleicos que codifican una o más citocinas.

10. Un sistema de expresión recombinante para su uso en una célula huésped seleccionada que comprende un casete de expresión de cualquiera de las reivindicaciones 1 a 7, y en el que dicha secuencia de polinucleótidos comprende además elementos de control capaces de conducir la expresión en la célula huésped seleccionada.

11. Una célula que comprende un casete de expresión de cualquiera de las reivindicaciones 1 a 7, y en el que dicha secuencia de polinucleótidos comprende además elementos de control compatibles con la expresión en la célula seleccionada. 12. Una composición para su uso en generar una respuesta inmunológica, que comprende un casete de expresión de cualquiera de las reivindicaciones 1 a 7. 13. Un polipéptido obtenible proporcionando un casete de expresión de cualquiera de las reivindicaciones 1 a 7, que expresa dicho polipéptido en una célula huésped adecuada, y aislar dicho polipéptido, para su uso en un método de generación de una respuesta inmunitaria en un sujeto.

14. Un polipéptido Env del VIH codificado por un casete de expresión de cualquiera de las reivindicaciones 1 a 7.

ES 2 553 575 T3   Figura 1

ES 2 553 575 T3   Peptido señal

ES 2 553 575 T3   Figura 5

ES 2 553 575 T3   Figura 14

ES 2 553 575 T3  

Flecha: son las regiones para supresiones de hoja β

*: son las glicoestaciones de unión N para subtipos C TV1 y TV2. Posible mutación (N->Q) o supresiones pueden ser realizadas.

Consenso Consenso Consenso Consenso Consenso Consenso Consenso Figura 105A

ES 2 553 575 T3   Consenso Consenso Consenso Consenso Consenso Consenso Consenso Consenso Figura 105B

ES 2 553 575 T3   Consenso Consenso Consenso