Infidelidad de la transcripción, su detección y sus usos.

Uso un péptido sintético con una longitud de 100 aminoácidos o menos, que comprende una secuencia seleccionada de SEQ ID NOs: 1 a 5

, 7 a 13, 15 a 18 y 20 a 32 para detectar o controlar trastornos de células proliferativas.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E11173357.

Solicitante: Genclis.

Nacionalidad solicitante: Francia.

Dirección: 15 Rue du Bois de la Champelle 54500 Vandoeuvre-les-Nancy FRANCIA.

Inventor/es: BIHAIN, BERNARD.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION C — QUIMICA; METALURGIA > BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE;... > PROCESOS DE MEDIDA, INVESTIGACION O ANALISIS EN LOS... > Procesos de medida, investigación o análisis en... > C12Q1/68 (en los que intervienen ácidos nucleicos)
google+ twitter facebook

Texto extraído del PDF original:

DESCRIPCIÓN

Infidelidad de la transcripción, su detección y sus usos La presente invención se refiere a péptidos y composiciones para usos terapéuticos, de diagnóstico, farmacogenómicos o para diseño de fármacos. Tal como se describirá, la invención resulta particularmente adecuada para detectar, controlar o tratar trastornos de células proliferativas.

Introducción a la invención

Los ácidos nucleicos ADN y ARN son macromoléculas que actúan para almacenar información genética en el núcleo celular (ADN) y para tranferir información genómica hacia el citoplasma después de un proceso denominado transcripción, que genera un ARN mensajero para producir una proteína. Ambos son polímeros lineales compuestos de monómeros denominados nucleótidos. El ADN y el ARN representan cada uno combinaciones de cuatro tipos de nucleótidos. Todos los nucleótidos tienen una estructura común: un grupo fosfato unido mediante un enlace fosfodiéster a una pentosa que, a su vez, está unida a una base orgánica: adenina, citosina, timina y guanina (A, C, T, G) para el ADN, y adenina, citosina, uracilo y guanina (A, C, U, G) para el ARN. En el ARN, la pentosa es ribosa, y en el ADN, es desoxirribosa. La molécula de ADN está organizada como una doble cadena de nucleótidos ordenados dispuestos en forma de una doble hélice. Las moléculas de ARN son polinucleótidos monocatenarios que principalmente producen 4 tipos de moléculas: 1) ARN mensajero (ARNm), que son nucleótidos monocatenarios que se transcriben desde el ADN y se traducen en proteínas en el citoplasma, 2) ARN de transferencia (ARNt), que adopta una estructura tridimensional bien definida y se une a aminoácidos (AA) específicos que son transferidos a cadenas polipeptídicas para formar proteínas con secuencias de AA específicas en un proceso denominado traducción, 3) ARN ribosómico (ARNr), que son moléculas más grandes que, junto con proteínas específicas, constituyen el ribosoma, una estructura que permite el ensamblaje de AA para producir proteínas siguiendo la información proporcionada por la secuencia especificada por los codones (un codón = 3 nucleótidos) presentes en un orden concreto sobre el ARNm, y 4) ARN corto regulador, denominado ARN no codificador (ARNnc). La secuencia de ARNm entonces se transforma en un lenguaje diferente, es decir, el lenguaje de AA, mediante un proceso denominado traducción.

En la presente, los inventores demuestran que, por primera vez, la fidelidad de la transcripción, es decir, la transferencia de información del ADN al ARNm, se reduce notablemente en células patológicas, en particular en células del cáncer. Esta falta de fidelidad en la transcripción en las células del cáncer es un fenómeno general que afecta a todos los cánceres y a la mayoría de los genes ensayados en los ejemplos ofrecidos, así como a la mayoría de las transcripciones presentes en las bases de datos disponibles, y que tiene varias implicaciones inmediatas e importantes. En particular, el descubrimiento de la infidelidad de la transcripción permite mejorar las estrategias proteómicas y transcriptómicas que se emplean en la actualidad para la investigación de trastornos patológicos. El descubrimiento de la infidelidad de la transcripción también permite una mejor clasificación de las enfermedades con respecto a su gravedad, y mejora la predicción del efecto terapéutico y el diseño de nuevos métodos para seleccionar fármacos con respecto a su eficacia basándose en su capacidad para corregir la falta o una modificación en la fidelidad de la transcripción. La presente invención, por tanto, tiene implicaciones y utilidades muy importantes en el diagnóstico y en el desarrollo de fármacos, así como en el tratamiento, la detección y el control de pacientes y en la eficacia de fármacos.

Para comprender el impacto del descubrimiento descrito a continuación, es importante reconocer que, en la actualidad, se cree que es necesaria una absoluta fidelidad en la transcripción del ADN al ARN para la función celular normal. Sin embargo, en la actualidad se sigue planteando una cuestión importante aún no resuelta. En efecto, la secuenciación y la anotación del genoma humano condujo a la idea de que están codificados 30-40 mil genes. Este cálculo sigue siendo mucho menor que el número de proteínas que pueden identificarse en la actualidad mediante métodos proteómicos: se han identificado hasta 300 mil proteínas. Para reconciliar estas diferencias, se ha propuesto que un único gen pueda producir varios ARNm diferentes que codifiquen diferentes proteínas mediante un proceso denominado corte y empalme alternativo. El corte y empalme alternativo elimina diferentes partes de un ARN premensajero (ARNpm), conduciendo con ello a la eliminación de diferentes elementos que corresponden a intrones específicos, y produce diferentes ARNm maduros. El análisis de la base de datos RefSeq indica que contiene 11259 transcripciones que corresponden a 6946 genes. Por tanto, el corte y empalme alternativo puede aumentar la heterogeneidad de las transcripciones en 76%. El mecanismo que describen en la presente los inventores es diferente del corte y empalme alternativo, e induce una heterogeneidad de proteínas mucho mayor. En efecto, los inventores demuestran la aparición de modificaciones no aleatorias en la secuencia del ARNm que producen cambios en los AA codificados, la introducción de codones de fin prematuros que producen isoformas de proteínas más cortas, y la alteración de los codones de fin naturales que implica la introducción de nuevas secuencias codificadoras que producen isoformas de proteínas alargadas. La introducción de huecos e inserciones modifica así el marco de lectura del ARNm y crea de ese modo secuencias de proteínas insospechadas. Los datos descritos en esta invención demuestran que este fenómeno de infidelidad de la transcripción está presente en células normales pero está notablemente potenciado en células patológicas, tales como células derivadas de un cáncer. Por tanto, se propone que la infidelidad de la transcripción (IT) contribuye a la diversificación de la información transferida desde el ADN al ARN. Los resultados de los investigadores también establecen que la infidelidad de la transcripción no se produce de modo aleatorio, sino que sigue unas reglas específicas en las que resulta importante el contexto que rodea a b0, las bases afectadas por el acontecimiento de IT.

Es posible imaginarse otro mecanismo para explicar que la heterogeneidad del ARN no aparece a nivel genómico sino a nivel de ARN: la edición de ARN. Sin embargo, la edición de ARN no puede explicar dos tipos del acontecimiento de IT, la introducción de huecos y la inserción. La edición de ARN se caracteriza por unos cambios de bases postranscripcionales en el ARNm y ARNt en eucariotas. La inmensa mayoría de los acontecimientos de edición de sustitución conocidos consisten en conversiones de C a U, o de A a I (leído como G) (Gott, J.M. y Emeson, R.B. (2000), Annu. Rev. Genet., 34, 499-531; Maas, S. y Rich, A. (2000), Bioessays, 22, 790-802; Niswender, C.M. (1998), Cell Mol. Life Sci., 54, 946-964). Diferentes trabajos han demostrado que estas conversiones surgen a través de mecanismos de desaminación, catalizados por adenosina y citidina desaminasas.

Otro acontecimiento de edición de sustitución es la converción de “U a C”. Aunque la teoría de la reversibilidad microscópica dicta que la reacción de la citidina desaminasa puede ir hacia atrás para generar esta conversión, también se ha propuesto que una actividad de tipo CTP sintetasa puede ser responsable. Se ha demostrado en varios ejemplos que la edición de ARN puede ser específica de células de cáncer frente a células normales. Además, la tasa de este fenómeno puede verse afectada en condiciones de cáncer.

En el conjunto con cáncer, a nivel de ADNc, los inventores observaron cambios de 5,7% de C  T, 9,2% de T  C, y 4,7% de A  G. Por tanto, la edición de ARNm puede justificar no más que 20% de las sustituciones de una sola base descritas en la presente. En efecto, las sustituciones de bases más comunes, A  C (24,6%) y T  G (16,8%), representan cambios en la familia de bases que, en la actualidad, no pueden explicarse por los procesos de edición del ARN enzimáticos humanos conocidos.

Además, se espera que la infidelidad de la transcripción provoque deleciones y/o inserciones de bases a través de un mecanismo (o mecanismos) diferente de la edición del ARNm. Además, un estudio reciente ha demostrado que una serie de registros de dbSNP (“Single Nucleotide Polymorphism dababase”, base de datos de polimorfismos de nucleótidos individuales) son, de hecho, sitios de edición (Eisenberg, E. et al. (2005), Nucleic Acids Res., 33 (14), 4612-4617). En la estrategia de los inventores, no se han considerado todos los SNP de dbSNP, por tanto se excluyen los SNP conocidos o los SNP falsos que corresponden a sitios de edición.

Por tanto, el mecanismo para explicar la heterogeneidad del ARNm en el cáncer observada es la infidelidad de la transcripción.

Otro estudio (Ruiz et al., 2004, Clinical cancer Research 10 (8), 2560-2567) se refiere a la identificación de linfocitos T colaboradores determinantes de antígeno carcinoembriónico, y que se predice que son potenciales enlaces a moléculas HLA-DR. Sin embargo, este documento no describe ninguna secuencia ni péptido sintético, como reivindican los presentes inventores.

Sumario de la presente invención

La presente invención se refiere a péptidos sintéticos, composiciones y usos de los mismos para fines terapéuticos y de diagnóstico, por ejemplo, para detectar y/o tratar enfermedades de células proliferativas El objeto de esta invención se refiere al uso de un péptido sintético como se define en las reivindicaciones.

La invención también describe el uso de un compuesto que altera (por ejemplo, reduce o aumenta) la tasa de la infidelidad de la transcripción de un gen de mamífero para la fabricación de una composición farmacéutica para su uso en un método de tratamiento de un ser humano o de un animal, en particular para tratar enfermedades tales como trastornos de células proliferativas incluyendo, pero no limitándose a, cánceres, enfermedades inmunes, enfermedades inflamatorias o envejecimiento.

La invención también describe métodos y productos (tales como sondas, cebadores, anticuerpos o sus derivados) para detectar o medir (el nivel de) la infidelidad de la transcripción en una muestra, así como los correspondientes kits.

La invención describe además métodos para identificar secuencias de infidelidad de la transcripción en proteínas o en ácidos nucleicos, así como su uso, por ejemplo, como marcadores, inmunógenos y/o para generar ligandos específicos para ellos.

A este respecto, la invención describe un método para identificar y/o producir biomarcadores, comprendiendo dicho método identificar, en una muestra procedente de un sujeto, la presencia de un sitio o sitios de infidelidad de la transcripción en una proteína o un ácido nucleico diana y, opcionalmente, determinar la secuencia de dicho sitio o sitios de infidelidad de la transcripción.

La invención también describe un método para identificar y/o producir un ligando específico para un rasgo o un trastorno patológico, comprendiendo dicho método identificar, en una muestra procedente de un sujeto que tiene dicho rasgo o trastorno patológico, la presencia de al menos un sitio de infidelidad de la transcripción en una o varias proteínas o ácidos nucleicos diana, opcionalmente determinando la secuencia de dicho al menos un sitio de infidelidad de la transcripción, y produciendo un ligando que se une de modo específico a dicha al menos una proteína (o dominio) o ácido nucleico creado mediante la infidelidad de la transcripción.

La invención resulta particularmente adecuada para identificar biomarcadores de trastornos de células proliferativas, tales como cánceres, enfermedades inmunes, enfermedades inflamatorias o envejecimiento. Es particularmente útil para producir ligandos que son específicos de tales trastornos en mamíferos, en particular ligandos que pueden detectar la presencia o gravedad de un trastorno proliferativo en un sujeto.

Esta invención también describe un ligando que se une de modo específico a una proteína (o dominio) o a un ácido nucleico creado mediante la infidelidad de la transcripción. El ligando puede ser un anticuerpo (o cualquier fragmento (tal como Fab, Fab’, CDR, etc.) o un derivado de éste, tal como se describirá a continuación), que se une de modo específico a una proteína (o dominio) creado mediante la infidelidad de la transcripción. El ligando también puede ser un ácido nucleico que se une de modo específico con un ácido nucleico creado mediante la infidelidad de la transcripción (por ejemplo, una sonda, un cebador, un ARNi (ARN de interferencia), etc.).

Esta invención también describe un péptido que comprende un dominio de una proteína creada mediante la infidelidad de la transcripción, en particular de una proteína de mamífero, más preferiblemente de una proteína humana. El péptido es generalmente un péptido sintético, es decir, un péptido que se ha preparado de modo artificial, por ejemplo, mediante síntesis química, síntesis y/o extensión de aminoácidos, digestión de proteínas, ensamblaje de péptidos, expresión recombinante, etc. El péptido comprende generalmente la secuencia de un fragmento C-terminal de dicha proteína. El péptido comprende preferiblemente menos de 100, 80, 75, 70, 65, 60, 50, 45, 40, 35, 30, 25 o incluso 20 aminoácidos (aunque, en otras realizaciones, la longitud del péptido puede ser mayor). La proteína puede ser una proteína de la superficie celular (por ejemplo, un receptor, etc.), una proteína segregada (por ejemplo, una proteína plasmática, etc.) o una proteína intracelular.

Otro aspecto de esta invención reside en el uso de un péptido sintético como se define anteriormente con una longitud de 100 aminoácidos o menos y, en particular, que comprende una secuencia seleccionada entre las SEQ ID NOs:1 a 5, 7 a 13, 15 a 18 y 20 a 32 para detectar o controlar trastornos de células proliferativas.

La invención también describe una composición de vacuna que comprende un péptido que comprende una parte de una proteína creada mediante la infidelidad de la transcripción. Un objetivo adicional de la invención reside en una composición de vacuna que comprende un péptido sintético, como se define anteriormente, con una longitud de 100 aminoácidos o menos, que comprende una secuencia seleccionada de SEQ ID NOs: 1 a 5, 7 a 13, 15 a 18 y 20 a 32, y opcionalmente un vehículo, excipiente y/o adyuvante adecuado.

Esta invención también se describe un método para producir un anticuerpo, comprendiendo dicho método inmunizar a un mamífero no humano con un péptido creado mediante la infidelidad de la transcripción. Un objetivo adicional de esta invención reside en un método para producir un anticuerpo, comprendiendo el método inmunizar a un mamífero no humano con un péptido sintético con una longitud de 100 aminoácidos o menos, que comprende una secuencia seleccionada de SEQ ID NOs: 1 a 5, 7 a 13, 15 a 18 y 20 a 32, como se define anteriormente, y recuperando anticuerpos que se unen a dicho péptido, o las correspondientes células productoras de anticuerpos. Opcionalmente, pueden producir derivados del anticuerpo.

La invención también describe un método para producir un anticuerpo, comprendiendo dicho método (i) identificar un dominio de una proteína creada mediante la infidelidad de la transcripción, y (ii) producir un anticuerpo que se une de modo específico a ese dominio. Opcionalmente, pueden producirse derivados del anticuerpo.

Esta invención también describe un anticuerpo que se une de modo específico a una parte de una proteína creada mediante la infidelidad de la transcripción, o un derivado de dicho anticuerpo que tiene sustancialmente la misma específicidad de antígeno. En particular, la invención reside en un anticuerpo, o derivado del mismo, que se une específicamente a un péptido sintético con una longitud de 100 aminoácidos o menos, que comprende una secuencia seleccionada de SEQ ID NOs: 1 a 5, 7 a 13, 15 a 18 y 20 a 32. El anticuerpo puede ser policlonal o monoclonal. El término derivado incluye cualquier fragmento (tal como Fab, Fab’, CDR, etc.) u otro derivado, tal como anticuerpos monocatenarios, anticuerpos bifuncionales, anticuerpos humanizados, anticuerpos humanos, anticuerpos quiméricos, etc.

Otro aspecto de esta invención se refiere a un anticuerpo o su derivado, según se definió anteriormente, que está conjugado con una molécula. La molécula puede ser un fármaco, un marcador, una molécula tóxica, un radioisótopo, etc.

La invención también describe al uso de un anticuerpo o su derivado, tal como se definió anteriormente, para detectar o cuantificar (por ejemplo, in vitro) la infidelidad de la transcripción de un gen.

La invención también se refiere al uso de un anticuerpo conjugado o su derivado, tal como se definió anteriormente, como medicamento o reactivo de diagnóstico.

La invención también describe un dispositivo o producto que comprende, inmovilizado sobre un soporte, un reactivo que se une de modo específico con una proteína o un ácido nucleico creado mediante la infidelidad de la transcripción. El reactivo puede ser, por ejemplo, una sonda, o un anticuerpo o su derivado.

La invención también describe un método para provocar o inducir o estimular la infidelidad de la transcripción en una célula, tejido u organismo. Este método puede comprender, generalmente, la introducción de un sitio de infidelidad de la transcripción en secuencias genómicas normales, por ejemplo, mediante un vector de terapia génica. Esta modificación puede dar como resultado la destrucción de una célula o un tejido. En particular, es posible crear un marco de lectura abierto en cualquier secuencia génica que de cómo resultado la producción de compuestos o proteínas tóxicas celulares. También es posible provocar la expresión, en una célula enferma (o diana), de un biomarcador específico que pueda fijarse como objetivo para moléculas tóxicas o terapéuticas. Utilizando esta estrategia, es por tanto posible provocar la muerte celular o una terapia cuando la infidelidad de la transcripción aparezca o exceda una tasa concreta.

La invención también describe el uso de un ácido nucleico que contiene un sitio o sitios de infidelidad de la transcripción para la fabricación de una composición farmacéutica para su uso en un método de tratamiento de un ser humano o animal. El gen puede ser cualquier gen, incluyendo un gen de mamífero o un gen procedente de un agente patógeno, tal como un gen vírico, un gen bacteriano, etc. A este respecto, la invención se refiere a un método para tratar una enfermedad provocada por un patógeno, comprendiendo dicho método provocar o estimular la infidelidad de la transcripción de un gen codificado por dicho patógeno.

En una realización particular, la invención se refiere a una molécula de ácido nucleico sintético que codifica un péptido de 100 aminoácidos o menos, que comprende una secuencia seleccionada de SEQ ID NOs: 1 a 5, 7 a 13, 15 a 18 y 20 a 32 para detectar o controlar trastornos de células proliferativas.

La invención también describe métodos para producir polipéptidos recombinantes in vitro con una infidelidad de la transcripción reducida. Estos métodos permiten una reducción en la microheterogeneidad en polipéptidos recombinantes. El método comprende utilizar células hospedantes que comprenden un ácido nucleico recombinante con una utilización de codones adaptada, para reducir la aparición de la infidelidad de la transcripción. El método también puede incluir el uso de cualquier compuesto o tratamiento que reduzca la aparición de la infidelidad de la transcripción. El método puede utilizarse en células hospedantes procariotas o eucariotas, por ejemplo, en cepas de E. coli o CHO.

La invención puede utilizarse en cualquier sujeto mamífero, en particular cualquier sujeto humano, para detectar, controlar o tratar una diversidad de trastornos patológicos asociados con trastornos de células proliferativas (por ejemplo, cánceres) y/o para producir, diseñar o seleccionar fármacos terapéuticamente activos.

Leyendas de las figuras

Figura 1: Principio de construcción y secuenciación de bancos de ADNc.

Figura 2: (a-q) Secuencias de referencia de ARNm utilizadas para el análisis. Para evitar distorsionar BLAST, la cola de poliA de las secuencias de referencia de ARNm se eliminó sistemáticamente. La figura 2r proporciona una lista de genes ensayados.

Figura 3: Archivos de salida MegaBLAST típicos.

Figura 4: Porcentaje de desviación de la secuencia de nucleótidos en cualquier posición para cada gen estudiado.

Figura 5: TPT1, VIM = número de EST y análisis del ensayo de proporción.

Figura 6: Variación en los EST antes y después de la aplicación secuencial de filtros electrónicos. Efectos de la eliminación de líneas celulares y Clip 400.

Figura 7: Contexto del ADN: a) Efecto de la composición de bases del ARNpm sobre la heterogeneidad de las bases b0. b) Composición de la base de sustitución para cada base sustituida. c) Reparto de bases afectadas y de sustitución dentro de ensayos C>N estadísticamente significativos. d) Efecto de la composición de bases del ARNpm sobre la base de sustitución que corresponde a la repetición de b-1 o b+1.

Figura 8: Variante de ARNm virtual y proteína para VIM.

Figura 9: Impacto en la codificación.

Figura 10: Proteínas de interés = secuencias de aminoácidos en las que el codón de fin se ve estadísticamente afectado.

Figura 11: DHPLC = principio y límites de la detección.

Figura 12: DHPLC = cebadores y productos de la PCR esperados.

Figura 13: Lista de 60 proteínas estudiadas.

Figura 14: Producción de anticuerpos.

Figura 15: Resultados de DHPLC.

Figura 16: Sensibildad de Sanger Figura 17: Detección de PSP de APOAII y APOCII en plasma de pacientes cancerosos.

Figura 18: PSP potencial en proteínas plasmáticas.

Figura 19: Evaluación de las predicciones de sustituciones en la secuencia del ARNm.

Descripción detallada de la invención

Definiciones

Infidelidad de la transcripción La expresión infidelidad de la transcripción indica un nuevo mecanismo mediante el cual se producen varias moléculas de ARN diferenciadas en una célula a partir de una única secuencia génica. Este mecanismo recién identificado afecta potencialmente a muchos genes, no es aleatorio, y sigue una reglas concretas, tal como se describirá a continuación. Tal como se muestra en los ejemplos, la infidelidad de la transcripción puede introducir sustituciones, deleciones e inserciones en moléculas de ARN, creando con ello una diversidad de proteínas a partir de un único gen. La infidelidad de la transcripción también puede afectar a secuencias de ARN no codificadoras, modulando con ello sus funciones. La medición, la modulación o la localización de la infidelidad de la transcripción, por tanto, representa una nueva estrategia para detectar o tratar trastornos, así como para el desarrollo de fármacos.

Sitio de infidelidad de la transcripción La expresión sitio de infidelidad de la transcripción indica una secuencia y/o una posición afectada por la infidelidad de la transcripción. Puede ser un dominio de ácido nucleico o de aminoácido que contenga al menos una modificación generada como resultado de la infidelidad de la transcripción. Dicha modificación puede ser el resultado, por ejemplo, de una conmutación en el marco de lectura (inserción y/o deleción), de la introducción o supresión de codones de fin, de la introducción de nuevos codones de inicio, de una sustitución o sustituciones de nucleótidos (que impliquen o no cambios en AA), etc. Un sitio de infidelidad de la transcripción puede comprender una o varias variaciones de la secuencia que sean el resultado de la infidelidad de la transcripción. Un sitio de infidelidad de la transcripción puede comprender, por ejemplo, un resto nucleótido o aminoácido modificado hasta, por ejemplo, 150 restos nucleótidos o aminoácidos modificados, o incluso más. El sitio de infidelidad de la transcripción generalmente se diferencia de la secuencia que resulta de una transcripción fiel en al menos una modificación de nucleótido o de aminoácido (por ejemplo, sustitución, deleción, inserción, inversión, etc.). Una proteína o un dominio creado mediante la infidelidad de la transcripción (proteína-IT) generalmente comprende de 1 a 50 aminoácidos (o incluso más), con al menos un resto aminoácidos modificado. Una secuencia de infidelidad de la transcripción de un ácido nucleico comprende generalmente de 1 a 150 nucleótidos (o incluso más), con al menos un resto nucleótido modificado.

Reglas e identificación de la infidelidad de la transcripción Basándose en técnicas específicas de detección y/o reglas concretas de la infidelidad de la transcripción según se define en la presente solicitud, ahora es posible predecir e identificar sitios de infidelidad de la transcripción en cualquier gen o proteína. Estos sitios también pueden obtenerse mediante el alineamiento de secuencias disponibles para un ARN concreto y la identificación de las sustituciones de bases. En última instancia pueden validarse mediante diversas técnicas, por ejemplo, utilizando ligandos específicos para una proteína-IT predicha.

Un método particular para identificar un sitio de infidelidad de la transcripción comprende: - proporcionar la secuencia de un gen, molécula de ARN o ADNc concretos, o una porción de éstos, e - identificar, dentro de dicha secuencia, la presencia de un cambio en algún nucleótido (por ejemplo, sustitución, deleción, inserción, inversión) que resulte de la infidelidad de la transcripción, siguiendo las reglas de la infidelidad de la transcripción, por ejemplo, tal como se analiza en (iii) a continuación.

Otro método particular para identificar un sitio de infidelidad de la transcripción comprende: - proporcionar la secuencia de una proteína concreta, o una porción de ésta, e - identificar, dentro de dicha secuencia, la presencia de un cambio en algún aminoácido (por ejemplo, sustitución, deleción, inserción, inversión) que resulte de la infidelidad de la transcripción, siguiendo las reglas de la infidelidad de la transcripción, por ejemplo, tal como se analiza en (iii) a continuación.

La presencia de un cambio resultante de la infidelidad de la transcripción en una molécula puede identificarse en un proceso en tres etapas, que comprende: (i) la identificación de sitios de infidelidad de la transcripción con una máquina de aprendizaje que se basa en la discriminacion cuadrática de fáctores de análisis factorial de correspondencia múltiple (MCFA), (ii) la identificación de la categoría de los sitios de infidelidad de la transcripción (b-1 o b+1 u otros) con el mismo método, y (iii) la predicción de la base de sustitución utilizando las siguiente reglas de la infidelidad de la transcripción: · Para cualquier base presente como un singletón, es decir, cualquier base que no esté precedida ni seguida por ella misma, entonces es muy probable que la base sustituida sea idéntica a la base que precede a la que está sustituida (en caso de la categoría b-1), o idéntica a la base que sigue a la que está sustituida (en el caso de la categoría b+1). Por ejemplo, CAT será CTT (regla b-1); ATG será AGG (regla b+1); · Cuando las sustituciones se producen dentro de tres A consecutivas, la sustitución de la segunda A preferentemente es a C; · Cuando las sustituciones se producen dentro de tres T consecutivas, la sustitución de la segunda T preferentemente es a C, después a A, después a G; · Los tramos de C y G raramente están sustituidos en la segunda, pero si se produce, la sustitución de la segunda C preferentemente es a A, y la sustitución de la segunda G preferentemente es a C; · Para otros casos, la base de sustitución es preferentemente C.

Otros métodos para identificar sitios de infidelidad de la transcripción dentro de la secuencia de cualquier proteína o ácido nucleido diana comprenden, por ejemplo, la comparación de marcadores de secuencia expresados (“expressed sequence tag”, EST) existentes, la amplificación directa de secuencias identificadas y la secuenciación de productos de la amplificación con un método de secuenciación específico (Sanger, químico, pirosecuenciación).

Esta estrategia produce secuencias variantes que implican cambios en AA, modificaciones de la longitud de la proteína, etc. Entonces pueden diseñarse oligonucleótidos que se aparean de modo selectivo con ARNm o ADNc que portan sitios de infidelidad de la transcripción, permitiendo la amplificación selectiva de nucleótidos con sitios de infidelidad de la transcripción a partir de un agrupación de secuencias. También pueden producirse anticuerpos que se dirijan a una proteína-IT.

Como alternativa, es posible identificar un sitio de infidelidad de la transcripción mediante el análisis de la secuencia o mediante reglas bioinformáticas. La secuencia resultante puede clonarse en cualquier vector de transfección. También es posible diseñar una construcción que comprenda dicha secuencia de infidelidad de la transcripción dentro de marco con un gen indicador, que será transcrito y traducido sólo si se produce la infidelidad de la transcripción. El gen indicador puede ser una enzima o una proteína fluorescente o cualquier gen que haga que la célula diana sea sensible, o resistente a la exposición a una toxina.

Un método detallado que permite la identificación de los sitios de infidelidad de la transcripción (o sustituciones) incluye el método TDG según se describe a continuación.

Una técnica descrita por Pan y Weissman y Liu et al. (PNAS, 2002, 99 (14), 9346-9351; y Anal. Biochem., 1 de septiembre, 2006, 356 (1):117-124) puede adaptarse para detectar un sitio o sitios de infidelidad de la transcripción en el ARN. Esta técnica se basa en el uso de una enzima, la timina ADN glicosilasa (TDG), que es capaz de enriquecer por separado dúplex de ADN que contienen desapareamientos en mezcla complejas. Estas enzimas reconocen de modo específico los desapareamientos de nucleótidos y generan sitios abásicos (el enlace entre la desoxirribosa y una de las bases del ADN está roto). Entonces, la TDG puede unirse de modo reversible a estos sitios abásicos y, por tanto, puede utilizarse para la purificación por afinidad de los fragmentos de ADN que contienen desapareamientos. En un experimento típico, el ARN se extrae de 2 tipos celulares (normal y canceroso) y se somete a una transcripción inversa para fabricar ADNc bicatenario. Después de una desnaturalización térmica y una lenta renaturalización de cada muestra, se genera un ADNc con uno o más desapareamientos y puede separarse de los dúplex perfectos. Estos ADNc entonces pueden analizarse mediante secuenciación directa, o compararse mediante DHPLC (véase a continuación).

Otras técnicas que pueden adaptarse para identificar sitios de infidelidad de la transcripción o mutaciones se describen, por ejemplo, en los documentos US 6.329.147, US 4.979.330, WO 02/077286 o US 6.120.992.

Generalmente, los métodos para identificar sitios de infidelidad de la transcripción comprenden también una etapa de validar la secuencia del sitio de infidelidad de la transcripción produciendo una molécula que comprende la secuencia identificada, generando un ligando que se une de modo específico a dicha molécula, y verificando en una muestra biológica la presencia de un antígeno que es reconocido de modo específico por dicho ligando.

Una secuencia de infidelidad de la transcripción típica de un ácido nucleico es una secuencia con una longitud entre 1 y 150 nucleótidos que comprende al menos una sustitución, deleción o inserción de bases provocada por la infidelidad de la transcripción, preferiblemente siguiendo una regla según se describe en el ejemplo 5. La secuencia de infidelidad de la transcripción puede ser mayor.

Un dominio típico de una proteína-IT es una secuencia de aminoácidos con una longitud entre 1 y 50 aminoácidos que comprende al menos una sustitución de un aminoácido (o más cambios debidos a la modificación en el marco de lectura como resultado de una deleción o inserción de bases) provocada por la infidelidad de la transcripción, preferiblemente siguiendo una regla según se describe en el ejemplo 5. El dominio de una proteína-IT puede ser mayor. Los ejemplos de proteínas-IT se proporcionan en la sección experimental, por ejemplo, en las figuras 13 y 14.

Detectar o medir la infidelidad de la transcripción

Esta invención describe un descubrimiento inesperado de que se produce una alta tasa de anomalías de secuencias naturales durante o al poco tiempo después de la transcripción del ADN a ARN. El proceso puede estar presente en células normales, pero aumenta mucho en células patológicas, por ejemplo, células del cáncer. El descubrimiento de que la transcripción del ADN en ARN está introduciendo variaciones en la secuencia siguiendo unas reglas que son diferentes de las definidas por las complementariedades de bases una a una permite el diseño lógico de nuevos reactivos (por ejemplo, sondas, cebadores, anticuerpos, aptámeros, etc.) que sean específicos para el ácido nucleico o la proteína creada mediante la infidelidad de la transcripción. Estos reactivos por tanto permiten detectar o medir la infidelidad de la transcripción, y discriminar entre condiciones normales o enfermas, así como el transporte dirigido de moléculas a células que muestren una infidelidad de la transcripción.

Además, la invención también describe el diseño lógico de reactivos (por ejemplo, sondas, cebadores, anticuerpos, aptámeros) que sean predictivos de la gravedad de una enfermedad (por ejemplo, cáncer). En efecto, se espera que una mayor tasa de infidelidad de la transcripción se correlacione con la gravedad de la enfermedad, y esta tasa aumenta progresivamente a medida que más y más productos génicos se ven afectados. La medición directa de la (in)fidelidad de la transcripción en una célula o células enfermas utilizando los métodos descritos en la presente o cualquier otra tecnología permite detectar células en diferentes etapas de avance de la enfermedad en cualquier tejido concreto. La medición precisa de estas variaciones en la expresión génica (transcripciones y proteínas) también mejora la capacidad para evaluar la eficacia de fármacos con respecto a la gravedad de la enfermedad. En la actualidad, diversas técnicas de micromatrices permiten la medición de los cambios en la expresión génica. Sin embargo, la fiabilidad y, de modo más importante, la reproducibildad de estos datos en la actualidad no es suficiente. Los inventores ahora pueden postular que una gran parte de la variabilidad de estos experimentos transcriptómicos es provocada, en parte, por la infidelidad de la transcripción según ha sido descubierta por los inventores. Por tanto, el descubrimiento de este fenómeno común permite el diseño de reactivos de expresión génica que se vean mínimamente afectados por la infidelidad de la transcripción, o que directamente reflejen la infidelidad de la transcripción que se produce en secuencias específicas siguiendo las reglas descritas en la presente solicitud.

También es posible e incluso probable que la infidelidad de la transcripción esté modulada por la tasa de transcripción. Los inventores especulan que un aumento en la expresión de un gen concreto en un trastorno patológico aumentará la IT y así aumentará la heterogeneidad de proteínas.

La infidelidad de la transcripción puede detectarse o medirse utilizando una serie de técnicas conocidas per se en la técnica, que pueden adaptarse. En particular, la infidelidad de la transcripción puede medirse utilizando reactivos específicos para ácidos nucleicos o proteínas creadas mediante la infidelidad de la transcripción, tales como sondas, cebadores o anticuerpos específicos, mediante electroforesis, análisis de migración en gel, espectrometría, etc., que permitan la detección entre varias formas de una proteína o de un ácido nucleico. La tasa de la infidelidad de la transcripción puede determinarse evaluando el número de genes en una células que están sometidos a la infidelidad de la transcripción y/o el número de sitios de infidelidad de la transcripción generados para un gen concreto. Esta tasa puede determinarse comparando el nivel de ácidos nucleicos o proteínas creados mediante la infidelidad de la transcripción en una muestra de ensayo, con el obtenido en una muestra de referencia.

Detección de la infidelidad de la transcripción a nivel de ácidos nucleicos

Tal como se analizó anteriormente, la infidelidad de la transcripción introduce una variación o variaciones en la secuencia de moléculas de ARN. La detección o la medición de la infidelidad de la transcripción por tanto puede realizarse detectando la presencia o la cantidad (absoluta o relativa) de dicha variación o variaciones en la secuencia de los ARN codificados por uno o varios genes, o en una célula entera o tejido o muestra. La detección de la infidelidad de la transcripción en ácidos nucleicos puede realizarse mediante diversas técnicas, tales como hibridación, amplificación, formación de heterodúplex, etc.

Casi todas las tecnologías utilizadas para la identificación de nucleótidos presentes en diversos tipos de tejidos se basa en un proceso denominado hibridación. La hibridación resulta crítica para tecnologías, tales como micromatrices, utilizadas para identificar polimorfismos y para buscar variaciones en la expresión génica. Esta técnica se aplica para medir el nivel de expresión génica. La hibridación de sondas oligonucleotídicas también se emplea para retirar secuencias de genes que se expresan con abundancia para permitir un mejor estudio de los mensajes de baja abundancia; este procedimiento se denomina hibridación sustractiva. La hibridación también es la primera etapa de la reacción de amplificación de genes que se emplea habitualmente en experimentos de PCR, en la forma directa o después de la aplicación de la transcriptasa inversa para convertir la secuencia del mensaje desde una secuencia de tipo ARN a una secuencia de tipo ADN.

El mecanismo básico que subyace a la hibridación es que la secuencia o secuencias de nucleótidos monocaternarias pueden unirse entre sí con la condición de que sus respectivas secuencias sean complementarias. Tanto la longitud como la ordenación específica de cada una de las 4 bases define la eficacia de la hibridación y la especificidad de la secuencia. Esto implica que cada base específica se une de manera no covalente a su base complementaria: A a T, y C a G, y viceversa. Esta unión no covalente en un apareamiento de secuencias está condicionada por la ordenación de la base. Así, en la práctica general, una secuencia definida de bases se une a una única secuencia complementaria. Esta reacción de unión específica proporciona la base para la hibridación que permite la identificación de cualquier secuencia complementaria en cualquier mezcla concreta de nucleótidos. La eficacia de la hibridación viene determinada por el número de bases que, en el orden apropiado, se aparean entre sí (se tolera un cierto grado de desapareamientos) y también por las condiciones del experimento, tales como la rigurosidad del tampón de unión, el contenido relativo en CG frente a TA (CG y TA están unidos mediante 3 y 2 enlaces de hidrógeno, respectivamente) y por la temperatura de fusión, es decir, la temperatura necesaria para permitir la disociación del 50% del ADN bicatenario.

La detección de la infidelidad de la transcripción empleando la hibridación generalmente comprende colocar una muestra en contacto con una sonda de ácido nucleico que sea específica para una secuencia de infidelidad de la transcripción, y detectar la presencia (o cantidad) de los híbridos formados, siendo dicha presencia o cantidad una indicación directa de la presencia o la tasa de la infidelidad de la transcripción. En una realización preferida, el método emplea un conjunto de sondas de ácidos nucleicos que son específicas para secuencias de infidelidad de la transcripción diferenciadas de uno o varios genes, respectivamente. Pueden prepararse sondas de ácidos nucleicos específicas para una secuencia de infidelidad de la transcripción para cualquier gen, empleando la información de la secuencia y las reglas de sustitución, inserción o deleción de nucleótidos según se describe en la presente solicitud (véase, por ejemplo, el ejemplo 5).

Una “sonda” de ácido nucleico se refiere a un ácido nucleico u un oligonucleótido que tiene una secuencia polinucleotídica que es capaz de una hibridación selectiva con una secuencia de infidelidad de la transcripción o su complemento, y que es adecuada para detectar la presencia (o su cantidad) en una muestra que contiene dicha secuencia o complemento. Las sondas preferiblemente son perfectamente complementarias con una secuencia de infidelidad de la transcripción, aunque se tolera un cierto grado de desapareamiento. Las sondas comprenden generalmente ácidos nucleicos monocatenarios con una longitud de 8 a 1500 nucleótidos, por ejemplo entre 10 y 1000, más preferiblemente entre 10 y 800, generalmente entre 20 y 700. Debe entenderse que también pueden emplearse sondas más largas. Por ejemplo, una sonda puede ser una molécula de ácido nucleico monocatenario de 8 a 400 nucleótidos de longitud, que puede hibridarse de modo específico con una secuencia de infidelidad de la transcripción.

Típicamente una sonda de ácido nucleico se hibrida de modo selectivo con una región de una molécula de ácido nucleico que no contiene una secuencia de infidelidad de la transcripción.

La selectividad, cuando se emplea para indicar la hibridación de ácidos nucleicos, indica que la hibridación de la sonda con la secuencia diana es diferente de la hibridación de dicha sonda con otra secuencia. A este respecto, aunque no sea necesaria una complementariedad perfecta entre la sonda y la secuencia diana, será lo suficientemente elevada como para permitir una hibridación selectiva.

Las sondas típicamente comprenden una secuencia que es complementaria con una secuencia de infidelidad de la transcripción en una molécula de ARN (o la correspondiente molécula de ADNc) que codifica una proteína de la superficie celular o una proteína segregada. Ejemplos de sondas se seleccionan de sondas que tienen una secuencia complementaria con una secuencia de infidelidad de la transcripción, o codifican una secuencia peptídica de una cualquiera de SEQ ID NO:1 a 32.

La secuencia de las sondas puede modificarse, por ejemplo, químicamente, por ejemplo para aumentar la estabilidad de los híbridos (por ejemplo, grupos intercalantes o nucleótidos modificados, tales como 2’- alcoxirribonucleótidos) o para marcar la sonda. Los ejemplos típicos de marcadores incluyen, sin limitación, radiactividad, fluorescencia, luminiscencia, marcaje enzimático y similares. La sonda puede hibridarse con el ácido nucleico diana en disolución, suspensión, o unido a un soporte sólido tal como, sin limitación, una esfera, una columna, una placa, un sustrato (para producir chips o matrices de ácidos nucleicos), etc.

La infidelidad de la transcripción se puede detectar o medir mediante amplificación selectiva utilizando cebadores específicos. La detección de la infidelidad de la transcripción mediante amplificación selectiva generalmente comprende colocar una muestra en contacto con un cebador de ácido nucleico que amplifica de modo específico una secuencia de infidelidad de la transcripción, y detectar la presencia (o la cantidad) de los productos de la amplificación formados, siendo dicha presencia o cantidad una indicación directa de la presencia o la tasa de la infidelidad de la transcripción. En una realización preferida, el método utiliza un conjunto de cebadores de ácidos nucleicos que permiten una amplificación específica de una secuencia de infidelidad de la transcripción diferenciada de uno o varios genes, respectivamente. La amplificación puede realizarse según diversas técnicas conocidas per se en la técnica tales como, sin limitación, la reacción en cadena de la polimerasa (PCR), la reacción en cadena de la ligasa (LCR), la amplificación mediada por la transcripción (TMA), la amplificación por desplazamiento de hebra (SDA), y la amplificación basada en la secuencia del ácido nucleico (NASBA).

Los cebadores de ácidos nucleicos específicas para una secuencia de infidelidad de la transcripción pueden prepararse para cualquier gen utilizando la información de la secuencia y las reglas de sustitución, inserción o deleción de nucleótidos según se describe en la presente solicitud (véase, por ejemplo, el ejemplo 5).

El término “cebador” indica un ácido nucleico o un oligonucleótido que tiene una secuencia polinucleotídica que es capaz de una hibridación selectiva con una secuencia de infidelidad de la transcripción o su complemento, o con una región de un ácido nucleico que flanquea un sitio de infidelidad de la transcripción, y que es adecuado para amplificar todo o parte de dicho sitio de infidelidad de la transcripción en una muestra que contenga dicha secuencia o complemento. Típicamente los cebadores se pueden seleccionar entre moléculas de ácidos nucleicos monocatenarios con una longitud de aproximadamente 5 a 60 nucleótidos, más preferiblemente una longitud de aproximadamente 8 a aproximadamente 50 nucleótidos, aún más preferiblemente una longitud de aproximadamente 10 a 40, 35, 30 ó 25 nucleótidos. Se prefiere una complementariedad perfecta, para asegurar una alta especificidad. Sin embargo, pueden tolerarse ciertos desapareamientos, tal como se analizó anteriormente para las sondas.

El término “flanquea” indica que la región debe localizarse a una distancia del sitio de infidelidad de la transcripción que sea compatible con las actividades polimerasa convencionales, por ejemplo, no más de 250 pb, preferiblemente no más de 200, 150, 100 o, más preferiblemente, 50 pb cadena arriba de dicho sitio.

Esta invención también describe al menos un par de cebadores de ácidos nucleicos, en el que dicho par de cebadores comprende un cebador directo y un cebador inverso, y en el que dichos cebadores directo e inverso permiten la amplificación selectiva de una secuencia de infidelidad de la transcripción, o de la secuencia exactamente complementaria, por ejemplo, en la figura 12.

La infidelidad de la transcripción se puede medir mediante una cromatografía líquida de alta resolución desnaturalizante (DHPLC). El principio de este método se describe, por ejemplo, en la figura 11. Básicamente, los productos de la amplificación se desnaturalizan y se reasocian. Durante la reasociación se forman homodúplex y heterodúplex, como resultado de la presencia de secuencias de infidelidad de la transcripción. La mezcla entonces se analiza mediante DHPLC. Puesto que las estructuras de ADN heterodúplex y homodúplex son diferentes en la temperatura del análisis se eluyen de modo diferente y su cantidad (relativa) puede evaluarse.

Como verificación de que las secuencias de infidelidad de la transcripción existen en células cancerosas con una frecuencia más alta que en células normales, la infidelidad de la transcripción predicha de genes seleccionados (ENO1, GAPDH, TMSB4X) se amplifica mediante RT-PCR utilizando los oligonucleótidos indicados (véase el ejemplo 6). Se verificaron las variaciones de homo- y heterodúplex (figura 15).

Otra técnica adecuada para detectar ácidos nucleicos puede utilizarse o adaptarse para detectar, cuantificar o controlar la infidelidad de la transcripción.

Detección de la infidelidad de la transcripción a nivel de proteínas

Debido a que la infidelidad de la transcripción conduce a cambios en la secuencia de proteínas, la presencia o el nivel de infidelidad de la transcripción también puede medirse detectando la presencia o la cantidad de proteínas-IT.

Pueden utilizarse y/o adaptarse diversas técnicas conocidas per se en la técnica para medir la infidelidad de la transcripción en proteínas. En particular, puesto que la infidelidad de la transcripción provoca modificaciones en las proteínas que conducen a cambios directos en su comportamiento, estos cambios puede detectarse, por ejemplo, mediante una electroforesis en gel bidimensional y espectrometría de masas, o mediante ionización de desorción por láser inducida en superficie. Como verificación de que una proteína-IT está presente en plasma humano, los inventores muestran el perfil de espectrometría de masas de un péptido localizado después del codón de fin canónico de ApoAII. Los datos de la espectrometría de masas muestran que la arginina está sustituida en el codón de fin canónico. Además, puesto que la infidelidad de la transcripción provoca la aparición de isoformas de proteínas (celulares y plasmáticas) más largas y más cortas (como resultado del codón de fin prematuro debido a la sustitución de bases, o una conmutación en el marco de lectura abierto en el caso de deleciones o inserciones), dichas isoformas pueden detectarse o cuantificarse utilizando sus ligandos específicos y/o estrategias de secuenciación de proteínas. A este respecto, los inventores demuestran que los cambios en la longitud de la proteína y de la secuencia primaria de AA se producen predominantemente en el dominio carboxi-terminal de la proteína. Por consiguiente, las estrategias de secuenciación deben dirigirse principalmente al extremo C-terminal de las proteínas, una región previamente insospechada (en efecto, los métodos de secuenciación de proteínas directos que se emplean en la actualidad sólo pueden realizarse comenzando en el AA NH2-terminal).

La detección de la infidelidad de la transcripción utilizando ligandos específicos generalmente comprende colocar una muestra en contacto con un ligando que sea específico para un dominio de una proteína-IT, y detectar la presencia (o cantidad del complejo formado, siendo dicha presencia o cantidad una indicación directa de la presencia o la tasa de la infidelidad de la transcripción. En una realización preferida, el método emplea un conjunto de ligandos que son específicos para dominios diferenciados de una o varias proteínas-IT, respectivamente. Los ligandos específicos para estos dominios pueden prepararse para cualquier proteína utilizando la información de la secuencia y las reglas de sustitución de aminoácidos según se describe en la presente solicitud (véase, por ejemplo, el ejemplo 5). El ligando puede utilizarse en forma soluble, o puede revestirse sobre una superficie o un soporte.

La invención también describe ligandos que se unen de modo selectivo a un dominio de una proteína-IT. Pueden contemplarse diferentes tipos de ligandos, tales como anticuerpos específicos, moléculas sintéticas, aptámeros, péptidos y similares.

El ligando puede ser un anticuerpo, o su fragmento o derivado. Por consiguiente, un aspecto concreto de esta invención reside en un anticuerpo que se une de modo específico a un dominio de una proteína-IT.

Dentro del contexto de esta invención, un anticuerpo indica un anticuerpo policlonal, un anticuerpo monoclonal, así como sus fragmentos o derivados que tienen sustancialmente la misma especificidad de antígeno. Los fragmentos incluyen, por ejemplo, Fab, Fab’2, regiones CDR, etc. Los derivados incluyen anticuerpos monocatenarios, anticuerpos humanizados, anticuerpos humanos, anticuerpos polifuncionales, etc.

Los anticuerpos contra dominios de proteínas-IT pueden producirse mediante procedimientos conocidos en general en la técnica. Por ejemplo, pueden producirse anticuerpos policlonales inyectando el dominio de la proteína-IT (por ejemplo, como una proteína o un péptido) solo o acoplado con una proteína adecuada en un animal no humano. Después de un periodo apropiado se sangra al animal, se recupera el suero y se purifica mediante técnicas conocidas en la técnica (Paul, W.E., “Fundamental Immunology”, 2ª ed., Raven Press, NY, p. 176, 1989; Harlow et al., “Antibodies: A Laboratory Manual”, CSH Press, 1988; Ward et al., Nature, 341 (1989), 544).

Pueden producirse péptidos con la misma secuencia que las proteínas-IT mediante procedimientos conocidos en general en la técnica. Estos péptidos pueden acoplarse a un soporte adecuado y utilizarse para la deteccón de autoanticuerpos presentes en muestras biológicas (por ejemplo, fluidos corporales).

Pueden prepararse anticuerpos monoclonales contra dominios de proteínas-IT, por ejemplo, mediante la técnica de Kohler-Millstein (2) (Kohler-Millstein, Galfre, G., y Milstein, C., Methods Enz., 73, p. 1 (1981)) que implica la fusión de un linfocito B inmunológico con células de mieloma. Por ejemplo, un inmunógeno, según se describió anteriormente, puede inyectarse en un mamífero no humano, según se ha descrito. Posteriormente se retira el bazo y se realiza la fusión con el mieloma según una diversidad de métodos. Las células de hibridoma resultantes entonces pueden ensayarse para la secreción de anticuerpos contra dominios de proteínas-IT.

Un anticuerpo “selectivo” para un dominio concreto de proteínas-IT indica un anticuerpo cuya unión a dicho dominio (o a su fragmento que contiene un epitopo) puede discriminarse de modo fiable de la unión no específica (es decir, de la unión a otro antígeno, en particular a la proteína nativa que contiene dicho dominio). Los anticuerpos selectivos para los dominios de las proteínas-IT permiten la detección de la presencia de proteínas que contienen dichos dominios en una muestra.

Diagnóstico

La presente invención describe la realización de ensayos de detección o de diagnóstico que pueden emplearse, entre otras cosas, para detectar la presencia, la ausencia, la predisposición, el riesgo o la gravedad de una enfermedad a partir de una muestra derivada de un sujeto. Debe considerarse que el término “diagnóstico” incluye métodos de farmacogenómica, prognóstico, etc.

La invención describe un método para detectar in vitro o ex vivo la presencia, la ausencia, la predisposición, el riesgo o la gravedad de enfermedades en una muestra biológica, preferiblemente una muestra biológica humana, que comprende colocar dicha muestra en contacto con un ligando que se une de modo específico a un sitio de infidelidad de la transcripción, y determinar la formación de un complejo.

Esta invención también describe un método para detectar la presencia, la ausencia, la predisposición, el riesgo o la gravedad de cánceres en un sujeto, comprendiendo dicho método colocar in vitro o ex vivo una muestra procedente de un sujeto en contacto con un ligando que se une de modo específico a un sitio de infidelidad de la transcripción expresado por las células del cáncer, y determinar la formación de un complejo.

Esta invención también describe un método para evaluar la respuesta o la sensibilidad de un sujeto a un tratamiento de un cáncer, comprendiendo dicho método detectar la presencia o la tasa de la infidelidad de la transcripción en una muestra procedente del sujeto en diferentes momentos antes y durante el desarrollo del tratamiento.

Esta invención también describe un método para determinar la eficacia de un tratamiento de una enfermedad cancerosa, comprendiendo dicho método (i) proporcionar una muestra de tejido procedente del sujeto durante o después de dicho tratamiento, (ii) determinar la presencia y/o la tasa de la infidelidad de la transcripción en dicha muestra, y (iii) comparar dicha presencia y/o tasa con la cantidad de infidelidad de la transcripción en una muestra de referencia procedente de dicho sujeto tomada antes o en una etapa más temprana del tratamiento.

La presencia (o aumento) de la infidelidad de la transcripción en una muestra es indicativa de la presencia, la predisposición o la etapa de avance de una enfermedad cancerosa. Por tanto, la invención describe el diseño de la intervención terapéutica apropiada, que será más eficaz y personalizada. Además, esta determinación a nivel presintomático permite aplicar un régimen preventivo.

Los métodos de diagnóstico descritos en la presente invención pueden realizarse in vitro, ex vivo o in vivo, preferiblemente in vitro o ex vivo. La muestra puede ser cualquier muestra biológica derivada de un sujeto, que contenga ácidos nucleicos o polipéptidos, según sea apropiado. Los ejemplos de dichas muestras incluyen fluidos corporales, tejidos, muestras de células, órganos, biopsias, etc. Las muestras más preferidas son sangre, plasma, suero, saliva, orina, fluido seminal y similares. La muestra puede tratarse antes de realizar el método, para rendir o mejorar la disponiblidad de los ácidos nucleicos o los polipéptidos para el ensayo. Los tratamientos pueden incluir, por ejemplo, uno o más de los siguientes: lisis celular (por ejemplo, mecánica, física, química, etc.), centrifugación, extracción, cromatografía en columna, y similares.

Un método descrito en la presente invención consiste en determinar la presencia en muestras humanas de anticuerpos dirigidos contra nuevos péptidos producidos mediante la infidelidad de la transcripción, y generar una estimulación inmunológica que conduzca a la producción de anticuerpos. Un segundo método de esta invención se dirige a la detección de células que portan estructuras inmunológicas dirigidas contra los péptidos de infidelidad de la transcripción.

Diseños de fármacos y terapia

Tal como se analizó anteriormente, la invención describe el diseño (o la selección) de nuevos fármacos evaluando la capacidad de una molécula candidata para modular la infidelidad de la transcripción. Estos métodos incluyen ensayos de unión y/o ensayos (de actividad) funcionales, y pueden realizarse in vitro (por ejemplo, en sistemas celulares o en ensayos no celulares), en animales, etc.

Esta invención describe un método para seleccionar, caracterizar, buscar u optimizar un compuesto biológicamente activo, comprendiendo dicho método determinar in vitro si un compuesto de ensayo modula la infidelidad de la transcripción. La modulación de la infidelidad de la transcripción puede evaluarse con respecto a un gen o una proteína concretos, o con respecto a un conjunto predefinido de genes o proteínas, o de modo global.

La presente invención también describe un método para seleccionar, caracterizar, buscar u optimizar un compuesto biológicamente activo, comprendiendo dicho método colocar in vitro un compuesto de ensayo en contacto con un gen, y determinar la capacidad de dicho compuesto de ensayo para modular la producción, a partir de dicho gen, de moléculas de ARN que contengan sitios de infidelidad de la transcripción.

La invención también describe un método para seleccionar, caracterizar, buscar y/u optimizar un compuesto biológicamente activo, comprendiendo dicho método poner en contacto un compuesto de ensayo con una célula, y determinar, en dicha célula, si el compuesto de ensayo modula la infidelidad de la transcripción.

Los anteriores ensayos de selección pueden realizarse en cualquier dispositivo adecuado, tal como placas, tubos, platos, matraces, etc. Generalmente, el ensayo se realiza en placas de microvaloración de múltiples pocillos. Por ejemplo pueden ensayarse varios compuestos en paralelo. Además, el compuesto de ensayo puede tener diversos orígenes, naturaleza y composición. Puede ser una sustancia orgánica o inorgánica, tal como un lípido, un péptido, un polipéptido, un ácido nucleico, una molécula pequeña, aislados o mezclados con otras sustancias. Los compuestos pueden ser todo o parte de un banco combinatorio de compuestos, por ejemplo.

Los compuestos que modulan la infidelidad de la transcripción pueden tener muchas utilidades, tales como utilidades terapéuticas, para reducir o aumentar la infidelidad de la transcripción en una célula. Dichos compuestos pueden utilizarse para tratar (o prevenir) enfermedades provocadas o asociadas con una infidelidad de la transcripción anómala, tales como enfermedades proliferativas (por ejemplo, cánceres), enfermedades inmunológicas, envejecimiento, enfermedades inflamatorias, etc.

Otros compuestos descritos en la presente invención son compuestos que se dirigen a la infidelidad de la transcripción, es decir, compuestos que se unen de modo selectivo a sitios de infidelidad de la transcripción. Estos compuestos (por ejemplo, anticuerpos, ARNi, etc.) pueden utilizarse como reactivos de diagnóstico, o como agentes terapéuticos, solos o conjugados con un marcador.

Los compuestos que modulan o se dirigen a la infidelidad de la transcripción que se describen en la presente invención pueden administrarse mediante cualquier vía adecuada, que incluye la vía oral, o mediante administración sistémica, por inyecciones intravenosas, intraarteriales, intracerebrales o intratecales. La dosificación puede variar dentro de amplios límites, y deberá ajustarse a las necesidades del individuo en cada caso concreto, dependiendo de diversos factores conocidos por los expertos en la técnica. Puede utilizarse cualquier forma de dosificación farmacéuticamente aceptable conocida en la técnica, tal como cualquier disolución, suspensión, polvo, gel, etc., incluyendo disoluciones isotónicas, disoluciones tamponadas y disoluciones salinas, etc. Los compuestos pueden administrarse por sí solos, pero en general se administran con un vehículo farmacéutico, con respecto a la práctica farmacéutica convencional (tal como se describe en Remington’s Pharmaceutical Sciences, Mack Publishing). Los anticuerpos pueden administrarse según métodos y protocolos conocidos per se en la técnica, que se emplean en la actualidad en terapias y ensayos humanos.

Efecto de la infidelidad de la transcripción sobre la función celular normal

En general se acepta que las proteínas son responsables de la mayoría de las funciones celulares. Sin embargo, también es evidente que el ARN conocido como ARN no codificador también es una molécula funcional en sí misma. Estas transcripciones, cuya importante ha sido subestimada, estarían presentes en muchos organismos y regulan muchas funciones celulares. Entre éstos, se encuentran ARNr, ARNt, ARNtm (ARN transmensajero), pero también otros ARN no codificadores (ARNsno, ARNsn, etc.) que intervienen en las modificaciones postranscripcionales del ARN, en el corte y empalme u otras funciones celulares. Las funciones del ARN y de las proteínas pueden verse afectadas por la falta de infidelidad de la transcripción descrita en esta solicitud. La secuencia de ADN se transcribe en ARNm en el núcleo por la acción de una proteína denominada ARN polimerasa II que reconoce la secuencia de la molécula de ADN y sintetiza un polímero monocatenario de nucleótidos que es complementario con el molde de ADN de origen. El orden y el tipo de base del ARN en cualquier posición concreta viene determinado por el orden y el tipo de base presente en la hebra de ADN que actúa como molde. El extremo 5’ del ARN transcrito, que se corresponde con la primera base del ARNm, se une a 7-metilguanilato unido al nucleótido inidical, constituyendo así 5’ CAP que protege al ARN de la degradación. Esta modificación se produce antes de que se haya completado la transcripción. El procesamiento en el extremo 3’ de la transcripción primaria implica la ruptura por una endonucleasa para producir un grupo 3’-hidroxilo libre al cual se añade una cadena de restos adenina por una enzima denominada poli(A) polimerasa. La cola de poli(A) resultante contiene entre 100-250 nucleótidos. La etapa final del procesamiento es el corte y empalme, que consiste en la escisión de la transcripción primaria del elemento que corresponde a las secuencias intrónicas, seguido del acoplamiento de los exones. Este proceso es controlado por numerosas proteínas y ARNnc, parte de los cuales se une al ARN. Es posible que esta unión sea una etapa que se vea afectada por la falta de infidelidad de la transcripción. En efecto, todas estas proteínas están codificadas por un ARN específico; por tanto, la función de estas proteínas puede verse potencialmente afectada por la falta de infidelidad de la transcripción. El proceso, muy complejo, de la maduración conduce a la producción de ARNm que será exportado desde el núcleo para que se produzca la traducción. Es importante reconocer que, en esta etapa, no todos los tripletes de nucleótidos que están presentes en el ARNm maduro serán traducidos a AA. El ARN mensajero maduro contiene regiones no codificadoras denominadas regiones 5’ y 3’ no traducidas que tienen importancia funcional para determinar la estabilidad global del ARNm y otros papeles en la traducción. Para trasladar de forma eficaz la información contenida en el ADN a la secuencia de AA apropiada de la proteína, se requiere una fidelidad absoluta de la transcripción. En efecto, cualquier error que se produzca durante la transcripción o durante los procesos de maduración dará como resultado potencialmente la introducción de cambios en la estabilidad del ARNm y, en último término, una variación en la secuencia primaria de AA de la proteína. Estas variaciones en la secuencia de la proteína pueden entonces exacerbar el fenómeno de la infidelidad de la transcripción mediante la alteración de la secuencia de la proteína implicada en el inicio de la transcripción, en la propia transcripción, en la formación del casquete 5’ del ARN, en la poliadenilación 3’, en el corte y empalme del ARN y/o en la exportación del ARN. Por tanto, la demostración descrita en esta invención de que la infidelidad de la transcripción afecta a un gran número de genes aislados a partir de células del cáncer abre la posibilidad de que el fenómeno pueda exacerbarse, conduciendo a un aumento progresivo en la gravedad de la enfermedad. La variación en las secuencias de ARN introducida por la infidelidad de la transcripción puede tener consecuencias inmediatas sobre la función celular. En efecto, la introducción de bases en la transcripción primaria del ARN que no son complementarias con las del molde de ADN tiene consecuencias potenciales inmediatas sobre la secuencia primaria de AA de la proteína resultante.

Cuando el cambio afecta a las primeras 2 bases del codón, generalmente ejerce un impacto directo sobre la secuencia de AA. Las variaciones que afectan a la tercera base del codón tendrán un impacto menor sobre la secuencia de AA de la proteína, porque el codigo genético está degenerado. Por tanto, los cambios en la base localizada en la tercera posición del codón pueden no influir directamento a la secuencia de AA de la proteína. Basándose en los datos descritos a continuación, los inventores creen que la infidelidad de la transcripción es un fenómeno que afecta a todas las bases independientemente de su posición en el codón y, por tanto, impacta sobre la secuencia primaria de AA de la proteína. Los cambios en la proteína pueden ser neutros o provocar una modificación de la función de la proteína, tanto un aumento como la pérdida de actividad. El fenómeno de la infidelidad de la transcripción se observa predominantemente después de codificar y completar al menos las primeras 400-500 bases del ARNm maduro; el extremo 5’ del ARNm se ve relativamente menos afectado. Se cree que estarán presentes fragmentos más cortos, y también más largos, de la proteína en las células del cáncer, así como en el plasma de los pacientes con cáncer. Estas isoformas más cortas y más largas pueden deducirse directamente de las reglas de la infidelidad de la transcripción descritas a continuación. Esto permite la producción de métodos diseñados de forma lógica para la identificación de marcadores específicos del cáncer o de la gravedad de la enfermedad inmunológica. Debido a que la tasa de transcripción de la mayoría de los genes está controlada para adaptarse a las necesidades celulares, se propone que la infidelidad de la transcripción provoca cambios en la expresión génica directamente debidos a una excesiva función de la proteína o a la falta de función de ésta. Por tanto, el fenómeno de la infidelidad de la transcripción ejerce un profundo efecto sobre la capacidad celular para realizar su tarea. La identificación de este defecto como una característica común a la mayoría de los genes aislados de todos los tipos de células del cáncer proporciona, por tanto, un fundamento para la búsqueda de nuevos métodos que permitan la medición cuantitativa de la tasa de la infidelidad de la transcripción en cualquier célula concreta. Este ensayo de selección permite el ensayo de nuevos fármacos capaces de limitar la infidelidad de la transcripción, evitando así el avance de la enfermedad y restableciendo la función celular normal.

Infidelidad de la transcripción y patología

La presente invención describe que la infidelidad de la transcripción conduce a importantes cambios en la secuencia de las proteínas. La función de cualquier proteína concreta viene determinada por su estructura tridimensional que depende directamente de su secuencia de AA. Las proteínas con un AA variante, un truncamiento de la proteína o un alargamiento de la proteína pueden producir una modificación profunda de la actividad de la proteína o permanecer neutras. Los ejemplos de proteínas modificadas que inhiben significativamente la función de sus homólogos normales se han descritos. La infidelidad de la transcripción es un fenómeno que afecta a un gran número de genes, produciendo con ello un gran número de proteínas. Debido a que varias de estas proteínas participan en mantener estable la estructura del ADN y participan en la reparación del ADN, una función defectuosa de estas proteínas puede producir una reparación defectuosa del ADN y dar como resultado una capacidad significativamente disminuida de las células para reparar con éxito el ADN dañado. Debido a que la fidelidad de la transcripción en las células normales es debida a la actividad de varios complejos de proteínas que controlan la transcripción, es bastante probable que unas pequeñas alteraciones iniciales de estas proteínas puedan exacerbar progresivamente el fenómeno. Esto producirá, en último término, una mayor tasa de infidelidad de la transcripción que, por consiguiente, suprimirá el estado de diferenciación celular y conducirá a formas cada vez más graves de la enfermedad. La demostración de que la infidelidad de la transcripción realmente se produce en las células del cáncer y que conduce a una amplia diversificación de las proteínas codificadas por cualquier gen concreto abre un área nueva para la selección de nuevas sondas de diagnóstico y para el diseño de nuevas dianas terapéuticas.

La presente invención describe un nuevo fenómeno que contribuye a la diversificación de la información presente en el ADN y que sigue una reglas específicas. Este proceso de infidelidad de la transcripción no aleatoria se ve muy exacerbado en células del cáncer, pero también se produce en células normales siguiendo las mismas reglas. Este mecanismo introduce bases nuevas en el ARNm, provocando así cambios profundos en el mensaje que será traducido a nivel de ribosomas. Es probable que el fenómeno sea bastante general, porque está presente en la mayoría de los genes ensayados. La consecuencia inmediata de la infidelidad de la transcripción es que un único gen puede producir muchas más proteínas de las sospechadas. Por tanto, el descubrimiento de los inventores tiene el potencial de explicar en parte la relativa discrepancia entre el número limitado de genes presentes en el genoma y el gran número de proteínas presentes en las muestras biológicas. Los inventores han demostrado que la infidelidad de la transcripción es un proceso no aleatorio y está gobernado por reglas específicas, algunas de las cuales ya se han descrito en la presente. Algunas será reveladas por una mayor caracterización del proceso utilizando métodos de bioinformática y biológicos. Los inventores se han centrado en la presente en la implicación de la infidelidad de la transcripción en el cáncer. Sin embargo, creen que el proceso es general y que puede contribuir a generar la diversidad de proteínas. Esta diversificación de las proteínas puede ejercer una influencia significativa sobre la capacidad del sistema inmunológico para reconocer un patrón de proteínas específico. A este respecto, se cree que la infidelidad de la transcripción desempeña un papel en la patogénesis de las enfermedades inmunológicas. Los inventores han considerado en la presente los acontecimientos de infidelidad de la transcripción que conducen a la sustitución de una sola base. Se han centrado en las sustituciones de una sola base porque no es probable que este mecanismo provoque una desestabilización significativa de la estructura del ARNm. Por tanto, las sustituciones de una sola base no deberían interferir con la traducción, sino ser reconocidas como un nuevo mensaje auténtico. A continuación se verá que también se espera que la infidelidad de la transcripción provoque deleciones y/o inserciones de bases. El mismo método descrito anteriormente detectará mecanismos alternativos de infidelidad de la transcripción.

El nuevo proceso descrito en esta solicitud tiene varias aplicaciones prácticas inmediatas.

Optimización de los experimentos proteómicos para identificar nuevos biomarcadores específicos de enfermedades y para diseñar nuevos anticuerpos que se dirigirán a proteínas de la enfermedad específicas

Basándose en las indicaciones de la presente solicitud, ahora es posible predecir los cambios que pueden producirse en cualquier secuencia de proteína como resultado de la infidelidad de la transcripción y, por tanto, predecir los cambios en las propiedades fisicoquímicas, tales como las masas moleculares aparentes y los puntos isoeléctricos. Esto puede producir unos patrones de proteínas modificados en geles bidimensionales y en espectrometría de masas. Debido a que la infidelidad de la transcripción afecta a la mayoría de los genes, ahora es posible centrarse en un conjunto limitado de proteínas y caracterizar sus cambios para identificar biomarcadores específicos de enfermedades (por ejemplo, cánceres). Los algoritmos de la infidelidad de la transcripción pueden acelerar el proceso de descubrimiento de biomarcadores. Como alternativa, es posible diseñar anticuerpos específicos dirigidos contra dominios de proteínas-IT, es decir, los dominios de las proteínas que contienen AA modificados, así como nuevos AA adicionales que extienden la proteína nativa generada mediante la infidelidad de la transcripción. Los anticuerpos dirigidos contra estos dominios serán específicos para el variante de la proteín y, por tanto, estarán dirigidos hacia proteínas específicas de enfermedades (por ejemplo, cáncer) presentes en un fluido corporal, en la superficie celular, o en el interior de las células del cáncer. Estos anticuerpos se emplearán para detectar proteínas características de un trastorno patológico en fluidos corporales, para detectar células enfermas circulando en el plasma, para identificar células enfermas en muestras histológicas, para evaluar la gravedad de una enfermedad, y también para dirigir medicaciones hacia células enfermas específicas. Esto puede lograrse mediante la transferencia génica de secuencias propensas a la infidelidad de la transcripción mediante un vector de terapia génica, por ejemplo, adenovirus, liposomas, etc. Como alternativa, los inventores han diseñado péptidos específicos que tienen la misma secuencia que un dominio que se produce como consecuencia de la IT. Éstos pueden utilizarse para detectar autoanticuerpos específicos y naturales dirigidos contra los dominios de proteínas-IT presentes, por ejemplo, en fluidos corporales.

La infidelidad de la transcripción se produce de modo no aleatorio y con frecuencia afecta a los codones de fin del ARNm en una gran proporción de los genes ensayados. Además, puesto que es posible calcular que hasta 6% de cualquier población concreta de ARNm contiene estas secuencias adicionales, por tanto es posible detectar, en una célula cancerosa concreta, una población específica de proteínas que muestre una nueva secuencia en el extremo carboxi-terminal. La localización de estas secuencias, por tanto, no resultaba concebible porque ningún proceso expuesto, excepto las enfermedades genéticas raras que afectan al ADN, ha sido capaz de introducir la lectura dentro del marco de secuencias que siguen inmediatamente a los codones de fin canónicos. Previamente no se sospechaba la existencia de estas secuencias ocultas. El descubrimiento de la infidelidad de la transcripción que conduce a la sustitución de una sola base que se produce en los codones de fin canónicos revela la existencia de dichas secuencias codificadoras y también demuestra que su presencia aumenta en células del cáncer porque la infidelidad de la transcripción está potenciada en estas células. Por tanto, es posible identificar y localizar estas secuencias que normalmente están escondidas para diseñar nuevos fármacos específicos del cáncer.

Una deleción o inserción de una sola base en relación con la IT que se produce en las secuencias codificadoras conduce a una conmutación en el marco de lectura. Como convergencia, las secuencias en la proteína correspondiente se modifican (un cambio en la secuencia de AA y en la longitud de la proteína). Por tanto, se puede detectar, en un célula cancerosa concreta, una población específica de proteínas que muestren una secuencia nueva. Por tanto, es posible identificar y localizar estas secuencias que normalmente están escondidas para diseñar nuevos fármacos específicos del cáncer.

Debido a la existencia de secuencias de proteínas nuevas o modificadas, y considerando que estas alteraciones están presentes en las proteínas presentes sobre la superficie celular, se propone utilizar estas secuencias para vacunar contra secuencias específicas de enfermedades. Estas vacunaciones se utilizarán para activar respuestas inmunológicas en pacientes diagnosticados con cualquier forma concreta de enfermedad (por ejemplo, cáncer) o para iniciar respuestas inmunológicas preventivas en pacientes con mayor riesgo de desarrollar enfermedades específicas (por ejemplo, cáncer) debido a una predisposición genética o debido a una mayor exposición a riesgos o toxinas ambientales.

Por tanto, esta invención describe un método para detectar la presencia o la etapa de una enfermedad en un sujeto, comprendiendo dicho método evaluar (in vitro o ex vivo) la presencia o la tasa de la infidelidad de la transcripción en una muestra procedente de dicho sujeto, siendo dicha presencia o tasa una indicación de la presencia o etapa de una enfermedad en dicho sujeto. La muestra puede ser cualquier tejido, célula, fluido, biopsia, etc., que contenga ácidos nucleicos y/o proteínas. La muestra puede tratarse antes de la reacción, es decir, mediante dilución, concentración, lisis, etc. El método comprende generalmente evaluar la infidelidad de la transcripción de una serie de genes o proteínas diferenciados, tales como proteínas plasmáticas, proteínas de la superficie celular, etc.

Esta invención también describe un método para tratar a un sujeto que lo necesite, el método comprende administrar a dicho sujeto una cantidad eficaz de un compuesto que altera (p. ej., reduce o aumenta) la tasa de la infidelidad de la transcripción de un gen de mamífero.

Esta invención también describe el uso de un compuesto que altera (por ejemplo, reduce o aumenta) la tasa de la infidelidad de la transcripción de un gen de mamífero para la fabricación de una composición farmacéutica para su uso en un método de tratamiento de un ser humano o animal, en particular para tratar un trastorno de células proliferativas, tal como cánceres y enfermedades inmunes.

La invención también describe un método para evaluar la eficacia de un fármaco o de un candidato a fármaco, comprendiendo dicho método una etapa de evaluar si dicho fármaco altera la tasa de la infidelidad de la transcripción de un gen de mamífero, de forma que dicha alteración es una indicación de la eficacia del fármaco.

La invención también describe métodos y productos (tales como sondas, cebadores, anticuerpos o sus derivados) para detectar o medir (el nivel de) la infidelidad de la transcripción en una muestra, así como los correspondientes kits.

La invención también describe un método para identificar y/o producir biomarcadores, comprendiendo dicho método identificar, en una muestra procedente de un sujeto, la presencia de un sitio o sitios de infidelidad de la transcripción en una proteína, ARN o gen diana y, opcionalmente, determinar la secuencia de dicho sitio o sitios de infidelidad de la transcripción. Por ejemplo, la proteína diana es una proteína de la superficie celular o una proteína segregada, en particular una proteína de la superficie celular o una proteína plasmática.

La invención describe un método para producir o identificar ligandos específicos para un rasgo o un trastorno patológico, comprendiendo dicho método identificar, en una muestra procedente de un sujeto que tiene dicho rasgo o trastorno patológico, la presencia de un sitio o sitios de infidelidad de la transcripción en una o varias proteínas, ARN o genes diana, opcionalmente determinando la secuencia de dicho sitio o sitios de infidelidad de la transcripción, y produciendo un ligando o ligandos que se unen de modo específico a dicho sitio o sitios de infidelidad de la transcripción.

La invención es particularmente adecuada para identificar biomarcadores de trastornos de células proliferativas, tales como cánceres, enfermedades inmunes, inflamación o envejecimiento. Es particularmente útil para producir ligandos que son específicos para tales trastornos en mamíferos, en particular ligandos que pueden detectar la presencia o gravedad de un trastorno de células proliferativas en un sujeto.

En particular, esta invención describe un péptido (sintético) que comprende un sitio de infidelidad de la transcripción de una proteína, en particular de una proteína de mamífero, más preferiblemente de una proteína humana. El péptido generalmente comprende un fragmento interno de la proteína, o la secuencia de un fragmento C-terminal de dicha proteína. El péptido preferiblemente comprende menos de 100, 80, 75, 70, 65, 60, 50, 45, 40, 35, 30, 25 o incluso 20 aminoácidos. La proteína puede ser una proteína de la superficie celular (por ejemplo, un receptor, etc.), una proteína segregada (por ejemplo, una proteína plasmática), o una proteína intracelular. Los ejemplos de dichas proteínas plasmáticas se proporcionan, por ejemplo, en la figura 13, e incluyen apolipoproteínas (por ejemplo, AI, AII, CI, CII, CIII, D, E), componentes del complemento (por ejemplo, C1s, C3, C7), proteína reactiva C, inhibidores de serpina peptidasa, fibrinógeno (por ejemplo, FGA1, FGA2), plasminógeno, transferrina, transtiretina, etc. Los ejemplos de receptores de la superficie celular incluyen, por ejemplo, receptores de citoquinas y receptores de hormonas, etc. En una realización específica, la invención se refiere a un péptido sintético que comprende un sitio de infidelidad de la transcripción de una proteína plasmática humana o un receptor de la superficie celular abundantes, tal como se listó anteriormente.

Los ejemplos específicos de dichos péptidos se describen en las figuras 10, 14 y 18. De modo más específico, los ejemplos de péptidos sintéticos de la presente invención comprenden toda o un fragmento de las siguientes secuencias de aminoácidos: QMWQLFWIYHLSS (TPT1) (SEQ ID NO: 1)KLHTLSAAIYYQQE (VIM) (SEQ ID NO: 2) DFLSNK (RPS6) (SEQ ID NO: 3)MYTVEFSVHKNN (RPL7A) (SEQ ID NO: 4)NGSLGDMSDLCT (RPS4X) (SEQ ID NO: 5)ASG (FTH1) (SEQ ID NO: 6) EPSEPSDF (FTL) (SEQ ID NO: 7) APSIFPTLPAKPGTKQPRSPVTALSLHMLLMVSSAPSCGLIQTVSSFTVYIFTL (TPI1) (SEQ ID NO: RSKAYSSVFLFRWCKANTLSKKHKFL (ALB) (SEQ ID NO: 10) GLDSTRALENEMTV (APCS) (SEQ ID NO: 11) GARRRPPSRCSE (APOA1) (SEQ ID NO: 12) SVQTIVFQPQLASRTPTGQS (APOA2) (SEQ ID NO: 13) IVFQPQLASRTPTGQS (APOA2) (SEQ ID NO: 14)QPDPPSVDKGRVPYSPDPPGSD (APOC2) (SEQ ID NO: 15) DPPSVDKGRVPYSPD (APOCII) (SEQ ID NO: 16) DLNTPSPPAYPSCELLGSCNLQGCPCRLLKRDSILSALLPHLMPGPPPGMLASQ (APOC3) (SEQ ID NO: 17) PGSTGRLHPLHVTSASLSPTPPPPHKDKPINHDKGS (APOD) (SEQ ID NO: 18) TPKPAAMRPHATPCLLPPRSLQRETLSPPQPSSWGGP (APOE) (SEQ ID NO: 19) EARVGGNVGSQTQ (AZGP1) (SEQ ID NO: 20) PSVLHTARGPRMPRPPLAPAGREPDHLPC (CHI3L1) (SEQ ID NO: 21) NVIPLKRKMNNTLN (HRG) (SEQ ID NO: 23) TPAARLMWSSNMPYFAQKTAKDMTSSWLQPRFIFLFVVN (IGFBP3) (SEQ ID NO: 24) GWGVFLLNPMAGGHAPTIISWEERQSWEIDGSHSSLLSLLCLWATLPTPLLSQ (INHA) (SEQ ID NO: 25) TGPTHHSPSPSISTWCLVPVHSVNKKP (KLK11) (SEQ ID NO: 26) WTPEPLLQPLSHPLPPAHPLGQQRL (PKM2) (SEQ ID NO: 27) LDGRQSDALTHLEAGTWVGI (PLG) (SEQ ID NO: 28) NLRGRAATKVKMGTQMIHEFALVSLAQWCANHVCLHSSVLPCVLNKK (TF) (SEQ ID NO: 30) GTSPPVDLKDEGWDFM (TTR) (SEQ ID NO: 32) Otro aspecto de esta invención se refiere al uso de un péptido con una longitud de 100 aminoácidos o menos, que comprende una secuencia seleccionada de SEQ ID NOs: 1 a 5, 7 a 13, 15 a 18 y 20 a 32 para detectar o controlar trastornos de células proliferativas.

Un aspecto adicional de esta invención se refiere al uso de un péptido, tal como se describió anteriormente, como inmunógeno. La invención también se refiere a una composición de vacuna que comprende dicho péptido, tal como se definió anteriormente, y opcionalmente un vehículo, excipiente y/o adyuvante adecuado.

La invención también describe un dispositivo o producto que comprende, inmovilizado sobre un soporte, un reactivo que se une de modo específico con sitio de infidelidad de la transcripción. El reactivo puede ser, por ejemplo, una sonda, o un anticuerpo o su derivado.

La invención puede utilizarse en cualquier sujeto mamífero, en particular cualquier sujeto humano, para detectar, controlar o tratar una diversidad de trastornos patológicos asociados con trastornos de células proliferativas (p. ej., cánceres) y/o para producir, diseñar o seleccionar fármacos terapéuticamente activos.

Producción y utilización de agentes que se dirigen a sitios de infidelidad de la transcripción

Utilizando las indicaciones de la presente invención, es posible producir agentes que puedan dirigirse a sitios de infidelidad de la transcripción, por ejemplo, que se unan a proteínas o ácidos nucleicos que contengan un sitio de infidelidad de la transcripción, o a células o tejidos que contengan o expresen estas proteínas o ácidos nucleicos. El agente de transporte dirigido puede ser un anticuerpo (o su derivado), una sonda, un cebador, un aptámero, etc., tal como se describió anteriormente.

Estos agentes de transporte dirigido pueden utilizarse, por ejemplo, como agentes de diagnóstico, para detectar, controlar, etc. la infidelidad de la transcripción en una muestra, tejido, sujeto, etc. Para este fin, el agente puede acoplarse a un resto marcador, tal como un radiomarcador, una enzima, un marcador fluorescente, un tinte luminiscente, etc.

Los agentes de transporte dirigido también pueden utilizarse como molécula terapéutica, por ejemplo, para tratar una célula o tejido u organismo que muestre una infidelidad de la transcripción anómala. El agente puede utilizarse como tal, o preferiblemente puede acoplarse a una molécula activa, tal como una molécula tóxica, un fármaco, etc.

Esta invención describe un método para producir un agente que se dirige a la infidelidad de la transcripción, comprendiendo dicho método (i) identificar un sitio de infidelidad de la transcripción de una proteína o un ácido nucleico, y (ii) producir un agente que se una de modo selectivo a dicho sitio. El sitio de infidelidad de la transcripción puede identificarse, por ejemplo, mediante el alineamiento de secuencias disponibles para una molécula de ARN concreta y la identificación de las variaciones de la secuencia, en particular en el extremo 3’. Los sitios de infidelidad de la transcripción también pueden identificarse aplicando las reglas de la infidelidad de la transcripción, según se describe en la presente solicitud (véase, por ejemplo, el ejemplo 5) o reglas nuevas que se describan después, a cualquier secuencia génica. Entonces puede producirse una molécula de péptido o de ácido nucleico que comprenda dicho sitio identificado utilizando métodos convencionales. La invención describe la etapa (i) del método que comprende identificar un sitio de infidelidad de la transcripción de una proteína segregada o de la superficie celular (por ejemplo, un receptor, etc.), o de un ácido nucleico. En efecto, las proteínas segregadas y las proteínas de la superficie celular pueden ser localizadas con facilidad utilizando un agente de transporte dirigido que se pone en contacto con la célula o se administra a un sujeto. Los ejemplos de dominios de dichas proteínas-IT se describen en los ejemplos.

Producción y utilización de una vacuna que provoca o estimula o inhibe una respuesta inmunológica contra un dominio de una proteína-IT

Utilizando las indicaciones de la presente invención es posible producir una composición de vacuna que provoca o inhibe una respuesta inmunológica contra proteínas-IT, o contra células o tejidos que contengan o que expresen dichas proteínas-IT o los correpondientes ácidos nucleicos.

Generalmente, la composición de vacuna comprende, como inmunógeno, una molécula que comprende la secuencia de un sitio de infidelidad de la transcripción. La composición de vacuna puede comprender cualquier vehículo, excipiente o adyuvante farmacéuticamente aceptable. La composición de vacuna puede utilizarse para generar una respuesta inmunológica contra una célula o tejido enfermo que exprese proteínas-IT, que de como resultado la destrucción de dicha célula o tejido por el sistema inmunológico. Como alternativa, la composición de vacuna puede utilizarse para inducir una tolerancia contra los sitios de infidelidad de la transcripción implicados en enfermedades autoinmunológicas.

La invención también describe un método para producir un inmunógeno que provoca, estimula o inhibe una respuesta inmunológica contra un dominio de proteínas-IT, o contra una célula o tejido que exprese dicha proteína, comprendiendo dicho método (i) identificar un sitio de infidelidad de la transcripción de una proteína o de un ácido nucleico, y (ii) producir un péptido que comprenda dicho sitio o su variante. El sitio de infidelidad de la transcripción puede identificarse, por ejemplo, mediante el alineamiento de las secuencias disponibles para una molécula de ARN concreta, y la identificación de las variaciones en las secuencias, en particular en el extremo 3’. El sitio de infidelidad de la transcripción también puede identificarse aplicando las reglas de la infidelidad de la transcripción, tal como se describe en la presente solicitud (véase, por ejemplo, el ejemplo 5) o reglas nuevas que se describan después, a cualquier secuencia génica. Entonces puede producirse una molécula de péptido que comprenda dicho sitio identificado utilizando métodos convencionales. En una realización preferida, la invención se refiere a un método para producir un anticuerpo, que comprende inmunizar un mamífero no humano con un péptido de acuerdo con la invención y recuperar anticuerpos que se unen a dicho péptido o las correspondientes células que productoras de anticuerpos.

Reducción de la infidelidad de la transcripción en sistemas de producción de proteínas recombinantes

Esta invención también describe un método para prevenir o reducir la infidelidad de la transcripción que puede producirse en sistemas de producción recombinantes, en particular en sistemas de producción de proteínas terapéuticas. En efecto, dicha infidelidad de la transcripción puede disminuir el rendimiento de producción del sistema, o dar como resultado la producción de mezclas de proteínas no caracterizadas que pueden mostrar diversos perfiles de actividad. Por tanto, se recomienda y resulta muy valioso poder reducir la aparicion o la tasa de la infidelidad de la transcripción en sistemas de producción recombinantes, tales como sistemas de producción bacterianos (si las reglas de la infidelidad de la transcripción son las mismas para sistemas procariotas), sistemas de producción eucariotas (por ejemplo, levaduras, células de mamífero, etc.). Esta reducción puede lograrse, por ejemplo adaptando la secuencia de la molécula de ácido nucleico codificadora y/o inhibiendo las moléculas de ARN generadas mediante la infidelidad de la transcripción. Como alternativa, las proteínas que contienen sitios de infidelidad de la transcripción pueden retirarse del medio.

Reducción de la sensibilidad a la infidelidad de la transcripción para un gen

Esta invención también describe un método para prevenir o reducir la IT que puede producirse en un gen. En efecto, dicha IT puede afectar a la expresión o a la actividad de una proteína, o dar como resultado la producción de mezclas de proteínas no caracterizadas que pueden mostrar diversos perfiles de actividad. Por tanto, se recomienda y resulta muy valioso poder reducir la aparicion o la tasa de la infidelidad de la transcripción para dicho gen. Esta reducción puede lograrse, por ejemplo, modificando la secuencia del gen (terapia génica) y/o inhibiendo las moléculas de ARN generadas mediante la infidelidad de la transcripción. Como alternativa, las proteínas que contienen sitios de infidelidad de la transcripción pueden degradarse de modo específico (por ejemplo, pueden localizarse de modo específico para su degradación).

Medición de la infidelidad de la transcripción a nivel de ARN

La transcriptómica es la ciencia que mide la variación a nivel de ARN (preferiblemente ARNm) que aparece en una diversidad de trastornos patológicos, de los cuales el cáncer es el más frecuente. La transcriptómica se basa en la hibridación de ADNc con un conjunto específico de oligonucleótidos que identifican subconjuntos predefinidos de genes. La eficacia de la hibridación depende de las secuencias específicas de cualquier ARN concreto que tendrá su transcripción inversa en el ADNc. La introducción de una variación insospechada en la secuencia de un ARN concreto disminuirá la eficacia de la hibridación y, por tanto, provocará una variación en la señal percibida por los chips transcriptómicos. El descubrimiento de que la infidelidad de la transcripción provoca alteraciones en la secuencia de bases del ARN tiene dos consecuencias inmediatas: en primer lugar, permite la optimización de los chips transcriptómicos para minimizar la consecuencia del desapareamiento de bases debido a la infidelidad de la transcripción y, por tanto, mejora la precisión del experimento transcriptómico. En efecto, la limitación actual de los experimentos transcriptómicos es su falta de reproducibilidad entre estudios. Los inventores ahora creen que una parte importante de dicha variabilidad está provocada por la infidelidad de la transcripción. La comprensión de las reglas de la infidelidad de la transcripción, tal como describió anteriormente, permite ahora el diseño de chips de micromatrices que miden de modo específico la tasa de la infidelidad de la transcripción en cualquier mezcla concreta de ADNc obtenido a partir de células normales o enfermas. El control de la tasa de la infidelidad de la transcripción a nivel de ARN permite una selección de alta capacidad de procesamiento de la tasa relativa de infidelidad de la transcripción que se produce en una célula concreta. Esto proporciona una información esencial para determinar la gravedad de una enfermedad, para definir las estrategias terapéuticas, y para clasificar a las células enfermas según su perfil de sensibilización farmacológico. La misma selección también permite ensayar la eficacia de nuevos fármacos, por ejemplo, en la terapia del cáncer.

Otras aplicaciones de la infidelidad de la transcripción

La infidelidad de la transcripción es un mecanismo natural recién descubierto que añade diversificación al código genético bien establecido. Los inventores han observado que la infidelidad de la transcripción se produce, aunque a tasas bajas, incluso en tejidos normales. Los inventores proponen que la infidelidad de la transcripción contribuye a explicar la relativamente baja abundancia de genes identificados en el genoma y la mucha mayor diversidad de proteínas presentes en las células vivas de tejidos y fluidos biológicos.

Los inventores proponen que la infidelidad de la transcripción tiene una función específica a nivel inmunológico. También proponen que el sistema inmunológico depende, al menos en parte, en que una tasa concreta de infidelidad de la transcripción afecte preferentemente a genes específicos para identificar al propio individuo. Por tanto, las anomalías en la tasa de infidelidad de la transcripción que se producen por razones aún desconocidas podrían contribuir a activar una respuesta inmunológica específica y contribuir a la patogénesis de enfermedades autoinmunológicas y alégicas. Las diferencias interindividuales en la infidelidad de la transcripción también podrían estar condicionadas por los polimorfismos de genes del sistema inmunológico, determinando por tanto la tasa de infidelidad de la transcripción que se produce en las células en circulación del sistema inmunológico, por ejemplo, linfocitos T o B, y también podrían contribuir a la evaluación de la idoneidad del donante y receptor de injertos, y para determinar la gravedad de las enfermedades de injerto frente al receptor.

Los inventores también postulan que la infidelidad de la transcripción se produce a una tasa mayor durante el proceso normal del envejecimiento. Esto crearía unas condiciones de reducción progresiva de la actuación que afectarían a todas las enzimas en general, y de forma más específica a las proteínas que están implicadas en la replicación celular, la reparación del ADN y el mantenimiento de la tasa normal de fidelidad de la transcripción. El concepto descrito anteriormente, por tanto, podría redirigir las investigaciones sobre los mecanismos del envejecimiento. Los métodos bioquímicos, proteómicos, transcriptómicos y otros métodos que permiten seleccionar secuencias de ARNm y ADNc, y la fidelidad a las especificadas por el ADN, podrían utilizarse, por tanto, para cuantificar la tasa de infidelidad de la transcripción que se produce en un individuo concreto. El ensayo de nuevas moléculas que reduzcan la tasa de infidelidad de la transcripción, por tanto, podría someterse a una selección biológica y conducir al desarrollo de fármacos que reduzcan la velocidad de envejecimiento.

Otros aspectos y ventajas de la invención se describen en la siguiente sección experimental.

Sección experimental

Ejemplo 1. Principio de construcción y secuenciación de un banco de ADNc típico (véase la figura 1)

La primera etapa para preparar un banco de ADN complementario (ADNc) es aislar el ARNm maduro del tipo de célula o tejido de interés. Debido a su cola de poli(A), resulta sencillo obtener una mezcla de todo el ARNm celular mediante hibridación con oligo dT complementarios unidos de forma covalente a una matriz. El ARNm unido entonces se eluye con un tampón de salinidad baja. La cola de poli(A) del ARNm entonces se deja hibridar con oligo dT en presencia de una transcriptasa inversa, una enzima que sintetiza una hebra de ADN complementaria a partir del molde de ARNm. Esto produce nucleótidos bicatenarios que contienen el molde de ARNm original y su secuencia de ADN complementaria. Después se obtiene ADN monocatenario retirando la hebra de ARN mediante un tratamiento alcalino o mediante la acción de la ARNasa H. Entonces se añade una serie de dG al extremo 3’ del ADN monocatenario mediante la acción de una enzima denominada terminal transferasa, una ADN polimerasa que no requiere un molde, sino que añade desoxioligonucleótidos al extremo 3’ libre de cada hebra de ADNc. El oligo dG se deja hibridar con oligo dC, que actúa como cebador para sintetizar, mediante la ADN polimerasa, una hebra de ADN complementaria con la hebra de ADNc original. Estas reacciones producen una molécula de ADN bicatenario completa que se corresponde con las moléculas de ARNm que se encuentran en la preparación original. Cada una de estas moléculas de ADN bicatenario se denominan habitualmente ADNc, y cada una contiene una doble cadena de oligo dC-oligo dG en un extremo, y una región de doble cadena de oligo dT-oligo dA en el otro extremo. Este ADN entonces se protege mediante metilación en los sitios de restricción. Entonces se acoplan conectores de restricción cortos en ambos extremos. Son segmentos de ADN sintético bicatenario que contienen el sitio de reconocimiento para una enzima de restricción concreta. El acoplamiento es realizado por la ADN ligasa del bacteriófago T4 que puede unir moléculas de ADN bicatenario con “extremos romos”. El ADN con extremos romos bicatenario resultante con un sitio de restricción en cada extremidad entonces se trata con una enzima de restricción que crea extremos pegajosos. La etapa final en la construcción de bancos de ADNc es el acoplamiento de la doble cadena rota por enzimas de restricción con un plásmido específico que se transfecta en una bacteria. Las bacterias recombinantes entonces se cultivan para producir un banco de plásmidos, en presencia de antibióticos que se corresponden con la resistencia a antibióticos específica del plásmido. Cada clon porta un ADNc derivado de una única parte del ARNm. Cada uno de estos clones entonces se aisla y se secuencia utilizando métodos de secuenciación clásicos. Un ensayo típico de secuenciación comienza en el sitio de inserción y produce secuencias de 400 a 800 pares de bases para cada clon. Esta secuencia actúa como molde para comenzar la segunda ejecución de la secuenciación. Este avance conduce a la secuenciación progresiva del inserto del plásmido completo. Los resultados de la secuenciación de numerosos ADNc denominados EST se han depositado en varias bases de datos públicas.

Ejemplo 2. Anotaciones de las bases de datos

Las bases de datos de EST contienen información de la secuencia que se corresponde con la secuencia de ADNc obtenida en los bancos de ADNc y, por tanto, se corresponde fundamentalmente con la secuencia del ARNm individual presente en cualquier momento concreto en el tejido que se utilizó para producir estos bancos. La calidad de estas secuencias se ha puesto en cuestión por varios motivos. En primer lugar, tal como se analizó anteriormente, el proceso para producir bancos de ADNc inicialmente se basaba en gran medida en la presencia de una cola de poli(A) en el extremo 3’ del ARNm eucariota. En segundo lugar, los ARNm son moléculas bastante frágiles que son digeridas con facilidad por unas nucleasas muy abundantes, denominadas ARNasas. En tercer lugar, mientras se estaban construyendo y secuenciando estos bancos, no se prestó mucha atención a la calidad del material original utilizado ni a su conservación. Debido a esto, se han utilizado secuencias de EST para anotar información genética, es decir, para determinar si un segmento de ADN genómico identificado y totalmente secuenciado codifica algún ARNm específico. En este contexto, las secuencias de EST fueron útiles para identificar la secuencia codificadora genómica. Sin embargo, no se prestó atención a la información que portaba la propia secuencia EST. En efecto, la secuencia genómica de ADN se considera mucho más fiable, con potentes argumentos técnicos que apoyan esta opinión. Los inventores especulan que la diversidad incluida en las secuencias EST podría contener información importante desde el punto de vista biológico, analítico o clínico. En efecto, las bases de datos de EST fueron producidas por una serie de investigadores que utilizaron diversos métodos: esto condujo a los inventores a especular que cada sesgo metodológico debería contribuir a un nivel de ruido de fondo con un cierto número de errores. Sin embargo, si existiesen diferencias en los errores debidas a la fuente del material utilizado para generar el banco, entonces la diferencia en la tasa de error estaría directamente relacionada con la fuente subyacente.

Para ensayar esto, los inventores recuperaron las bases de datos est_human disponibles en el sitio de NCBI ftp. Se seleccionaron estas bases de datos porque estas secuencias no estaba anotadas ni curadas con herramientas humanas ni bioinformáticas.

Los inventores utilizaron un sistema de identificación del banco para determinar si un EST se obtuvo de un tejido canceroso o normal. Cada banco se denominó normal o canceroso. Mediante el emparejamiento del número de registro de cada EST con el identificador del banco correspondiente se clasificaron 2,6 millones de EST como obtenidos de tejidos cancerosos, y 2,8 millones de EST como obtenidos de tejidos normales.

Para obtener las alineaciones de los EST, los inventores utilizaron el programa informático disponible para el público megaBLAST 2.2.13 (Basic Local Alignment Search Tool, Zheng Zhang, A greedy algorithm for nucleotide sequence alignment search, J. Comput. Biol., 2000) y se especificaron los siguientes parámetros de selección: -d est_human: base de datos para la selección (todos EST humanos de dbEST) -i sequences.fasta: formato de archivo FASTA que contiene la secuencia de referencia que se corresponde con genes expresados con abundancia (figura 2) -D 2: salida de BLAST tradicional -q -2: puntuación de -2 para un desapareamiento de nucleótidos -r 1: puntuación de 1 para un único apareamiento de nucleótidos -b 100000: número máximo de secuencias para las cuales se indica el alineamiento -p 90: porcentaje de coincidencia mínimo entre EST y la secuencia de referencia -S 3: toma en cuentra EST que se aparean con la secuencia de referencia -W 16: longitud del mejor apareamiento perfecto para comenzar con la extensión del alineamiento -e 10: valor esperado (valor E), número de alineamientos que se espera encontrar simplemente por azar para una secuencia concreta y una base de datos concreta, según el modelo estocástico de Karlin y Altschul (1990) -F F: no se filtra la secuencia de referencia -o NonFiltre_test_90.out: archivo de salida de informe de megaBLAST -v 0: número máximo de secuencias que muestran una línea de descripción -R T (T de “true”, verdadero): indica la información logarítmica al final de la salida de megaBLAST -I T: muestra los GI en la definición de línea [T/F] La línea de comando para el BLAST es: megablast -d est_human -i C:/SeqRef/TPT1/sequences.fasta -o C:/blast/NonFiltre_test_90.out -R T -D 2 -I T -q -2 -r 1 -v 0 -b 100000 -p 90,00 -S 3 -W 16 -e 10,0 -F F La figura 2(a-q) muestra las 17 secuencias utilizadas para el análisis; para evitar distorsionar el BLAST se eliminó sistemáticamente la cola de poliA de las secuencias de referencia de ARNm. La figura 2r proporciona una lista de genes que se utilizaron para ensayar la aparición de variaciones en la secuencia.

Ejemplo 3. Identificación de las variaciones en la secuencia entre EST procedentes de orígenes normales y cancerosos

Se seleccionaron 17 genes basándose en su gran representación en la base de datos. Cada secuencia EST entonces se alineó frente a su secuencia de referencia de ARNm curada (RefSeq) procedente de NCBI utilizando el MegaBLAST. Esto crea una matriz en la que cualquier base concreta se define por el número de EST que se aparean en esta posición. Entonces los inventores midieron la proporción de EST que se desvían de RefSeq en cualquier posición concreta. La comparación de las secuencias de EST alineadas según el tejido de origen condujo a la identificación de las variaciones en las secuencias que producen en cada posición de las bases en el grupo de cáncer o normal. La figura 4 proporciona una representación gráfica de estas variaciones que se producen en los conjuntos normales y cancerosos para los 17 genes seleccionados. El examen visual de los datos reveló que la variación en la secuencia se producía con más frecuencia en el conjunto de cáncer, y también que el fenómeno parecía predominar más sitios del ARNm específicos. La mayoría de las observaciones se localizaron al menos 400- 500 bases después del comienzo de la secuencia del ARNm, por tanto predominantemente en la parte 3’ del gen. Este número tan alto de variaciones no puede ser explicado por los SNP. En la gráfica se muestran los SNP putativos ( ) y los SNP biológicamente validados (O); estos SNP se obtuvieron en la base de datos NCBI (dbSNP, construida 126, septiembre, 2006) (Sherry, S.T. et al. (2001), Nucleic Acids Res., 29, 308-311). Los SNP putativos y biológicamente validados que conducen a variaciones en EST (n = 442) se excluyeron de posteriores análisis (por tanto, también se excluyeron los sitios de edición del ARN (SNP falsos)).

La siguiente etapa de este análisis fue ensayar la significancia estadística de las diferencias en la variación en la secuencia que se producen entre EST de cáncer y normales. Para cada posición, los inventores compararon la proporción de la base de RefSeq con la de las tres otras bases entre los grupos normal y con cáncer utilizando un ensayo de proporción bilateral. Este ensayo se aplicó sistemáticamente siempre que se cumpliesen las siguientes condiciones: n > 70, y (ni. * n.j)/n > 5, i = 1, 2, j = 1, 2 (siendo n = el número de EST de cáncer y normales para un gen, n1. = el número de EST de cáncer, n2. = el número de EST normales, n.1 = el número de EST que tienen la RefSeq, n.2 = el número de EST que tienen una sustitución). Se dice que un ensayo estadístico es positivo al nivel umbral de 5% cuando el correspondiente valor de P es menor que 0,05; en este caso, la hipótesis nula (es decir, ambas proporciones son iguales) se rechaza.

Además, se consideraron los siguientes dos ensayos de proporción unilateral para precisar en qué conjunto la variabilidad era mayor. El primero permitió concluir que las variabilidades eran diferentes en ambos grupos cuando el ensayo estadístico es positivo, y entonces se midió en esta caso si la variabilidad era estadísticamente mayor en el conjunto del cáncer. Por el contrario, el segundo ensayo verificó la hipótesis de que la variabilidad era significativamente mayor en el conjunto normal. Ambos ensayos unilaterales se realizaron cuando se cumplieron las mismas condiciones que los ensayos bilaterales.

La figura 3 proporciona una descripción de los resultados de BLAST típicos. Tal como se muestra en las figuras 5a y 5b, para el gen representativo TPT1, el número de EST en cualquier posición concreta sobre el gen es similar en los grupos de cáncer y normales. La figura 5c muestra que 489 de 830 ensayos de proporción posibles cumplían los criterios asignados. Los ensayos de proporción que eran estadísticamente significativos al nivel de 5% se muestran en la figura 5d. Puede calcularse un error estimado resultante de los múltiples ensayos, definido por el estimador basado en la localización (C. Dalmasso, P. Broet (2005), Journal de la Société FranÇaise de Statistique, tomo 146, n1-2, 2005). Los 26 ensayos de proporción positivos son debidos a las sustituciones de bases que aparecen en el tejido normal (N>C) en la figura 5d (n = 26; LBE = 33). Esto contrasta con la acumulación de ensayos de proporción estadísticamente significativos que aparecen debido a las variaciones en la secuencia en el grupo de cáncer (C>N) (n = 145; LBE = 15). Se realizó un análisis similar para un segundo gen, VIM (figura 5e-5h). De nuevo, el número de EST en cualquier posición concreta de un gen es superponible en los grupos de cáncer y normales. 752 de los 1847 ensayos de proporcion cumplían los criterios. De nuevo, se observó una gran diferencia en el número de ensayos de proporción positivos: n = 78 variaciones son debidas al grupo normal (LBE = 50), n = 269 variaciones son debidas al grupo de cáncer (LBE = 24). Se repitió el mismo análisis en 17 genes que están presentes en abundancia en la base de datos de EST. La figura 5i es un resumen de los resultados estadísticos obtenidos. De los 17 genes ensayados, 15 muestran mayores variaciones en la secuencia en los EST obtenidos de tejidos con cáncer (figura 5j). En esta etapa, el análisis estadístico cubre sólo del 9% al 91% de las posiciones de cada gen (una media de 32%) debido a las restricciones del ensayo estadístico.

La conclusión de esta primera ronda de análisis es que los EST del mismo gen fueron diferentes cuando se comparan según la fuente del tejido (normal frente a canceroso) de la cual se extrajo el ARNm. Suponiendo que la tasa de errores técnicos que produce la variación en la secuencia de EST no es diferente según los orígenes normal o canceroso del tejido, y considerando el hecho de que 15 de 17 de los genes ensayados mostraron variaciones en la secuencia debidas a la fuente del tejido, los inventores proponen que estas diferencias son el resultado directo del estado de las células (normal frente a canceroso) a partir de las cuales se produjeron los EST.

Se realizaron experimentos similares para estudiar las inserciones y las deleciones. Los resultados se obtuvieron después de aplicar el filtro F3 (véase el ejemplo 4). Se emplearon condiciones más rigurosas para evitar acontecimientos no biológicos (errores de la secuenciación, alineamientos erróneos de MegaBLAST…): se consideró un hueco o una inserción sólo si no había otras modificaciones presentes en una ventana -10/+10. Para cada posición, los inventores compararon la proporción de ventanas con deleción (o inserción) con otras ventanas entre los grupos normales y de cáncer utilizando un ensayo de proporción bilateral como se describió anteriormente. La figura 5k es un resumen de los resultados estadísticos obtenidos. De los 17 genes ensayados, 14 (o 10 para la inserción) muestran mayores variaciones en la secuencia (deleciones e inserciones) en los EST obtenidos de tejidos cancerosos (figura 5l).

Ejemplo 4. Verificación del exceso de variación en el conjunto de cáncer C>N frente al conjunto normal N>C

Se procesaron bancos que se habían originado de muestras de cáncer o muestras normales fundamentalmente de la misma manera. Por tanto, se espera que aparezcan errores aleatorios de la construcción del banco o la secuenciación del clon en la misma proporción en ambos conjuntos y que no justifiquen las diferencias observadas entre los grupos de EST normales y de cáncer. El análisis matemático es coherente con esta interpretación (Brulliard M. et al., PNAS, 1 de mayo, 2007, vol. 104, nº 18, 7522-7527, véase el material suplementario, figura 7).

Después se realizó una búsqueda para eliminar otras fuentes de heterogeneidad de los EST aplicando secuencialmente procedimientos de filtrado basados en el siguiente fundamento. Los requerimientos iniciales fueron que los EST se alinearan con RefSeq con 100% de coincidencia en al menos 16 bases consecutivas, y con 90% de coincidencia en al menos 50 bases. Tal como se muestra en la figura 6b, esto produce, cuando se comparan los conjuntos de cáncer y normales para los 17 genes, 2281 y 725 diferencias estadísticamente significativas C>N y N>C, respectivamente (columna F1), y diferenciadas de los SNP putativos o biológicamente validados. El segundo filtro (F2) requiere que cada EST se alinee con RefSeq continuamente en más del 70% de su longitud. El tercer filtro (F3) retira los EST con una secuencia más relacionada con los parálogos y los pseudogenes que con la RefSeq auténtica. El cuarto filtro (F4) deleciona del análisis las primeras y últimas 50 bases de cada alineamiento de EST. Se empleó este filtro para eliminar los desapareamientos en los bordes 3’ y 5’ de los EST que pueden ser creados por el programa MegaBLAST para optimizar aún más los alineamientos y/o que resultan de la acumulación de errores en las extremidades de EST alineadas. El último filtro (F5) normaliza las longitudes de secuencia de EST para cada gen para eliminar cualquier diferencia en la longitud entre los conjuntos normales y de cáncer. En efecto, los inventores advirtieron que, después de aplicar los primeros 4 filtros, la longitud de los EST de cáncer media fue mayor que la de los EST normales (640  248, y 554  229 bases, respectivamente). Sin embargo, también observaron una heterogeneidad de los EST de cáncer significativamente mayor en 5 genes cuando la longitud media de los EST no era diferente entre los conjuntos normales y de cáncer (TPT1, VIM, HSPA8, LDHA, CALM2).

El número de ensayos C>N estadísticamente significativos siguió siendo mayor que el número de ensayos N>C, pero la proporción C/N disminuyó de 3,15 (F1) a 2,05 (F5) (figura 6c).

Para determinar aún más que la heterogeneidad de los EST de cáncer no era debida a la acumulacion de errores al final del ensayo de secuenciación, se tomó en cuenta sólo la información proporcionada después de las primeras 50 bases y no más larga de 450 bases en cualquier ensayo de secuenciación. Después de este filtrado drástico, los ensayos C>N estadísticamente significativos fueron 455 (LBE = 92), y los ensayos N>C fueron 292 (LBE = 119) para los 17 genes. Por tanto, puede considerarse de modo razonable que las variaciones en la secuencia que provocan la mayor heterogeneidad en los EST del grupo de cáncer son un reflejo directo de la heterogeneidad del ARNm de las células cancerosas (figura 6d).

Después los inventores verificaron de forma independiente que una mayor heterogeneidad de EST estadísticamente significativa persistía en el conjunto de cáncer después de eliminar los EST producidos a partir de células cancerosas cultivadas. Después de este filtrado, los ensayos C>N estadísticamente significativos fueron 1009 (LBE = 117), y los ensayos N>C fueron 445 (LBE = 193) para los 17 genes (figura 6e).

Ejemplo 5. La ruptura del código de sustitución de bases se produce debido a la infidelidad de la

transcripción en células cancerosas

El siguiente objetivo de los inventores fue determinar si el fenómeno descrito de la sustitución de bases debido a la infidelidad de la transcripción es un fenómeno aleatorio o sigue reglas específicas. Para lograr esto, se centraron en las variaciones de EST en las que C>N es estadísticamente significativo. Para evitar sesgos que podrían ser introducidos por los procedimientos de filtrado, se emplearon todos los datos no filtrados disponibles. La primera indicación de que la infidelidad de la transcripción no es un proceso aleatorio fue que las sustituciones de bases raramente aparecen en la región 5’ de los genes ensayados. Para todos los genes ensayados, muy raramente se observó la aparición del fenómeno de sustitución de bases en las primeras 400-500 bases del ARNm maduro. La segunda observación que indica que la infidelidad de la transcripción no es aleatoria surge de la observación de que existe una diferencia en la composición de bases en el molde de ADN genómico observado cuando se comparan secuencias cadena arriba y cadena debajo de los acontecimientos de sustitución (heterogéneos, H, n = 2281) con aquellas en que no se detectaron acontecimientos de sustitución (no heterogéneos, NH, n = 12273). El criterio para los sitios NH fueron unas variaciones en el conjunto de cáncer menores que 0,5% y no estadísticamente diferentes de las variaciones del conjunto normal (figura 7a). En este análisis, se denomina a la base que sufre la sustitución como b0, las bases localizadas en el extremo 5’ del ARNpm se denominan b-n, y las bases localizadas en el extremo 3’ se denominan b+n. Para mayor claridad, en este análisis los inventores hacen referencia a la composición de bases del ARNpm: esto se corresponde en el ADN con la hebra que no es el molde (la hebra no transcrita por ARNP). Los datos demuestran que no todas las 4 bases son igualmente susceptibles a la variación: b0 = A (33%)  T (32%) >> C (21%) >> G (14%). Además, las composiciones de las 4 bases cadena arriba y las 3 bases cadena abajo del sitio del acontecimiento fueron estadísticamente diferentes (resultados del análisis de chi- cuadrado) de las de los sitios sin una variación de EST significativa (figura 7a, la composición de bases se expresa en porcentaje, y el gris claro muestra las bases enriquecidas; el gris oscuro muestra las bases insuficientes). De modo específico, los sitios en los que se producen variaciones fueron precedidos y seguidos con más frecuencia por A  G > T  C.

Por tanto, la aparición de heterogeneidad en las EST de cáncer no es aleatoria, sino que está determinada en primer lugar por la naturaleza de la base que está siendo sustituida y en segundo lugar por la naturaleza de las bases que preceden y siguen inmediatamente al acontecimiento.

Después los inventores se preguntaron si la base de sustitución se selecciona de modo aleatorio. Resulta evidente a partir de la figura 7b que no es el caso. La significancia estadística de la diferencia en las proporciones se calculó con la hipótesis nula de que la base de sustitución se selecciona de modo aleatorio (ensayo de ajuste de las tres bases de sustitución a la distribución uniforme). A fue sustituida preferentemente por C (p = 2,8 x 10-125), T por G (p = 5,7 x 10-29), y G por A (p = 2,2 x 10-32). La sustitución de C mostró una distribución más uniforme, con una ligera insuficiencia de T (p = 0,007).

Después se buscaron las causas subyacentes a la sustitución de bases preferente. Para lograr esto, los inventores distinguieron entre dos conjuntos de acontecimientos informativos y no informativos.

Los acontecimientos informativos son situaciones en las que la base sustituida es diferente de la base precedente (b-1) o de la base siguiente (b+1) (n = 1676) (figura 7c). Los acontecimientos no informativos son situaciones que no cumplen estos criterios. Cuando se analizan acontecimientos informativos aparecen dos casos: la base sustituida es reemplazada por b-1 o b+1 (79%) o por otra base, diferente de b-1 y b+1 (21%). 1) En el primer subconjunto, la base de sustitución fue idéntica a b-1 (n = 799, figura 7c, panel B) o b+1 (n = 530, figura 7c, panel C). Cuando la base de sustitución fue b-1, entonces b0 = A (36%) > C (30%) >> T (21%) >> G (13%) (figura 7d, panel A). A fue sustituida preferentemente por C (71% de los casos). Cuando la base de sustitución fue b+1, entonces b0 = T (47%) >> A (21%) > C (19%) >> G (13%) (figura 7a, panel B). T fue sustituida preferentemente por G (71%). De manera interesante, la importancia estadística de las bases circundantes también fue diferente (figura 7d, panel A, y figura 7d, panel B). Para las sustituciones b-1, el patrón de influencia relativa de la composición de bases fue b0 > b-1 > b- 2 > b+1 > b-3 > b+2. Para las sustituciones b+1, la influencia relativa de las bases circundantes sigue el patrón de b0 > b+1 > b-1 > b+2 > b-3 > b-2. 2) En el segundo subconjunto de acontecimientos informativos, la base de sustitución no se correponde con b-1 ni b+1 (n = 347, figura 7c, panel D). Las bases afectadas tuvieron el siguiente orden: A (47%) > T (29%) > C (14%) > G (10%). A fue reemplazada más habitualmente por C (91% de los casos), T por C (50%) y A (42%), C por G (46%), y G por C (73%). Por tanto, cuando la base de sustitución no se corresponde con b-1 ni b+1, la base de sustitución no se selecciona de modo aleatorio, sino que es C en muchísimas ocasiones.

Después los inventores consideraron el conjunto de acontecimientos no informativos, es decir, las situaciones en las que 1) b-1 = b+1, y en las que 2) b-1 = b0 = b+1 (figura 7c). Cuando b-1 y b+1 son idénticos pero diferentes de b0 (n = 339, figura 7c, panel E), las bases sustituidas tuvieron el siguiente orden: T (34,8%) > G (23,6%) > C (21,2%) < A (20,4%), y siguieron el mismo patrón de preferencia que en la figura 7b: T  G, G  A, A  C. Las sustituciones que se produce en la base central de repetición de tres bases idénticas (n = 266, figura 7c, panel F) se observaron en el siguiente orden: A (46,2%) > T (36,9%) > G (10,5%) > C (6,4%). En este caso, los acontecimientos de sustitución más comunes fueron: A  C, y T  C y A. Las raras sustituciones de GGG fueron reemplazadas, de modo más habitual, por GCG y CCC por CAC (figura 7c).

Por tanto, cuando las sustituciones aparecen dentro de tres bases idénticas consecutivas, y cuando las sustituciones no se corresponden con b-1 ni b+1, entonces C es la base de sustitución más habitual (figura 7c). Cuando la base de sustitución se corresponde con b-1, la sustitución más habitual es A  C; cuando la base de sustitución se corresponde con b+1, la sustitución más habitual es T  G.

Por tanto, puede concluirse que ni la base que se sustituye ni la base de sustitución se seleccionan de modo aleatorio. Ambos fenómenos siguen patrones predecibles definidos por la composición de la base que se sustituye y la de las bases localizadas cadena arriba y cadena debajo de este acontecimiento.

Pueden definirse algoritmos específicos para identificar con precisión la composición del motivo que determina la aparición de la sustitución de bases en cualquier secuencia concreta.

Después, los inventores separaron el conjunto C>N en dos conjuntos en los que N es estable (no se observa desviación en la misma posición en el conjunto normal) o no lo es. La desviación se considera sólo si excede de un cierto umbral definido como el porcentaje medio de desviación en el conjunto normal. La figura 7e demuestra que el conjunto C>N porta la firma -4/+3 en el que N se desvía. La longitud del contexto es menos importante en el otro conjunto. La figura 7f muestra una acumulación en el intervalo 500-1000 que es más importante en el conjunto C>N en el que N se desvía, que en el conjunto C>N en el que N es estable. En éste último, parece que aparecieron acontecimientos más tempranos (intervalo 0-500). Las bases de sustitución para los sitios C>N fueron similares entre los dos conjuntos (figura 7g).

En el caso de deleciones o inserciones, los resultados demuestran que las bases omitidas (398 casos C>N) tuvieron el siguiente orden: C (46,0%) > T (37,9%) >> A (9,3%) > G (6,8%) (figura 5m), y que las bases insertadas (225 casos C>N) tuvieron el siguiente orden: G (36,0%) > C (30,2%) > A (21,8%) > T (12,0%) (figura 5o). Los inventores observaron que los acontecimientos de deleción o inserción a menudo se producen en bases idénticas conservadas. Un programa específico diseñado para analizar estos acontecimientos muestra efectivamente que 94,7% de las deleciones y 81% de las inserciones se producen en tramos de longitudes variables. Los tramos pueden ser bipolares y asimétricos (por ejemplo, AAATAA) o no (por ejemplo, CCCGG) o repeticiones de nucleótidos individuales (por ejemplo, AAA) (véanse los motivos en la figura 5m-5p). En el caso de las deleciones, las bases omitidas son idénticas a la base b-1 o b+1 (tramo) en 84% de los casos. La mayoría de los motivos son dobletes o tripletes de C > T > A  G. Se observan resultados similares en el caso de las inserciones. De hecho, los motivos de los tramos no parecen ser diferentes entre C>N y N>C. La especificidad de C>N o N>C surgiría de otra información alrededor de los tramos. Otros análisis en más genes confirmarán estas observaciones.

Tomando en cuenta los 17 genes, los inventores observaron una heterogeneidad de EST con una tasa de 10 por 100 bases (figura 5j y figura 8a-c). Esta tasa es mayor que cualquier tasa de mutación descrita producida en el ADN genómico. Como referencia, se puede calcular que los polimorfismos de un solo nucleótido se producen aleatoriamente en el genoma una vez cada 300 bases. La tasa de polimorfismos de un solo nucleótido que afectan al ADN transcrito es mucho menor: se calcula que aparece una vez cada 3000 bases. Es evidente que las mutaciones en el ADN se producen con más frecuencia en el cáncer. Sin embargo, los trabajos en profundidad de secuenciación de ADN de cáncer de mama y colon que incluían 14 de los 17 genes utilizados en este estudio, condujeron a una tasa de mutación somática estimada de 3,1 mutaciones por 106 bases (Sjoblom, T. et al. (2006), Science, 314, 268-274). Por tanto, la infidelidad de la transcripción que se describe en esta invención se produce con una tasa mucho mayor que las mutaciones que afectan al ADN. De manera más importante, la mayoría de las sustituciones de bases en el ADN tienen consecuencias limitadas a nivel de proteínas, porque menos del 10% del ADN genómico se transcribe a ARNm. En contraste, la sustitución de bases debido a la infidelidad de la transcripción a menudo tiene consecuencias directas sobre la función de la proteína. En efecto, 1179 de 2281 sustituciones descritas en la presente (1548 CDS - 369 sustituciones silenciosas) condujeron a unas sustituciones de bases con un impacto inmediato sobre la secuencia primaria de AA de la proteína (figura 8d). De manera más importante, se observaron unas sustituciones de bases significativas que afectan al codón de fin en 9 de los 17 genes ensayados. Sin embargo, antes del concepto de la infidelidad de la transcripción no se había propuesto que las proteínas humanas contuviesen secuencias codificadoras adicionales codificadas por secuencias de ARN consideradas hasta la fecha “regiones no traducidas”. Los inventores ahora demuestran que la sustitución de bases que se produce en los codones de fin naturales debido a la infidelidad de la transcripción revela nuevas regiones codificadoras que codifican AA específicos. Estas nuevas regiones codificadoras están en fase con el marco de lectura abierto nativo. El codón de fin natural se transforma en un codón codificador. El siguiente triplete de bases entonces se lee como un AA y la traducción avanza con una nueva región codificadora hasta que se alcanza un nuevo codón de fin. Los inventores han verificado que éste es el caso en 8 de los 17 genes que mostraron infidelidad de la transcripción. Estos 8 contenían codones de fin alternativos dentro del marco con la correspondiente RefSeq (GAPDH no contiene un codón de fin alternativo). Esto tiene una consecuencia inmediata porque, en cada caso, se crean nuevas secuencias codificadoras de 14, 7, 13, 15, 13, 4, 9, 55 AA en TPT1, RPS6, RPL7A, VIM, RPS4X, FTH1, FTL y TPI1, respectivamente (figura 10). La adición de estos AA tiene el potencial de crear motivos que serán muy potenciados en el cáncer; estos motivos darán o no como resultado una nueva función de las proteínas. La predicción de este acontecimiento conduce al posible desarrollo de herramientas útiles que puedan ser utilizadas en el diagnóstico, con objetivos terapéuticos u otros objetivos. La predicción de este acontecimiento también conduce al posible desarrollo de anticuerpos específicos que reconocerán secuencias específicas del cáncer en el extremo carboxi-terminal de la proteína. Ningún método analítico actual es capaz de unaa secuenciación de proteínas directa en el extremo carboxi-terminal. Sin embargo, es posible romper las proteínas de forma enzimática y secuenciar los productos de la ruptura desde su extremo NH2 terminal. También es posible analizar el contenido de AA de los péptidos generados mediante proteolisis utilizando espectrometría de masas. Los inventores además han demostrado que estos codones de fin alternativos también se ven afectados por la infidelidad de la transcripción (7/9 genes tiene el segundo codón de fin alternativo afectado). El mismo fenómeno descrito anteriormente puede expandir aún más la lectura a un nuevo conjunto de secuencias. La anotación de todas las secuencias de proteínas utilizando el método de los inventores revelará varias secuencias de ARNm codificadoras insospechadas que serán transcritas con más o menos eficacia dependiendo de la utilización de los codones, así como de la capacidad de la maquinaria de traducción para traducir correctamente o no las sustituciones de las bases. De hecho, las sustituciones de las bases pueden conducir a cambios en la estructura del ARNm, que pueden modificar la velocidad de lectura ribosómica. No obstante, los inventores suponen que las sustituciones de bases no implicarán cambios en la estructura del ARN. Basándose en la aparición de alteraciones en los codones de fin, calculan, en los genes afectados, que hasta 4% del ARNm en los tejidos cancerosos contiene estas regiones codificadoras adicionales.

Un programa específico basado en varios filtros puede utilizarse para anotar todas las secuencis de proteínas para la presencia de un péptido de post-fin (PSP) putativo. Después de recuperar la secuencia nucleica que se corresponde con las proteínas estudiadas, el programa busca la presencia o la ausencia de una secuencia nucleica en fase después del fin canónico, con otro fin en fase (la posibilidad de pasar por encima de uno o más codones de fin en el caso de que la infidelidad de la transcripción afecte a estos codones de fin alternativos debe tomarse en cuenta). Puede fijarse una longitud mínima (por ejemplo, sólo las secuencias que codifiquen más de 12 aminoácidos pero, en último término, la longitud del péptido puede ser menor) según un criterio mínimo para la predicción de un patrón antigénico potencial. Entonces los PSP antigénicos se almacenan (figura 18). Se emplea otra etapa para validar los candidatos con la anotación mediante la formación de la máquina de aprendizaje del fin canónico: en efecto, puede determinarse la probabilidad de que una o más bases del codón de fin puedan ser sustituidas mediante la infidelidad de la transcripción. También es posible analizar el contenido en AA de los péptidos generados mediante proteolisis utilizando espectrometría de masas.

Los inventores también han descubierto que, además de crear condiciones que permiten la traducción de nuevas secuencias de proteínas, la infidelidad de la transcripción puede introducir codones de fin prematuros en el ARNm. Se identificaron 24 nuevos codones de fin que aparecían dentro del marco de lectura abierto canónico en 13 de los 17 genes. Esto indica que la infidelidad de la transcripción puede dar como resultado la producción de proteínas más cortas que carecen de dominios específicos. Estas proteínas truncadas pueden producir un aumento o la pérdida de la función. Es probable que la estructura tridimensional de la proteína se vea afectada y, por tanto, se crean nuevas entidades que pueden ser reconocidas por el sistema inmunológico.

Por último, la infidelidad de la transcripción en los 17 genes ensayados revela que 50% de todas las sustituciones C>N identificadas conducen a cambios en los AA. 17% se corresponden con la sustitución de AA por otros AA de la misma familia, y 33% se corresponden con sustituciones de AA por una clase diferente de AA. Por tanto, la infidelidad de la transcripción es capaz de generar proteínas con nuevas secuencias de AA con funciones o actividad potencialmente modificadas. La predicción de la infidelidad de la transcripción utilizando las reglas descritas anteriormente permitirá la predicción lógica de cambios en el comportamiento de proteínas y el resultado de experimentos proteómicos.

Ejemplo 6. Validaciones biológicas

Las validaciones biológicas se realizan a dos niveles: ARNm y proteínas. En primer lugar, se detectarán las sustituciones en el ARNm de los 17 genes de interés en tejidos cancerosos humanos. Los inventores utilizaron DHPLC (cromatografía líquida de alta resolución desnaturalizante), que es un método cromatográfico a gran escala para detectar mutaciones en las secuencias. El principio del experimento se describe en la figura 11a-c. Primero los inventores desarrollaron un método para ensayar el umbral de DHPLC transgenómico para estimar el porcentaje de ADN mutado en la muestra que es suficiente para permitir la formación y la detección de heterodúplex. En efecto, se emplearon fragmentos de PCR de 300 pb con 1 y 3 sustituciones de bases. Se prepararon diferentes proporciones de estos fragmentos: 0%, 2,5%, 5%, 7,5%, 10%, 20% o 50%. La DHPLC permite distinguir el ADN normal y el ADN normal más mutado en cuanto la muestra contenga del 2,5% al 5% de ADN mutado (figura 11d).

Estos resultados indican que los inventores fueron capaces de distinguir el ARNm de tejidos normales y cancerosos para los genes de interés. Se empleó ARNm extraído de tejidos adyacentes normales y cancerosos (Biochain Inc.) para ensayar tres genes: GAPDH, ENO1 y TMSB4X. Como la DHPLC se aplica al ADN, las muestras de ARNm se convierten en ADNc utilizando transcriptasa inversa. Los inventores elegieron regiones que muestran sustituciones mucho más significativas en EST procedentes de tejidos de cáncer que EST procedentes de tejidos normales. Los cebadores utilizados para la amplificación se muestran en la figura 12.

En un primer conjunto de experimentos, varios ADNc de tejido adyacente normal y canceroso (hígado, riñón, mama y colon) se amplificaron mediante PCR con dichos cebadores y se inyectaron en el sistema DHPLC. La temperatura de la estufa se seleccionó con el programa informático Navigator (Transgenomic). Se obtuvieron perfiles para los genes descritos anteriormente, y un experimento representativo se presenta en la figura 15 para los genes ENO1, GAPDH y TMSB4X. Tal como se muestra en las figuras 15a a 15c, los perfiles del cáncer son claramente diferentes de los perfiles normales para los genes GAPDH y ENO1. No se observaron diferencias para el gen TMSB4X, tal como se esperaba (tiene muchos menos sitios de infidelidad de la transcripción). Las inyecciones del mismo producto de PCR y de otros 2 productos de PCR se realizaron por triplicado (figura 15b y 15c), y los perfiles fueron muy reproducibles en el mismo experimento. Sin embargo, la naturaleza de la diferencia no puede deducirse de este experimento.

Por consiguiente, se realiza la continuación de esta validación biológica basada en ARNm. De hecho, la secuenciación de los productos de PCR procedentes de tejidos cancerosos puede permitir una detección precisa de las mutaciones más abundantes.

El método de secuenciación de Sanger clásico de ARNm amplificado con PCR de transcripción inversa no detecta los variantes de secuencia que se producen a unas tasas inferiores a 15-30% en una posición específica (figura 16). En efecto, la lectura automática de nucleótidos mutados obtenida mediante la secuenciación de mezclas de productos de la amplificación de secuencias conocidas mutadas y no mutadas se obtiene en mezclas del 50-50% y se detectan picos secundarios del 15%. La pirosecuenciación y la PCR de emulsión son métodos más sensibles que permiten la detección de la heterogeneidad del ADNc, y por tanto es posible el análisis de los productos de RT-PCR obtenidos de células cancerosas y normales (Thomas, R.K. et al. (2006), Nat. Med., 12, 852-855).

Un gen afectado por la infidelidad de la transcripción se clona por completo, o se clona un fragmento que comprende y que no comprende su sitio de infidelidad de la transcripción. La construcción con y sin el codón de fin canónico se acopla dentro del marco con el gen que codifica la resistencia a la neomicina. Se transfectan células cancerosas y normales con esta construcción quimérica, primero de forma transitoria y después estable. Los inventores predicen que la infidelidad de la transcripción conducirá a cambiar el codón de fin canónico, permitiendo con ello la traducción del gen de neomicina y creando una célula resistente a la neomicina. También predicen que las células cancerosas que sean resistentes a la neomicina crecerán con más rapidez, y que la forma de estas células será significativamente diferente de la de las células normales. Además, predicen que estas células serán más invasivas y pueden compararse con las células de una etapa más tardía del avance del cáncer. Por tanto, esta técnica puede utilizarse para determinar la fase cancerosa de diferentes células procedentes de un paciente individual.

La prueba final de que la resistencia a la neomicina aparece como resultado de la infidelidad de la transcripción se obtendrá secuenciando la construcción insertada amplificada a partir del ADN genómico y demostrando que la información genómica permanece inalterada. Los inventores también verificarán que el ARNm de la célula resistente a la neomicina contiene un codón de fin mutado debido a la infidelidad de la transcripción.

Una técnica que permite la detección de sitios de infidelidad de la transcripción es la construcción de bancos de ADNc que consisten en clonar ADNc obtenido mediante transcripción inversa a partir del ARN extraído de tejidos de pacientes cancerosos y normales. Cada ADNc, amplificado o no a partir de un gen específico, se clona en plásmidos diferentes que se tranforman en Escherichia coli. Se escogen diferentes colonias de E. coli y los plásmidos se secuencian. El número de clones que deben secuenciarse depende del porcentaje de sustituciones en el fragmento de ADNc clonado. Un análisis estadístico proporcionará la variación en la secuencia en los sitios de infidelidad de la transcripción. Esta técnica puede mejorarse. En efecto, después de la transcripción inversa y de la amplificación con cebadores específicos, el ADNc puede clonarse en un plásmido que porte un gen indicador, por ejemplo, el gen lacZ. El ADNc y el gen indicador pueden clonarse en fase. Cuando aparece una sustitución en la secuencia del codón de fin del ARNm, el gen indicador se expresa. Cuando las células de E. coli se transforman con esta construcción, las colonias que portan el plásmido en el que el ADNc está mutado en el codón de fin se seleccionan con la expresión del gen indicador. Después de esto, el plásmido puede secuenciarse para verificar si la sustitución del codón de fin está presente.

Se emplea otra técnica basada en la PCR a tiempo real con cebadores específicos para detectar los sitios de infidelidad de la transcripción. Estos cebadores se diseñan para que se apareen con un ADNc con una variación o variaciones en la secuencia basadas en un análisis estadístico. Se diseña un segundo cebador para que se aparee con el ADNc sin la variación en la secuencia (referencia). El número de variaciones en la secuencia del cebador es muy importante, y los inventores han determinado que, en un experimento de ensayo con una variación conocida en la secuencia, son necesarias dos mutaciones fuera de la posición que se estudia para obtener una señal fluorescente específica. Cuando el cebador es complementario con el ADNc sin una sustitución en la secuencia (referencia), la señal fluorescente se detecta tras un número específico de ciclos de amplificación. El mismo ADNc amplificado con el cebador que porta la sustitución en la secuencia conduce a una señal de fluorescencia que aparece con un número grande de ciclos de amplificación. La diferencia entre el número de ciclos de amplificación entre los dos cebadores es una estimación directa de la presencia de un ADNc con una sustitución en la secuencia. Además, los inventores han verificado que el método es lo suficientemente sensible como para detectar 1% de la secuencia mutada en una mezcla de secuencias conocidas.

En un experimento típico, un ARN extraído de tejidos de pacientes cancerosos y normales se somete a transcripción inversa y se amplifica con cada uno de dichos cebadores específicos. Entonces se mide la diferencia entre los ciclos de amplificación con ambos cebadores.

Por último, los inventores se centraron en las nuevas proteínas inducidas cuando el codón de fin natural se ve afectado. Los inventores demostraron que el codón de fin se ve significativamente afectado en 9 de los 17 genes de interés. Esto conduce a poblaciones específicas de proteínas diferenciadas con una nueva secuencia en el extremo carboxi-terminal. Los inventores han calculado que los tejidos cancerosos con genes afectados contienen 4% de proteínas que son más largas que las normales.

A la vista de esta hipótesis, se analizaron 60 proteínas plasmáticas abundantes (figura 13) y se buscaron posibles PSP. Se descubrieron 22 genes para los cuales un PSP era lo suficientemente largo y antigénico (figura 18). Después se buscaron secuencias de proteínas más largas putativas inducidas (figura 18b-c). Después se buscaron nuevos péptidos putativos en el plasma obtenido de individuos normales y cancerosos (figura 18). Se seleccionaron 3 de estas 22 proteínas interesantes: APOAI, APOAII y APOCII. Basándose en los anteriores análisis, se espera encontrar proteínas más largas en el plasma de los pacientes cancerosos (13, 16 y 17 AA más largas). Se predice que estas secuencias peptídicas de infidelidad de la transcripción serán inmunogénicas, y los anticuerpos dirigidos contra estas nuevas secuencias representan ligandos específicos para medir la infidelidad de la transcripción (figura 14). Puesto que el análisis de Kyte-Doolittle indica que estas secuencias no son hidrófobas, se espera que estas tres nuevas proteínas se segreguen hacia la circulación (véase a continuación).

Identificación del péptido de post-fin (PSP) de ApoII y ApoCII debido a la sustitución en el codón de fin canónico Los PSP que resultan de las sustituciones de bases en el codón de fin canónico pueden identificarse y caracterizarse de la siguiente manera. Se preparan anticuerpos policlonales de conejo que reconocen una porción o porciones inmunogénicas del PSP en cuestión. Estos anticuerpos antipéptido pueden comprobarse mediante un análisis de la transferencia de puntos utilizando el péptido purificado para verificar que, en efecto, reconocen el PSP. Entonces puede realizarse un análisis de la transferencia Western con muestras de plasma obtenidas de pacientes cancerosos utilizando anticuerpos dirigidos contra el PSP. La figura 17a (panel derecho) demuestra que el anticuerpo anti-PSP de ApoAII reconoce una banda en las transferencias Western realizadas con muestras de plasma obtenidas de pacientes con cáncer de próstata, que no se observa cuando se emplea suero preinmunológico de conejo como control negativo (figura 17a, panel izquierdo). La banda de PSP de ApoAII también se observa en pacientes con cáncer en la fase metastásica (figura 17b, panel derecho). Esta banda tiene una masa molecular ligeramente mayor (11,4 kDa) comparada con la de la forma de monómero nativa de la ApoII (figura 17a, panel central, figura 17b, panel izquierdo). Esta masa molecular se corresponde con la predicha basada en el secuencia peptídica adicional. También pueden prepararse geles bidimensionales para caracterizar aún más esta banda.

Pueden realizarse experimentos de cromatografía de afinidad para aislar la forma de PSP de ApoAII utilizando el anticuerpo anti-PSP (figura 17e). El anticuerpo anti-PSP se inmoviliza sobre esferas de matriz y esta columna se incuba en presencia de plasma o HDL deslipidado, y después se lava secuencialmente para eliminar las proteínas unidas no específicamente y, por último, se eluye con detergente o reactivos caotrópicos. La fracción eluida se analiza mediante transferencia Western utilizando los anticuerpos anti-PSP y los anticuerpos comerciales anti- ApoAII. Dos bandas a 9 kDa y 11,4 kDa son reconocidas por el anticuerpo comercial anti-ApoAII, mientras que sólo la banda de 11,4 kDa es reconocida por el anticuerpo anti-PSP. Por tanto, la banda de 9 kDa se corresponde con la forma nativa de ApoAII y la de 11,4 kDa se corresponde con la forma de PSP de ApoAII. La presencia de ApoAII nativa en la fracción eluida sugiere que la proteína PSP de ApoAII puede formar dímeros con la proteína ApoAII nativa bajo condiciones no reductoras nativas. En efecto, la ApoAII existe normalmente en el plasma como un dímero de dos monómeros unidos mediante un único puente disulfuro.

La ApoAII se localiza principalmente en la fracción de HDL del plasma, que puede aislarse mediante ultracentrifugación secuencial. Unos análisis de la transferencia Western demuestran que la PSP de ApoAII no se detecta en la fracción de d < 1,07 g/ml que contiene VLDL y LDL, sino en la fracción de d > 1,07 g/ml que contiene HDL y proteínas plasmáticas (figura 17c). Después de más etapas de ultracentrifugación para purificar y lavar el HDL (d = 1,07-1,21 g/ml), la transferencia Western revela que la PSP de ApoAII permanece asociada con la fracción HDL en lugar de con la fracción d > 1,21 g/ml, también denominada suero deficiente en lipoproteínas (LPDS). Una cantidad correspondiente del plasma demuestra, en la transferencia Western, que esto no es debido a una dilución de la fracción de d > 1,21 g/ml durante las etapas de purificación. La separación de las lipoproteínas del plasma mediante una filtración en gel utilizando Superose 6B (Amersham, GE Healthcare) también demuestra que la PSP de ApoAII eluye de una manera similar a la de la ApoAII asociada con HDL.

La asociación de PSP de ApoAII con HDL permite la purificación de la forma de PSP de ApoAII de una manera similar a la de la ApoAII. En primer lugar, el HDL se deslipida para eliminar todos los lípidos. El sedimento de proteínas exento de lípidos resultante entonces se resuspende en tampón Tris 10 mM que contiene urea o guanidina en presencia o en ausencia de un agente reductor, y se aplica a una columna de filtración en gel (por ejemplo, Superdex 200, Amersham, GE Healthcare). Un análisis de la transferencia Western (figura 17d) demuestra que la forma de PSP de ApoAII sigue estando presente en HDL deslipidado. Se logró una mayor purificación mediante una electroforesis preparativa (por ejemplo, DE52). La forma de PSP de ApoAII fue rastreada mediante un análisis de la transferencia Western. La forma de PSP de ApoAII purificada entonces se rompió de forma enzimática (tripsina), y los péptidos resultantes se analizan en MS-MS para la secuenciación completa de los AA. Los resultados demuestran que el codón de fin canónico está reemplazado preferentemente por arginina, con una sustitución (U a C) o (U a A), seguido de serina, valina, ácido glutámico, treonina, isoleucina, valina, fenilalanina, ácido glutámico, prolina, ácido glutámico, leucina, alanina, serina, arginina. Esta es la secuencia exacta de aminoácidos que se predice que aparecerá tras pasar por encima del codón de fin canónico de ApoAII. Por tanto, el codón de fin canónico UGA de ApoAII se sustituye por AGA o CGA que conduce a una arginina. Una hipótesis aún inexplorada es que UGA se convierte en GGA, que conduce a la glicina, pero la detección de este variante mediante espectrometría de masas todavía se encuentra fuera de los límites tecnológicos actuales.

Otro ejemplo se ilustra con el PSP de ApoCII. La figura 17f muestra un experimento similar al de la figura 17a, con la excepción de que los análisis de la transferencia Western se realizan con anticuerpos comerciales anti-ApoCII y con anticuerpos anti-PSP de ApoCII. Puede seguirse un procedimiento similar al del PSP de ApoAII para ApoCII. Sin embargo, ApoCII es menos abundante en el plasma. Por tanto, se requiere una cantidad mucho mayor de plasma que contenga PSP de ApoCII para obtener una cantidad suficiente para el análisis con MS-MS.

Conclusiones

Los inventores describen en la presente un nuevo mecanismo que conduce a unas sustituciones de bases que se producen en su mayor parte en el extremo 3’ de la secuencia codificadora y la región no traducida del ARNm. Estas sustituciones de bases conducen a cambios en la secuencia de AA de proteínas debido a cambios en la identidad de los AA, la introducción de codones de fin prematuros, así como la modificación de los codones de fin naturales que resultan en la introducción de nuevas regiones codificadoras. Este fenómeno de infidelidad de la transcripción también puede afectar al mundo del ARNnc y alterar la regulación mediada por estos ARN. Se produce en la mayoría de los genes con una tasa que excede cualquier fenómeno descrito que conduzca a una mutación en el ADN. La infidelidad de la transcripción aumenta muchísimo en células cancerosas. La infidelidad de la transcripción proporciona un nuevo paradigma para comprender la patología del cáncer, la gravedad de la enfermedad y el avance de la enfermedad. Tiene implicaciones importantes no sólo en el diseño de nuevos experimentos transcriptómicos y proteómicos, sino también para el desarrollo de diagnósticos y productos terapéuticos específicos.

LISTA DE SECUENCIAS

<110> TRANSMEDI SA <120> Infidelidad de la transcripción, su detección y sus usos <130> B478EPPC <160> 32 <170> Patent In versión 3.3 <210> 1 <211> 13 <212> PRT <213> Homo sapiens <400> 1 <210> 2 <211> 14 <212> PRT <213> Homo sapiens <400> 2 <210> 3 <211> 6 <212> PRT <213> Homo sapiens <400> 3 <210> 4 <211> 12 <212> PRT <213> Homo sapiens <400> 4 <210> 5 <211> 12 <212> PRT <213> Homo sapiens <400> 5 <210> 6 <211> 3 <212> PRT <213> Homo sapiens <400> 6 <210> 7 <211> 8 <212> PRT <213> Homo sapiens <400> 7 <210> 8 <211> 54 <212> PRT <213> Homo sapiens <400> 8 <210> 9 <211> 69 <212> PRT <213> Homo sapiens <400> 9 <210> 10 <211> 26 <212> PRT <213> Homo sapiens <400> 10 <210> 11 <211> 14 <212> PRT <213> Homo sapiens <400> 11 <210> 12 <211> 12 <212> PRT <213> Homo sapiens <400> 12 <210> 13 <211> 20 <212> PRT <213> Homo sapiens <400> 13 <210> 14 <211> 16 <212> PRT <213> Homo sapiens <400> 14 <210> 15 <211> 22 <212> PRT <213> Homo sapiens <400> 15 <210> 16 <211> 15 <212> PRT <213> Homo sapiens <400> 16 <210> 17 <211> 54 <212> PRT <213> Homo sapiens <400> 17 <210> 18 <211> 36 <212> PRT <213> Homo sapiens <400> 18 <210> 19 <211> 37 <212> PRT <213> Homo sapiens <400> 19 <210> 20 <211> 13 <212> PRT <213> Homo sapiens <400> 20 <210> 21 <211> 29 <212> PRT <213> Homo sapiens <400> 21 <210> 22 <211> 72 <212> PRT <213> Homo sapiens <400> 22 <210> 23 <211> 14 <212> PRT <213> Homo sapiens <400> 23 <210> 24 <211> 39 <212> PRT <213> Homo sapiens <400> 24 <210> 25 <211> 53 <212> PRT <213> Homo sapiens <400> 25 <210> 26 <211> 27 <212> PRT <213> Homo sapiens <400> 26 <210> 27 <211> 25 <212> PRT <213> Homo sapiens <400> 27 <210> 28 <211> 20 <212> PRT <213> Homo sapiens <400> 28 <210> 29 <211> 71 <212> PRT <213> Homo sapiens <400> 29 <210> 30 <211> 48 <212> PRT <213> Homo sapiens <400> 30 <210> 31 <211> 100 <212> PRT <213> Homo sapiens <400> 31 <210> 32 <211> 16 <212> PRT <213> Homo sapiens <400> 32

REIVINDICACIONES

1. Uso un péptido sintético con una longitud de 100 aminoácidos o menos, que comprende una secuencia seleccionada de SEQ ID NOs: 1 a 5, 7 a 13, 15 a 18 y 20 a 32 para detectar o controlar trastornos de células proliferativas.

2. El uso de un péptido de la reivindicación 1, para detectar o controlar trastornos de células proliferativas, donde el péptido es inmunogénico.

3. Una composición de vacuna que comprende un péptido de la reivindicación 1, y opcionalmente un vehículo, excipiente y/o adyuvante adecuado.

4. Una molécula de ácido nucleico sintética que codifica un péptido de 100 aminoácidos o menos que comprende una secuencia seleccionada de SEQ ID NOs: 1 a 5, 7 a 13, 15 a 18 y 20 a 32 para detectar o controlar trastornos de células proliferativas.

5. Un método para producir un anticuerpo, comprendiendo el método inmunizar a un mamífero no humano con un péptido de la reivindicación 1 y recuperar anticuerpos que se unen a dicho péptido, o las correspondientes células productoras de anticuerpos.

6. Un anticuerpo, o derivado del mismo, que se une específicamente a un péptido de la reivindicación 1.

7. Un anticuerpo, o derivado del mismo, según la reivindicación 6, donde dicho anticuerpo es el conjugado de una molécula, tal como un fármaco, un marcador, una molécula tóxica o un radioisótopo.

8. El anticuerpo conjugado, o derivado del mismo, de la reivindicación 7, para usar como medicamento o reactivo de diagnóstico.

ES 2 553 435 T3   - q21.

18q12 E11173357 17-11-2015 - q14.

Figura 2r - q22.

- 124.

- 13.4.

- p36.2.

- q13.

- bisfosfato, 2303 pb, chr 16 q22 ligero, 870 pb, chr 19q13.3 pb, chr 10p13.

choque térmico de 70 kDa, 2260 pb, chr 11q24.1.

- 3 - fosfato deshidrogenasa, 1310 pb, chr 12p13.

TPT1 = Proteína tumoral, traduccionalmente controlada, 1, 830 pb, chr 13q12 VIM = Vimentina, 1847 FTH1 = Ferritina, polipéptido pesado 1, 1228 pb, chr 11q13.

RPS4X = Proteína ribosómica S4, unida a X, 955 pb, chr X q13.1.

RPL7A = Proteína ribosómica L7a, 890 pb, chr 9q34.

ENO1 = Enolasa 1, 1812 pb, chr 1p36.3 HSPA8 = Proteína 8 de GAPDH = Gliraldehído TMSB4X = Timosina, beta 4, unida a X, 627 pb, chr X q21.3 RPS6 = Proteína ribosómica S6, 829 pb, chr 9p21.

FTL = Ferritina, polipéptido ALB = Albúmina, 2215 pb, chr 4q11 ALDOA = Aldolasa A, fructos ATP5A1 = ATP sintasa, transportador de H+, complejo F1 mitocondrial, subunidad alfa 1, músculo cardíaco, 1945 pb, chr CALM2 = Calmodulina 2 (fosforilasa quinasa, delta), 1128 pb, chr 2p21.

LDHA = Lactato deshidrogenasa A, 1661 pb, chr 11p15.4.

TPI1 = Triosafosfato isomerasa 1, 1220 pb, chr 12p13.

ES 2 553 435 T3  

Posiciones C>N (398)

Mono

Inicio

Final

Base omitida Nb Ref Especialidad Frec Ref Frec EST

r a 5 m

u i g F

ES 2 553 435 T3  

r a 5 n

u i g F

ES 2 553 435 T3  

Posiciones N>C (100)

Inicio Bipolar Final Mono Base insertada Nb Ref Freq Ref Freq EST 1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6

r a 5 p

u i g F

ES 2 553 435 T3  

ES 2 553 435 T3  

) e s n e g 7 t ( 1

0 n / 5 s e n i o c

r a 7 f

u

t i t u

i g

s

F

s u e d r o e m ú N

s a d l a u m u

s )

c

e

a

n

s

e

e

g

n

7

i o

( 1

c t i t u s u S

ES 2 553 435 T3  

ES 2 553 435 T3 de   PCR la de columna la en En presencia de un productos de zcla homodúplex me los e una qu como antes ºC a 65 ºC antes del análisis.

eluyen - 296, 2003 alquiera de los homodúplex forman heterodúplex. B. Los y generalmente 70ºC), a ºC 50 cromosomas de dos varían compara (que Figura 11c DHPLC análisis del Una a.

eraturas mp DHPLC.

te las a diante me patrones cromatográficos muestran cuatro picos diferentes que pertenecen a cuatro especies diferentes de ADN.

grado Fuente: Theru A. Sivakumaran et al., Current Science, 84:291 mayor detectada en mutación ºC durante 3 min y reasociados a lo largo de 30 min mediante un enfriamiento gradual desde 95 de desnaturalizan se Principio 2.

Figura

desnaturalizados a 95 desapareamiento, no sólo se forman los homodúplex originales sino también las hebras sentido y antisentido de cu heterodúplex separación de ADN. c. Los correspondientes

ES 2 553 435 T3  

ES 2 553 435 T3 la y en   TMSB4X representa y se GAPDH canceroso ENO1, perfil el ºC para el gen GAPDH, de 61,5 ºC genes y ,5 igator (Transgenomic).

los verde con en representa se complementarios normal mperatura de la estufa es de 62 DHPLC oligonucleótidos de perfil El utilizando Figura 15a PCR hígado. e diante ma DHPLC (Transgenomic). La te me plificó am se riñón, mama, colon

a tejido adyacente normal para los genes ENO1, GAPDH y TMSB4X.

de Inc.) tejidos de (Biochian obtuvo se cancerosos l ADNc . E pacientes

pfx

de ADN

Perfiles de DHPLC de tejido tumoral frente

El polimerasa negro. Las muestras de ADN bicatenario se inyectaron en un siste para el gen ENO1, y de 55 ºC para el gen TMSB4X. Las curvas se visualizaron y se normalizaron con el programa informático Nav

ES 2 553 435 T3 se para   normal azul y DHPLC normal de para perfil rojo El en PLC.

visualizaron y se normalizaron con el DH presenta ma re vas se siste se el PCR en de veces dos duplicado el inyectó para se PCR obtenido de DHPLC Figura 15b producto de cada perfil

ral frente a tejido adyacente normal para el gen ENO1.

y El tejidos 4 negro. en los para representa se diferentes PCR de canceroso perfil el productos y dos verde en prepararon

Diferentes perfiles de PCR y de carga de DHPLC de tejido tumo

Se representa canceroso. Para el duplicado de carga, los perfiles se representan en morado para normal y azul claro para canceroso. Las cur programa informático Navigator (Transgenomic).

ES 2 553 435 T3 se para   normal azul y DHPLC normal de para perfil rojo El en DHPLC.

p resenta ma re vas se visualizaron y se normalizaron con el siste se el PCR en de veces dos duplicado el inyectó para se PCR 5c obtenido de DHPLC Figura 1 producto de cada perfil y El tejidos 4 negro. en los para representa rentes se dife PCR de canceroso perfil el productos y dos verde en prepararon

Diferentes perfiles de PCR y de carga de DHPLC de tejido tumoral frente a tejido adyacente normal para el gen GAPDH.

Se representa canceroso. Para el duplicado de carga, los perfiles se representan en morado para normal y azul claro para canceroso. Las cur programa informático Navigator (Transgenomic).

ES 2 553 435 T3  

ES 2 553 435 T3 cabra   diantes de mperatura me condiciones bajo humana bandas mperatura ambiente), las - ApoAII anti - poliacrilamida revelaron 4 - 12% se al anticuerpo o), SDS Entonces de izquierd geles iado.

a panel (b) aprop 1/100, tastásica conjugado me (dilución fase ST que contenía leche en polvo desnatada al 5% (1 h, te la conejo en anticuerpo de cáncer segundo con el o (a) preinmunológico con - PSP de ApoAII policlonal de conejo (1/100, panel derecho). Después de 1 h de incubación a te suero próstata incubaron de se utilizando cáncer con estern después y pacientes lavaron de transferencia W se la de procedente mbranas me análisis n el mercado (1/250, panel central), y anticuerpo anti plasma las aplicó realizarón biente, Se reductoras. Después de una transferencia sobre membranas de PVDF y de un bloque en TB se disponible e am quimioluminiscencia y exposición a películas de rayos X.

ES 2 553 435 T3 al - el para anti   estern EDTA ercial y diferentes sferencia ºC) s 4 que rcial o utilizando com La contra min, come ApoAII - ApoAII dializó de anti tastásica.

rpm, - ApoAII me anti PSP rpos (1000 fase tanol enfriado en hielo (2:1, v/v, 5 de la purificado se anticue - me en on análisis de la transferencia W ugación forma l HDL la én se realizó un análisis de la tran E centrif to se redisolvió en Tris 10 mM cáncer d.

preinmunológico, aislar una con g/ml).

de suero para tern utilizando los es 1,21 pacientes (d > seguido utilizando afinidad de de dietílico, - PSP de ApoAII (panel superior) utilizando las mismas diluciones que las deslipidado reunido lipoproteínas éter L en HD cromatografía de de plasma utilizando ug del deficiente analizó mediante transferencia W or) o anticuerpo anti la deslipidación del HDL liofilizado utilizando cloroformo en se suero experimentos eluida secuencial de deslipidación estern realizaron fracción rcial (panel inferi segunda Se La una transferencia W e.

la matriz.

ultracentrifugación de - ApoAII come realizó volumen correspondiente se diante un me o análisis de anteriormente.

esferas un g/ml) Después sobre original realizó describió - 1,21 - 80 ºC y después se liofilizó. Entonces se realizó HDL).

Se se 1,07 reunido 8.

(d como inmovilizado proteína pH M, tal HDL plasma de 6 - PSP el mg en urea ApoAII, preparó de Se las fracciones indicadas con anticuerpo anti stern por - PSP de ApoAII.

c.

fracciones recuperada después de cada etapa se dializaron contra NaCl 0,15 M, pH 7,4, que contenía EDTA al 0,01%. Se realizar en indicadas en las figuras 17a a 17b. Los geles se sobrecargaron, lo cual explica la distorsión y las bandas tan grandes. Tambi We 0,01%, pH 7,4, se congeló a ml sedimentar la proteína deslipidada. Esto se repitió y el sedimento final se secó en una atmósfera de N2 (gaseoso). El sedimen contenía PSP anticuerpo anti anti

ES 2 553 435 T3   - PSP de ApoCII policlonal de conejo.

utilizó un anticuerpo anti Se realizó un experimento similar al de la figura a., con la excepción de que se

ES 2 553 435 T3