Identificación de tumores.

Un método para clasificar una muestra que contiene células que contienen células tumorales de un tipo tisular, comprendiendo dicho método determinar los niveles de expresión de 50 o más secuencias transcritas en células de una muestra que contiene células obtenida de un sujeto humano, y

clasificar la muestra que contiene células tumorales de uno o más de una pluralidad de tipos tumorales conocidos comparando los niveles de expresión de dichas secuencias en dichas células con los niveles de expresión de dichas secuencias en la pluralidad de tipos tumorales conocidos,

en el que las 50 o más secuencias transcritas se seleccionan aleatoriamente,

en el que dicha clasificación se realiza usando un algoritmo de clasificación basado en distancia, y

en el que la probabilidad de tipos tumorales conocidos se selecciona de epitelial, no epitelial, células germinales, sarcoma, adrenal, cerebro, mama, carcinoide-intestino, cuello uterino

(células escamosas), colangiocarcinoma, endometrio, GIST (tumor del estroma gastrointestinal), riñón, leiomiosarcoma, hígado, pulmón (adenocarcinoma, células grandes), pulmón (células pequeñas), pulmón (escamoso), linfoma (linfocitos B), Linfoma (de Hodgkin), meningioma, mesotelioma, osteosarcoma, ovario (células claras), ovario (células serosas), páncreas, próstata, piel (células basales), piel (melanoma), intestino delgado y grueso; tejido blando (liposarcoma); tejido blando (MFH o Histiocitoma Fibroso Maligno), tejido blando (Sarcoma-sinovial), tiroides (folicular-papilar), tiroides (carcinoma medular) y vejiga urinaria.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2005/019736.

Solicitante: bioTheranostics, Inc.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 9640 Towne Centre Drive, Suite 200 San Diego, CA 92121 ESTADOS UNIDOS DE AMERICA.

Inventor/es: ERLANDER, MARK, G., MA,XIAO-JUN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION C — QUIMICA; METALURGIA > BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE;... > PROCESOS DE MEDIDA, INVESTIGACION O ANALISIS EN LOS... > Procesos de medida, investigación o análisis en... > C12Q1/68 (en los que intervienen ácidos nucleicos)

PDF original: ES-2548514_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Identificación de tumores Campo de la invención

La presente invención se refiere al uso de expresión génica para clasificar tumores humanos. La clasificación se realiza mediante el uso de perfiles de expresión génica, o patrones, de 50 o más secuencias expresadas que se correlacionan con tumores que surgen de ciertos tejidos así como que se correlacionan con ciertos tipos tumorales. La invención también posibilita el uso de 50 o más secuencias génicas específicas, cuya expresión se correlaciona con la fuente tisular y el tipo de tumor en diversos cánceres. Los perfiles de expresión génica, bien realizados en expresión de ácido nucleico, expresión de proteínas u otros formatos de expresión, pueden usarse para determinar que una muestra que contiene células contiene células tumorales de un tipo tisular o de un origen tisular para permitir una identificación más precisa del cáncer y por lo tanto tratamiento del mismo así como el pronóstico del sujeto del que se obtuvo la muestra.

Sumario de la invención

La presente invención se refiere al uso de mediciones de expresión génica para clasificar o identificar tumores en muestras que contienen células obtenidas de un sujeto en una situación clínica, tal como en casos de muestras fijadas en formalina, incluidas en parafina (FFPE). La invención proporciona la capacidad para clasificar tumores en las condiciones del mundo real a las que se enfrenta un hospital y otros laboratorios que tienen que realizar ensayos sobre muestras de FFPE clínicas. La invención también puede aplicarse a otras muestras, tal como muestras nuevas, que no se han sometido a ningún tratamiento o se han sometido a poco o mínimo tratamiento (tal como simplemente almacenamiento a una temperatura reducida, no de congelación), y muestras congeladas. Las muestras pueden ser de una muestra tumoral primaria o de un tumor que ha resultado de una metástasis de otro tumor. Como alternativa, la muestra puede ser una muestra citológica, tal como, pero sin limitación, células en una muestra sanguínea. En algunos casos de una muestra tumoral, los tumores pueden no haberse sometido a clasificación por técnicas de patología tradicionales, pueden haberse clasificado inicialmente pero se desea confirmación, o se han clasificado como un "carcinoma primario desconocido" (CUP) o "tumor de origen desconocido" (TUO) o "tumor primario desconocido". La necesidad de confirmación es particularmente relevante a la luz de las estimaciones de 5 a 10 % de clasificación errónea usando técnicas convencionales. Por lo tanto puede verse que la invención proporciona un medio para identificación de cáncer o CID.

En un primer aspecto de la invención, se proporciona un método para clasificar una muestra que contiene células como que contiene células tumorales de un tipo tisular, comprendiendo dicho método determinar los niveles de expresión de 50 o más secuencias transcritas de células en una muestra que contiene células obtenida de un sujeto humano, y clasificar la muestra, que contiene, eliminando uno o más tipos tumorales de la consideración, células tumorales de un tipo tisular epitelial o no epitelial incluyendo un tumor de células germinales o un sarcoma, basándose en los niveles de expresión de dichas secuencias. Los perfiles de expresión génica, bien realizados en expresión de ácido nucleico, expresión de proteínas u otros marcadores de la expresión génica, pueden usarse para determinar que una muestra que contiene células contiene células tumorales de un tipo tisular o de un origen tisular para permitir una identificación más precisa del cáncer y por lo tanto el tratamiento del mismo así como el pronóstico del sujeto del que se obtuvo la muestra.

En algunas realizaciones, la invención se usa para clasificar entre al menos 34 o al menos 39 tipos tumorales con precisión significativa en una situación clínica. La invención se basa en parte en el descubrimiento sorprendente e inesperado de que 50 o más secuencias expresadas en el genoma humano se pueden clasificar entre al menos 34, o al menos 39, tipos tumorales, así como subconjuntos de esos tipos tumorales, de una manera significativa. Dicho de otro modo, la invención se basa en parte en el descubrimiento de que no es necesario usar aprendizaje supervisado para identificar secuencias génicas que se expresan en correlación con diferentes tipos tumorales. Por lo tanto la invención se basa en parte en el reconocimiento de que 50 o más secuencias expresadas cualesquiera, incluso una colección aleatoria de secuencias expresadas, tienen la capacidad de clasificarse, y por lo tanto pueden usarse para clasificar, una célula como una célula tumoral de un tejido u origen tisular.

También se describe la clasificación de la muestra que contiene células como que contiene una célula tumoral de un tipo u origen tisular determinando los niveles de expresión de 50 o más secuencias transcritas y clasificando después la muestra que contiene células como que con tiene una célula tumoral de una pluralidad (dos o más) de tipos tumorales. Para clasificar entre al menos 34 a al menos 39 tipos tumorales, y subconjuntos de los mismos, pueden usarse tan pocas como 50 secuencias expresadas para proporcionar clasificación de una manera significativa. La invención también se basa en parte en la observación de que no es necesario que las secuencias expresadas sean los niveles de expresión de los que están evidentemente o en gran medida correlacionados (directamente, o indirectamente mediante correlación con otra secuencia expresada) con cualquiera de los tipos tumorales. También se describe el uso de los niveles de expresión de genes, cuyos niveles de expresión no se correlacionan fuertemente con la clasificación real de la muestra tumoral particular, como una de las 50 o más secuencias transcritas. Todos los genes seleccionados pueden ser no correlacionados tales, o solamente una parte

de los genes puede ser no correlacionados, típicamente al menos 90 %, 85 %, 75 %, 50 % o 25 %, así como partes que quedan dentro de los Intervalos creados usando dos cualesquiera de los ejemplos de puntos anteriores como puntos finales de un intervalo.

La Invención se práctica determinando los niveles de expresión de secuencias génlcas en los que no es necesario que las secuencias se hayan seleccionado basándose en una correlación de sus niveles de expresión con los tipos tumorales para clasificar. Por lo tanto como ejemplo no limitante, no es necesario que las secuencias génicas se seleccionen basándose en sus valores de correlación con tipos tumorales o una clasificación basada en los valores de correlación. Adicionalmente, la invención puede practicarse con uso de niveles de expresión génica que no se correlacionan necesariamente con uno o más niveles de expresión génica distintos usados para clasificación. Por lo tanto, en realizaciones adicionales, la capacidad para que el nivel de expresión de una secuencia expresada actúe en la clasificación no es redundante con (independiente de) la capacidad de al menos otro nivel de expresión génica usado para clasificación.

La invención puede aplicarse para identificar el origen de un cáncer en un paciente en una amplia diversidad de casos incluyendo, pero sin limitación, identificación del origen de un cáncer en una situación clínica. En algunas realizaciones, la identificación se realiza por clasificación de una muestra que contiene células que se sabe que contiene células cancerosas, pero el origen de estas células es desconocido. En otras realizaciones, la identificación se realiza por clasificación de una muestra que contiene células como que contiene una o más células cancerosas seguido de identificación del origen o los orígenes de esa célula o esas células cancerosas.... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para clasificar una muestra que contiene células que contienen células tumorales de un tipo tisular, comprendiendo dicho método determinar los niveles de expresión de 50 o más secuencias transcritas en células de una muestra que contiene células obtenida de un sujeto humano, y

clasificar la muestra que contiene células tumorales de uno o más de una pluralidad de tipos tumorales conocidos

comparando los niveles de expresión de dichas secuencias en dichas células con los niveles de expresión de dichas

secuencias en la pluralidad de tipos tumorales conocidos,

en el que las 50 o más secuencias transcritas se seleccionan aleatoriamente,

en el que dicha clasificación se realiza usando un algoritmo de clasificación basado en distancia,

y

en el que la probabilidad de tipos tumorales conocidos se selecciona de epitelial, no epitelial, células germinales, sarcoma, adrenal, cerebro, mama, carcinoide-intestino, cuello uterino (células escamosas), colangiocarcinoma, endometrio, GIST (tumor del estroma gastrointestinal), riñón, leiomiosarcoma, hígado, pulmón (adenocarcinoma, células grandes), pulmón (células pequeñas), pulmón (escamoso), linfoma (linfocitos B), Linfoma (de Hodgkin), meningioma, mesotelioma, osteosarcoma, ovario (células claras), ovario (células serosas), páncreas, próstata, piel (células básales), piel (melanoma), intestino delgado y grueso; tejido blando (liposarcoma); tejido blando (MFH o Histiocitoma Fibroso Maligno), tejido blando (Sarcoma-sinovial), tiroides (folicular-papilar), tiroides (carcinoma medular) y vejiga urinaria.

2. El método de la reivindicación 1, que comprende además determinar los niveles de expresión de un número adicional de secuencias transcritas, cuyos niveles de expresión no se usan en dicha clasificación.

3. El método de la reivindicación 2, en el que dichos niveles de expresión se determinan mediante el uso de un microarray.

4. El método de la reivindicación 1, 2 o 3, en el que dichas 50 o más secuencias transcritas comprenden una o más seleccionadas del conjunto de 74 secuencias génicas identificadas en la Tabla 1; o

el conjunto de 90 secuencias génicas identificadas en la Tabla 1 y por las SEQ ID NOs: 149-200; o

el conjunto de 126 secuencias génicas en una combinación de dichas 74 secuencias génicas y dichas 90 secuencias génicas.

5. El método de la reivindicación 4, en el que dichas 50 o más secuencias transcritas comprenden cinco o más seleccionadas de dicho conjunto de 74 secuencias génicas o del conjunto de 90 secuencias génicas o del conjunto de 126 secuencias génicas.

6. El método de una cualquiera de las reivindicaciones 1 a 6, en el que dicha determinación comprende medir la expresión de todas o parte de las secuencias transcritas como una molécula de ARNm.

7. El método de una cualquiera de las reivindicaciones 1 a 7, en el que dicha determinación comprende la amplificación de todas o parte de las secuencias transcritas, o

transcripción inversa y mareaje del ARN correspondiente a dichas secuencias transcritas.

8. El método de la reivindicación 7, en el que dicha amplificación comprende amplificación lineal de ARN o PCR cuantitativa.

9. El método de la reivindicación 7, en el que dicha amplificación es de secuencias presentes a una distancia de 600 nucleótidos de los sitios de poliadenilación de las secuencias transcritas.

10. El método de la reivindicación 7, en el que dicha amplificación es amplificación por PCR cuantitativa de al menos 50 nucleótidos de las secuencias transcritas.

11. El método de una cualquiera de las reivindicaciones 1 a 6, en el que dicha muestra es una muestra clínica de un paciente humano.

12. El método de la reivindicación 11, en el que dicha muestra es una muestra fijada en formalina, incluida en parafina (FFPE).

13. El método de una cualquiera de las reivindicaciones 1 a 6, en el que dicha muestra que contiene células se obtiene de un sujeto humano que se sospecha que está aquejado de, o está en riesgo de desarrollar, cáncer; o

es una sección de una muestra que contiene células; o células aisladas de una muestra que contiene células; o una muestra fresca; o una muestra congelada; o un aspirado; o

una muestra citológica; o

una muestra preparada por lavado ductal; o

una biopsia de aguja.

5 14. El método de una cualquiera de las reivindicaciones 1 a 6, en el que el algoritmo de clasificación basado en la

distancia es el algoritmo de vecino más cercano a k (KNN) o algoritmo de máquina de vector de soporte (SVM).