Descubrimiento de virus mediante secuenciación y ensamblaje de ARNip, miARN, ARNpi derivados de virus.

Método para descubrir un genoma microbiano que comprende:

(a)

(i) obtener una pluralidad de ARN que interaccionan con PIWI que se producen de manera natural, para generar una biblioteca de ARN, u obtener una pluralidad de ARN que interaccionan con PIWI a partir de un organismo u organismos, o una planta o plantas; y

(ii) determinar la secuencia de los ARN que interaccionan con PIWI, y usar esas secuencias para ensamblar los ARN que interaccionan con PIWI en al menos un cóntigo que comprende una pluralidad de los ARN que interaccionan con el nucleótido PIWI; o

(b) el método de (a), en el que los cóntigos se ensamblan usando la ayuda de un programa informático.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2010/036849.

Solicitante: THE REGENTS OF THE UNIVERSITY OF CALIFORNIA.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 1111 FRANKLIN STREET, 12TH FLOOR OAKLAND, CA 94607 ESTADOS UNIDOS DE AMERICA.

Inventor/es: DING,SHOU-WEI, WU,QINGFA.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION C — QUIMICA; METALURGIA > BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE;... > PROCESOS DE MEDIDA, INVESTIGACION O ANALISIS EN LOS... > Procesos de medida, investigación o análisis en... > C12Q1/68 (en los que intervienen ácidos nucleicos)
  • SECCION C — QUIMICA; METALURGIA > BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE;... > PROCESOS DE MEDIDA, INVESTIGACION O ANALISIS EN LOS... > Procesos de medida, investigación o análisis en... > C12Q1/70 (en los que intervienen virus o bacteriófagos)
  • SECCION C — QUIMICA; METALURGIA > TECNOLOGIA COMBINATORIA > QUIMICA COMBINATORIA; BIBLIOTECAS, p. ej. QUIMIOTECAS,... > Bibliotecas per se , p. ej. arrays, mezclas > C40B40/06 (Bibliotecas que contienen nucleótidos o polinucleótidos, o sus derivados)

PDF original: ES-2532891_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Descubrimiento de virus mediante secuenciación y ensamblaje de ARNip, miARN, ARNpi derivados de virus Campo técnico

En una realización, la divulgación proporciona un método para descubrir un genoma microbiano. En otra realización, la invención proporciona un método para identificar un virus. Los métodos usan ARN que interaccionan con PIWI (ARNpi), incluyendo ARNpi aislados o secuenciados a partir de organismos invertebrados tales como insectos (Anthropoda), nematodos (Nemapoda), Mollusca, Porifera y otros invertebrados, y/o plantas, hongos o algas, cianobacterias y similares.

Antecedentes

El descubrimiento de nuevos virus a menudo se ve impedido por dificultades en su amplificación en cultivo celular y/o la carencia de su reactividad cruzada en ensayos de hibridación serológicos y de ácido nucleico con virus conocidos. Recientemente se han identificado muchos virus nuevos en muestras del entorno y clínicas usando enfoques metagenómicos, en los que en primer lugar se purifican partículas virales y entonces se amplifican al azar secuencias de ácido nucleico viral antes de subclonar y secuenciar (Delwart, 27).

La familia Dicer de receptores inmunitarios de huésped media en la inmunidad antiviral en hongos, plantas y animales invertebrados mediante interferencia de ARN (¡ARN) o silenciamiento de ARN (1-3). En esta inmunidad, un ARN bicatenario (ARNbc) viral se reconoce por Dicer y se corta en trozos para dar ARN de interferencia pequeños (ARNip). Estos ARNip derivados de virus se cargan entonces en un complejo de silenciamiento de ARN para que actúen como determinantes de especificidad y para guiar el corte de los ARN virales diana mediante una proteína Argonauta (AGO) presente en el complejo. Las proteínas Dicer contienen normalmente un dominio ARN helicasa, un dominio PAZ compartido con AGO y dos dominios endorribonucleasa tipo III (ARNasa III) en tándem. Dicer escinde ARNbc con preferencia simple hacia un extremo terminal de ARNbc, produciendo fragmentos de ARN pequeño dobles de tamaños diferenciados progresivamente desde el extremo terminal (4).

Además de ARNip, microARN (miARN) y ARN que interaccionan con PIWI (ARNpi) también guían el silenciamiento de ARN en complejos similares pero con AGO distintas (4-6). En Drosophila melanogaster, miARN y ARNip son predominantemente de 22 y 21 nucleótidos de longitud, dependen de Dicer-1 (DCR1) y DCR2 para su biogénesis, y actúan en complejos de silenciamiento que contiene AG1 y AG2 en la subfamilia AGO, respectivamente (4-6). Por el contrario, ARNpi de -24-3 nt son independientes de Dicer y requieren AG3, aubergina (AUB) y PIWI en la subfamilia PIWI para su biogénesis (4-6). Los análisis genéticos (7-1) han demostrado claramente un papel para DCR2 de D. melanogaster en la inmunidad y la biogénesis de ARNip virales que seleccionan como diana diversos virus ARN de hebra positiva (+), incluyendo virus de Flock House (VFH), virus de la parálisis del grillo, virus C de Drosophila (VCD) y virus Sindbis (VSIN). La clonación y la secuenciación de ARN pequeños a partir de células de Drosophila infectadas con VFH indican además que los productos intermedios de replicación de ARNbc viral (vRI- ARNbc) son el sustrato de DCR2 y el precursor de ARNip virales (11-12). La susceptibilidad de Drosophila al virus X de Drosophila (VXD), que contiene un genoma de ARNbc, está influida por componentes a partir de las rutas tanto de ARNip (por ejemplo, AG2 y R2D2) como de ARNpi (por ejemplo, AUB y PIWI) (13). Sin embargo, aún no se ha notificado la detección de ARN pequeños derivados a partir de cualquier virus ARNbc (1, 13).

En primer lugar se detectaron ARN pequeños derivados de virus en plantas infectadas con un virus ARN+ (14). Las proteínas Dicer implicadas en la producción de ARNip que seleccionan como diana tanto virus ARN+ como virus ADN se han identificado en Arabidopsis thaliana (2-3), que codifica para AGO en la subfamilia AGO pero no en la subfamilia PIWI (15). La clonación y la secuenciación de ARNip virales de plantas sugiere que pueden procesarse o bien a partir de vRI-ARNbc o bien de regiones de horquilla de precursores de ARN monocatenario (16-2). También se ha demostrado la producción de ARNip virales en hongos, gusanos de seda, mosquitos y nematodos en respuesta a infección con virus ARN+ y recientemente se han clonado y secuenciado ARN de silenciamiento pequeños virales producidos en hongos y mosquitos (21-25).

Por tanto, los datos disponibles ¡lustran que la acumulación de ARN de silenciamiento pequeños derivados de virus es una característica común de una respuesta inmunitaria activa frente a la infección viral en diversas especies huésped eucariotas.

Sumario

La divulgación proporciona un método para el descubrimiento de virus que no depende ni de la amplificación ni de la purificación de partículas virales. Muchas enfermedades humanas tales como aproximadamente la mitad de todos los casos analizados de encefalitis y gastroenteritis humanas, no tienen una etiología identificada. Por tanto, el descubrimiento de nuevos virus debería facilitar la identificación de virus patógenos humanos, mejorar la

comprensión de su transmisión y proporcionar herramientas de diagnóstico y dianas para el desarrollo de antivirales.

Los métodos se basan en el mecanismo de invertebrados, plantas, algas, hongos, etc. de procesamiento de ARN inhibidores pequeños virales, o ARN de "silenciamiento pequeños", (ARNip), microARN (miARN) y/o ARN que interaccionan con PIWI (ARNpi), incluyendo inmunidad viral mediada por miARN, ARNpi, ARNip y/o ¡ARN en plantas e invertebrados, incluyendo insectos (Drosophila melanogaster y mosquitos) y nematodos (Caenorhabditis elegans), y algas, hongos, cianobacterias y similares.

La invención proporciona un método para descubrir un genoma microbiano según la reivindicación 1 en el presente documento.

En realizaciones alternativas, los métodos comprenden además determinar la secuencia del contigo ensamblado; o comprende además:

(a) buscar en una base de datos de secuencias virales o de microorganismo usando el al menos un contigo para identificar una secuencia, o subsecuencia de la misma, que codifica para proteína, ácido nucleico o genoma viral o de microorganismo, que tiene una homología significativa con respecto al contigo ensamblado; o

(b) el método de (a), en el que la base de datos comprende secuencias de nucleótidos no redundantes; o

(c) el método de (a), en el que la base de datos comprende secuencias de traducción in silico,

en los que opcionalmente el contigo ensamblado tiene una homología significativa con respecto a un género o genoma viral conocido.

En realizaciones alternativas, los métodos comprenden además buscar en una base de datos de secuencias virales o de microorganismo usando el al menos un contigo para identificar una secuencia, o subsecuencia de la misma, que codifica para proteína, ácido nucleico o genoma viral o de microorganismo, que tiene un porcentaje de homología de al menos el 5% al 1% con respecto a la totalidad o parte del contigo ensamblado.

En realizaciones alternativas, los métodos comprenden además realizar un análisis filogenético de la secuencia que codifica para proteína, ácido nucleico o genoma viral o de microorganismo identificada con el contigo.

En realizaciones alternativas, los métodos comprenden además identificar y anotar el análisis filogenético de la secuencia viral identificada con el contigo.

En realizaciones alternativas, las secuencias de ARN o nucleótidos obtenidas están sustancialmente purificadas o aisladas de un organismo de interés.

En realizaciones alternativas, los métodos comprenden además purificar sustancialmente ARNpi a partir de un organismo de interés... [Seguir leyendo]

 


Reivindicaciones:

1. Método para descubrir un genoma microbiano que comprende:

(a)

(i) obtener una pluralidad de ARN que interaccionan con PIWI que se producen de manera natural, para generar una biblioteca de ARN, u obtener una pluralidad de ARN que interaccionan con PIWI a partir de un organismo u organismos, o una planta o plantas; y

(ii) determinar la secuencia de los ARN que interaccionan con PIWI, y usar esas secuencias para ensamblar los ARN que interaccionan con PIWI en al menos un contigo que comprende una pluralidad de los ARN que interaccionan con el nucleótido PIWI; o

(b) el método de (a), en el que los cóntigos se ensamblan usando la ayuda de un programa informático.

2. Método según la reivindicación 1, que comprende además determinar la secuencia del contigo ensamblado.

3. Método según la reivindicación 1, que comprende además:

(a) buscar en una base de datos de secuencias virales o de microorganismo usando el al menos un contigo para identificar una secuencia, o subsecuencia de la misma, que codifica para proteína, ácido nucleico o genoma viral o de microorganismo, que tiene una homología significativa con respecto al contigo ensamblado; o

(b) el método de (a), en el que la base de datos comprende secuencias de nucleótidos no redundantes; o

(c) el método de (a), en el que la base de datos comprende secuencias de traducción in silico;

en el que opcionalmente el contigo ensamblado tiene una homología significativa con respecto a un género o genoma viral conocido.

4. Método según la reivindicación 3, en el que la secuencia, o subsecuencia de la misma, que codifica para proteína, ácido nucleico o genoma viral o de microorganismo, tiene un porcentaje de homología de al menos el 5% al 1% con respecto a la totalidad o parte del contigo ensamblado.

5. Método según la reivindicación 3 o la reivindicación 4, que comprende además:

(iv) realizar un análisis filogenético de la secuencia que codifica para proteína, ácido nucleico o genoma viral o de microorganismo identificada con el contigo.

6. Método según la reivindicación 5, que comprende además:

(v) identificar y anotar el análisis filogenético de la secuencia viral identificada con el contigo.

7. Método según la reivindicación 1, en el que las secuencias de ARN que interaccionan con PIWI obtenidas están sustancialmente purificadas o aisladas de un organismo de interés.

8. Método según la reivindicación 1, que comprende además purificar sustancialmente ARN que interaccionan con PIWI, a partir de un organismo de interés y secuenciar los fragmentos de ARN para obtener una biblioteca de ARN.

9. Método según cualquiera de las reivindicaciones 1 a 4, que comprende además eliminar segmentos secuenciados de la biblioteca que se solapan con la secuencia genómica del organismo de interés a partir de la que se derivó el ARN.

1. Método según cualquiera de las reivindicaciones 1 a 4, que comprende además rellenar los huecos entre los cóntigos.

11. Método según la reivindicación 1, en el que el rellenado de los huecos entre los cóntigos comprende el uso de RT-PCR y/o secuenciación para rellenar los huecos entre los cóntigos.

12. Método según cualquiera de las reivindicaciones 1 a 4, que comprende además completar una secuencia genómica de un virus o un microorganismo que comprende el contigo usando 5-RACE y 3-RACE.

13. Método según la reivindicación 1, en el que el organismo o los organismos es/son un invertebrado, un insecto (,Anthropoda), un nematodo (Nemapoda), Mollusca, Porífera, una planta, hongos, algas, cianobacterias; o el organismo o los organismos se identifican o no se identifican y se derivan a partir de una muestra del entorno, en el que opcionalmente la muestra del entorno es una muestra de tierra, una muestra de agua o una muestra de aire.

14. Método para identificar un virus, que comprende:

construir una biblioteca de ARN pequeños a partir de un organismo u organismos;

secuenciar de manera masiva la biblioteca de ARN pequeños;

ensamblar los ARN pequeños secuenciados usando

(a) todos los ARN que interaccionan con PIWI; o

(b) ARN que interaccionan con PIWI, de una longitud definida en una pluralidad de cóntigos;

identificar y eliminar aquellas secuencias ensambladas mapeadas sobre el genoma del organismo para proporcionar un conjunto enriquecido de cóntigos;

realizar una búsqueda de homología de cóntigos frente a virus conocidos tanto a nivel de nucleótido como de proteína;

opcionalmente usar RT-PCR y secuenciar para rellenar los huecos entre los cóntigos que muestran similitudes limitadas con un virus conocido;

completar la secuencia genómica de longitud completa del virus identificado con 5-RACE y 3-RACE; y anotar el virus identificado.

15. Método según la reivindicación 14, en el que el organismo o los organismos es/son un invertebrado, un insecto 2 (Anthropoda), un nematodo (Nemapoda), Mollusca, Porífera, una planta, hongos, algas, cianobacterias; o el

organismo o los organismos se identifican o no se identifican y se derivan a partir de una muestra del entorno, en el que opcionalmente la muestra del entorno es una muestra de tierra, una muestra de agua o una muestra de aire.