ESTRATEGIAS MEJORADAS PARA LA SECUENCIACION DE GENOMAS COMPLEJOS UTILIZANDO TECNOLOGIAS DE SECUENCIACION DE ALTO RENDIMIENTO.
Procedimiento para determinar una secuencia genómica que comprende las etapas de:
(a) proporcionar un primer subconjunto del genoma mediante la digestión del genoma con por lo menos una primera endonucleasa de restricción para proporcionar fragmentos de restricción;
(b) realizar la ligación de por lo menos un adaptador con los fragmentos de restricción del primer subconjunto para proporcionar un primer conjunto de fragmentos de restricción ligados al adaptador;
(c) amplificar selectivamente el primer conjunto de fragmentos de restricción ligados al adaptador utilizando una primera combinación de cebador en la que por lo menos un primer cebador contiene una sección complementaria al adaptador y a una parte de la secuencia de reconocimiento de la endonucleasa de restricción y que contiene además una primera secuencia seleccionada en el extremo 3'' de la secuencia del cebador, comprendiendo la primera secuencia seleccionada entre 0 y 10 nucleótidos selectivos, para proporcionar un primer subconjunto de fragmentos de restricción amplificados ligados al adaptador;
(d) repetir la etapa (c) con por lo menos un segundo y/o una o más combinaciones adicionales del cebador en las que el cebador contiene una distinta secuencia seleccionada segunda y/o adicionales en su extremo 3'' que contiene el mismo número de nucleótidos selectivos, para proporcionar unos subconjuntos segundo y/o adicionales de fragmentos de restricción amplificados ligados al adaptador;
(e) fragmentar cada uno de los subconjuntos primero, segundo y/o adicionales de fragmentos de restricción amplificados ligados al adaptador para generar unas genotecas de secuenciación primera, segunda y/o adicionales;
(f) determinar por lo menos una parte de las secuencias de nucleótidos de por lo menos una parte de los fragmentos contenidos en cada una de las genotecas primera, segunda y/o adicionales;
(g) alinear la secuencia de los fragmentos en cada una de las genotecas primera, segunda y/o adicionales para generar cóntigos de los fragmentos de restricción amplificados ligados al adaptador obtenidos que representan fracciones dispersas del genoma;
(h) repetir las etapas (a)-(g) para por lo menos unas endonucleasas de restricción segunda y/o adicionales;
(i) alinear los cóntigos obtenidos en las etapas (g) y (h) para cada una de las endonucleasas de restricción segunda y/o adicionales para proporcionar una secuencia del genoma
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/NL2006/000312.
Solicitante: KEYGENE N.V..
Nacionalidad solicitante: Países Bajos.
Dirección: AGRO BUSINESS PARK 90,6708 PW WAGENINGEN.
Inventor/es: VAN EIJK,MICHAEL,JOSEPHUS,THERESIA, HOGERS,RENE,CORNELIS,JOSEPHUS, SØRENSEN,ANKER,PREBEN.
Fecha de Publicación: .
Fecha Concesión Europea: 21 de Abril de 2010.
Clasificación PCT:
- C12Q1/68 QUIMICA; METALURGIA. › C12 BIOQUIMICA; CERVEZA; BEBIDAS ALCOHOLICAS; VINO; VINAGRE; MICROBIOLOGIA; ENZIMOLOGIA; TECNICAS DE MUTACION O DE GENETICA. › C12Q PROCESOS DE MEDIDA, INVESTIGACION O ANALISIS EN LOS QUE INTERVIENEN ENZIMAS, ÁCIDOS NUCLEICOS O MICROORGANISMOS (ensayos inmunológicos G01N 33/53 ); COMPOSICIONES O PAPELES REACTIVOS PARA ESTE FIN; PROCESOS PARA PREPARAR ESTAS COMPOSICIONES; PROCESOS DE CONTROL SENSIBLES A LAS CONDICIONES DEL MEDIO EN LOS PROCESOS MICROBIOLOGICOS O ENZIMOLOGICOS. › C12Q 1/00 Procesos de medida, investigación o análisis en los que intervienen enzimas, ácidos nucleicos o microorganismos (aparatos de medida, investigación o análisis con medios de medida o detección de las condiciones del medio, p. ej. contadores de colonias, C12M 1/34 ); Composiciones para este fin; Procesos para preparar estas composiciones. › en los que intervienen ácidos nucleicos.
Fragmento de la descripción:
Estrategias mejoradas para la secuenciación de genomas complejos utilizando tecnologías de secuenciación de alto rendimiento.
Campo técnico
La presente invención se refiere a los campos de la biología molecular y de la genética. La presente invención se refiere a unas estrategias mejoradas para determinar la secuencia de genomas preferentemente complejos (es decir, grandes), basándose en la utilización de técnicas de secuenciación.
Antecedentes de la invención
El ensamblaje secuencias aleatorias del genoma completas en genomas grandes (de 100 Mbp o superiores) con secuencias borrador del genoma es un tema complicado. Muchas plantas y animales contienen además un gran número de secuencias repetidas, con lo que se complica aún más el problema. Dicho problema informático aún es mayor con la aparición de las técnicas de alta capacidad de secuenciación, tales como las técnicas de 454 Life Science. Dichas técnicas ya no se basan en el método de didesoxisecuenciación de Sanger, sino fundamentalmente en la secuenciación por síntesis (pirosecuenciación), que resulta más sencilla de realizar en una superficie sólida. La secuenciación por síntesis proporciona una gran cantidad de secuencias, aunque de una longitud relativamente corta (aproximadamente 100 bp [pares de bases]) en comparación con la longitud relativamente grande de entre 500 y 1000 bp tal como resulta habitual en el método de didesoxisecuenciación de Sanger.
Una de las desventajas de las que adolecen dichos fragmentos cortos es que el ensamblaje de los cóntigos para determinar la secuencia genómica requiere una gran potencia informática, lo que hace que los procedimientos actuales de secuenciación constituyan una tarea relativamente costosa y lenta. Por consiguiente, existe la necesidad de procedimientos de secuenciación compleja que sean económicos, fiables y rápidos, es decir, grandes genomas, para reforzar la tecnología que a veces se ha denominado del "genoma de 1000
Sumario de la invención
Los presentes inventores han descubierto ahora que dicho problema se puede solucionar con una estrategia distinta y que las técnicas de alta capacidad de secuenciación se pueden utilizar eficientemente en el ensamblaje del genoma.
La presente invención comprende la utilización de una técnica que divide el genoma en partes complementarias y reproducibles mediante la restricción del genoma con una o más endonucleasas de restricción para obtener un conjunto de fragmentos de restricción y proporcionar posteriormente un subconjunto de fragmentos de restricción mediante amplificación selectiva. Se secuencia y ensambla el subconjunto a un cóntigo. Mediante la repetición de dicha etapa para uno o más conjuntos distintos de endonucleasas de restricción, se obtienen distintos cóntigos. Dichos cóntigos distintos se utilizan para ensamblar la secuencia borrador del genoma. La presente invención no requiere conocimiento alguno de la secuencia y se puede aplicar a genomas de cualquier tamaño y complejidad. La presente invención se puede ajustar para cualquier tipo y tamaño de genoma. La presente invención proporciona un acceso más rápido, fiable y veloz a cualquier genoma de interés y permite, por lo tanto, acelerar el análisis del genoma.
Definiciones
En la descripción y ejemplos siguientes, se utiliza un cierto número de términos. A fin de proporcionar una comprensión clara y consistente de la presente memoria y reivindicaciones, comprendiendo el alcance a proporcionar a dichos términos, se proporcionan las siguientes definiciones. Excepto si se define de otro modo en la presente memoria, todos los términos técnicos y científicos tienen el mismo significado que les atribuyen habitualmente los expertos en la materia a la que pertenece la presente invención.
Ácido nucleico: un ácido nucleico según la presente invención puede comprender cualquier polímero u oligómero de bases de pirimidina y purina, preferentemente citosina, timina y uracilo, y adenina y guanina, respectivamente (véase Albert L. Lehninger, Principles of Biochemistry ("Principios de Bioquímica"), en 793-800 (Worth Pub. 1982)). La presente invención contempla cualquier desoxirribonucleótido, ribonucleótido o componente peptídico de un ácido nucleico, y cualquier variante química de los mismos, tales como las formas metiladas, hidroximetiladas o glucosiladas de los mismos. Los polímeros u oligómeros pueden presentar una composición heterogénea u homogénea, y se pueden aislar a partir de fuentes naturales o se pueden producir artificialmente o sintéticamente. Además, los ácidos nucleicos pueden ser ADN o ARN, o una mezcla de los mismos, y pueden existir de un modo permanente o transitorio en forma monocatenaria o bicatenaria, comprendiendo los estados homodúplex, heterodúplex e híbrido.
Reducción de la complejidad: el término reducción de la complejidad se utiliza para indicar un procedimiento en el que la complejidad de una muestra de ácido nucleico, tal como un ADN genómico, se reduce al generar un subconjunto de la muestra. Dicho subconjunto puede ser representativo de la muestra entera (es decir, complejo) y es preferentemente un subconjunto reproducible. Reproducible significa en el presente contexto que cuando se reduce la complejidad de la misma muestra utilizando el mismo procedimiento, se obtiene el mismo subconjunto, o por lo menos uno de comparable. El procedimiento utilizado en la reducción de la complejidad puede ser cualquier procedimiento de reducción de la complejidad conocido en la técnica. Los ejemplos de procedimientos de reducción de la complejidad comprenden, por ejemplo, el AFLP® (Keygene N.V., Países Bajos; véase, por ejemplo, el documento EP 0 534 858), los procedimientos descritos por Dong (véanse, por ejemplo, los documentos WO 03/012118, WO 00/24939, EP 1 124 990) o Barany (por ejemplo el documento US 6 534 293), ligamiento indexado (Unrau et al., véase posteriormente), etc. Los procedimientos de reducción de la complejidad utilizados en la presente invención tienen en común que son reproducibles. Reproducibles en el sentido de que cuando se reduce la complejidad de la misma muestra del mismo modo, se obtiene el mismo subconjunto de la muestra, al contrario de lo que sucede con una reducción de la complejidad más aleatoria tal como la microdisección o la utilización de ARNm (ADNc) que representa una parte del genoma transcrito en un tejido seleccionado y que su reproducibilidad depende del tejido, el período de aislamiento, etc.
Etiquetado: el término etiquetado se refiere a la adición de una etiqueta a una muestra de ácido nucleico a fin de poder distinguirla de una segunda u otra muestra de ácido nucleico. El etiquetado se puede realizar, por ejemplo, mediante la adición de un identificador de la secuencia durante la reducción de la complejidad o mediante cualquier otro medio conocido en la técnica. Dicho identificador de la secuencia puede, por ejemplo, ser una secuencia de bases única con una longitud variable pero definida que se utiliza para identificar una muestra específica de ácido nucleico. Los ejemplos habituales de las mismas son, por ejemplo secuencias ZIP. Al utilizar dicha etiqueta, se puede determinar el origen de una con un procesamiento adicional. En el caso de combinación de productos procesador procedentes de muestras de ácido nucleico distintas, se tendrían que identificar las distintas mezclas de ácidos nucleicos utilizando distintas etiquetas.
Genoteca etiquetada: el término genoteca etiquetada se refiere a una genoteca de ácido nucleico etiquetado.
Secuenciación: el término secuenciación se refiere a la determinación del orden de nucleótidos (secuencias de bases) en a muestra de ácido nucleico, por ejemplo ADN o ARN.
Alinear y alineación: los términos "alinear" y "alineación" se refieren a la comparación de dos o más secuencias de nucleótidos basándose en la presencia de extensiones cortas o largas de nucleótidos idénticos o similares. En la técnica se conocen diversos procedimientos de alineación de secuencias de nucleótidos, tal como se describirá con mayor detalle posteriormente. A veces se utiliza ensamblaje como sinónimo.
Técnicas de alta capacidad de identificación: las técnicas de alta capacidad de identificación, con frecuencia abreviadas como HTS, consisten en un procedimiento...
Reivindicaciones:
1. Procedimiento para determinar una secuencia genómica que comprende las etapas de:
2. Procedimiento según la reivindicación 1, en el que por lo menos una de las endonucleasas de restricción primera, segunda y/o adicionales es una cortadora poco frecuente.
3. Procedimiento según cualquiera de las reivindicaciones 1 ó 2, en el que por lo menos una de las endonucleasas de restricción primera, segunda y/o adicionales es una cortadora frecuente.
4. Procedimiento según cualquiera de las reivindicaciones 1, 2 ó 3, en el que se utilizan por lo menos dos cortadoras poco frecuentes.
5. Procedimiento según cualquiera de las reivindicaciones 1 a 4, en el que se utilizan una cortadora poco frecuente y una cortadora frecuente.
6. Procedimiento según cualquiera de las reivindicaciones 1 a 5, en el que el procedimiento de amplificación es la PCR.
7. Procedimiento según cualquiera de las reivindicaciones 1 a 6 en el que la secuencia seleccionada en el extremo 3' del cebador contiene entre 1 y 8 nucleótidos seleccionados.
8. Procedimiento según cualquiera de las reivindicaciones 1 a 7, en el que las secuencias seleccionadas primera, segunda y adicionales presentan el mismo número de nucleótidos pero difieren en las secuencias de nucleótidos entre sí de la secuencia selectiva que se encuentra en el extremo 3' del cebador.
9. Procedimiento según cualquiera de las reivindicaciones 1 a 8, en el que secuenciación se realiza mediante la didesoxisecuenciación de Sanger.
10. Procedimiento según cualquiera de las reivindicaciones 1 a 8, en el que secuenciación se realiza en un soporte sólido tal como una perla.
11. Procedimiento según cualquiera de las reivindicaciones 1 a 8, en el que la secuenciación se basa en la secuenciación de alto rendimiento.
12. Procedimiento según cualquiera de las reivindicaciones 1 a 8, en el que la secuenciación se basa en la secuenciación la secuenciación por síntesis.
13. Procedimiento según cualquiera de las reivindicaciones 1 a 8, en el que la secuenciación se basa en la pirosecuenciación.
14. Procedimiento según cualquiera de las reivindicaciones 1 a 8, en el que secuenciación comprende las etapas de:
15. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que la construcción de cóntigos se ve ayudada además por la utilización de secuencias de nucleótidos obtenidas a partir de otras fuentes, que comprenden, pero sin limitarse a las mismas, secuencias del extremo BAC, secuencias aleatorias BAC, secuencias EST o secuencias aleatorias del genoma entero.
16. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que el procedimiento para reducir la complejidad de la mezcla se basa en ligadores de indización, la inmunoprecipitación de la cromatina (CHIP) o cebadores de la PCR dirigidos contra motivos conservados.
Patentes similares o relacionadas:
Método para analizar ácido nucleico molde, método para analizar sustancia objetivo, kit de análisis para ácido nucleico molde o sustancia objetivo y analizador para ácido nucleico molde o sustancia objetivo, del 29 de Julio de 2020, de Kabushiki Kaisha DNAFORM: Un método para analizar un ácido nucleico molde, que comprende las etapas de: fraccionar una muestra que comprende un ácido nucleico molde […]
MÉTODOS PARA EL DIAGNÓSTICO DE ENFERMOS ATÓPICOS SENSIBLES A COMPONENTES ALERGÉNICOS DEL POLEN DE OLEA EUROPAEA (OLIVO), del 23 de Julio de 2020, de SERVICIO ANDALUZ DE SALUD: Biomarcadores y método para el diagnostico, estratificación, seguimiento y pronostico de la evolución de la enfermedad alérgica a polen del olivo, kit […]
Detección de interacciones proteína a proteína, del 15 de Julio de 2020, de THE GOVERNING COUNCIL OF THE UNIVERSITY OF TORONTO: Un método para medir cuantitativamente la fuerza y la afinidad de una interacción entre una primera proteína de membrana o parte de la misma y una […]
Secuenciación dirigida y filtrado de UID, del 15 de Julio de 2020, de F. HOFFMANN-LA ROCHE AG: Un procedimiento para generar una biblioteca de polinucleótidos que comprende: (a) generar una primera secuencia del complemento (CS) de un polinucleótido diana a partir […]
Métodos para la recopilación, estabilización y conservación de muestras, del 8 de Julio de 2020, de Drawbridge Health, Inc: Un método para estabilizar uno o más componentes biológicos de una muestra biológica de un sujeto, comprendiendo el método obtener un […]
Evento de maíz DP-004114-3 y métodos para la detección del mismo, del 1 de Julio de 2020, de PIONEER HI-BRED INTERNATIONAL, INC.: Un amplicón que consiste en la secuencia de ácido nucleico de la SEQ ID NO: 32 o el complemento de longitud completa del mismo.
Composiciones para modular la expresión de SOD-1, del 24 de Junio de 2020, de Biogen MA Inc: Un compuesto antisentido según la siguiente fórmula: mCes Aeo Ges Geo Aes Tds Ads mCds Ads Tds Tds Tds mCds Tds Ads mCeo Aes Geo mCes Te (secuencia […]
Aislamiento de ácidos nucleicos, del 24 de Junio de 2020, de REVOLUGEN LIMITED: Un método de aislamiento de ácidos nucleicos que comprenden ADN de material biológico, comprendiendo el método las etapas que consisten en: (i) efectuar un lisado […]