Modelado predictivo a base de estructura.

Un método implementado por computadora para llevar a cabo la evolución dirigida,

el método comprende:

(a) recibir un conjunto de datos sin filtrar que tiene información de mediciones físicas de moléculas, en donde el conjunto de datos sin filtrar comprende la siguiente información para cada una de una pluralidad de variantes biomoleculares: (i) actividad de la biomolécula variante en un ligando en un sitio de unión de la biomolécula variante, (ii) una secuencia de la biomolécula variante, en donde la secuencia es una secuencia de ácido nucleico o una secuencia de proteínas, y (iii) uno o más parámetros geométricos que caracterizan la geometría del ligando en el sitio de unión de la biomolécula variante;

(b) filtrar el conjunto de datos sin filtrar para producir un subconjunto de datos filtrados, eliminando información para una o más de las variantes biomoleculares, en donde el filtrado elimina al menos uno de los parámetros geométricos del conjunto de datos sin filtrar y/o elimina del conjunto de datos sin filtrar ciertas variantes biomoleculares que tienen valores de parámetros geométricos fuera de los rangos definidos, y en donde el filtrado comprende modelos de actividad de secuencia de entrenamiento con una pluralidad de subconjuntos de datos seleccionados y prueba de la capacidad de los modelos de actividad de secuencia entrenados con la pluralidad de subconjuntos de datos seleccionados para predecir la actividad de una biomolécula variante en el ligando en el sitio de unión de la biomolécula variante en función de variables independientes y, por lo tanto, identifica un subconjunto de datos filtrados que proporciona un modelo de actividad de secuencia con mayor capacidad para predecir la actividad de una biomolécula variante en el ligando en el sitio de unión de la biomolécula variante en función de variables independientes que un modelo de actividad de secuencia entrenado con el conjunto de datos sin filtrar, en donde la secuencia de la biomolécula variante y los parámetros geométricos filtrados que caracterizan la geometría del ligando en el sitio de unión de la biomolécula variante son variables independientes en los modelos de actividad de secuencia entrenados con la pluralidad de subconjuntos de datos seleccionados, cada subconjunto de datos seleccionado tiene información para al menos uno de los parámetros geométricos y/o ciertas variantes biomoleculares que tienen valores de parámetros geométricos fuera de los rangos definidos eliminados del conjunto de datos sin filtrar de (a); y

(c) aplicar un modelo de actividad de secuencia entrenado usando el subconjunto de datos filtrados para identificar una o más variantes de biomolécula nuevas predichas para tener actividad que cumpla con uno o más criterios, en donde cada una de las una o más variantes de biomolécula nueva tiene una secuencia de ácido nucleico o proteína que difiere de las secuencias de las variantes de biomoléculas que proporcionan información para el conjunto de datos sin filtrar de (a).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2014/057900.

Solicitante: Codexis, Inc.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 200 Penobscot Drive Redwood City, CA 94063 ESTADOS UNIDOS DE AMERICA.

Inventor/es: ZHANG,XIYUN, SARMIENTO,RUSSELL JAVINIAR, BASKERVILLE,DONALD SCOTT.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G16B15/30 FISICA.G16 TECNOLOGÍAS DE LA INFORMACIÓN Y DE LA COMUNICACIÓN [TIC] ESPECIALMENTE ADAPTADAS PARA ÁREAS DE APLICACIÓN ESPECÍFICAS.G16B BIOINFORMATICA, es decir, TECNOLOGIAS DE LA INFORMACION Y DE LA COMUNICACION [TIC] ESPECIALMENTE ADAPTADAS PARA EL PROCESAMIENTO DE DATOS GENETICOS O DATOS RELACIONADOS CON PROTEINAS EN LA BIOLOGÍA MOLECULAR COMPUTACIONAL. › G16B 15/00 TIC especialmente adaptadas para el análisis de estructuras moleculares bidimensionales o tridimensionales, p. ej. relaciones estructurales o funcionales o alineamiento de estructuras. › Identificación de medicamentos usando datos estructurales; Predicción del acoplamiento o de la unión.
  • G16B35/00 G16B […] › TIC especialmente adaptadas a las bibliotecas combinatorias in silico de ácidos nucleicos, proteínas o péptidos.

PDF original: ES-2774965_T3.pdf

 

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .