Mapeo de una enunciación de audio a una acción usando un clasificador.

Un método, que comprende:

recibir (302), mediante un dispositivo informático (102),

una enunciación de audio;

determinar (304) una cadena de texto basándose en la enunciación;

determinar (306) un vector de característica de cadena basándose en la cadena de texto, incluyendo el vector de característica de cadena una o más características de cadena;

recibir (308) datos de sensor;

determinar (310) un vector de característica de sensor basándose en los datos de sensor, incluyendo el vector de característica de sensor una o más características de sensor;

seleccionar (312) un clasificador objetivo de un conjunto de clasificadores, en donde el clasificador objetivo se selecciona basándose en una determinación de que un criterio de característica de cadena del clasificador objetivo corresponde a al menos una característica de cadena del vector de característica de cadena y un criterio de característica de sensor del clasificador objetivo corresponde a al menos una característica de sensor en el vector de característica de sensor; e

iniciar (314), mediante el dispositivo informático (102), una acción objetivo que corresponde al clasificador objetivo,

en el que el criterio de característica de cadena comprende al menos un criterio en un conjunto de criterios que comprenden un criterio de identidad de término, un criterio de identidad de parte de voz y un criterio de identidad de clase de léxico, una identidad de término indicando si, con qué frecuencia y una posición en la que se contiene un término dado en una cadena de texto correspondiente, una identidad de parte de voz indicando si, con qué frecuencia y una posición en la que se contiene una palabra con una parte de voz dada en una cadena de texto correspondiente y una identidad de clase de léxico indicando si, con qué frecuencia y una posición en la que se contiene una palabra en una clase de léxico dada en una cadena de texto correspondiente.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2013/047852.

Solicitante: Google LLC.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 1600 AMPHITHEATRE PARKWAY MOUNTAIN VIEW, CA 94043 ESTADOS UNIDOS DE AMERICA.

Inventor/es: MORENO MENGIBAR,PEDRO J, JANSCHE,MARTIN, BIADSY,FADI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L15/06 SECCION G — FISICA.G10 INSTRUMENTOS DE MUSICA; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACION O DESCODIFICACION DEL AUDIO O LA VOZ.G10L 15/00 Reconocimiento de la voz (G10L 17/00 tiene prioridad). › Creación de plantillas de referencia; Entrenamiento de sistemas de reconocimiento de la voz, p. ej. adaptación a las características de la voz de la persona que habla (G10L 15/14 tiene prioridad).
  • G10L15/22 G10L 15/00 […] › Procedimientos utilizados durante el proceso de reconocimiento de la voz, p. ej. diálogo hombre-máquina.

PDF original: ES-2646729_T3.pdf

 

  • Fb
  • Twitter
  • G+
  • 📞

Patentes similares o relacionadas:

Sistema de asistencia, del 21 de Junio de 2017, de DEUTSCHES ZENTRUM FUR LUFT- UND RAUMFAHRT E.V.: Sistema de apoyo al controlador aéreo para apoyar a un controlador aéreo en tareas de planificación y/o conducción que dependen de la […]

Sistema y método de diálogo de múltiples intervalos, del 22 de Febrero de 2017, de 24/7 Customer, Inc: Un sistema para construir y procesar un diálogo de múltiples intervalos con un usuario, que comprende: un procesador; e instrucciones de software que cuando se ejecutan […]

Aumento del reconocimiento de voz con imágenes de profundidad, del 21 de Diciembre de 2016, de Microsoft Technology Licensing, LLC: Un método para el reconocimiento de voz de un usuario en un dispositivo informático, que comprende: recibir información de profundidad de un espacio físico […]

Imagen de 'Mezclador de pistas de audio semántico' Mezclador de pistas de audio semántico, del 16 de Diciembre de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Mezclador de audio para mezclar una pluralidad de pistas de audio para dar una senal de mezcla (MS), comprendiendo el mezclador de audio: […]

Imagen de 'Sistema de diálogo de voz con proceso para evitar rechazos' Sistema de diálogo de voz con proceso para evitar rechazos, del 16 de Julio de 2014, de DEUTSCHE TELEKOM AG: Proceso para operar con un sistema de diálogo de voz, que puede ser controlado sobre un enlace de telecomunicaciones por un terminal de comunicaciones, comprendiendo el proceso […]

Método para clasificar el lenguaje hablado en sistemas de diálogo hablado, del 16 de Abril de 2014, de DEUTSCHE TELEKOM AG: Método para la clasificación de por lo menos dos idiomas en un sistema automático de diálogo que procesa la entrada de voz digitalizada, que comprende las etapas […]

CONTROL DE VEHÍCULOS, del 19 de Julio de 2011, de THE BOEING COMPANY: Un procedimiento implementado por ordenador para controlar un vehículo, que comprende: recibir una o más instrucciones emitidas como voz; […]

PROCEDIMIENTO PARA PROPORCIONAR UN SERVICIO DE VOZ INTERACTIVO SOBRE UNA PLATAFORMA ACCESIBLE A UN TERMINAL CLIENTE, SERVICIO DE VOZ, PROGRAMA INFORMÁTICO Y SERVIDOR CORRESPONDIENTES, del 31 de Enero de 2012, de FRANCE TELECOM: Procedimiento de puesta a disposición de un servicio de voz interactivo en formato VoiceXML, de entre un conjunto de servicios de voz interactivos, […]

‹‹ Implementación de modo dinámico de baja potencia para dispositivos informáticos

Métodos para hacer composiciones con harina de arroz y almidón de maíz ››