Sistemas y métodos para identificar contenido de audio utilizando una aplicación interactiva de guía de medios.

Un sistema de guía de medios que comprende:

medios (906) para recibir un programa de video que incluye uno o varios recursos de audio,

medios

(924) para recibir una entrada de usuario que incluye una solicitud de identificación de un recurso de audio que se reproduce dentro del 5 programa de video,

medios (906) para determinar un segmento del recurso de audio en el que se minimiza la interferencia respecto de datos de audio no relacionados con el recurso de audio;

medios (910) para generar una firma de audio en base al segmento del recurso de audio;

medios para identificar el recurso de audio comparando la firma de audio generada con firmas de audio conocidas de una serie de recursos de audio conocidos dentro de un almacenamiento de datos, en el que cada firma de audio conocida está asociada con un recurso de audio conocido y en el que el almacenamiento de datos incluye información de recursos de audio asociada con una serie de recursos de audio conocidos; y

medios para proporcionar información de recursos de audio asociada con el recurso de audio identificado a una interfaz de usuario para su visualización.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2010/050380.

Solicitante: UNITED VIDEO PROPERTIES, INC..

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 2830 De La Cruz Boulevard Santa Clara, CA 95050 ESTADOS UNIDOS DE AMERICA.

Inventor/es: LAJOIE,DAN, CARLBERG,MARVIN, NISHIMURA,AKITAKA.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Detalles de los sistemas de televisión (detalles... > H04N5/445 (para visualizar información adicional (H04N 5/50  tiene prioridad))
  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO DE DATOS DIGITALES ELECTRICOS (computadores... > Equipo o métodos de tratamiento de datos o de cálculo... > G06F17/30 (Recuperación de la información; Estructura de bases de datos a este efecto)
  • SECCION G — FISICA > REGISTRO DE LA INFORMACION > REGISTRO DE LA INFORMACION BASADO EN UN MOVIMIENTO... > Montaje; Indexación; Direccionamiento; Temporización... > G11B27/32 (sobre pistas auxiliares separadas del mismo soporte de registro o de un soporte auxiliar)
  • SECCION G — FISICA > REGISTRO DE LA INFORMACION > REGISTRO DE LA INFORMACION BASADO EN UN MOVIMIENTO... > Montaje; Indexación; Direccionamiento; Temporización... > G11B27/28 (utilizando señales de información registradas por el mismo procedimiento que para el registro principal)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Distribución selectiva de contenido, p. ej. televisión... > H04N21/231 (Operación de almacenamiento de contenido, p. ej., almacenamiento de películas en caché para el almacenamiento a corto plazo, duplicación de los datos en varios servidores o priorización para la eliminación)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Distribución selectiva de contenido, p. ej. televisión... > H04N21/81 (Monomedia, componentes del mismo)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Distribución selectiva de contenido, p. ej. televisión... > H04N21/472 (Interfaz de usuario final para petición de contenido, datos adicionales o servicios; Interfaz de usuario final para interacción con el contenido, p.ej. para reservar el contenido o establecimientos de recordatorios, para petición de notificación de eventos o manipulación de contenido mostrado)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Distribución selectiva de contenido, p. ej. televisión... > H04N21/233 (• Procesamiento de flujos elementales de audio)

PDF original: ES-2475965_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Sistemas y mïtodos para identificar contenido de audio utilizando una aplicaciïn interactiva de guïa de medios Antecedentes de la invenciïn Esta invenciïn se refiere, en general, a aplicaciones interactivas de guïa de medios, y mïs en particular, a sistemas y mïtodos para gestionar e identificar contenido de audio utilizando una aplicaciïn interactiva de guïa de medios.

Con el uso creciente de las guïas interactivas de programas y otras aplicaciones de guïa de medios, el soporte avanzado de las aplicaciones de guïa de medios para contenido de medios diferente a la programaciïn tradicional de televisiïn es cada vez mïs importante. Especïficamente, son cada vez mïs deseables las caracterïsticas de guïa de medios dirigidas a la gestiïn de contenido de audio. Al mismo tiempo, la convergencia de los sistemas de almacenamiento de medios estï impulsando la necesidad de aplicaciones de guïa de medios para gestionar y explotar las relaciones entre diferentes clases de contenido de medios, tal como entre video y audio.

En los sistemas convencionales de aplicaciones de televisiïn interactiva, no existe ningïn mïtodo cïmodo para recuperar informaciïn acerca de un recurso de audio incorporado dentro de un programa de video. En particular, puede haber ocasiones en las que un usuario desee ver informaciïn que identifica un recurso de audio mientras visualiza un programa de video. Por ejemplo, un usuario puede escuchar una canciïn reproducida en un programa de video y desear identificar o comprar dicha canciïn.

Por consiguiente, serïa deseable disponer de un enfoque sistemïtico para gestionar e identificar contenido de audio dentro de una aplicaciïn de guïa de medios.

La solicitud de patente internacional WO02/27600 A2 describe un mïtodo y un sistema diseïados para permitir a los usuarios identificar sonidos pregrabados que estïn representados en una base de datos de grabaciïn.

Resumen de la invenciïn En vista de lo anterior, se dan a conocer sistemas y mïtodos para gestionar e identificar contenido de audio incorporado en video, utilizando una aplicaciïn interactiva de guïa de medios.

En un enfoque, un sistema de guïa de medios comprende un sistema de guïa de medios comprende:

medios para recibir un programa de video que incluye uno o varios recursos de audio,

medios para recibir una entrada de usuario que incluye una solicitud de identificar un recurso de audio reproducido dentro del programa de video,

medios para determinar un segmento del recurso de audio en el que se minimiza la interferencia procedente de datos de audio no relacionados con el recurso de audio;

medios para generar una firma de audio en base al segmento del recurso de audio;

medios para identificar el recurso de audio comparando la firma de audio generada con firmas de audio conocidas de una serie de recursos de audio conocidos dentro de un almacenamiento de datos, en el que cada firma de audio conocida estï asociada con un recurso de audio conocido, y en el que el almacenamiento de datos incluye informaciïn de recursos de audio asociada con una serie de recursos de audio conocidos; y

medios para proporcionar informaciïn de recursos de audio asociada con el recurso de audio identificado, a una interfaz de usuario para su visualizaciïn.

El almacenamiento de datos incluye una serie de firmas de audio conocidas, donde cada firma de audio conocida estï asociada con un recurso de audio conocido. El proceso incluye generar una firma de recurso de audio, e identificar el recurso de audio puede incluir comparar la firma de recurso de audio generada, con el conjunto o serie de firmas de audio conocidas en el almacenamiento de datos. El sistema identifica el recurso de audio mediante la identificaciïn de una coincidencia entre la firma de recurso de audio generada y una de la serie de firmas de audio conocidas.

La generaciïn de una firma de recurso de audio puede incluir el procesamiento de una muestra del recurso de audio a efectos de calcular la frecuencia promedio de cruce por cero, el tempo estimado, el espectro promedio de frecuencias, la planitud espectral, los tonos destacados y/o el ancho de banda. La generaciïn de la firma del recurso de audio puede incluir asimismo la determinaciïn de un segmento ïptimo del recurso de audio a muestrear. En la realizaciïn, la determinaciïn del segmento ïptimo puede incluir determinar dïnde se minimiza la interferencia producida por datos de audio no relacionados con el recurso de audio. Por ejemplo, el proceso de determinar dïnde se minimiza la interferencia puede incluir analizar el recurso de audio en busca de caracterïsticas de audio o acïsticas indicativas de datos de audio no relacionados con el recurso de audio. Como otro ejemplo, el proceso para determinar dïnde se minimiza la interferencia puede incluir analizar metadatos asociados con el programa de video para determinar cuïndo estïn presentes datos de audio no relacionados con el recurso de audio.

En otra realizaciïn, el procesador genera metadatos que incluyen, por lo menos, una parte de la informaciïn de recursos de audio asociada con el recurso de audio identificado. La informaciïn de recursos de audio puede incluir tïtulo del audio, artista, ïlbum, carïtula del ïlbum, gïnero, tipo, posiciïn del recurso de audio en el programa de video, tiempo de reproducciïn del recurso de audio en el programa de video, tiempo de inicio del recurso de audio, tiempo de finalizaciïn del recurso de audio, texto del audio, letras y/o calidad del audio.

La identificaciïn del recurso de audio puede incluir procesar metadatos asociados con el recurso de audio para extraer la informaciïn de recursos de audio. Los metadatos pueden incluir letras de canciones, datos de subtïtulos ocultos y/o texto asociado con el recurso de audio. En un enfoque, el procesador compara metadatos asociados con el recurso de audio, con la informaciïn de recursos de audio asociada con el conjunto de recursos de audio conocidos para identificar el recurso de audio.

En ciertas configuraciones, el equipo de usuario incluye el procesador y/o el almacenamiento de datos. En otras configuraciones, una fuente de medios incluye el procesador y/o el almacenamiento de datos.

En un enfoque, la solicitud para identificar un recurso de audio es una primera solicitud, y el procesador estï configurado para: i) almacenar la informaciïn de recursos de audio asociada con el recurso de audio identificado, ii) recibir una segunda solicitud para identificar el recurso de audio, iii) comparar la primera y la segunda solicitudes para determinar que la primera y la segunda solicitudes se refieren al mismo recurso de audio y iv) proporcionar la informaciïn de recursos de audio almacenada, en respuesta a la segunda solicitud.

En otro enfoque, el procesador recibe mïltiples solicitudes para identificar el recurso de audio, estando el procesador configurado para: i) almacenar una indicaciïn de cada solicitud, ii) determinar que se ha recibido un nïmero umbral de solicitudes, iii) identificar un segundo usuario que estï viendo el programa de video, el cual no ha solicitado identificar el recurso de audio y iv) proporcionar automïticamente la informaciïn de recursos de audio al segundo usuario cuando el recurso de audio se estï reproduciendo.

En una realizaciïn, la informaciïn de recursos de audio se superpone sobre el programa de video. La informaciïn de recursos de audio puede ser seleccionable y se puede presentar al usuario una opciïn para comprar el recurso de audio identificado, en respuesta a la selecciïn. En otra realizaciïn, el procesador estï configurado para: i) seleccionar un anuncio en base, por lo menos en parte, a la informaciïn de recursos de audio, y ii) presentar el anuncio al usuario.... [Seguir leyendo]

 


Reivindicaciones:

1. Un sistema de guïa de medios que comprende:

medios (906) para recibir un programa de video que incluye uno o varios recursos de audio,

medios (924) para recibir una entrada de usuario que incluye una solicitud de identificaciïn de un recurso de audio que se reproduce dentro del programa de video,

medios (906) para determinar un segmento del recurso de audio en el que se minimiza la interferencia respecto de datos de audio no relacionados con el recurso de audio;

medios (910) para generar una firma de audio en base al segmento del recurso de audio;

medios para identificar el recurso de audio comparando la firma de audio generada con firmas de audio conocidas de una serie de recursos de audio conocidos dentro de un almacenamiento de datos, en el que cada firma de audio conocida estï asociada con un recurso de audio conocido y en el que el almacenamiento de datos incluye informaciïn de recursos de audio asociada con una serie de recursos de audio conocidos; y

medios para proporcionar informaciïn de recursos de audio asociada con el recurso de audio identificado a una interfaz de usuario para su visualizaciïn.

2. El sistema acorde con la reivindicaciïn 1, en el que la informaciïn de recursos de audio incluye por lo menos un tïtulo de audio, un artista, un ïlbum, una carïtula del ïlbum, un gïnero, un tipo, una localizaciïn del recurso de audio en el programa de video, un tiempo de reproducciïn del recurso de audio en el programa de video, un tiempo de inicio del recurso de audio, un tiempo de finalizaciïn del recurso de audio y la calidad del audio.

3. El sistema acorde con la reivindicaciïn 1, en el que los medios (910) para generar la firma de audio incluyen medios para procesar una muestra del recursos de audio a efectos de calcular una o varias frecuencias promedio de cruce por cero, un tempo estimado, un espectro de frecuencia promedio, una planitud espectral, los tonos destacados y un ancho de banda.

4. El sistema acorde con la reivindicaciïn 1, en el que los medios (906) para determinar un segmento del recurso de audio en el que se minimice la interferencia incluyen medios para analizar el recurso de audio en busca de caracterïsticas de audio o acïsticas indicativas de datos de audio no relacionados con el recurso de audio.

5. El sistema acorde con la reivindicaciïn 1, en el que los medios (906) para determinar un segmento del recurso de audio en el que se minimice la interferencia incluyen medios para analizar metadatos incluidos con el programa de video a efectos de determinar cuïndo estïn presentes datos de audio no relacionados con el recurso de audio.

6. El sistema acorde con la reivindicaciïn 1, en el que la informaciïn de recursos de audio es seleccionable, y en el que se puede presentar al usuario una opciïn para comprar el recurso de audio identificado en respuesta a la selecciïn.

7. El sistema acorde con la reivindicaciïn 1, que comprende ademïs i) medios (920) para seleccionar un anuncio en base, por lo menos en parte, a la informaciïn de recursos de audio, y ii) medios para presentar el anuncio al usuario.

8. El sistema acorde con la reivindicaciïn 1, en el que el recurso de audio es una canciïn, un diïlogo, una narraciïn, un efecto de sonido o una mïsica de fondo.

9. Un mïtodo para identificar audio utilizando una aplicaciïn de guïa de medios, comprendiendo el mïtodo:

recibir un programa de video que incluye uno o varios recursos de audio,

recibir una entrada de usuario que incluye una solicitud para identificar un recurso de audio que se reproduce dentro del programa de video,

determinar un segmento del recurso de audio en el que se minimiza la interferencia respecto de datos de audio no relacionados con el recurso de audio;

generar una firma de audio en base al segmento del recurso de audio;

identificar el recurso de audio comparando la firma de audio generada con firmas de audio conocidas de una serie de recursos de audio conocidos dentro de un almacenamiento de datos, en el que cada firma de audio estï asociada con un recurso de audio conocido y en el que el almacenamiento de datos incluye informaciïn de recursos de audio asociada con una serie de recursos de audio conocidos; y

proporcionar informaciïn de recursos de audio asociada con el recurso de audio identificado a una interfaz de usuario para su visualizaciïn.

10. El mïtodo acorde con la reivindicaciïn 9, en el que la informaciïn de recursos de audio incluye por lo menos un tïtulo de audio, un artista, un ïlbum, una carïtula del ïlbum, un gïnero, un tipo, una localizaciïn del recurso de audio en el programa de video, un tiempo de reproducciïn del recurso de audio en el programa de video, un tiempo de inicio del recurso de audio, un tiempo de finalizaciïn del recurso de audio, y la calidad del audio.

11. El mïtodo acorde con la reivindicaciïn 9, en el que la generaciïn de la firma de audio incluye procesar una muestra del recurso de audio para calcular uno o varios de la frecuencia promedio de cruce por cero, el tempo estimado, el espectro de frecuencia promedio, la planitud espectral, los tonos destacados y el ancho de banda.

12. El mïtodo acorde con la reivindicaciïn 9, en el que la determinaciïn de un segmento del recurso de audio en el

que se minimice la interferencia incluye analizar el recurso de audio en busca de caracterïsticas de audio o acïsticas indicativas de datos de audio no relacionados con el recurso de audio.

13. El mïtodo acorde con la reivindicaciïn 9, en el que la determinaciïn de un segmento del recurso de audio en el que se minimice la interferencia incluye analizar metadatos incluidos con el programa de video para determinar cuïndo estïn presentes datos de audio no relacionados con el recurso de audio.

14. El mïtodo acorde con la reivindicaciïn 9, en el que la informaciïn de recursos de audio es seleccionable, y en el que se puede presentar al usuario una opciïn para comprar el recurso de audio identificado en respuesta a la selecciïn.

15. El mïtodo acorde con la reivindicaciïn 9, que comprende ademïs: i) seleccionar un anuncio en base, por lo menos en parte, a la informaciïn de recursos de audio, y ii) presentar el anuncio al usuario.

16. El mïtodo acorde con la reivindicaciïn 9, en el que el recurso de audio es una canciïn, un diïlogo, una narraciïn, un efecto de sonido o una mïsica de fondo.