SISTEMA Y METODO DE AJUSTE DE RETARDO AUDIO/VIDEO.

Sistema y método de ajuste de retardo audio/vídeo que comprende las siguientes etapas:

extraer parámetros característicos de una fuente de audio (3); introducir los parámetros extraídos de la fuente de audio (3) en el video procedente de una fuente de video (1); extraer de la señal de audio, tras el procesado del video, los mismos parámetros extraídos en la primera etapa; obtener de la señal de video, tras el procesado del video, los parámetros de audio introducidos en la segunda etapa; comparar los parámetros de audio extraídos en la tercera etapa y obtenidos en la cuarta; calcular el retardo existente entre los parámetros de audio comparados; almacenar el retardo calculado; y finalmente retardar la señal de audio un valor de retardo configurable en función del retardo calculado y del retardo almacenado procedente de una ejecución anterior del método

Tipo: Patente de Invención. Resumen de patente/invención. Número de Solicitud: P200931181.

Solicitante: UNIVERSIDAD POLITECNICA DE MADRID.

Nacionalidad solicitante: España.

Provincia: MADRID.

Inventor/es: MARTINEZ BARBERO,JESUS.

Fecha de Solicitud: 17 de Diciembre de 2009.

Fecha de Publicación: .

Fecha de Concesión: 1 de Septiembre de 2010.

Clasificación Internacional de Patentes:

  • H04N7/52A

Clasificación PCT:

  • H04N5/04 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 5/00 Detalles de los sistemas de televisión (Detalles de los dispositivos de análisis o sus combinaciones con la producción de la tensión de alimentación H04N 3/00). › Sincronización (para los sistemas de televisión que utilizan la modulación de impulsos codificados H04N 7/56).
  • H04N7/52 H04N […] › H04N 7/00 Sistemas de televisión (detalles H04N 3/00, H04N 5/00; métodos y arreglos, para la codificación, decodificación, compresión o descompresión de señales de vídeo digital H04N 19/00; distribución selectiva de contenido H04N 21/00). › Sistema para la transmisión de un impulso codificado modulado con otras señales moduladas por impulsos codificados, p. ej. una señal de audio o una señal de sincronización mediante la combinación de un flujo de video con otros datos de contenido o adicionales (multiplexado de flujos multiplexados, inserción de bits de relleno en un flujo multiplexado, para obtener una tasa de bits constante, ensamblado de flujo elemental en paquetes en el lado del servidor H04N 21/236; Desensamblado de un flujo multiplexado, multiplexación de flujo multiplexado, extracción o procesado de Servicos de Información, desensamblado de un flujo elemental en paquetes H04N 21/434).
  • H04N7/62
SISTEMA Y METODO DE AJUSTE DE RETARDO AUDIO/VIDEO.

Fragmento de la descripción:

Sistema y método de ajuste de retardo audio/vídeo.

Campo de la invención

La presente invención pertenece al campo de las comunicaciones digitales para la producción y difusión de señales de televisión.

Estado de la técnica

La utilización de tecnologías digitales en los equipos encargados del tratamiento del audio y del vídeo de los procesos de producción para televisión ha originado una serie de problemas de desfase audio y vídeo debido a los distintos retardos introducidos por la utilización de estas tecnologías. Una de las razones de esta diferencia en los retardos en la producción es debida a que, mientras en el mundo analógico los equipos apenas introducían retardos en la señal, en el digital es necesario almacenar la información de cada cuadro para poder tratar la imagen y transmitirla posteriormente a su salida. Por tanto, el almacenamiento y procesado de una imagen que tenga 25 cuadros por segundo sin entrelazar, significa que se introduce en la salida un retardo 1/25 segundos (40 ms), sin tener en cuenta el tiempo de procesado. Si el número de procesos que intervinieran en la operación fueran constantes, un simple retardo en el audio de Nx40 ms solucionaría el problema, siendo N el número de procesos por los que pasa la señal. Sin embargo, el número de procesos difiere dependiendo de la aplicación que se pretende realizar y de la forma de operar de los técnicos que la lleven a cabo.

Además de lo anteriormente expuesto, el retardo entre el audio y el vídeo puede sufrir modificaciones en el control de realización puesto que se utilizan mezcladores de vídeo. Los mezcladores de vídeo son los encargados de mezclar las diferentes señales que entran en el control y se caracterizan por tener varias etapas de procesado de imagen, en cada una de las cuales se pueden realizar operaciones de mezcla ó de inserción de imágenes. De esta forma, cuando una señal pasa por tres etapas de procesado, caso típico en los mezcladores profesionales, la señal de salida es retardada 120 ms con respecto al audio. Así, la salida de un estudio presentaría un margen de desincronización audio/vídeo entre 40 y 120 ms.

El problema se agrava cuando la señal ha de pasar por varios controles o por entornos de distribución, tales como las redes IP en las que el camino de audio es diferente del vídeo que hacen que el retardo sea ingobernable.

Los métodos de sincronización audio/vídeo conocidos principalmente tratan los retardos derivados de la transferencia de vídeo en baja calidad en las redes IP. Uno de los métodos más utilizados hoy en día se basa en el procesamiento de imágenes, con el fin de detectar los labios del interlocutor, y en el procesamiento del audio, con el fin de ajustar lo máximo posible el sonido al movimiento de los labios. Sin embargo, este método presenta un problema importante que se trata del consumo de CPU requerido para el tratamiento de señales.

Por otro lado, el procesamiento digital del audio permite detectar y clasificar sonidos como sonoros o sordos. En los sonoros, existe una frecuencia fundamental con una amplitud que destaca sobre otras componentes de frecuencias de menor amplitud, sin embargo, en los sordos hay muchas frecuencias que influyen en la tonalidad con amplitudes similares y no hay ninguna frecuencia que se imponga al resto. Un ejemplo de vocal sonora es la "a" que tiene como frecuencia dominante una frecuencia alrededor de los 780 hercios y como segunda componente una frecuencia alrededor de los 1600 hercios. El reconocimiento de voz en este caso se basa tanto en el análisis de la envolvente espectral (frecuencias formadoras) como en su evolución en el tiempo. En este contexto, a la voz humana se la puede considerar como "estacionaria a trozos" con periodos estacionarios de 20 o 40 ms y generándose de 5 a 20 fonemas por segundo. Este reconocimiento de voz, junto con el estudio de la imagen focalizando el interés sobre la ubicación de los labios, se usa para corregir las desincronizaciones sin embargo, este procesamiento implica una carga computacional elevada lo cual supone una limitación considerable.

Era por tanto deseable un método de ajuste de retardo de audio/vídeo que solucionara los problemas existentes en el estado de la técnica en este sector.

Descripción de la invención

La presente invención propone un método de ajuste de retardo de audio/vídeo con el fin de paliar los problemas expuestos en el estado de la técnica.

Para ello, el método realiza una inserción de datos de audio en el vídeo con el fin de sincronizar el audio y el vídeo Concretamente, el método se basa en la introducción de elementos significativos del audio dentro de la señal de vídeo cuando el audio es de tipo voz. Este método no es invasivo puesto que los datos de audio no se insertan o mezclan con los datos de imagen sino que se introducen en campos de datos libres del propio stream de vídeo. El método tampoco requiere una gran capacidad para realizar el procesado puesto que únicamente estudia el sonido y los campos de datos del flujo de vídeo, es decir, no necesita tratar la imagen y por tanto reduce la carga computacional asociada a dicho procesamiento. De esta forma, con este método es posible analizar el flujo de audio y de vídeo, detectar el retardo de la imagen con respecto al audio y, una vez detectado dicho retardo, ajustar de forma escalonada una línea de retardo del audio para evitar posibles cortes o saltos en el sonido. Este ajuste escalonado del retardo se puede realizar mediante saltos de retardo en tiempos preestablecidos. Como ejemplo si se tiene un vídeo con un retardo de 200 ms respecto al audio, este ajuste se puede realizar añadiendo retardos de audio de 50 en tramos de 500 ms, de forma que en 1,5 segundos el audio y el vídeo estarán sincronizados, o añadiendo saltos de 100 ms en tramos de 500 ms, en cuyo caso en 0,5 segundos estaría sincronizado. El salto podría ser del retardo completo, de esta forma el sincronizado del audio y del vídeo no presentaría demoras.

El método parte de una fuente de vídeo a cuya salida se añade el resultado de procesar y extraer parámetros de audio de la fuente de audio. Preferentemente, se extraerá la envolvente en frecuencias junto con las amplitudes del sonido sonoro que en ese momento se esté produciendo, estos datos acompañarían al vídeo en toda su trayectoria.

A partir del momento en el que el vídeo tiene la referencia de su audio asociado con esas marcas de sincronización, tanto el vídeo como el audio podrán pasar por los diferentes elementos de producción de programas, mezcladores, sincronizadores de cuadro, etc.

Una vez finalizados los procesos de producción, el vídeo estará retardado con respecto al audio en un número variable de cuadros que variará con el tiempo y dependerá de los diferentes procesos y formas de operación por los que hayan pasado las señales.

Para corregir este retardo, la señal de audio resultante del proceso de producción es tratada por un procesador que extrae el parámetro definido (envolvente de frecuencias y amplitudes). Dicho parámetro es comparado con los parámetros que tiene el flujo de datos del vídeo, resultado de la inserción realizada antes de los procesos de producción, obteniendo tras la comparación un valor del retardo real del vídeo con respecto al audio, de forma que será necesario retardar el audio para la sincronización, esto se realiza mediante el mismo comparador que controla una línea de retardo variable, el comparador controla de forma remota el tiempo de retardo que añade la línea de retardo variable a la señal de audio. El comparador enviará los retardos necesarios para ajustar de forma escalonada la línea de retardo en el audio para evitar posibles cortes o saltos en el sonido. Finalmente, se obtiene en la salida dos señales totalmente síncronas: la señal de audio y la señal de vídeo

En la creación de material audiovisual hay diferentes tipos de fuentes y procesos de producción de vídeo. A continuación se particulariza la implementación de este método para cada uno de ellos:

- El resultado de la captura de imágenes con una única cámara: en este caso, el método detecta e introduce la envolvente de frecuencias y amplitudes de los sonidos sonoros en el flujo de datos del vídeo.

- El resultado de la edición de imágenes: en este caso, cuando se inserta audio y vídeo de una misma secuencia, se copian también los datos de la envolvente de frecuencias que tenga la imagen original, en la imagen resultante de la edición, puesto que al ser una copia de audio y vídeo,...

 


Reivindicaciones:

1. Método de ajuste de retardo audio/vídeo, caracterizado porque comprende las siguientes etapas:

a) extraer parámetros característicos de una fuente de audio (3);
b) introducir los parámetros extraídos de la fuente de audio (3) en el vídeo procedente de una fuente de vídeo (1);
c) extraer de la señal de audio, tras el procesado del vídeo, los mismos parámetros extraídos en a);
d) obtener de la señal de vídeo, tras el procesado del vídeo, los parámetros de audio introducidos en b);
e) comparar los parámetros de audio extraídos en c) y obtenidos en d);
f) calcular el retardo existente entre los parámetros de audio comparados en e);
g) almacenar el retardo calculado;
h) retardar la señal de audio un valor de retardo configurable en función del retardo calculado y del retardo almacenado procedente de una ejecución anterior del método.

2. Método de ajuste de retardo audio/vídeo, según la reivindicación 1, caracterizado porque la extracción de parámetros característicos comprende la extracción de la envolvente espectral y de las amplitudes del sonido sonoro de la fuente de audio (3) en el momento de extracción.

3. Método de ajuste de retardo audio/vídeo, según cualquiera de las reivindicaciones anteriores, caracterizado porque en procesos en los que el vídeo procede de distintas fuentes de vídeo (1):

- si el audio y vídeo insertados proceden de la misma secuencia, se copian los parámetros característicos del audio de la imagen fuente en la imagen destino;
- si el audio se inserta con una imagen diferente, no se copian los parámetros característicos del audio de la imagen fuente en la imagen destino, no conteniendo la imagen destino datos de envolvente espectral de ningún sonido.

4. Método de ajuste de retardo audio/vídeo, según cualquiera de las reivindicaciones anteriores, caracterizado porque el vídeo y el audio proceden de distintas fuentes de vídeo (1) y de audio (3), comprendiendo, las siguientes etapas:

- asociar, en cada entrada de vídeo, al menos una señal de audio;
- procesar las entradas de audio de cada entrada de vídeo extrayendo los parámetros característicos de cada entrada de audio;
- introducir, en cada una de las señales de vídeo, los parámetros característicos como valor de referencia en el flujo de datos de las entradas de vídeo en las que esté asociadas.

5. Método de ajuste de retardo audio/vídeo, según cualquiera de las reivindicaciones anteriores, caracterizado porque la introducción de los parámetros extraídos de la fuente de audio (3) en el vídeo (1) se realiza dentro del campo de datos especificado en cada uno de los estándares.

6. Método de ajuste de retardo audio/vídeo, según cualquiera de las reivindicaciones anteriores, caracterizado porque retardar la señal de audio comprende las siguientes etapas:

- comprobar si el valor de retardo calculado en f) difiere del retardo almacenado de la ejecución anterior del método;
- seleccionar un valor de salto de retardo si el valor de retardo calculado en f) difiere del retardo almacenado;
- actualizar el valor de retardo almacenado aumentando o disminuyendo dicho retardo un valor igual al valor de salto de retardo seleccionado;
- retardar el audio el valor de retardo almacenado.

7. Método de ajuste de retardo audio/vídeo, según la reivindicación 6, caracterizado porque la selección del salto de retardo se realiza entre los divisores del tiempo de cuadro.

8. Sistema de ajuste de retardo audio/vídeo, caracterizado porque comprende:

• unos medios de procesamiento configurados para realizar las siguientes etapas:
i) extraer parámetros característicos de una fuente de audio (3);
j) introducir los parámetros extraídos de la fuente de audio (3) en el vídeo procedente de una fuente de vídeo (1);
k) extraer de la señal de audio, tras el procesado del vídeo, los mismos parámetros extraídos en a);
l) obtener de la señal de vídeo, tras el procesado del vídeo, los parámetros de audio introducidos en b);
• un comparador (2) configurado para realizar las siguientes etapas:
m) comparar los parámetros de audio extraídos en k) y obtenidos en l);
n) calcular el retardo existente entre los parámetros de audio comparados en m);
o) almacenar el retardo calculado;
• una línea de retardo (5) configurada para realizar la siguiente etapa:
p) retardar la señal de audio un valor de retardo configurable en función del retardo calculado y del retardo almacenado procedente de una ejecución anterior del método.

9. Sistema de ajuste de retardo audio/vídeo, según la reivindicación 8, caracterizado porque los medios de procesamiento comprenden un bloque de procesado de audio (4) configurado para la extracción de parámetros característicos mediante la extracción de la envolvente espectral y de las amplitudes del sonido sonoro de la fuente de audio (3) en el momento de extracción.

10. Sistema de ajuste de retardo audio/vídeo, según cualquiera de las reivindicaciones 8-9, caracterizado porque el vídeo procede de distintas fuentes de vídeo (1), donde:

- si el audio y vídeo insertados proceden de la misma secuencia, los medios de procesamiento están configurados para copiar los parámetros característicos del audio de la imagen fuente en la imagen destino;
- si el audio se inserta con una imagen diferente, los medios de procesamiento están configurados para borrar los parámetros característicos del audio que tuviera la imagen.

11. Sistema de ajuste de retardo audio/vídeo, según cualquiera de las reivindicaciones 8-10, caracterizado porque el vídeo y el audio proceden de distintas fuentes de vídeo (1) y de audio (3), estando los medios de procesamiento configurados para realizar, en cada entrada de vídeo, las siguientes etapas:

- asociar, en cada entrada de vídeo, al menos una señal de audio;
- procesar las entradas de audio de cada entrada de vídeo extrayendo los parámetros característicos de cada entrada de audio;
- introducir, en cada una de las señales de vídeo, los parámetros característicos como valor de referencia en el flujo de datos de las entradas de vídeo en las que esté asociadas.

12. Sistema de ajuste de retardo audio/vídeo, según cualquiera de las reivindicaciones 8-11, caracterizado porque los medios de procesamiento están configurados para introducir los parámetros extraídos de la fuente de audio (3) en el vídeo (1) dentro del campo de datos especificado en cada uno de los estándares.

13. Sistema de ajuste de retardo audio/vídeo, según cualquiera de las reivindicaciones 8-12, caracterizado porque el comparador de audio (2) está configurado para realizar las siguientes etapas:

- comprobar si el valor de retardo calculado en f) difiere del retardo almacenado de la ejecución anterior del método;
- seleccionar un valor de salto de retardo si el valor de retardo calculado en f) difiere del retardo almacenado;
- enviar el valor de retardo a la línea de retardo de audio (5);
- actualizar el valor de retardo almacenado aumentando o disminuyendo dicho retardo un valor igual al valor de salto de retardo seleccionado.

14. Sistema de ajuste de retardo audio/vídeo, según la reivindicación 13, caracterizado porque el comparador de audio (2) está configurado para seleccionar el salto de retardo entre los divisores del tiempo de cuadro.

15. Sistema de ajuste de retardo audio/vídeo, según cualquiera de las reivindicaciones 8-14, caracterizado porque el comparador de audio (2) está configurado para:

- establecer un margen de identificación correspondiente a la diferencia máxima admitida para considerar que los parámetros característicos son idénticos;
- buscar, dentro de un margen temporal de corrección configurable, los parámetros característicos recibidos en la señal de audio, ordenando a la línea de retardo (5) un retardo de la señal de audio si el comparador de audio (2) obtiene los parámetros característicos insertados en el vídeo correspondientes, bajo un margen de identificación, a los parámetros característicos recibidos en la señal de audio.

 

Patentes similares o relacionadas:

Imagen de 'PROCESAMIENTO DE AUDIO PARA EQUIPO AUDIOVISUAL'PROCESAMIENTO DE AUDIO PARA EQUIPO AUDIOVISUAL, del 28 de Mayo de 2010, de MATSUSHITA ELECTRIC INDUSTRIAL CO., LTD.: SE SUMINISTRA UN APARATO DE DECODIFICACION DE AUDIO PARA RECIBIR UNA CORRIENTE DE BITS EN BASE BLOQUE A BLOQUE, DECODIFICANDO UN BLOQUE DE LA CORRIENTE DE BITS PARA FORMAR […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 5 de Junio de 2019, de Godo Kaisha IP Bridge 1: Un sistema de codificación y decodificación de imágenes que incluye un aparato de codificación de imágenes que codifica una señal de imagen procedente de una fotografía […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 5 de Junio de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]

Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento, del 20 de Febrero de 2019, de Panasonic Intellectual Property Corporation of America: Un procedimiento de codificación y decodificación de imágenes que incluye un procedimiento de codificación de imágenes para codificar un bloque objetivo de […]

Dispositivo y método para la sincronización de diferentes partes de un servicio digital, del 6 de Febrero de 2019, de THOMSON LICENSING: Un dispositivo que actúa como una fuente de servicio digital , que comprende primeros medios para proporcionar, a la salida, datos […]

Procedimiento de codificación de imagen y procedimiento de decodificación de imagen, del 25 de Septiembre de 2018, de Godo Kaisha IP Bridge 1: Un procedimiento de codificación para codificar un cuadro en movimiento que incluye una pluralidad de cuadros con referencia a un cuadro de referencia seleccionado […]

Procedimiento de transmisión de imágenes, procedimiento de procesamiento de imágenes, procesador de imágenes, y medio de almacenamiento de datos, del 17 de Enero de 2018, de Sun Patent Trust: Un procedimiento de transmisión de imágenes para transmisión de datos (Dv) de imagen comprimidos correspondientes a una imagen en movimiento que comprende tramas, comprendiendo […]

Método de codificación de imágenes, del 3 de Enero de 2018, de Panasonic Intellectual Property Corporation of America: Un método de codificación de imágenes para codificar una señal de imagen que contiene Planos de Objetos de Video, que comprende: emitir una señal de imagen […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .