Reconstrucción de datos de audio multicanal.

Procedimiento de procesamiento de datos sonoros, para la reconstrucción de datos de audio multicanal a partir deal menos datos en un número de canales restringido y de datos de espacialización,

comprendiendo dichoprocedimiento una etapa de test (306) de validez de datos de espacialización de una trama recibida y, si dicho testmuestra que dichos datos de espacialización recibidos son válidos, etapas de:

a/ mediante un modelo respectivo de una pluralidad de modelos de predicción, predicción de acuerdo con dichomodelo de un valor de espacialización (307), y

b/ elección de un modelo de predicción, a partir de los valores de espacialización predichos de este modo y, a partirde los datos de espacialización recibidos, para poder, en caso de recepción posterior de datos de espacializacióndefectuosos, predecir de acuerdo con dicho modelo seleccionado un valor de espacialización y utilizar dicho valor deespacialización predicho para la reconstrucción de los datos de audio multicanal;

y en el que, durante la etapa b/:

mediante un modelo respectivo de la pluralidad de modelos, se calcula un valor de semejanza , a partir,por un lado, del valor de espacialización predicho según dicho modelo y, por otro lado, deun valor estimado (WL(b,n), WR(b,n)) a partir de los datos de espacialización recibidos, yse selecciona el modelo de predicción para el cual dicho valor de semejanza indica una mayor adecuación entre elvalor de espacialización predicho y dicho valor estimado.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2009/051304.

Solicitante: FRANCE TELECOM.

Nacionalidad solicitante: Francia.

Dirección: 6 place d''Alleray 75015 Paris FRANCIA.

Inventor/es: PHILIPPE, PIERRICK, VIRETTE,DAVID.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • H04S1/00 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04S SISTEMAS ESTEREOFONICOS.Sistemas con dos canales (H04S 5/00, H04S 7/00 tienen prioridad).
  • H04S3/00 H04S […] › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).

PDF original: ES-2387869_T3.pdf

 

Reconstrucción de datos de audio multicanal.

Fragmento de la descripción:

Reconstrucción de datos de audio multicanal

La invención se refiere a la ocultación de datos de espacialización defectuosos, para la reconstrucción de datos de audio multicanal. Los datos de audio multicanal son típicamente reconstruidos a partir de al menos datos de espacialización y de datos de audio en un número de canales restringido, por ejemplo datos monocanal.

Los datos de audio multicanal están destinados típicamente a varias pistas de audio respectivas. Pueden utilizarse varias fuentes sonoras respectivas para contribuir a proporcionar al oyente la ilusión de un sonido envolvente.

Los datos de audio multicanal pueden comprender por ejemplo datos en estéreo en dos canales, o bien incluso datos 5.1 en seis canales, en particular para aplicaciones de Home Cinema. La invención también puede aplicarse en el campo de las conferencias de audio espacializadas, en el que los datos que corresponden a un locutor

experimentan un tratamiento de espacialización para proporcionar al oyente la ilusión de que la voz de este locutor proviene de una posición particular del espacio.

Los datos de espacialización se utilizan para obtener datos multicanal a partir de los datos en un número inferior de canales, por ejemplo datos monocanal. Estos datos de espacialización pueden comprender por ejemplo diferentes diferencias de nivel inter-vías o ILD (del inglés “Interchannel Level Difference”) , correlaciones inter-vías o ICC (del inglés “Interchannel Cross Correlation”) , retardos entre vías o ITD (del inglés “Interchannel Time Difference”) , diferencias de fase entre vías o IPD (del inglés “Interchannel Phase Difference”) , u otras.

Puede ocurrir que los datos de audio recibidos, que comprenden al menos los datos monocanal y los datos de 25 espacialización, sean defectuosos, es decir que algunos datos falten o que sean erróneos.

La detección de esta transmisión defectuosa puede realizarse por medio de un código de tipo CRC (del inglés “Cyclic Redundancy Check”) .

Se conoce el alivio de estos defectos sustituyendo valores defectuosos por valores predichos. Estos valores predichos pueden determinarse siguiendo un modelo de predicción conocido.

Se conocen varios modelos de predicción. Por ejemplo, se selecciona como valor predicho un valor arbitrario, un valor precedente, un valor determinado a partir de los datos de audio recibidos anteriormente siguiendo, por ejemplo,

procedimientos de predicción lineal, u otros.

Cuando se reciben de forma defectuosa datos monocanal, la sustitución de los valores defectuosos por valores predichos de datos monocanal se revela en general relativamente satisfactoria.

Sin embargo, cuando se reciben de forma defectuosa datos de espacialización, la sustitución de los valores defectuosos por valores predichos puede revelarse insatisfactoria.

Las variaciones fuertes de los datos de espacialización a lo largo del tiempo se traducen para el oyente en la sensación de desplazamientos bruscos de las fuentes sonoras.

45 Por ejemplo, si se sustituyen los valores defectuosos por un valor arbitrario correspondiente a una ausencia de espacialización, la sensación de un retorno a un sonido monocanal puede ser molesta para el oyente, en particular en el caso de señales binaurales. En efecto, las señales binaurales, es decir que permiten una restitución fiel del espacio 3D a nivel de las orejas, corresponden a menudo a fuentes sonoras virtuales relativamente fijas en el espacio.

Existe, por lo tanto, una necesidad de una mejor ocultación de los defectos de los datos de espacialización durante la reconstrucción de datos de audio multicanal. Por ejemplo, el documento US 2005/182996 (BRUHN STEFAN) , 18 de agosto de 2005, describe la construcción de un modelo de predicción sobre la base de una combinación

55 apropiada de canales.

De acuerdo con un primer aspecto, la invención tiene por objeto un procedimiento de procesamiento de datos sonoros, para la reconstrucción de datos de audio multicanal a partir de, al menos, datos en un número de canales restringido y de datos de espacialización, comprendiendo este procedimiento, tal como se define en la reivindicación 1, una etapa de test de la validez de datos de espacialización de una trama recibida. Si este test muestra que estos datos de espacialización son válidos:

a/ mediante modelo respectivo de una pluralidad de modelos de predicción, se predice, según este modelo, un valor de espacialización,

65 b/ se selecciona un modelo de predicción, a partir de los valores de espacialización predichos de este modo y, a partir de los datos de espacialización recibidos efectivamente, para poder, en caso de recepción posterior de datos de espacialización defectuosos, predecir según este modelo seleccionado un valor de espacialización, y utilizar este valor de espacialización predicho para la reconstrucción de los datos de audio multicanal.

Durante la etapa b/, se confronta cada valor de espacialización predicho con un valor estimado a partir de los datos de espacialización recibidos. En particular, puede preverse calcular, por modelo, un valor de semejanza a partir, por un lado, del valor de espacialización predicho siguiendo este modelo y, por otro lado, de un valor estimado a partir de los datos de espacialización recibidos. Se selecciona entonces el modelo de predicción para el cual el valor de semejanza indica una mayor adecuación entre el valor predicho y el valor estimado.

De este modo, se utilizan datos de espacialización considerados como válidos para seleccionar entre una pluralidad de modelos de predicción un modelo de predicción a adoptar en caso de recepción de datos de espacialización considerados como defectuosos. Dicho procedimiento adaptativo según el contenido permite paliar los defectos de los datos de espacialización de forma más satisfactoria que en la técnica anterior en la que se utiliza un solo modelo

de predicción.

Por “un número de canales restringido”, se entiende un número de canales inferior al número de canales de los datos multicanal. Por ejemplo, los datos en un número de canales restringido pueden comprender datos monocanal.

Los datos de espacialización y, de forma más general, los datos de audio recibidos, pueden provenir de un canal de transmisión. Por ejemplo, estos datos pueden recibirse por Internet. Como alternativa, los datos de audio recibidos pueden leerse en un soporte de almacenamiento, por ejemplo un DVD (del inglés “Digital Versatile Disk”) , u otro. La invención no está en absoluto limitada por la procedencia de los datos de audio recibidos.

Los datos de audio recibidos pueden comprender una señal codificada, una señal demultiplexada y/o decodificada, valores numéricos, u otros.

Las etapas a/ y b/ pueden realizarse sistemáticamente después de la recepción de una trama considerada como válida. De este modo, los procesamientos se distribuyen en el tiempo.

Puede preverse, en particular cuando las etapas a/ y b/ se realizan para cada trama válida, escribir en la memoria un identificador del modelo de predicción seleccionado y esto para poder, en caso de recepción posterior de datos de espacialización defectuosos, recuperar rápidamente el modelo de predicción a aplicar.

Como alternativa, la ejecución de las etapas a/ y/o b/ puede estar sometida a la realización de ciertas condiciones, lo que puede permitir evitar realizar cálculos inútiles.

Por ejemplo, cuando una trama se considera como válida, los datos de espacialización se almacenan en una memoria, al menos de forma temporal. Las etapas a/ y b/ se realizan (a partir de los datos almacenados de este modo) , solamente en caso de recepción posterior de datos de espacialización considerados como defectuosos. De este modo, se evita realizar en particular las predicciones de la etapa a/ cuando esto no es necesario.

De acuerdo con otro ejemplo, puede preverse realizar las predicciones de la etapa a/ sistemáticamente después de la recepción de una trama considerada como válida, mientras que la etapa b/ solamente se realiza (a partir de los

45 datos de espacialización de la trama o las tramas precedentes, conservadas... [Seguir leyendo]

 


Reivindicaciones:

1. Procedimiento de procesamiento de datos sonoros, para la reconstrucción de datos de audio multicanal a partir de al menos datos en un número de canales restringido y de datos de espacialización, comprendiendo dicho

procedimiento una etapa de test (306) de validez de datos de espacialización de una trama recibida y, si dicho test muestra que dichos datos de espacialización recibidos son válidos, etapas de:

a/ mediante un modelo respectivo de una pluralidad de modelos de predicción, predicción de acuerdo con dicho modelo de un valor de espacialización (307) , y

b/ elección de un modelo de predicción, a partir de los valores de espacialización predichos de este modo y, a partir de los datos de espacialización recibidos, para poder, en caso de recepción posterior de datos de espacialización defectuosos, predecir de acuerdo con dicho modelo seleccionado un valor de espacialización y utilizar dicho valor de espacialización predicho para la reconstrucción de los datos de audio multicanal;

y en el que, durante la etapa b/:

mediante un modelo respectivo de la pluralidad de modelos, se calcula un valor de semejanza

por un lado, del valor de espacialización predicho según dicho modelo

un valor estimado (WL (b, n) , WR (b, n) ) a partir de los datos de espacialización recibidos, y

se selecciona el modelo de predicción para el cual dicho valor de semejanza indica una mayor adecuación entre el valor de espacialización predicho y dicho valor estimado.

2. Procedimiento de acuerdo con la reivindicación 1, que comprende además, si el test muestra que los datos de espacialización recibidos son válidos, y previamente a la etapa a/, una etapa de almacenamiento de dichos datos de espacialización válidos; y en el que la etapa b/ se realiza en caso de recepción posterior de datos de espacialización defectuosos, a partir de dichos datos de espacialización almacenados.

3. Procedimiento de acuerdo con la reivindicación 2, en el que la etapa a/ se realiza en caso de recepción posterior de datos de espacialización defectuosos, a partir de dichos datos de espacialización almacenados.

4. Procedimiento de acuerdo con la reivindicación 1, en el que las etapas a/ y b/ se realizan sistemáticamente

después de la recepción de una trama válida, comprendiendo el procedimiento además, después de la etapa b/, una 35 etapa de escritura en memoria de un identificador del modelo de predicción seleccionado.

5. Procedimiento de acuerdo con la reivindicación 1, en el que el valor de espacialización predicho comprende una ganancia .

6. Procedimiento de acuerdo con la reivindicación 1, en el que el valor de espacialización predicho comprende un retardo.

7. Procedimiento de acuerdo con la reivindicación 1, en el que durante las etapas a/ y b/:

45 por trama de una secuencia de tramas recibidas, y para al menos un modelo de la pluralidad de modelos, se predice

de acuerdo con dicho modelo un valor de especialización

para dicho modelo, el valor de semejanza

se calcula a partir, por un lado, de la secuencia de valores de espacialización predichos según dicho modelo y, por otro lado, de una secuencia de valores estimados (WL (b, n) , WR (b, n) ) a partir de los datos de espacialización de la secuencia de tramas recibidas.

8. Procedimiento de acuerdo con la reivindicación 1, en el que, la etapa a/ se realiza para los datos de espacialización correspondientes a una banda de frecuencias (b) dada.

55 9. Programa informático que comprende instrucciones para la implementación del procedimiento de acuerdo con la reivindicación 1, cuando dichas instrucciones son ejecutadas por un procesador.

10. Dispositivo de ocultación (20) de datos de espacialización defectuosos para la reconstrucción de datos de audio multicanal, comprendiendo el dispositivo:

una unidad de memoria (21) para almacenar una pluralidad de juegos de instrucciones, correspondiendo cada juego de instrucciones a un modelo de predicción,

medios de recepción para recibir datos de espacialización,

un módulo de test (22) de la validez de los datos de espacialización recibidos por los medios de recepción,

un módulo de estimación (23) adecuado para, en caso de recepción de datos de espacialización detectados como 5 válidos por el módulo de test (22) , y por juego de instrucciones almacenado en la unidad de memoria, ejecutar dicho juego de instrucciones para predecir un valor de espacialización, y

un módulo de selección (24) para seleccionar un modelo de predicción, a partir de los valores de espacialización predichos por el módulo de estimación, siendo este módulo de selección adecuado: 10

• para calcular, mediante modelo respectivo de la pluralidad de modelos, un valor de semejanza

partir, por un lado, del valor de espacialización predicho según dicho modelo lado, de un valor estimado (WL (b, n) , WR (b, n) ) a partir de los datos de espacialización recibidos por los medios de recepción, y

• para seleccionar el modelo de predicción para el cual dicho valor de semejanza indica una mayor adecuación entre el valor de espacialización predicho y dicho valor estimado;

comprendiendo el dispositivo de ocultación además un módulo de predicción (25) dispuesto para, en caso de 20 recepción posterior de datos de espacialización considerados como defectuosos por el módulo de test (22) , predecir un valor de espacialización de acuerdo con dicho modelo seleccionado por el módulo de selección.

11. Aparato de reconstrucción (26) de datos de audio multicanal, comprendiendo dicho aparato:

medios de reconstrucción multicanal (27) , para reconstruir datos de audio multicanal a partir al menos de datos monocanal,

el dispositivo de ocultación (20) de acuerdo con la reivindicación 10, en el que el módulo de predicción (25) está dispuesto para, en caso de recepción de datos de espacialización considerados como defectuosos por el módulo de 30 test (22) , proporcionar el valor de espacialización predicho a los medios de reconstrucción multicanal para la reconstrucción de los datos de audio multicanal.


 

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .