DISPOSITIVO Y METODO PARA GENERAR UNA SEÑAL ESTEREOFONICA CODIFICADA DE UNA PIEZA DE AUDIO O FLUJO DE DATOS DE AUDIO.

Dispositivo para generar una señal estereofónica codificada de una pieza de audio o un flujo de datos de audio con un primer canal estereofónico y un segundo canal estereofónico a partir de una representación multicanal de la pieza de audio o el flujo de datos de audio,

que presenta información acerca de más de dos multicanales, con las características siguientes:

un medio (11) para proporcionar los más de dos multicanales a partir de la representación multicanal;

un medio (12) para la realización de un procesamiento de señal de auricular para generar una señal estereofónica no codificada con un primer canal (10a) estereofónico no codificado y un segundo canal (10b) estereofónico no codificado, estando configurado el medio (12) para la realización

para evaluar cada multicanal con una primera función de filtro (HiL) derivada de una posición virtual de un altavoz para reproducir el multicanal y una primera posición virtual de oído de un oyente, para el primer canal estereofónico y con una segunda función de filtro (HiR) derivada de una posición virtual del altavoz y una segunda posición virtual de oído del oyente, para el segundo canal estereofónico, para generar un primer canal evaluado y un segundo canal evaluado para cada multicanal, siendo diferentes las dos posiciones virtuales de oído del oyente,

para sumar (22) los primeros canales evaluados para obtener el primer canal (10a) estereofónico no codificado y

para sumar (23) los segundos canales evaluados para obtener el segundo canal (10b) estereofónico no codificado;

para utilizar la primera función de filtro (HiL) que considera el sonido directo, las reflexiones y la reverberación difusa, y la segunda función de filtro (HiR) que considera el sonido directo, las reflexiones y la reverberación difusa, y

un codificador (13) estereofónico para codificar el primer canal (10a) estereofónico no codificado y el segundo canal (10b) estereofónico no codificado para obtener la señal (14) estereofónica codificada, estando configurado el codificador estereofónico de tal manera que una tasa de transmisión de datos requerida para transmitir la señal estereofónica codificada es menor que una tasa de transmisión de datos requerida para transmitir la señal estereofónica no codificada

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2006/001622.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C,80686 MUNCHEN.

Inventor/es: POPP, HARALD, PLOGSTIES,JAN, MUNDT,HARALD.

Fecha de Publicación: 9 de Junio de 2010.

Fecha Concesión Europea: 17 de Marzo de 2010.

Clasificación Internacional de Patentes:

H04S3/00A2

Clasificación PCT:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
H04S3/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).

DISPOSITIVO Y METODO PARA GENERAR UNA SEÑAL ESTEREOFONICA CODIFICADA DE UNA PIEZA DE AUDIO O FLUJO DE DATOS DE AUDIO.

Fragmento de la descripción:

Dispositivo y método para generar una señal estereofónica codificada de una pieza de audio o flujo de datos de audio.

La presente invención se refiere a la tecnología de audio multicanal y, en particular, a aplicaciones de audio multicanal en relación a tecnologías de auricular.

La publicación de la AES "MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio", J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, C. Spenger, mayo de 2004, Berlín, describe la codificación eficaz respecto a la tasa de bits de una señal multicanal, que puede decodificarse con decodificadores estereofónicos de MP3.

Las solicitudes de patente internacional WO 99/49574 y WO 99/14983 dan a conocer técnicas de procesamiento de señal de audio para activar un par de altavoces de auricular dispuestos de manera opuesta para que un usuario obtenga una percepción espacial de la escena de audio a través de los dos auriculares, que no sólo es una representación estereofónica sino una representación multicanal. De esta manera, el oyente obtiene, a través de sus auriculares, una percepción espacial de una pieza de audio que en el mejor de los casos es igual que su percepción espacial, si el usuario estuviera en un espacio de reproducción que por ejemplo estuviera equipado con un sistema de audio 5.1. Para este propósito, para cada altavoz de auricular, se le suministra a cada canal de la pieza de audio multicanal o el flujo de datos de audio multicanal, como se ilustra en la figura 2, un filtro separado, después de lo cual se suman los respectivos canales filtrados correspondientes entre sí, como se ilustrará posteriormente.

En el lado izquierdo en la figura 2, se encuentran las entradas 20 multicanal que representan en conjunto una representación multicanal de la pieza de audio o del flujo de datos de audio. Tal escenario se muestra esquemáticamente por ejemplo en la figura 10. La figura 10 muestra un espacio 200 de reproducción en el que está dispuesto un denominado sistema de audio 5.1. El sistema de audio 5.1 comprende un altavoz 201 central, un altavoz 202 frontal-izquierdo, un altavoz 203 frontal-derecho, un altavoz 204 posterior-izquierdo y un altavoz 205 posterior-derecho. Un sistema de audio 5.1 tiene un altavoz 206 de graves adicional que también se denomina canal de mejora de frecuencia baja. En el denominado "punto óptimo" del espacio 200 de reproducción, se encuentra un oyente 207 que lleva unos auriculares 208 que presentan un altavoz 209 de auricular izquierdo y un altavoz 210 de auricular derecho.

El medio de procesamiento mostrado en la figura 2 está configurado ahora para filtrar cada canal 1, 2, 3 de las entradas 20 multicanal con un filtro H_iL que describe el canal de sonido proveniente del altavoz hacia el altavoz 209 izquierdo en la figura 10 y para filtrar adicionalmente el mismo canal con un filtro H_iR que representa el sonido de uno de los cinco altavoces para el oído derecho o hacia el altavoz 210 derecho del auricular 208.

Si, por ejemplo, el canal 1 en la figura 2 fuera el canal frontal-izquierdo emitido por el altavoz 202 en la figura 10, el filtro H_iL representaría el canal indicado por una línea 212 discontinua, en tanto que el filtro H_1R reproduciría el canal representado por una línea 213 discontinua. Como se indica a modo de ejemplo en la figura 10 por una línea 214 discontinua, el altavoz 209 de auricular izquierdo no sólo recibe el sonido directo, sino también reflexiones primarias en un margen del espacio de reproducción y, por supuesto, también reflexiones posteriores expresadas en una reverberación difusa.

Tal representación de filtro se ilustra en la figura 11. En particular, la figura 11 muestra un ejemplo esquemático de una respuesta de impulso de un filtro, por ejemplo, del filtro H_1L de la figura 2. El sonido directo ilustrado en la figura 11 por la línea 212 se representa mediante un pico al inicio del filtro, en tanto que las reflexiones primarias, como se representan por ejemplo en la figura 10 mediante 214, se reproducen por una región central que tiene varios picos menores (discretos) en la figura 11. La reverberación difusa ya no se descompone entonces normalmente según picos individuales, ya que el sonido del altavoz 202 se refleja en principio con una frecuencia arbitraria, disminuyendo por supuesto la energía adicionalmente con cada reflexión y distancia de propagación adicional, como se ilustra por la energía que disminuye en la sección posterior que en la figura 11 se denomina "reverberación difusa".

Cada filtro mostrado en la figura 2 comprende de esta manera una respuesta de impulso de filtro que tiene aproximadamente un desarrollo como se muestra por la ilustración esquemática de respuesta de impulso de la figura 11. Es obvio que la respuesta individual de impulso de filtro dependerá del espacio de reproducción, la colocación de los altavoces, las posibles características de atenuación en el espacio de reproducción, debidas por ejemplo a varias personas presentes o a los muebles en el espacio de reproducción, etc. y también de manera ideal de las características de los altavoces 201 a 206 individuales.

El hecho de que las señales de todos los altavoces se superpongan en el oído del oyente 207 se ilustra por los sumadores 22 y 23 en la figura 2. De esta manera, cada canal se filtra con un filtro correspondiente para el oído izquierdo para después simplemente sumar las señales emitidas por los filtros destinadas al oído izquierdo para obtener la señal de salida del auricular para el oído izquierdo L. De manera análoga, se realiza una sumación mediante el sumador 23 para el oído derecho o el altavoz 210 del auricular derecho en la figura 10 para obtener la señal de salida del auricular para el oído derecho mediante la superposición de todas las señales de altavoz filtradas con un filtro correspondiente para el oído derecho.

Debido al hecho de que, aparte del sonido directo, también existen reflexiones primarias y, en particular, una reverberación difusa, la cual es particularmente significativa para la percepción del espacio, para que el tono no suene sintético o "seco" sino que le dé al oyente la impresión de que realmente se encuentra sentado en una sala de conciertos con sus características acústicas, todas las respuestas de impulso de los filtros 21 individuales serán de longitudes considerables. La convolución de cada multicanal individual de la representación multicanal con dos filtros ya da como resultado por tanto una tarea de cálculo considerable. Ya que se requieren dos filtros para cada multicanal individual, concretamente uno para el oído izquierdo y otro para el oído derecho, cuando el canal de altavoz de graves también se trata de manera separada, se requiere una cantidad total de 12 filtros diferentes entre sí para una reproducción de auricular de una representación multicanal 5.1. Todos los filtros tienen, como es evidente en la figura 11, una respuesta de impulso muy larga para poder considerar no sólo el sonido directo sino también las reflexiones primarias y la reverberación difusa, que realmente confiere a una pieza de audio la reproducción correcta de sonido y una buena impresión espacial.

Por tanto, para poner en práctica el concepto conocido, aparte de un reproductor 220 multicanal, como se muestra en la figura 10, se requiere un procesamiento 222 virtual de sonido muy complicado, que suministra las señales para los dos altavoces 209 y 210 representados por líneas 224 y 226 en la figura 10.

Los sistemas de auricular para generar un sonido de auricular multicanal son por tanto complicados, voluminosos y caros, lo que se debe a la elevada potencia de cálculo, a la elevada demanda de corriente para la elevada potencia de cálculo requerida y a la elevada demanda de memoria de trabajo para las evaluaciones a realizar con la respuesta de impulso y al gran volumen o los elementos caros relacionados con ello para el reproductor. Las aplicaciones de este tipo están relacionadas de esta manera a las tarjetas de sonido de PC domésticas o tarjetas de sonido de ordenadores portátiles o también sistemas estereofónicos domésticos.

En particular, el sonido multicanal de auricular permanece inaccesible para el mercado continuamente creciente de reproductores móviles, como por ejemplo, los reproductores de CD portátiles o, en particular, los reproductores de hardware, ya que los requerimientos de cálculo para filtrar los multicanales con por ejemplo 12 filtros diferentes no pueden realizarse en este segmento de precios ni con respecto a los recursos del procesador ni con respecto al consumo...

Reivindicaciones:

1. Dispositivo para generar una señal estereofónica codificada de una pieza de audio o un flujo de datos de audio con un primer canal estereofónico y un segundo canal estereofónico a partir de una representación multicanal de la pieza de audio o el flujo de datos de audio, que presenta información acerca de más de dos multicanales, con las características siguientes:

un medio (11) para proporcionar los más de dos multicanales a partir de la representación multicanal;
un medio (12) para la realización de un procesamiento de señal de auricular para generar una señal estereofónica no codificada con un primer canal (10a) estereofónico no codificado y un segundo canal (10b) estereofónico no codificado, estando configurado el medio (12) para la realización
para evaluar cada multicanal con una primera función de filtro (H_iL) derivada de una posición virtual de un altavoz para reproducir el multicanal y una primera posición virtual de oído de un oyente, para el primer canal estereofónico y con una segunda función de filtro (H_iR) derivada de una posición virtual del altavoz y una segunda posición virtual de oído del oyente, para el segundo canal estereofónico, para generar un primer canal evaluado y un segundo canal evaluado para cada multicanal, siendo diferentes las dos posiciones virtuales de oído del oyente,
para sumar (22) los primeros canales evaluados para obtener el primer canal (10a) estereofónico no codificado y
para sumar (23) los segundos canales evaluados para obtener el segundo canal (10b) estereofónico no codificado;
para utilizar la primera función de filtro (H_iL) que considera el sonido directo, las reflexiones y la reverberación difusa, y la segunda función de filtro (H_iR) que considera el sonido directo, las reflexiones y la reverberación difusa, y
un codificador (13) estereofónico para codificar el primer canal (10a) estereofónico no codificado y el segundo canal (10b) estereofónico no codificado para obtener la señal (14) estereofónica codificada, estando configurado el codificador estereofónico de tal manera que una tasa de transmisión de datos requerida para transmitir la señal estereofónica codificada es menor que una tasa de transmisión de datos requerida para transmitir la señal estereofónica no codificada.

2. Dispositivo según la reivindicación 1, en el que la primera y la segunda función de filtro corresponden a una respuesta de impulso de filtro que presenta un pico en un valor pequeño de tiempo, que representa el sonido directo, varios picos menores en valores de tiempo medios, que representan las reflexiones, y una región continua, que ya no se descompone según picos individuales y que representa la reverberación difusa.

3. Dispositivo según una de las reivindicaciones anteriores,

en el que la representación multicanal presenta uno o varios canales base así como información paramétrica para calcular los multicanales a partir de uno o varios canales base, y

en el que el medio (11) para proporcionar está configurado para calcular los al menos tres multicanales a partir del uno o los varios canales base y la información paramétrica.

4. Dispositivo según la reivindicación 3,

en el que el medio (11) para proporcionar está configurado para suministrar, en el lado de salida, una representación de dominio de frecuencia en bloques para cada multicanal, y

en el que el medio (12) para la realización está configurado para evaluar la representación de dominio de frecuencia en bloques con una representación de dominio de frecuencia de la primera y la segunda función de filtro.

5. Dispositivo según una de las reivindicaciones anteriores,

en el que el medio (12) para la realización está configurado para suministrar una representación de dominio de frecuencia en bloques del primer canal estereofónico no codificado y el segundo canal estereofónico no codificado, y

en el que el codificador (13) estereofónico es un codificador basado en transformación y está configurado además para procesar la representación de dominio de frecuencia en bloques del primer canal estereofónico no codificado y el segundo canal estereofónico no codificado sin una conversión de la representación de dominio de frecuencia en una representación temporal.

6. Dispositivo según una de las reivindicaciones anteriores,

en el que el codificador (13) estereofónico está configurado para realizar una codificación (15) estereofónica común del primer y el segundo canal estereofónico.

7. Dispositivo según una de las reivindicaciones anteriores,

en el que el codificador (13) estereofónico está configurado para cuantificar (16) un bloque de valores espectrales utilizando un umbral de enmascaramiento psicoacústico y someterlo a codificación (17) de entropía para obtener la señal estereofónica codificada.

8. Dispositivo según una de las reivindicaciones anteriores,

en el que el medio (11) para proporcionar está configurado como decodificador BCC.

9. Dispositivo según una de las reivindicaciones anteriores,

en el que el medio (11) para proporcionar está configurado como decodificador multicanal que presenta un banco de filtros con varias salidas,

en el que el medio (12) para la realización está configurado para evaluar señales en las salidas del banco de filtros con la primera y la segunda función de filtro, y

en el que el codificador (13) estereofónico está configurado para cuantificar (16) el primer canal estereofónico no codificado existente en el dominio de frecuencia y el segundo canal estereofónico no codificado existente en el dominio de frecuencia y someterlo a una codificación (17) de entropía para obtener la señal estereofónica codificada.

10. Método para generar una señal estereofónica codificada de una pieza de audio o un flujo de datos de audio con un primer canal estereofónico y un segundo canal estereofónico a partir de una representación multicanal de la pieza de audio o el flujo de datos de audio que presenta información acerca de más de dos multicanales, con las etapas siguientes:

proporcionar (11) los más de dos multicanales a partir de la representación multicanal;
realizar (12) un procesamiento de señal de auricular para generar una señal estereofónica no codificada con un primer canal (10a) estereofónico no codificado y un segundo canal (10b) estereofónico no codificado, presentando la etapa de realización (12) las etapas siguientes:
evaluar cada multicanal con una primera función de filtro (H_iL) derivada de una posición virtual de un altavoz para reproducir el multicanal y una primera posición virtual de oído de un oyente, para el primer canal estereofónico y con una segunda función de filtro (H_iR) derivada de una posición virtual del altavoz y una segunda posición virtual de oído del oyente, para el segundo canal estereofónico, para generar un primer canal evaluado y un segundo canal evaluado para cada multicanal, siendo diferentes las dos posiciones virtuales de oído del oyente,
sumar (22) los primeros canales evaluados para obtener el primer canal (10a) estereofónico no codificado, y
sumar (23) los segundos canales evaluados para obtener el segundo canal (10b) estereofónico no codificado;
utilizar la primera función de filtro (H_iL) que considera el sonido directo, las reflexiones y la reverberación difusa, y la segunda función de filtro (H_iR) que considera el sonido directo, las reflexiones y la reverberación difusa; y
codificar (13) de manera estereofónica el primer canal (10a) estereofónico no codificado y el segundo canal (10b) estereofónico no codificado para obtener la señal (14) estereofónica codificada,

realizándose la etapa de codificar de manera estereofónica de tal manera que una tasa de transmisión de datos requerida para transmitir la señal estereofónica codificada es menor que una tasa de transmisión de datos requerida para transmitir la señal estereofónica no codificada.

11. Programa informático con un código de programa para realizar el método para generar una señal estereofónica codificada según la reivindicación 10, cuando el programa informático se ejecuta en un ordenador.

Patentes similares o relacionadas:

CODIFICACION Y DECODIFICACION DE AUDIO, del 26 de Mayo de 2010, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Codificador de audio que comprende: - medios para recibir una señal de audio de canal M donde M>2; - medios de mezclado descendente […]

PROCEDIMIENTO DE CONVERSION DE FORMATO SONORO 5.1. A BINAURAL HIBRIDO, del 27 de Abril de 2010, de PORTAS ARRONDO,IVAN: Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido que comprende obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir […]

ESPACIALIZACION BINAURAL DE DATOS SONOROS CODIFICADOS EN COMPRESION, del 16 de Marzo de 2010, de FRANCE TELECOM: Procedimiento de tratamiento de datos sonoros para una restitución espacializada en tres dimensiones sobre dos vías de restitución para los oídos […]

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]