Método y aparato para procesar una señal de medios.

Método de procesamiento de una señal de audio, que comprende las etapas siguientes:

extraer información espacial a partir de un tren de bits;

generar información de mapeado de fuentes mediante la utilización de la información espacial para fuentes múltiples;

generar por lo menos una información de renderización mediante la utilización de información de mapeado de fuentes e información de filtro para un efecto de sonido envolvente;

suavizar dicha por lo menos una información de renderización mediante la utilización de información de renderización adyacente a dicha por lo menos una información de renderización; y

generar una señal de sonido envolvente que presenta el efecto de sonido envolvente aplicando dicha por lo menos una información de renderización suavizada a una señal de submezcla, siendo generada la señal de submezcla mediante la submezcla de las fuentes múltiples, en el que

la señal de submezcla incluye un canal de entrada izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada incluye un canal de salida izquierdo y un canal de salida derecho, y

la información de renderización comprende una primera información de renderización y una segunda información de renderización, estando la primera información de renderización destinada a generar el canal de salida izquierdo mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida derecho mediante su aplicación al canal de entrada derecho y estando la segunda información de renderización destinada a generar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida izquierdo mediante su aplicación al canal de entrada derecho.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/KR2007/000340.

Solicitante: LG ELECTRONICS INC..

Nacionalidad solicitante: República de Corea.

Dirección: 20, YEOUIDO-DONG YEONGDEUNGPO-GU SEOUL 150-721 REPUBLICA DE COREA.

Inventor/es: KIM,Dong Soo, LIM,Jae Hyun, OH,Hyen O, JUNG,Yang Won, PANG,HEE SUCK.

Fecha de Publicación: 6 de Agosto de 2014.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).

PDF original: ES-2496571_T3.pdf

Fragmento de la descripción:

Método y aparato para procesar una señal de medios.

Campo técnico

La presente invención se refiere a un aparato para procesar una señal de medios y un método del mismo y, más particularmente, a un aparato para generar una señal de sonido envolvente mediante información espacial de la señal de medios y un método del mismo.

Antecedentes de la técnica

En general, diversos tipos de aparatos y métodos han tenido un amplio uso en la generación de una señal de medios multicanal mediante información espacial para la señal de medios multicanal y una señal de submezcla, en la que la señal de submezcla se genera realizando la submezcla de la señal de medios multicanal para obtener una señal mono o estéreo.

Sin embargo, los métodos y aparatos anteriores no pueden utilizarse en entornos inadecuados para generar una señal multicanal. Por ejemplo, no pueden utilizarse para un dispositivo capaz de generar solo una señal estéreo. En otras palabras, no existe ningún método ni aparato para generar una señal de sonido envolvente, en los que la señal de sonido envolvente presente características multicanal en un entorno incapaz de generar una señal multicanal mediante información espacial de la señal multicanal.

En consecuencia, dado que no existe ningún método ni aparato para generar una señal de sonido envolvente en un dispositivo capaz de generar solo una señal mono o estéreo, es difícil procesar la señal de medios con eficacia.

El documento New use cases for spatial audio coding (Jakka, Julia et al., ISO/IEC JTC 1/SC 28/WG 11/M12913, 11 de enero de 26, XP341582) da a conocer un códec de audio espacial que admite la generación eficaz de salidas de audio binaural. En primer lugar, se realiza la transformación al dominio QMF de la señal de entrada que consiste en uno o dos canales de audio sometidos a submezcla y, a continuación, se aplican los parámetros espaciales para reconstruir el audio multicanal que se transforma a su vez al dominio del tiempo mediante síntesis QMF.

Exposición de la invención

Problema técnico

En consecuencia, la presente invención va dirigida a un aparato para procesar una señal de audio y un método del mismo que evitan sustancialmente uno o más de los problemas debidos a las limitaciones y desventajas de la técnica relacionada.

Uno de los objetivos de la presente invención es ofrecer un aparato para procesar una señal de medios y un método del mismo, por medio de los cuales la señal de medios puede convertirse en una señal de sonido envolvente mediante información espacial para la señal de medios.

En la descripción siguiente, se exponen características y ventajas adicionales de la presente invención, que en parte resultarán evidentes a partir de la presente descripción o se podrán deducir mediante la puesta en práctica de la presente invención. Los objetivos y otras ventajas de la presente invención se llevarán a cabo y alcanzarán mediante la estructura especialmente señalada en la descripción y las reivindicaciones, así como los dibujos adjuntos, del presente documento.

Solución técnica

Para lograr estas y otras ventajas y de conformidad con el propósito de la presente invención, se definen un método y un aparato en las reivindicaciones adjuntas.

Debe tenerse en cuenta que tanto la descripción general anterior como la descripción detallada siguiente son ejemplificativas e ilustrativas y tienen por objeto ofrecer más detalles de la invención reivindicada.

Efectos ventajosos

Un aparato y un método de procesamiento de señales según la presente invención permiten que un decodificador, que recibe un tren de bits que comprende una señal de submezcla generada realizando la submezcla de una señal multicanal e información espacial de la señal multicanal, para generar una señal que presenta un efecto de sonido envolvente en entornos incapaces de recuperar la señal multicanal.

Breve descripción de los dibujos

Los dibujos adjuntos, que se facilitan para permitir una mayor comprensión de la presente invención y que se integran en la presente memoria y forman parte de esta, ilustran formas de realización de la presente invención y, junto con la descripción, sirven para explicar los principios de la presente invención.

En los dibujos:

la figura 1 es un diagrama de bloques de un aparato de codificación de señales de audio y un aparato de decodificación de señales de audio según una forma de realización de la presente invención;

la figura 2 es un diagrama estructural de un tren de bits de una señal de audio según una forma de realización de la presente invención;

la figura 3 es un diagrama de bloques detallado de una unidad de conversión de información espacial según una forma de realización de la presente invención;

las figuras 4 y 5 son diagramas de bloque de las configuraciones de canales utilizadas para el método de mapeado de fuentes según una forma de realización de la presente invención;

las figuras 6 y 7 son diagramas de bloque detallados de una unidad de renderización para una señal de submezcla estéreo según una forma de realización de la presente invención;

la figuras 8 y la figura 9 son diagramas de bloques detallados de una unidad de renderización para una señal de submezcla mono según una forma de realización de la presente invención;

las figuras 1 y 11 son diagramas de bloque de una unidad de suavizado y una unidad de expansión según una forma de realización de la presente invención;

la figura 12 es un gráfico para describir un primer método de suavizado según una forma de realización de la presente invención;

la figura 13 es un gráfico para describir un segundo método de suavizado según una forma de realización de la presente invención;

la figura 14 es un gráfico para describir un tercer método de suavizado según una forma de realización de la presente invención;

la figura 15 es un gráfico para describir un cuarto método de suavizado según una forma de realización de la presente invención;

la figura 16 es un gráfico para describir un quinto método de suavizado según una forma de realización de la presente invención;

la figura 17 es un diagrama para describir la información de filtro prototipo correspondiente a cada canal;

la figura 18 es un diagrama de bloques para un primer método de generación de información de filtro de

renderización en una unidad de conversión de información espacial según una forma de realización de la

presente invención;

la figura 19 es un diagrama de bloques para un segundo método de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención;

la figura 2 es un diagrama de bloques para un tercer método de generación de información de filtro de

renderización en una unidad de conversión de información espacial según una forma de realización de la

presente invención;

la figura 21 es un diagrama para describir un método de generación de una señal de sonido envolvente en una unidad de renderización según una forma de realización de la presente invención;

la figura 22 es un diagrama para un primer método de interpolación según una forma de realización de la presente invención;

la figura 23 es un diagrama para un segundo método de interpolación según una forma de realización de la presente invención;

la figura 24 es un diagrama para un método de conmutación de bloques según una forma de realización de la presente invención;

la figura 25 es un diagrama de bloques para una posición a la cual se aplica una longitud de ventana elegida por una unidad de elección de longitud de ventana según una forma de realización de la presente invención;

la figura 26 es un diagrama para unos filtros de diversas longitudes utilizados en el procesamiento de una señal de audio según una forma de realización de la presente invención;

La figura 27 es un diagrama para un método de procesamiento dividido de una señal de audio mediante una pluralidad de subfiltros según una forma de realización de la presente invención;

la figura 28 es un diagrama de bloques para un método de renderización de información de renderización de partición generada por una pluralidad de subfiltros para una señal de submezcla mono según una forma de realización de la presente invención;

la figura 29 es un diagrama de bloques para un método de renderización de información de renderización de partición generada por una pluralidad de subfiltros... [Seguir leyendo]

Reivindicaciones:

1. Método de procesamiento de una señal de audio, que comprende las etapas siguientes:

extraer información espacial a partir de un tren de bits;

generar información de mapeado de fuentes mediante la utilización de la información espacial para fuentes múltiples;

generar por lo menos una información de renderización mediante la utilización de información de mapeado de fuentes e información de filtro para un efecto de sonido envolvente;

suavizar dicha por lo menos una información de renderización mediante la utilización de información de renderización adyacente a dicha por lo menos una información de renderización; y

generar una señal de sonido envolvente que presenta el efecto de sonido envolvente aplicando dicha por lo menos una información de renderización suavizada a una señal de submezcla, siendo generada la señal de submezcla mediante la submezcla de las fuentes múltiples, en el que

la señal de submezcla incluye un canal de entrada izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada incluye un canal de salida izquierdo y un canal de salida derecho, y

la información de renderización comprende una primera información de renderización y una segunda información de renderización, estando la primera información de renderización destinada a generar el canal de salida izquierdo mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida derecho mediante su aplicación al canal de entrada derecho y estando la segunda información de renderización destinada a generar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida izquierdo mediante su aplicación al canal de entrada derecho.

2. Método según la reivindicación 1, en el que el suavizado de dicha por lo menos una información de renderización se realiza en un dominio del tiempo o un dominio de la frecuencia.

3. Método según la reivindicación 1 o 2, que comprende además la expansión de la información de renderización desde una primera banda de frecuencias en la que se genera la información de renderización hasta una segunda banda de frecuencias.

4. Método según la reivindicación 3, en el que la información de renderización se expande mediante la utilización de un mismo valor de la información de renderización en la primera banda de frecuencias.

5. Método según cualquiera de las reivindicaciones 1 a 4, en el que el filtro utilizado para el suavizado de dicha por lo menos una información de renderización se realiza mediante un filtro MR de primer orden.

6. Método según cualquiera de las reivindicaciones 1 a 5, que comprende además la generación de una señal de sonido envolvente que presenta el efecto de sonido envolvente aplicando dicha por lo menos una información de renderización suavizada a una señal de submezcla generada mediante la submezcla de las fuentes múltiples.

7. Método según cualquiera de las reivindicaciones 1 a 6, en el que la información del filtro comprende por lo menos una información de filtro HRTF o un valor decidido en función de una selección del usuario.

8. Aparato para procesar señales de audio, que comprende:

una unidad de decodificación de información espacial (8) que extrae información espacial de un tren de bits;

una unidad de mapeado de fuentes (11) que genera información de mapeado de fuentes mediante la utilización de la información espacial para fuentes múltiples;

una unidad de integración (13) que genera por lo menos una información de renderización mediante la utilización de información de mapeado de fuentes e información de filtro para un efecto de sonido envolvente;

una unidad de suavizado (142) que suaviza dicha por lo menos una información de renderización mediante la utilización de información de renderización adyacente a dicha por lo menos una información de renderización; y

una unidad de renderización (9) que genera una señal de sonido envolvente que presenta el efecto de sonido envolvente aplicando dicha por lo menos una información de renderización suavizada a una señal de submezcla, siendo generada la señal de submezcla mediante la submezcla de las fuentes múltiples, en el que

la señal de submezcla Incluye un canal de entrada Izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada Incluye un canal de salida Izquierdo y un canal de salida derecho, y

la información de renderlzaclón comprende una primera información de renderización y una segunda información de renderización, estando la primera información de renderización destinada a generar el canal de salida izquierdo mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida derecho mediante su aplicación al canal de entrada derecho, y estando la segunda información de renderización destinada a generar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida Izquierdo mediante su aplicación al canal de entrada derecho.

9. Aparato según la reivindicación 8, en el que la unidad de suavizado suaviza por lo menos una Información de renderización en un dominio del tiempo o un dominio de la frecuencia.

1. Aparato según la reivindicación 8 o 9, en el que la unidad de suavizado expande la Información de renderización desde una primera banda de frecuencias en la que se genera la información de renderización hasta una segunda banda de frecuencias.

11. Aparato según la reivindicación 1, en el que la unidad de suavizado se expande mediante la utilización de un mismo valor de la información de renderización en la primera banda de frecuencias.

12. Aparato según cualquiera de las reivindicaciones 8 a 11, en el que la unidad de suavizado suaviza dicha por lo menos una información de renderización mediante la utilización de un filtro 11R de primer orden.

13. Aparato según cualquiera de las reivindicaciones 8 a 12, que comprende además una unidad de renderización (9) que genera una señal de sonido envolvente que presenta un efecto de sonido envolvente aplicando la información de renderización suavizada a una señal de submezcla generada mediante la submezcla de las fuentes múltiples.

14. Aparato según cualquiera de las reivindicaciones 8 a 13, en el que la información del filtro incluye por lo menos una información de filtro HRTF o un valor decidido en función de una selección del usuario.

15. Aparato según la reivindicación 14, en el que la información de filtro se convierte mediante conversión de dominio en información de un dominio para generar la señal de sonido envolvente.

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]