Procedimiento y aparato para procesar una señal de medios.
Procedimiento de procesamiento de una señal de audio, que comprende las etapas siguientes:
extraer información espacial a partir de un tren de bits;
generar información de mapeado de fuentes mediante la información espacial para fuentes múltiples;
generar por lo menos una información de renderización mediante la información de mapeado de fuentes e información de filtro para un efecto de sonido envolvente;
interpolar dicha por lo menos una información de renderización mediante información de renderización adyacente a dicha por lo menos una información de renderización y
generar una señal de sonido envolvente que presenta el efecto de sonido envolvente aplicando dicha por lo menos una información de renderización interpolada a una señal de reducción de mezcla, siendo generada la señal de reducción de mezcla mediante la reducción de mezcla de las fuentes múltiples, en el que la señal de reducción de mezcla incluye un canal de entrada izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada incluye un canal de salida izquierdo y un canal de salida derecho, y la información de renderización comprende una primera información de renderización y una segunda información de renderización, en el que la primera información de renderización es para generar el canal de salida izquierdo mediante su aplicación al canal de entrada izquierdo o para generar el canal de salida derecho mediante su aplicación al canal de entrada derecho, y la segunda información de renderización es para generar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o para generar el canal de salida izquierdo mediante su aplicación al canal de entrada derecho.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/KR2007/000342.
Solicitante: LG ELECTRONICS INC..
Nacionalidad solicitante: República de Corea.
Dirección: 20 YEOUIDO-DONG YEONGDEUNGPO-KU SEOUL 150-721 REPUBLICA DE COREA.
Inventor/es: KIM,Dong Soo, LIM,Jae Hyun, OH,Hyen O, JUNG,Yang Won, PANG,HEE SUCK.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
PDF original: ES-2513265_T3.pdf
Ver la galería de la patente con 12 ilustraciones.
Fragmento de la descripción:
Procedimiento y aparato para procesar una señal de medios.
Campo técnico
La presente invención se refiere a un aparato para procesar una señal de medios y un procedimiento del mismo, y más particularmente a un aparato para generar una señal de sonido envolvente mediante información espacial de la señal de medios y un procedimiento del mismo.
Antecedentes de la técnica
En general, diversos tipos de aparatos y procedimientos han tenido un uso generalizado en la generación de una señal de medios multicanal mediante información espacial para la señal de medios multlcanal y una señal de reducción de mezcla, en la que la señal de reducción de mezcla se genera realizando la reducción de mezcla de la señal de medios multicanal para obtener una señal mono o estéreo.
Sin embargo, los procedimientos y aparatos anteriores no pueden utilizarse en entornos Inadecuados para generar una señal multicanal. Por ejemplo, no pueden utilizarse para un dispositivo capaz de generar solo una señal estéreo. En otras palabras, no existe ningún procedimiento ni aparato para generar una señal de sonido envolvente, en los que la señal de sonido envolvente presente características multicanal en un entorno incapaz de generar una señal multicanal mediante información espacial de la señal multicanal.
En consecuencia, dado que no existe ningún procedimiento ni aparato para generar una señal de sonido envolvente en un dispositivo capaz de generar solo una señal mono o estéreo, es difícil procesar la señal de medios con
eficacia.
El documento New use cases for spatial audio coding (Jakka, Julia et al., ISO/IEC JTC 1/SC 28/WG 11/M12913, 11 de enero de 26, XP341582) da a conocer un códec de audio espacial que admite la generación eficaz de salidas de audio binaural. En primer lugar, se realiza la transformación al dominio QMF de la señal de entrada que consiste en uno o dos canales de audio sometidos a reducción de mezcla y, a continuación, se aplican los parámetros espaciales para reconstruir el audio multicanal que se transforma a su vez al dominio del tiempo mediante síntesis QMF.
Exposición de la invención
Problema técnico
En consecuencia, la presente invención va dirigida a un aparato para procesar una señal de audio y un procedimiento del mismo que evitan sustancialmente uno o más de los problemas debidos a las limitaciones y desventajas de la técnica relacionada.
Uno de los objetivos de la presente invención es ofrecer un aparato para procesar una señal de medios y un procedimiento del mismo, por medio de los cuales la señal de medios puede convertirse en una señal de sonido envolvente mediante información espacial para la señal de medios.
En la descripción siguiente, se exponen características y ventajas adicionales de la presente invención, que en parte se pondrán de manifiesto a partir de la presente descripción o se podrán deducir mediante la puesta en práctica de la presente invención. Los objetivos y otras ventajas de la presente invención se llevarán a cabo y alcanzarán mediante la estructura especialmente señalada en la descripción y las reivindicaciones, así como los dibujos adjuntos, del presente documento.
Solución técnica
Para lograr estas y otras ventajas y de conformidad con el propósito de la presente invención, se definen un procedimiento y un aparato en las reivindicaciones adjuntas.
Debe tenerse en cuenta que tanto la descripción general anterior como la descripción detallada siguiente son ejemplificativas e ilustrativas y tienen por objeto ofrecer más detalles de la invención reivindicada.
Efectos ventajosos
Un aparato y un procedimiento de procesamiento de señales según la presente invención permiten que un decodificador, que recibe un tren de bits que comprende una señal de reducción de mezcla generada realizando la reducción de mezcla de una señal multicanal e información espacial de la señal multicanal, para generar una señal que presenta un efecto de sonido envolvente en entornos incapaces de recuperar la señal multicanal.
Breve descripción de los dibujos
Los dibujos adjuntos, que se facilitan para permitir una mayor comprensión de la presente invención y que se integran en la presente memoria y forman parte de esta, ilustran formas de realización de la presente invención y, junto con la descripción, sirven para explicar los principios de la presente invención.
En los dibujos:
la figura 1 es un diagrama de bloques de un aparato de codificación de señales de audio y un aparato de decodificación de señales de audio según una forma de realización de la presente invención;
la figura 2 es un diagrama estructural de un tren de bits de una señal de audio según una forma de realización de la presente invención;
la figura 3 es un diagrama de bloques detallado de una unidad de conversión de información espacial según una forma de realización de la presente invención;
las figuras 4 y 5 son diagramas de bloque de las configuraciones de canales utilizadas para el procedimiento de mapeado de fuentes (en inglés, ''source mapping process") según una forma de realización de la presente invención;
las figuras 6 y 7 son diagramas de bloque detallados de una unidad de renderización (en inglés, "rendering") para una señal de reducción de mezcla estéreo según una forma de realización de la presente invención;
la figuras 8 y la figura 9 son diagramas de bloques detallados de una unidad de renderización para una señal de reducción de mezcla mono según una forma de realización de la presente invención;
las figuras 1 y 11 son diagramas de bloque de una unidad de suavizado y una unidad de expansión según una forma de realización de la presente invención;
la figura 12 es un gráfico para describir un primer procedimiento de suavizado según una forma de realización de la presente invención;
la figura 13 es un gráfico para describir un segundo procedimiento de suavizado según una forma de realización de la presente invención;
la figura 14 es un gráfico para describir un tercer procedimiento de suavizado según una forma de realización de la presente invención;
la figura 15 es un gráfico para describir un cuarto procedimiento de suavizado según una forma de realización de la presente invención;
la figura 16 es un gráfico para describir un quinto procedimiento de suavizado según una forma de realización de la presente invención;
la figura 17 es un diagrama para describir la información de filtro prototipo correspondiente a cada canal;
la figura 18 es un diagrama de bloques para un primer procedimiento de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención;
la figura 19 es un diagrama de bloques para un segundo procedimiento de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención;
la figura 2 es un diagrama de bloques para un tercer procedimiento de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención;
la figura 21 es un diagrama para describir un procedimiento de generación de una señal de sonido envolvente en una unidad de renderización según una forma de realización de la presente invención;
la figura 22 es un diagrama para un primer procedimiento de interpolación según una forma de realización de la presente invención;
la figura 23 es un diagrama para un segundo procedimiento de interpolación según una forma de realización de la presente invención;
la figura 24 es un diagrama para un procedimiento de conmutación de bloques según una forma de realización de la presente invención;
la figura 25 es un diagrama de bloques para una posición a la cual se aplica una longitud de ventana elegida por una unidad de elección de longitud de ventana según una forma de realización de la presente invención;
la figura 26 es un diagrama para unos filtros de diversas longitudes utilizados en el procesamiento de una señal de audio según una forma de realización de la presente invención;
La figura 27 es un diagrama para un procedimiento de procesamiento dividido de una señal de audio mediante una pluralidad de subfiltros según una forma de realización de la presente invención;
la figura 28 es un diagrama de bloques para un procedimiento de renderización de información de renderización de partición generada... [Seguir leyendo]
Reivindicaciones:
1. Procedimiento de procesamiento de una señal de audio, que comprende las etapas siguientes: extraer información espacial a partir de un tren de bits;
generar información de mapeado de fuentes mediante la información espacial para fuentes múltiples;
generar por lo menos una información de renderización mediante la información de mapeado de fuentes e información de filtro para un efecto de sonido envolvente;
interpolar dicha por lo menos una información de renderización mediante información de renderización adyacente a dicha por lo menos una información de renderización y
generar una señal de sonido envolvente que presenta el efecto de sonido envolvente aplicando dicha por lo menos una información de renderización interpolada a una señal de reducción de mezcla, siendo generada la señal de reducción de mezcla mediante la reducción de mezcla de las fuentes múltiples, en el que
la señal de reducción de mezcla Incluye un canal de entrada Izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada Incluye un canal de salida izquierdo y un canal de salida derecho, y
la Información de renderización comprende una primera información de renderización y una segunda información de renderización, en el que la primera Información de renderización es para generar el canal de salida izquierdo mediante su aplicación al canal de entrada izquierdo o para generar el canal de salida derecho mediante su aplicación al canal de entrada derecho, y la segunda información de renderización es para generar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o para generar el canal de salida izquierdo mediante su aplicación al canal de entrada derecho.
2. Procedimiento según la reivindicación 1, en el que la interpolación se realiza en uno de entre un dominio del tiempo, un dominio de la frecuencia y un dominio de QMF.
3. Procedimiento según la reivindicación 1 o 2, en el que la interpolación se realiza linealmente entre la información de renderización adyacente.
4. Procedimiento según cualquiera de las reivindicaciones 1 a 3, en el que la interpolación se realiza mediante por lo menos uno de entre un valor previo en unas posiciones específicas en las que se encuentra dicha por lo menos una información de renderización, un valor por defecto y una combinación del valor anterior y el valor por defecto.
5. Procedimiento según las reivindicaciones 1 a 4, que comprende además la expansión de dicha por lo menos una información de renderización desde una primera banda de frecuencias en la que se genera dicha por lo menos una información de renderización hasta una segunda banda de frecuencias.
6. Procedimiento según cualquiera de las reivindicaciones 1 a 5, en el que la información del filtro incluye por lo menos una información de filtro HRTF o un valor decidido en función de una selección del usuario.
7. Aparato para procesar una señal de audio, que comprende:
una unidad de decodificación de información espacial (8) que extrae información espacial de un tren de bits;
una unidad de mapeado de fuentes (11) que genera un mapeado de fuentes mediante la información espacial para fuentes múltiples;
una unidad de integración (13) que genera por lo menos una información de renderización mediante la información de mapeado de fuentes e información de filtro para un efecto de sonido envolvente;
una unidad de interpolación (141) que interpola dicha por lo menos una información de renderización mediante información de renderización adyacente a dicha por lo menos una información de renderización; y
una unidad de renderización (9) que genera una señal de sonido envolvente que presenta un efecto de sonido envolvente aplicando dicha por lo menos una información de renderización interpolada a una señal de reducción de mezcla generada mediante la reducción de mezcla de las fuentes múltiples, en el que
la señal de reducción de mezcla incluye un canal de entrada izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada incluye un canal de salida izquierdo y un canal de salida derecho, y
la información de renderización comprende una primera información de renderización y una segunda información
de renderización, en el que la primera información de renderización es para generar el canal de salida Izquierdo mediante su aplicación al canal de entrada Izquierdo o para generar el canal de salida derecho mediante su aplicación al canal de entrada derecho, y la segunda Información de renderización es para generar el canal de salida derecho mediante su aplicación al canal de entrada Izquierdo o para generar el canal de salida izquierdo mediante su aplicación al canal de entrada derecho.
8. Aparato según la reivindicación 7, en el que la unidad de interpolación interpola dicha por lo menos una información de renderización en uno de entre un dominio del tiempo, un dominio de la frecuencia y un dominio QMF.
9. Aparato según la reivindicación 7 u 8, en el que la unidad de interpolación interpola linealmente entre la información de renderización adyacente.
1. Aparato según cualquiera de las reivindicaciones 7 a 9, en el que la unidad de interpolación interpola mediante por lo menos uno de entre un valor anterior en unas posiciones específicas, en las que se encuentra la por lo menos una información de renderización, un valor por defecto y una combinación del valor anterior y el valor por defecto.
11. Aparato según cualquiera de las reivindicaciones 7 a 1, en el que la unidad de interpolación expande dicha por lo menos una información de renderización desde una primera banda de frecuencias, en la que se genera dicha por lo menos una información de renderización hasta una segunda banda de frecuencias.
12. Aparato según la reivindicación 11, en el que la unidad de interpolación realiza la expansión mediante un mismo valor que la información de renderización en la primera banda de frecuencias.
13. Aparato según cualquiera de las reivindicaciones 7 a 12, en el que la información del filtro comprende por lo menos una de entre una información de filtro HRTF y un valor decidido en función de una selección del usuario.
Patentes similares o relacionadas:
Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]
Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]
Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]
Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]