Dispositivo y procedimiento para determinar un valor estimado.

Dispositivo para determinar un valor estimado (pe) de una necesidad de unidades de información para codificar una señal,

que presenta información de audio o de vídeo, presentando la señal varias bandas de frecuencia, con las siguientes características:

un medio (102) para proporcionar una medida (nb(b)) de una interferencia permitida para una banda de frecuencia (b) de la señal, comprendiendo la banda de frecuencia (b) al menos dos valores espectrales de una representación espectral de la señal, y una medida (e(b)) de una energía de la señal en la banda de frecuencia;

un medio (106) para calcular una medida (nl(b)) de una distribución de la energía (e(b)) en la banda de frecuencia (b), difiriendo la distribución de la energía en la banda de frecuencia de una distribución completamente uniforme, estando configurado el medio (106) para calcular la medida (nl(b)) de la distribución de la energía (e(b)), para determinar como medida de la distribución de la energía un valor estimado de un número de valores espectrales, cuyas magnitudes son mayores o iguales que un umbral de magnitud predeterminado, o cuyas magnitudes son menores o iguales que el umbral de magnitud, siendo el umbral de magnitud una etapa de cuantificación exacta o estimada, que en un cuantificador (1014) conduce a que los valores menores o iguales a la etapa de cuantificación se cuantifiquen como cero; y

un medio (104) para calcular el valor estimado (pe) usando la medida (nb(b)) de la interferencia permitida, la medida (e(b)) de la energía y la medida (nl(b)) de la distribución de la energía, estando configurado el medio (104) para calcular el valor estimado, para calcular el valor estimado usando la siguiente expresión:

donde pe es el valor estimado, donde nl(b) representa la medida de la distribución de la energía en la banda b, donde e(b) es una energía de la señal en la banda b, donde nb(b) es la interferencia permitida en la banda b, y donde s es un término aditivo.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2005/001651.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: SCHUG, MICHAEL, HILPERT, JOHANNES, GEYERSBERGER,STEFAN, NEUENDORF,Max.

Fecha de Publicación: 20 de Marzo de 2012.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
G10L19/02 G10L […] › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
H04B1/66 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04B TRANSMISION. › H04B 1/00 Detalles de los sistemas de transmision, no cubiertos por uno de los grupos H04B 3/00 - H04B 13/00; Detalles de los sistemas de transmisión no caracterizados por el medio utilizado para la transmisión. › para reducir el ancho de banda de las señales; para mejorar la eficacia de la transmisión (H04B 1/68 tiene prioridad).
H04N7/26

PDF original: ES-2376887_T3.pdf

Fragmento de la descripción:

Dispositivo y procedimiento para determinar un valor estimado La presente invención se refiere a codificadores para codificar una señal, que comprende información de audio y/o de vídeo, y en particular a la estimación de una necesidad de unidades de información para codificar esta señal.

A continuación se explica el codificador conocido. En una entrada 1000 se alimenta una señal de audio que debecodificarse. Ésta se suministra en primer lugar a una etapa de ajuste a escala 1002, en la que se realiza un denominado control de amplificación AAC, para establecer el nivel de la señal de audio. La información secundaria del ajuste a escala se suministra a un formateador 1004 de flujo de bits, tal como se representa mediante la flecha entre el bloque 1002 y el bloque 1004. La señal de audio ajustada a escala se suministra después de esto a un banco 1006 de filtros MDCT. En el codificador AAC, el banco de filtros implementa una transformación de coseno discreta modificada con un 50% de ventanas solapadas, determinándose la longitud de ventana mediante un bloque 1008.

Hablando en general, el bloque 1008 existe para que se aplique la función ventana a señales transitorias con ventanas más cortas, y que se aplique la función ventana a señales más bien estacionarias con ventanas más largas. Esto sirve para que, debido a las ventanas más cortas, se consiga para las señales transitorias una mayor resolución temporal (a costa de la resolución de frecuencia) , mientras que para señales más bien estacionarias se consiga una mayor resolución de frecuencia (a costa de la resolución temporal) por ventanas más largas, prefiriéndose según la tendencia ventanas más largas, dado que prometen una mayor ganancia de codificación. En la salida del banco 1006 de filtros se encuentran bloques sucesivos, considerado desde el punto de vista temporal, de valores espectrales, que según la forma de realización del banco de filtros pueden ser coeficientes MDCT, coeficientes de Fourier o también señales de subbanda, teniendo cada señal de subbanda un determino ancho de banda limitado, que se establece mediante el canal de subbandas correspondiente en el banco 1006 de filtros, y presentando cada señal de subbanda un determinado número de valores de muestreo de subbandas.

A continuación se explica a modo de ejemplo el caso, en el que el banco de filtros emite bloques sucesivos, considerado desde el punto de vista temporal, de coeficientes espectrales MDCT, que hablando en general, representan espectros de corta duración sucesivos de la señal de audio que debe codificarse en la entrada 1000. Un bloque de valores espectrales MDCT se alimenta entonces a un bloque 1010 de procesamiento TNS, en el que tiene lugar una conformación de ruido temporal (TNS = temporal noise shaping) . La técnica TNS se usa para conformar la forma temporal del ruido de cuantificación dentro de cada ventana de la transformación. Esto se consigue aplicando un proceso de filtrado a partes de los datos espectrales de cada canal. La codificación se realiza por ventanas. En particular se ejecutan las siguientes etapas, para aplicar la herramienta de TNS a una ventana de datos espectrales, es decir a un bloque de valores espectrales.

En primer lugar se selecciona un intervalo de frecuencia para la herramienta de TNS. Una selección adecuada consiste en cubrir un intervalo de frecuencia de desde 1, 5 kHz hasta la máxima banda de factor de escala posible con un filtro. Se indica que este intervalo de frecuencia depende de la tasa de muestreo, tal como se especifica en la norma MPEG4 (norma ISO/IEC 19496-3: 2001 (E) ) sección 4. 6. 9.

A continuación se realiza un cálculo LPC (LPC = linear predictive coding = codificación predictiva lineal) , y concretamente con los coeficientes MDCT espectrales, que se encuentran en el intervalo de frecuencia objetivo seleccionado. Para una estabilidad aumentada se excluyen de este proceso los coeficientes que corresponden a frecuencias inferiores a 2, 5 kHz. Los procedimientos LPC habituales, tal como se conocen del procesamiento de voz, pueden usarse para el cálculo LPC, por ejemplo, el algoritmo de Levinson-Durbin conocido. El cálculo se realiza para el orden máximo admisible del filtro de conformación de ruido.

Como resultado del cálculo LPC se obtiene la ganancia de predicción PG esperada. Además se obtienen los coeficientes de reflexión o coeficientes Parcor.

Cuando la ganancia de predicción no supera un determinado umbral, no se aplica la herramienta de TNS. En este caso se escribe una información de control en el flujo de bits, para que un decodificador sepa que no se ha realizado ningún procesamiento TNS.

Sin embargo, cuando la ganancia de predicción supera un umbral, se aplica el procesamiento TNS.

En una etapa siguiente se cuantifican los coeficientes de reflexión. El orden del filtro de conformación de ruido usado se determina mediante la eliminación de todos los coeficientes de reflexión con un valor absoluto inferior a un umbral de la “cola” de la serie de coeficientes de reflexión. El número de los coeficientes de reflexión restantes se encuentra en el orden de magnitud del filtro de conformación de ruido. Un umbral adecuado se encuentra a 0, 1.

Los coeficientes de reflexión restantes se transforman normalmente en coeficientes de predicción lineales, conociéndose esta técnica también como procedimiento “Step-Up”.

Los coeficientes LPC calculados se usan entonces como coeficientes de filtro de conformación de ruido del codificador, es decir como coeficientes de filtro de predicción. Este filtro FIR se hace pasar por el intervalo de frecuencia objetivo especificado. Durante la decodificación se usa un filtro autorregresivo, mientras que durante la codificación se usa un denominado filtro de media móvil. Finalmente se suministra además la información secundaria para la herramienta de TNS al formateador de flujo de bits, tal como se representa mediante la flecha, que se muestra entre el bloque 1010 de procesamiento TNS y el formateador 1004 de flujo de bits en la figura 3.

Después de esto se ejecutan varias herramientas opcionales no mostradas en la figura 3, tales como, por ejemplo, una herramienta de predicción a largo plazo, una herramienta de intensidad/acoplamiento, una herramienta de predicción, una herramienta de sustitución de ruido, hasta que finalmente se llega a un codificador 1012 central/lateral. El codificador 1012 central/lateral está activo cuando la señal de audio que debe codificarse es una señal multicanal, es decir una señal estéreo con un canal izquierdo y un canal derecho. Hasta ahora, es decir en el sentido de procesamiento antes del bloque 1012 en la figura 3 se procesaron el canal estéreo izquierdo y el derecho independientemente entre sí, es decir se ajustaron a escala, se transformaron mediante el banco de filtros, se sometieron al procesamiento TNS o no, etc.

En el codificador central/lateral se comprueba entonces en primer lugar, si tiene sentido una codificación central/lateral, es decir si en realidad proporciona una ganancia de codificación. Una codificación central/lateral proporcionará entonces una ganancia de codificación, cuando el canal izquierdo y el derecho son más bien similares, dado que entonces el canal central, es decir la suma del canal izquierdo y del derecho es prácticamente igual al canal izquierdo o al derecho, independientemente del ajuste a escala mediante el factor 1/2, mientras que el canal lateral sólo tiene valores muy pequeños, dado que es igual a la diferencia entre el canal izquierdo y el derecho. Con esto puede verse que entonces, cuando el canal izquierdo y el derecho son prácticamente iguales, la diferencia es prácticamente cero o comprende sólo valores muy pequeños, que se espera que se cuantifiquen como cero en un cuantificador 1014 posterior y por consiguiente puedan transmitirse de manera muy eficaz, dado que al cuantificador 1014 le sigue un codificador 1016 de entropía.

Al cuantificador 1014 se le suministra desde un modelo 1020 psicoacústico una interferencia permitida por banda de factor de escala. El cuantificador funciona de manera iterativa, es decir se llama en primer lugar a un bucle iterativo externo, que entonces llama a un bucle iterativo interno. Hablando en general, se realiza en primer lugar, partiendo de valores iniciales de anchos de etapa de cuantificación, una cuantificación de un bloque de valores en la entrada del cuantificador 1014. En particular, el bucle interno cuantifica los coeficientes MDCT, utilizándose un determinado número de bits. El bucle... [Seguir leyendo]

Reivindicaciones:

1. Dispositivo para determinar un valor estimado (pe) de una necesidad de unidades de información para codificar una señal, que presenta información de audio o de vídeo, presentando la señal varias bandas de frecuencia, con las siguientes características:

un medio (102) para proporcionar una medida (nb (b) ) de una interferencia permitida para una banda de frecuencia (b) de la señal, comprendiendo la banda de frecuencia (b) al menos dos valores espectrales de una representación espectral de la señal, y una medida (e (b) ) de una energía de la señal en la banda de frecuencia;

un medio (106) para calcular una medida (nl (b) ) de una distribución de la energía (e (b) ) en la banda de frecuencia (b) , difiriendo la distribución de la energía en la banda de frecuencia de una distribución completamente uniforme, estando configurado el medio (106) para calcular la medida (nl (b) ) de la distribución de la energía (e (b) ) , para determinar como medida de la distribución de la energía un valor estimado de un número de valores espectrales, cuyas magnitudes son mayores o iguales que un umbral de magnitud predeterminado, o cuyas magnitudes son menores o iguales que el umbral de magnitud, siendo el umbral de magnitud una etapa de cuantificación exacta o estimada, que en un cuantificador (1014) conduce a que los valores menores o iguales a la etapa de cuantificación se cuantifiquen como cero; y un medio (104) para calcular el valor estimado (pe) usando la medida (nb (b) ) de la interferencia permitida, la medida (e (b) ) de la energía y la medida (nl (b) ) de la distribución de la energía, estando configurado el medio (104) para calcular el valor estimado, para calcular el valor estimado usando la siguiente expresión:

2. Dispositivo según la reivindicación 1, en el que el medio (106) de cálculo está configurado para tener en cuenta para el cálculo de la medida de la distribución de la energía magnitudes de valores espectrales en la banda de frecuencia.

3. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (106) de cálculo está configurado para calcular un factor de forma según la siguiente ecuación:

donde X (k) es un valor espectral a un índice de frecuencia k, donde kOffset es un primer valor espectral en una banda b, y donde ffac (b) es el factor de forma.

4. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (106) de cálculo está configurado para tener en cuenta una raíz a la cuarta de una relación entre la energía en la banda de frecuencia y un ancho de la banda de frecuencia o el número de valores espectrales dentro de la banda de frecuencia.

5. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (106) de cálculo está configurado para calcular la medida de la distribución de la energía según las siguientes ecuaciones:

donde X (k) es un valor espectral a un índice de frecuencia k, donde kOffset es un primer valor espectral en una banda b, donde ffac (b) es un factor de forma, donde nl (b) representa la medida de la distribución de la energía en la banda b, donde e (b) es una energía de señal en la banda b, y donde width (b) es un ancho de la banda.

6. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (104) para calcular el valor estimado está configurado para utilizar un cociente de la energía en la banda de frecuencia y la interferencia en la banda de frecuencia.

7. Dispositivo según una de las reivindicaciones anteriores, en el que s es igual a 1, 5.

8. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (104) para calcular el valor estimado está configurado para calcular el valor estimado según la siguiente ecuación:

donde se cumple que:

y donde se cumple que:

donde pe es el valor estimado, donde nl (b) representa la medida de la distribución de la energía en la banda b, donde e (b) es una energía de la señal en la banda b, donde nb (b) es la interferencia permitida en la banda b, donde s es un término aditivo, que es preferiblemente igual a 1, 5, donde X (k) es un valor espectral a un índice de frecuencia k, donde kOffset es un primer valor espectral en una banda b, donde ffac (b) es un factor de forma, y donde width (b) es un ancho de la banda.

9. Dispositivo según una de las reivindicaciones anteriores, en el que la señal se facilita como representación espectral con valores espectrales.

10. Procedimiento para determinar un valor estimado de una necesidad de unidades de información para codificar una señal, que presenta información de audio o de vídeo, presentando la señal varias bandas de frecuencia, con las siguientes etapas:

proporcionar (102) una medida (nb (b) ) de una interferencia permitida para una banda de frecuencia (b) de la señal, comprendiendo la banda de frecuencia al menos dos valores espectrales de una representación espectral de la señal, y una medida (e (b) ) de una energía de la señal en la banda de frecuencia (b) ;

calcular (106) una medida (nl (b) ) de una distribución de la energía en la banda de frecuencia (b) , difiriendo la distribución de la energía en la banda de frecuencia de una distribución completamente uniforme, determinándose como medida (nl (b) ) de la distribución de la energía un valor estimado de un número de valores espectrales, cuyas magnitudes son mayores o iguales que un umbral de magnitud predeterminado, o cuyas magnitudes son menores o iguales que el umbral de magnitud, siendo el umbral de magnitud una etapa de cuantificación exacta o estimada, que en un cuantificador (1014) conduce a que los valores menores o iguales a la etapa de cuantificación se cuantifiquen como cero; y calcular (104) el valor estimado (pe) usando la medida (nb (b) ) de la interferencia permitida, la medida (e (b) ) de la energía y la medida (nl (b) ) de la distribución de la energía usando la siguiente expresión:

11. Programa informático con un código de programa para realizar el procedimiento para determinar un valor estimado de una necesidad de unidades de información para codificar una señal según la reivindicación 10, cuando el programa se ejecuta en un ordenador.

Patentes similares o relacionadas:

Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]

Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]

Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]

Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]

Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]