PROCEDIMIENTO DE CODIFICACION MULTIPLE OPTIMIZADO.

Procedimiento de codificación múltiple en compresión, en el que una señal de entrada está destinada a alimentar en paralelo al menos un primer codificador y un segundo codificador,

comprendiendo cada uno de los codificadores primero y segundo una sucesión de bloques funcionales, con vistas a una codificación en compresión de dicha señal de entrada por cada uno de los codificadores primero y segundo, operando al menos una parte de dichos bloques funcionales cálculos para suministrar parámetros respectivos que sirven para la codificación de dicha señal de entrada por cada codificador, comprendiendo los codificadores primero y segundo respectivamente al menos un primer y un segundo bloque funcional dispuestos para realizar operaciones comunes, caracterizado porque:

- se opera, en una misma etapa y en un único bloque, cálculos para suministrar un mismo juego de parámetros al primer bloque y al segundo bloque, y

- en el caso en el que el primer y/o el segundo codificador funcione a una velocidad diferente de dicho único bloque, se adapta dicho juego de parámetros a la velocidad del primer y/o segundo codificador para utilizarse por el primer y/o segundo bloque, respectivamente

Tipo: Resumen de patente/invención. Número de Solicitud: W04003009FR.

Solicitante: FRANCE TELECOM.

Nacionalidad solicitante: Francia.

Dirección: 6 PLACE D'ALLERAY,75015 PARIS.

Inventor/es: BENJELLOUN TOUIMI, ABDELLATIF, LAMBLIN,CLAUDE, VIRETTE,DAVID.

Fecha de Publicación: .

Fecha Concesión Europea: 9 de Septiembre de 2009.

Clasificación Internacional de Patentes:

  • G10L19/00B
  • G10L19/02T
  • G10L19/12 SECCION G — FISICA.G10 INSTRUMENTOS DE MUSICA; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACION O DESCODIFICACION DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Determinación o codificación de una excitación de código, p.ej. en codificadores vocales de predicción lineal excitados por código [CELP].
  • G10L19/14A1

Clasificación PCT:

  • G01L19/02 G […] › G01 METROLOGIA; ENSAYOS.G01L MEDIDA DE FUERZAS, TENSIONES, PARES, TRABAJO, POTENCIA MECANICA, RENDIMIENTO MECANICO O DE LA PRESION DE LOS FLUIDOS (pesado G01G). › G01L 19/00 Detalles o accesorios de aparatos para la medida de la presión permanente o cuasi-permanente de un medio fluyente en la medida en que estos detalles o accesorios no son especiales de los tipos particulares de manómetros. › Dispositivos para impedir o para compensar los efectos de inclinaciones o de la aceleración del dispositivo de medida; Medios de puesta a cero (para los barómetros aneroides G01L 7/14).
  • G10L19/00 G10L […] › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • G10L19/12 G10L 19/00 […] › Determinación o codificación de una excitación de código, p.ej. en codificadores vocales de predicción lineal excitados por código [CELP].
  • G10L19/14

Clasificación antigua:

  • G01L19/02 G01L 19/00 […] › Dispositivos para impedir o para compensar los efectos de inclinaciones o de la aceleración del dispositivo de medida; Medios de puesta a cero (para los barómetros aneroides G01L 7/14).
  • G10L19/00 G10L […] › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • G10L19/12 G10L 19/00 […] › Determinación o codificación de una excitación de código, p.ej. en codificadores vocales de predicción lineal excitados por código [CELP].
  • G10L19/14

Fragmento de la descripción:

Procedimiento de codificación múltiple optimizado.

La presente invención se refiere a la codificación/decodificación de señales digitales, en aplicaciones de transmisión o de almacenamiento de señales multimedia tales como las señales de audio (habla y/o sonidos) o vídeo.

Para ofrecer movilidad y continuidad, los servicios de comunicación multimedia modernos e innovadores deben poder funcionar en una gran variedad de condiciones. El dinamismo del sector de la comunicación multimedia, la heterogeneidad de las redes, del acceso y de los terminales han generado una proliferación de formatos de compresión.

La presente invención se inscribe en el contexto de una optimización de las técnicas de "codificación múltiple", puestas en práctica cuando una señal digital, o una parte de esta señal, se codifica según diversas técnicas de codificación. Esta codificación múltiple puede efectuarse de manera simultánea (en una sola pasada) o no. Los tratamientos pueden realizarse sobre la misma señal, o eventualmente sobre versiones derivadas de la misma señal (por ejemplo, según anchos de banda diferentes). Se distingue por tanto la "codificación múltiple" de las "transcodificaciones", en las que cada codificador realiza la compresión de una versión procedente de la decodificación de la señal comprimida por el codificador anterior.

La codificación múltiple se presenta por ejemplo en el caso de un mismo contenido que está codificado según varios formatos y se transmite a continuación a terminales que no soportan los mismos formatos de codificación. Si se trata de una difusión en tiempo real, el tratamiento deberá realizarse de manera simultánea. Si se trata de un acceso a una base de datos, las codificaciones podrán realizarse una tras otra, en diferido. En estos ejemplos, la codificación múltiple permite codificar una misma señal según formatos diferentes utilizando varios codificadores (o eventualmente varias velocidades o varios modos de un mismo codificador), funcionando cada codificador de manera independiente con respecto a los demás codificadores.

Otro uso de codificación múltiple se encuentra en estructuras de codificación en las que varios codificadores se encuentran en competición para codificar un segmento de señal, seleccionándose finalmente un único codificador para la codificación de este segmento. La elección del codificador seleccionado puede realizarse como resultado de un tratamiento de este segmento, o incluso con posterioridad (por decisión retardada). En lo sucesivo, se designará como "codificación multimodo" este tipo de estructura (en referencia a la selección de un "modo" de codificación). En estas estructuras multimodo, se hace que varios codificadores que comparten una "pasada común" codifiquen la misma parte de señal. Las técnicas de codificación utilizadas pueden ser diferentes, o proceder de una única estructura de codificación. No obstante, no serán totalmente independientes salvo que se trate de técnicas "sin memoria". En efecto, en el caso (actual) de técnicas de codificación que ponen en práctica tratamientos recursivos, el tratamiento de un segmento dado de señal depende de la manera en la que se codificó esta señal en el pasado. Por tanto hay una cierta dependencia entre los codificadores, puesto que un codificador deberá tener en cuenta en sus memorias la salida de otro codificador.

En estos diferentes contextos se ha introducido la noción de "codificación múltiple" así como las condiciones de uso de tales técnicas. No obstante, la complejidad de puesta en práctica puede resultar insalvable.

Por ejemplo, en el caso de los servidores de contenidos que difunden un mismo contenido en varios formatos adaptados a las condiciones de acceso, de redes y terminales de diferentes clientes, esta operación se vuelve extremadamente compleja a medida que aumenta el número de formatos deseado. Si se trata de una difusión en tiempo real, se está limitado rápidamente por los recursos del sistema suponiendo que los diferentes formatos están codificados en paralelo.

El segundo caso de uso mencionado se refiere a las aplicaciones de codificación multimodo, que permiten la selección de un codificador de entre un conjunto para cada parte de señal analizada. La selección requiere la definición de un criterio, pretendiendo los más habituales la optimización del equilibrio velocidad-distorsión. Al analizarse la señal en segmentos temporales sucesivos, en cada segmento se evalúan varias codificaciones. Se selecciona a continuación la codificación de velocidad más baja para una calidad dada, o la de la mejor calidad para una velocidad dada. Se observará que pueden utilizarse otras restricciones aparte de la de velocidad/distorsión.

En general, en tales estructuras, la selección de la codificación se realiza "a priori" mediante un análisis de la señal en el segmento considerado (la selección según las características de la señal). No obstante, la dificultad de producir una clasificación robusta de la señal para esta selección ha llevado a proponer una selección "a posteriori" del modo óptimo después de la codificación del conjunto de los modos, a costa sin embargo de una gran complejidad.

Se han propuesto métodos intermedios que combinan los dos planteamientos para aliviar el coste de cálculo. No obstante, estas estrategias no son óptimas y resultan menos eficaces que la exploración de todos los modos. La exploración de todos los modos o de una gran parte de los modos constituye una aplicación de codificación múltiple que presenta una complejidad potencialmente alta, difícilmente compatible a priori con la codificación en tiempo real, por ejemplo.

Actualmente, la mayor parte de las operaciones de codificación múltiple y de transcodificación no tienen en cuenta las interacciones entre los formatos y entre el formato y su contenido. Se han propuesto algunas técnicas de codificación multimodo, pero la decisión del modo utilizado se hace generalmente a priori o bien sobre la señal (mediante clasificación, como por ejemplo el codificador SMV por "Selectable Modo Vocoder", vocoder de modo seleccionable), o bien en función de las condiciones de la red (por ejemplo, en los codificadores AMR por "Adaptive Multi-Rate", tasa múltiple adaptativa).

En los documentos:

"An overview of variable rate speech coding for cellular networks", Gersho, A.; Paksoy, E.; Wireless Communications, 1992. Conference Proceedings, 1992 IEEE International Conference on Selected Topics, 25-26 de junio de 1992, página(s): 172-175,

"A variable rate speech coding algorithm for cellular networks", Paksoy, E.; Gersho, A.; Speech Coding for Telecommunications, 1993. Proceedings, IEEE Workshop 1993, página(s): 109-110,

"Variable rate speech coding for multiple access wireless networks", Paksoy E.; Gersho A.; Electrotechnical Conference, 1994, Proceedings, 7th Mediterranean, 12-14 de abril de 1994, página(s): 47-50 vol.1,

se presentan varios modos de selección, en particular una decisión controlada por la fuente y una decisión controlada por la red.

En el caso de una decisión controlada por la fuente, la decisión a priori se realiza a partir de una clasificación de la señal de entrada. Existen por tanto numerosos métodos de clasificación de la señal.

En el caso de una decisión controlada por la red, es más sencillo realizar un codificador multimodo cuya velocidad se selecciona mediante un módulo externo en vez de por la fuente. El método más sencillo consiste en elaborar una familia de codificadores cada uno a velocidad fija, pero cuyas velocidades son diferentes entre codificadores y conmutar entre estas diferentes velocidades para obtener un modo actual deseado.

También se han presentado algunos trabajos sobre la posibilidad de combinar varios criterios para seleccionar a priori el modo que debe utilizarse, especialmente en los documentos:

"Variable-rate for the basic speech service in UMTS", Berruto, E.; Sereno, D.; Vehicular Technology Conference, 1993 IEEE 43rd, 18-20 de mayo de 1993, página(s): 520-523,

"A VR-CELP codec implementation for CDMA mobile communications", Cellario, L.; Sereno, D.; Giani, M.; Blocher, P.; Hellwig, K.; Acoustics, Speech, and Signal Processing, 1994, ICASSP-94, 1994 IEEE International Conference, Volumen: 1, 19-22...

 


Reivindicaciones:

1. Procedimiento de codificación múltiple en compresión, en el que una señal de entrada está destinada a alimentar en paralelo al menos un primer codificador y un segundo codificador, comprendiendo cada uno de los codificadores primero y segundo una sucesión de bloques funcionales, con vistas a una codificación en compresión de dicha señal de entrada por cada uno de los codificadores primero y segundo,

operando al menos una parte de dichos bloques funcionales cálculos para suministrar parámetros respectivos que sirven para la codificación de dicha señal de entrada por cada codificador,

comprendiendo los codificadores primero y segundo respectivamente al menos un primer y un segundo bloque funcional dispuestos para realizar operaciones comunes, caracterizado porque:

    - se opera, en una misma etapa y en un único bloque, cálculos para suministrar un mismo juego de parámetros al primer bloque y al segundo bloque, y
    - en el caso en el que el primer y/o el segundo codificador funcione a una velocidad diferente de dicho único bloque, se adapta dicho juego de parámetros a la velocidad del primer y/o segundo codificador para utilizarse por el primer y/o segundo bloque, respectivamente.

2. Procedimiento según la reivindicación 1, caracterizado porque dicho un único bloque está constituido por uno o varios bloques de uno de los codificadores primero y segundo.

3. Procedimiento según la reivindicación 1, caracterizado porque comprende las etapas de preparación siguientes:

    a) identificar los bloques funcionales que forman cada codificador, así como una o varias funciones realizadas por cada bloque,
    b) localizar, entre dichas funciones, funciones que son comunes de un codificador al otro, y
    c) ejecutar dichas funciones comunes, de una vez, para una parte al menos de todos los codificadores, en al menos un mismo módulo de cálculo.

4. Procedimiento según la reivindicación 3, caracterizado porque, para cada función ejecutada en la etapa c), se utiliza al menos un bloque funcional de un codificador seleccionado de entre dicha pluralidad de codificadores, y porque el bloque de dicho codificador seleccionado está dispuesto para suministrar resultados parciales a los demás codificadores, para una codificación eficaz, en dichos otros codificadores, verificando un criterio óptimo entre la complejidad y la calidad de la codificación.

5. Procedimiento según la reivindicación 4, en el que los codificadores son susceptibles de operar a velocidades respectivas diferentes, caracterizado porque el codificador seleccionado es el codificador de velocidad más baja, y porque los resultados obtenidos, como resultado de la ejecución de la función en la etapa c) con parámetros propios del codificador seleccionado, se adaptan a las velocidades de una parte al menos de los demás codificadores mediante una búsqueda focalizada de parámetros para una parte al menos de todos los demás modos, hasta el codificador de velocidad más alta.

6. Procedimiento según la reivindicación 4, en el que los codificadores son susceptibles de operar a velocidades respectivas diferentes, caracterizado porque el codificador seleccionado es el codificador de velocidad más alta, y porque los resultados obtenidos, como resultado de la ejecución de la función en la etapa c) con parámetros propios del codificador seleccionado, se adaptan a las velocidades de una parte al menos de los demás codificadores mediante una búsqueda focalizada de parámetros para una parte al menos de todos los demás modos, hasta el codificador de velocidad más baja.

7. Procedimiento según la reivindicación 5, en combinación con la reivindicación 6, caracterizado porque, para una velocidad dada, se utiliza el bloque funcional de un codificador que opera con dicha velocidad dada, como módulo de cálculo, y se adapta progresivamente al menos una parte de los parámetros propios de este codificador:

    - hasta el codificador de velocidad más alta, mediante búsqueda focalizada, y
    - hasta el codificador de velocidad más baja, mediante búsqueda focalizada.

8. Procedimiento según la reivindicación 2, en el que los bloques funcionales de los diferentes codificadores están dispuestos en cuadrícula, con varios caminos posibles en la cuadrícula, caracterizado porque cada camino de la cuadrícula está definido por una combinación de modos de funcionamiento de los bloques funcionales, alimentando cada bloque funcional varias variantes posibles del bloque funcional siguiente.

9. Procedimiento según la reivindicación 8, caracterizado porque está previsto un módulo de selección parcial, después de cada etapa de codificación realizada por uno o varios bloques funcionales, que puede seleccionar los resultados proporcionados por uno o varios de estos bloques funcionales, para etapas siguientes de codificación.

10. Procedimiento según la reivindicación 8, en el que los bloques funcionales son susceptibles de operar a velocidades respectivas diferentes y utilizando parámetros respectivos propios de dichas velocidades, caracterizado porque, para un bloque funcional dado, el camino de la cuadrícula seleccionada es el que atraviesa el bloque funcional de velocidad más baja, y porque los resultados obtenidos de dicho bloque funcional de velocidad más baja se adaptan a las velocidades de una parte al menos de los demás bloques funcionales mediante una búsqueda focalizada de parámetros para una parte al menos de todos los demás bloques funcionales, hasta el bloque funcional de velocidad más alta.

11. Procedimiento según la reivindicación 8, en el que los bloques funcionales son susceptibles de operar a velocidades respectivas diferentes y utilizando parámetros respectivos propios de dichas velocidades, caracterizado porque, para un bloque funcional dado, el camino de la cuadrícula seleccionada es el que atraviesa el bloque funcional de velocidad más alta, y porque los resultados obtenidos de dicho bloque funcional de velocidad más alta se adaptan a las velocidades de una parte al menos de los demás bloques funcionales mediante una búsqueda focalizada de parámetros para una parte al menos de todos los demás bloques funcionales, hasta el bloque funcional de velocidad más baja.

12. Procedimiento según la reivindicación 10, en combinación con la reivindicación 11, caracterizado porque, para una velocidad dada asociada a los parámetros de un bloque funcional de un codificador, se utiliza el bloque funcional que opera a dicha velocidad dada, como módulo de cálculo, y se adapta progresivamente al menos una parte de los parámetros propios de este bloque funcional:

    - hasta el bloque funcional que puede operar a la velocidad más baja, mediante búsqueda focalizada, y
    - hasta el bloque funcional que puede operar a la velocidad más alta, mediante búsqueda focalizada.

13. Procedimiento según la reivindicación 3, caracterizado porque dicho módulo de cálculo es un módulo independiente de dichos codificadores, y dispuesto para redistribuir los resultados obtenidos en la etapa c) a todos los codificadores.

14. Procedimiento según la reivindicación 13, en combinación con la reivindicación 3, caracterizado porque el módulo independiente y el o los bloques de al menos uno de los codificadores están dispuestos para intercambiar mutuamente los resultados obtenidos en la etapa c), y porque el módulo de cálculo está dispuesto para realizar una transcodificación de adaptación entre bloques funcionales de codificadores diferentes.

15. Procedimiento según una de las reivindicaciones 13 y 14, caracterizado porque el módulo independiente comprende un bloque de codificación al menos parcial y un bloque de transcodificación de adaptación.

16. Procedimiento según una de las reivindicaciones anteriores, en el que los codificadores en paralelo están dispuestos para operar en codificación multimodo, caracterizado porque está previsto un módulo de selección a posteriori, que puede seleccionar un codificador de entre los codificadores.

17. Procedimiento según la reivindicación 16, caracterizado porque está previsto un módulo de selección parcial, después de cada etapa de codificación realizada por uno o varios bloques funcionales, independiente de los codificadores y que puede seleccionar uno o varios codificadores.

18. Procedimiento según una de las reivindicaciones anteriores, en el que los codificadores son de tipo por transformada, caracterizado porque el módulo de cálculo comprende un bloque de asignación de bits, compartido entre todos los codificadores, estando cada asignación de bits realizada para un codificador seguida de una adaptación a este codificador especialmente en función de su velocidad.

19. Procedimiento según la reivindicación 18, caracterizado porque el procedimiento comprende además una etapa de cuantificación, cuyos resultados se proporcionan a todos los codificadores.

20. Procedimiento según la reivindicación 19, caracterizado porque comprende además etapas comunes a todos los codificadores de entre:

    - una transformada tiempo-frecuencia (MDCT),
    - una detección de sonoridad en la señal de entrada,
    - una detección de tonalidad,
    - la determinación de una curva de enmascaramiento, y
    - una codificación de envolvente espectral.

21. Procedimiento según la reivindicación 18, en el que los codificadores realizan una codificación en subbanda (MPEG-1), caracterizado porque el procedimiento comprende además etapas comunes a todos los codificadores de entre:

    - la aplicación de un banco de filtros de análisis,
    - una determinación de factores de escala,
    - un cálculo de transformada espectral (FFT), y
    - la determinación de umbrales de enmascaramiento según un modelo psicoacústico.

22. Procedimiento según una de las reivindicaciones 1 a 17, en el que los codificadores son del tipo de análisis por síntesis (CELP), caracterizado porque el procedimiento comprende etapas comunes a todos los codificadores de entre al menos:

    - un pretratamiento,
    - el análisis de coeficientes de predicción lineal,
    - un cálculo de señal de entrada ponderada, y
    - una cuantificación para al menos una parte de los parámetros.

23. Procedimiento según la reivindicación 22, en combinación con la reivindicación 17, caracterizado porque el módulo de selección parcial se pone en práctica después de una etapa compartida de cuantificación vectorial para parámetros a corto plazo (LPC).

24. Procedimiento según la reivindicación 22, en combinación con la reivindicación 17, caracterizado porque el módulo de selección parcial se pone en práctica después de una etapa compartida de búsqueda de parámetro a largo plazo (LTP) en bucle abierto.

25. Producto de programa de ordenador destinado a almacenarse en una memoria de una unidad de tratamiento, especialmente de un ordenador o de un terminal móvil, o en un soporte de memoria amovible y destinado a actuar conjuntamente con un lector de la unidad de tratamiento, caracterizado porque comprende las instrucciones para la puesta en práctica del procedimiento de transcodificación según una de las reivindicaciones anteriores.

26. Dispositivo auxiliar para una codificación múltiple en compresión, codificación en la que una señal de entrada está destinada a alimentar en paralelo una pluralidad de codificadores que comprenden cada uno una sucesión de bloques funcionales, con vistas a una codificación en compresión de dicha señal por cada codificador, caracterizado porque comprende una memoria que almacena las instrucciones de un producto de programa de ordenador según la reivindicación 25.

27. Dispositivo según la reivindicación 26, caracterizado porque comprende además un módulo (MI) de cálculo independiente para la puesta en práctica del procedimiento según una de las reivindicaciones 13 a 17 y 23, 24.


 

Patentes similares o relacionadas:

Procedimiento y aparato para conmutar señales de voz o audio, del 9 de Enero de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de conmutación de señales de voz o audio, caracterizado por que comprende: cuando se produce una conmutación desde una señal de voz o audio de […]

Control dependiente de la armonicidad de una herramienta de filtro de armónicos, del 10 de Octubre de 2018, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para ejecutar un control dependiente de la armonicidad de una herramienta de filtro de armónicos de un códec de audio, que comprende: un estimador de tono […]

Libro de códigos de dominio de transformada en un codificador y decodificador CELP, del 28 de Marzo de 2018, de VOICEAGE CORPORATION: Un codificador de una señal (s(n)) de audio de entrada, que comprende: una etapa de libro de códigos adaptativo estructurada para buscar […]

Dispositivo de codificación de audio y dispositivo de decodificación de audio, del 26 de Julio de 2017, de III Holdings 12, LLC: Aparato de codificación de voz que comprende: una sección de análisis de LPC configurada para realizar un análisis predictivo lineal […]

Codificación y decodificación de posiciones de impulso de pistas de una señal de audio, del 19 de Julio de 2017, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato para decodificar una señal de audio codificada, donde una o más pistas se asocian con la señal de audio codificada, cada una de las pistas teniendo una pluralidad […]

Cuantificador vectorial, cuantificador inverso vectorial y procedimientos para los mismos, del 14 de Junio de 2017, de III Holdings 12, LLC: Un aparato de cuantificación vectorial que comprende: una primera sección de selección que selecciona un vector de código de clasificación […]

Procedimiento y dispositivo de conmutación de señales de audio, del 14 de Junio de 2017, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de conmutación del ancho de banda de señales de voz o audio, caracterizado por que comprende: cuando se produce una […]

Determinación de un presupuesto de codificación de una trama de transición LPD/FD, del 7 de Junio de 2017, de Orange: Procedimiento de determinación de una distribución de bits de codificación de una trama de transición , implementándose dicho procedimiento en un codificador/decodificador […]

Otras patentes de FRANCE TELECOM