CUANTIFICACION DE VECTORES CON UN UNICO LIBRO DE CODIGOS PARA APLICACIONES DE MULTIPLES TASAS DE TRANSMISION.

Un procedimiento de cuantificación de vectores representativos de datos de voz/audio,

comprendiendo dicho procedimiento:

- proporcionar un libro de códigos unificado que comprende M vectores de reproducción, donde M es un número máximo predefinido de niveles;

- recibir una selección de un nivel de cuantificación N de un conjunto de al menos dos valores predefinidos que son inferiores o iguales a M;

- seleccionar para un vector que va a cuantificarse un vector de reproducción de un libro de códigos de N niveles que comprende N vectores de reproducción, donde para cada posible selección de N a partir de dicho conjunto de al menos dos valores predefinidos, dichos N vectores de reproducción de dicho libro de códigos de N niveles se representan mediante los N primeros vectores de reproducción de dicho libro de códigos unificado

Tipo: Resumen de patente/invención. Número de Solicitud: W06052956IB.

Solicitante: NOKIA CORPORATION.

Nacionalidad solicitante: Finlandia.

Dirección: KEILALAHDENTIE 4,00045 ESPOO.

Inventor/es: VASILACHE,ADRIANA, RAMO,ANSSI.

Fecha de Publicación: .

Fecha Concesión Europea: 21 de Octubre de 2009.

Clasificación Internacional de Patentes:

  • G10L19/14A1R
  • H03M7/30V

Clasificación PCT:

  • G10L19/14
  • H03M7/30 ELECTRICIDAD.H03 CIRCUITOS ELECTRONICOS BASICOS.H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Compresión (análisis-síntesis de la voz para reducción de redundancia G10L 19/00; para transmisión de imágenes H04N ); Expansión; Supresión de datos innecesarios, p. ej. reducción de redundancia.
CUANTIFICACION DE VECTORES CON UN UNICO LIBRO DE CODIGOS PARA APLICACIONES DE MULTIPLES TASAS DE TRANSMISION.

Fragmento de la descripción:

Cuantificación de vectores con un único libro de códigos para aplicaciones de múltiples tasas de transmisión.

Campo de la invención

La presente invención se refiere a un procedimiento, un dispositivo y un producto de aplicación software para una cuantificación de N niveles de vectores, donde N puede seleccionarse antes de dicha cuantificación a partir de un conjunto de al menos dos valores predefinidos que son inferiores o iguales a un número máximo predefinido de niveles M. La invención se refiere además a un procedimiento, un dispositivo y un producto de programa informático para recuperar vectores de reproducción para vectores que se hayan cuantificado en N niveles, a un sistema para transferir representaciones de los vectores, y a un procedimiento, un dispositivo y un producto de aplicación de software para determinar un libro de códigos que se utilizará en una cuantificación de este tipo.

Antecedentes de la invención

Los algoritmos de codificación de voz y audio presentan una gran variedad de aplicaciones en sistemas de comunicaciones, multimedia y de almacenamiento. El desarrollo de tales algoritmos de codificación está impulsado por la necesidad de ahorrar capacidad de transmisión y de almacenamiento, manteniendo al mismo tiempo una alta calidad de la señal codificada. La complejidad del codificador está limitada por la potencia de procesamiento de la plataforma de la aplicación. En algunas aplicaciones, por ejemplo, el almacenamiento de voz, el codificador puede ser sumamente complejo, pero el descodificador debe ser lo más simple posible.

En un codificador de voz típico, una señal de voz de entrada se procesa en segmentos denominados tramas. Normalmente, la longitud de trama es de 10 a 30 ms, y un segmento de anticipación de 5 a 15 ms de la trama posterior también está disponible. La trama puede dividirse adicionalmente en una pluralidad de subtramas. Para cada trama, el codificador determina una representación paramétrica de la señal de entrada, por ejemplo mediante una codificación predictiva lineal (LPC). Los parámetros obtenidos se cuantifican y se transmiten a través de un canal de comunicaciones o se almacenan en un medio de almacenamiento en forma digital. En el extremo de recepción, el descodificador genera una señal sintetizada basándose en los parámetros recibidos.

En este caso, los coeficientes LPC (o las correspondientes frecuencias de espectro de líneas (LSF)) obtenidos mediante LPC se cuantifican normalmente en la actualidad con una cuantificación vectorial (VQ) almacenando los coeficientes LPC/LSF en un vector. De manera similar, los parámetros relacionados con la señal de excitación (por ejemplo, parámetros de ganancia, de tono o de sonoridad) de varias tramas o subtramas posteriores también pueden cuantificarse mediante VQ.

VQ es un procedimiento de compresión de datos con pérdidas basado en el principio de codificación por bloques. En una VQ de N niveles, los vectores se cuantifican seleccionando, a partir de un libro de códigos que contiene N vectores de reproducción (las denominadas palabras de código), los vectores de reproducción que provocan la distorsión más pequeña con respecto a los vectores (determinándose dicha distorsión mediante una medida de distorsión apropiada como, por ejemplo, la distancia euclídea o la distancia euclídea cuadrada, por nombras algunas). Estos vectores de reproducción seleccionados pueden identificarse de manera unívoca mediante identificadores respectivos. Si los vectores cuantificados van a transmitirse a través de un canal de transmisión y si el libro de códigos se conoce en el sitio de recepción, entonces puede ser suficiente intercambiar solamente los identificadores entre el cuantificador en el sitio de transmisión y una unidad en el sitio de recepción que va a recuperar el vector de reproducción seleccionado para un vector en el sitio de transmisión. Después, esta unidad simplemente recupera del libro de códigos los vectores de reproducción identificados por el identificador. Frecuentemente, N se elige como una potencia de 2 y, por lo tanto, palabras binarias con una longitud de palabra de n=log2(N) pueden utilizarse como identificadores para los vectores de reproducción. Por tanto, la longitud de palabra n es proporcional a la tasa de transmisión de bits de salida del cuantificador. Con una longitud de palabra n mayor, aumenta el número de niveles N = 2n y, por tanto, la resolución del cuantificador, pero también aumenta la tasa de transmisión de bits de salida del cuantificador.

La cuantificación de los parámetros requiere libros de códigos, los cuales contienen vectores de reproducción optimizados para la tarea de cuantificación. Anteriormente, el diseño de los libros de códigos para la VQ se consideraba como una tarea desafiante debido a la necesidad de una integración multidimensional. En 1980, Linde, Buzo y Gray (LBG) propusieron el denominado algoritmo LBG para generar libros de códigos en base a una secuencia de entrenamiento de vectores (véase el documento "An algorithm for Vector Quantization", de Linde Y., Buzo A. y Gray R.M, IEEE Transactions on Communications, volumen 28, número 1, enero de 1980). La utilización de una secuencia de entrenamiento de vectores evita la necesidad de una integración multidimensional. El algoritmo LBG puede considerarse como una generalización multidimensional del algoritmo de Lloyd clásico, el cual es adecuado para la generación de libros de códigos para una cuantificación escalar.

El algoritmo LBG genera un libro de códigos para un número de niveles N deseado. Si en el mismo códec deben soportarse varios números de niveles N, entonces para cada número de niveles N, un libro de códigos respectivo debe entrenarse y almacenarse tanto en el cuantificador como en una unidad que se utilice para recuperar los vectores de reproducción a partir de los identificadores de los vectores de reproducción. Esta necesidad de varios números de niveles N puede surgir, por ejemplo, en escenarios de codificación donde se requiera una transmisión a terminales con diferentes capacidades de almacenamiento y de procesamiento, o donde las características del canal de transmisión varíen a lo largo del tiempo, o donde la tasa de transmisión de bits total disponible se asigne dinámicamente entre la codificación fuente y de canal, por nombrar algunos. El almacenamiento de libros de códigos respectivos para varios números diferentes de niveles N aumenta de manera desventajosa los requisitos de memoria tanto del cuantificador como de una unidad para la recuperación de vectores de reproducción de vectores que se hayan cuantificado, aumentando por tanto el tamaño y los costes. Además, la estructura del cuantificador y de la unidad de recuperación de vectores de reproducción se vuelve más complicada ya que debe controlarse el acceso a varios libros de códigos.

El documento de la técnica anterior "Embedded Coding of Speech: A Vector Quantization Approach", de Haoui, A. y Messerschmitt D.G., Proceedings IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), abril de 1985, volumen 10, páginas 1703 a 1706, se refiere a codificadores de voz embebidos. Un codificador de voz embebido es un codificador fuente con la propiedad de que la fidelidad de su reproducción de la señal de entrada se degrada lentamente a medida que disminuye por etapas la tasa de transmisión de bits desde una tasa de transmisión máxima hasta una tasa de transmisión mínima. En este caso, el codificador no conoce la tasa de transmisión de bits real que está transmitiéndose y sólo conoce el orden en el que se descartarán los bits (por ejemplo, el flujo de bits transmitido puede orientarse a octetos, descartándose los bits en orden desde el menos al más significativo). Un libro de códigos está diseñado para la tasa de transmisión máxima y la cuantificación siempre se lleva a cabo para un número fijo de niveles correspondiente a esta tasa de transmisión máxima independientemente del número de bits que se descarten durante la transmisión (afectando por tanto a la tasa de transmisión de bits real). Para tener en cuenta el descarte de bits se propone, por ejemplo, asignar dos palabras binarias que solo difieran en el bit menos significativo a dos palabras de código cercanas entre sí en la distancia euclídea, de manera que la sustitución del bit menos significativo por cero genere un pequeño incremento del error.

El documento de la técnica anterior "Low-Complexity Multi-Rate Lattice Vector Quantization with Application to Wideband TCX Speech Coding...

 


Reivindicaciones:

1. Un procedimiento de cuantificación de vectores representativos de datos de voz/audio, comprendiendo dicho procedimiento:

    - proporcionar un libro de códigos unificado que comprende M vectores de reproducción, donde M es un número máximo predefinido de niveles;
    - recibir una selección de un nivel de cuantificación N de un conjunto de al menos dos valores predefinidos que son inferiores o iguales a M;
    - seleccionar para un vector que va a cuantificarse un vector de reproducción de un libro de códigos de N niveles que comprende N vectores de reproducción, donde para cada posible selección de N a partir de dicho conjunto de al menos dos valores predefinidos, dichos N vectores de reproducción de dicho libro de códigos de N niveles se representan mediante los N primeros vectores de reproducción de dicho libro de códigos unificado.

2. Un dispositivo de cuantificación de vectores representativos de datos de voz/audio, comprendiendo dicho dispositivo:

    - medios para proporcionar un libro de códigos unificado que comprende M vectores de reproducción, donde M es un número máximo predefinido de niveles;
    - medios para recibir una selección de un nivel de cuantificación N de un conjunto de al menos dos valores predefinidos que son inferiores o iguales a M;
    - medios para seleccionar para un vector que va a cuantificarse un vector de reproducción de un libro de códigos de N niveles que comprende N vectores de reproducción, donde para cada posible selección de N a partir de dicho conjunto de al menos dos valores predefinidos, dichos N vectores de reproducción de dicho libro de códigos de N niveles se representan mediante los N primeros vectores de reproducción de dicho libro de códigos unificado.

3. Una aplicación software de cuantificación de vectores representativos de datos de voz/audio, comprendiendo dicha aplicación software:

    - código de programa configurado para proporcionar un libro de códigos unificado que comprende M vectores de reproducción, donde M es un número máximo predefinido de niveles;
    - código de programa configurado para recibir una selección de un nivel de cuantificación N de un conjunto de al menos dos valores predefinidos que son inferiores o iguales a M;
    - código de programa configurado para seleccionar para un vector que va a cuantificarse un vector de reproducción de un libro de códigos de N niveles que comprende N vectores de reproducción, donde para cada posible selección de N a partir de dicho conjunto de al menos dos valores predefinidos, dichos N vectores de reproducción de dicho libro de códigos de N niveles se representan mediante los N primeros vectores de reproducción de dicho libro de códigos unificado.

4. Un procedimiento para recuperar vectores de reproducción para vectores que son representativos de datos voz/audio y que se han cuantificado, comprendiendo dicho procedimiento:

    - obtener un parámetro N seleccionado a partir de un conjunto de al menos dos valores predefinidos que son inferiores o iguales a un número máximo predefinido de niveles M;
    - recibir un identificador de un vector de reproducción que se ha seleccionado para un vector en una cuantificación de N niveles; y
    - recuperar, en base a dicho identificador, dicho vector de reproducción de un libro de códigos de N niveles que comprende N vectores de reproducción, donde para cada posible selección de N a partir de dicho conjunto de al menos dos valores predefinidos, dichos N vectores de reproducción de dicho libro de códigos de N niveles se representan mediante los N primeros vectores de reproducción del mismo libro de códigos unificado de M vectores de reproducción.

5. Un dispositivo para recuperar vectores de reproducción para vectores que son representativos de datos voz/audio y que se han cuantificado, comprendiendo dicho dispositivo:

    - medios para obtener un parámetro N seleccionado a partir de un conjunto de al menos dos valores predefinidos que son inferiores o iguales a un número máximo predefinido de niveles M;
    - medios para recibir un identificador de un vector de reproducción que se ha seleccionado para un vector en una cuantificación de N niveles; y
    - medios para recuperar, en base a dicho identificador, dicho vector de reproducción de un libro de códigos de N niveles que comprende N vectores de reproducción, donde para cada posible selección de N a partir de dicho conjunto de al menos dos valores predefinidos, dichos N vectores de reproducción de dicho libro de códigos de N niveles se representan mediante los N primeros vectores de reproducción del mismo libro de códigos unificado de M vectores de reproducción.

6. Una aplicación software para recuperar vectores de reproducción para vectores que son representativos de datos voz/audio y que se han cuantificado, comprendiendo dicha aplicación software:

    - código de programa configurado para obtener un parámetro N seleccionado a partir de un conjunto de al menos dos valores predefinidos que son inferiores o iguales a un número máximo predefinido de niveles M;
    - código de programa configurado para recibir un identificador de un vector de reproducción que se ha seleccionado para un vector en una cuantificación de N niveles; y
    - código de programa configurado para recuperar, en base a dicho identificador, dicho vector de reproducción de un libro de códigos de N niveles que comprende N vectores de reproducción, donde para cada posible selección de N a partir de dicho conjunto de al menos dos valores predefinidos, dichos N vectores de reproducción de dicho libro de códigos de N niveles se representan mediante los N primeros vectores de reproducción del mismo libro de códigos unificado de M vectores de reproducción.

7. Un sistema para transferir representaciones de vectores representativos de datos de voz/audio, que comprende:

    - medios para proporcionar un primer libro de códigos unificado que comprende M vectores de reproducción, donde M es un número máximo predefinido de niveles;
    - medios para recibir una selección de un nivel de cuantificación N de un conjunto de al menos dos valores predefinidos que son inferiores o iguales a M;
    - medios para seleccionar para un vector que va a cuantificarse un vector de reproducción de un libro de códigos de N niveles que comprende N vectores de reproducción, donde para cada posible selección de N a partir de dicho conjunto de al menos dos valores predefinidos, dichos N vectores de reproducción de dicho libro de códigos de N niveles se representan mediante los N primeros vectores de reproducción de dicho primer libro de códigos unificado de M vectores de reproducción;
    - medios para transmitir un identificador de dicho vector de reproducción seleccionado a través de un canal de transmisión;
    - medios para recibir dicho identificador; y
    - medios para recuperar, en base a dicho identificador y dicho nivel de cuantificación N seleccionado, dicho vector de reproducción de un libro de códigos de N niveles que comprende N vectores de reproducción representados mediante los N primeros vectores de reproducción de un segundo libro de códigos unificado de M vectores de reproducción que es igual a dicho primer libro de códigos unificado.

8. Un procedimiento para determinar un libro de códigos, comprendiendo dicho procedimiento:

    - generar vectores de reproducción mediante un algoritmo de entrenamiento en base, al menos parcialmente, a una pluralidad de vectores de entrenamiento representativos de datos de voz/audio; y
    - disponer dichos vectores de reproducción generados en un libro de códigos unificado de M vectores de reproducción según un algoritmo de disposición de manera que para cada N seleccionable de un conjunto de al menos dos valores predefinidos, los N primeros vectores de reproducción de dicho libro de códigos unificado forman un libro de códigos de N niveles para una cuantificación de N niveles de vectores representativos de datos de voz/audio y obtienen, para un enfoque predefinido de generación y disposición de dichos vectores de reproducción, una distorsión de cuantificación media mínima, donde M es un número máximo predefinido de niveles, donde N puede seleccionarse antes de dicha cuantificación a partir de dicho conjunto de al menos dos valores predefinidos que son inferiores o iguales a M, y donde en dicha cuantificación de N niveles se selecciona un vector de reproducción para cada vector a partir de un libro de códigos de N niveles de N vectores de reproducción.

9. El procedimiento según la reivindicación 8, en el que se establece que N = 2n y M = 2m, siendo n y m valores enteros.

10. El procedimiento según la reivindicación 9, que comprende:

    - generar un libro de códigos inicial de M vectores de reproducción mediante dicho algoritmo de entrenamiento;
    - generar un libro de códigos de 2 niveles de 2 vectores de reproducción mediante dicho algoritmo de entrenamiento;
    - seleccionar aquellos 2 vectores de reproducción de dicho libro de códigos inicial que sean más similares a dichos 2 vectores de reproducción de dicho libro de códigos de 2 niveles;
    - copiar dichos 2 vectores de reproducción seleccionados de dicho libro de códigos inicial en las 2 primeras posiciones de dicho libro de códigos unificado y borrar dichos 2 vectores de reproducción seleccionados de dicho libro de códigos inicial; y
    - repetir, para 1 < i = m, las siguientes etapas:
    - generar un libro de códigos de I niveles de I = 2i vectores de reproducción mediante dicho algoritmo de entrenamiento;
    - identificar aquellos I/2 vectores de reproducción de dicho libro de códigos de I niveles que sean más similares a dichos I/2 vectores de reproducción ya copiados en dicho libro de códigos unificado;
    - para los restantes I/2 vectores de reproducción no identificados de dicho libro de códigos de I niveles, seleccionar aquellos I/2 vectores de reproducción de dicho libro de códigos inicial que sean más similares a dichos I/2 vectores de reproducción restantes no identificados; y
    - copiar dichos I/2 vectores de reproducción seleccionados de dicho libro de códigos inicial en las siguientes posiciones libres, en sentido ascendente, de dicho libro de códigos unificado y borrar dichos I/2 vectores de reproducción seleccionados de dicho libro de códigos inicial.

11. El procedimiento según la reivindicación 9, que comprende:

    - generar un libro de códigos de 2 niveles de 2 vectores de reproducción mediante dicho algoritmo de entrenamiento;
    - copiar dichos 2 vectores de reproducción de dicho libro de códigos de 2 niveles en las 2 primeras posiciones de dicho libro de códigos unificado; y
    - repetir, para 1 < i = m, las siguientes etapas:
    - generar un libro de códigos de I niveles de I = 2i vectores de reproducción mediante dicho algoritmo de entrenamiento, donde en dicho algoritmo de entrenamiento los I/2 vectores de reproducción ya copiados en dicho libro de códigos unificado forman la primera parte de un libro de códigos de I vectores de reproducción, que sirve como una inicialización de dicho libro de códigos de I niveles generado por dicho algoritmo de entrenamiento, y se suponen fijos en todo dicho algoritmo de entrenamiento; y
    - copiar los I/2 últimos vectores de reproducción de dicho libro de códigos generado de I niveles en las I/2 siguientes posiciones libres, en sentido ascendente, de dicho libro de códigos unificado.

12. El procedimiento según la reivindicación 8, que comprende:

    - generar un libro de códigos inicial de M vectores de reproducción mediante dicho algoritmo de entrenamiento en base a una pluralidad de vectores de entrenamiento;
    - seleccionar, de dicho libro de códigos inicial, los dos vectores de reproducción que sean más diferentes entre sí;
    - copiar dichos dos vectores de reproducción seleccionados de dicho libro de códigos inicial en las dos primeras posiciones de dicho libro de códigos unificado y borrar dichos dos vectores de reproducción seleccionados de dicho libro de códigos inicial; y
    - repetir, mientras dicho libro de códigos inicial no esté vacío, las siguientes etapas:
    - seleccionar el vector de reproducción de dicho libro de códigos inicial que sea más diferente con respecto a todos los vectores de reproducción ya copiados en dicho libro de códigos unificado; y
    - copiar dicho vector de reproducción seleccionado de dicho libro de códigos inicial en la siguiente posición libre, en sentido ascendente, de dicho libro de códigos unificado y borrar dicho vector de reproducción seleccionado de dicho libro de códigos inicial.

13. El procedimiento según la reivindicación 8, que comprende:

    - generar un libro de códigos inicial de M vectores de reproducción mediante dicho algoritmo de entrenamiento en base a una pluralidad de vectores de entrenamiento;
    - seleccionar, de dicho libro de códigos inicial, el vector de reproducción que sea más similar a todos los dichos vectores de entrenamiento;
    - copiar dicho vector de reproducción seleccionado de dicho libro de códigos inicial en la primera posición de dicho libro de códigos unificado y borrar dicho vector de reproducción seleccionado de dicho libro de códigos inicial; y
    - repetir, mientras dicho libro de códigos inicial no esté vacío, las siguientes etapas:
    - seleccionar el vector de reproducción de dicho libro de códigos inicial que sea más diferente con respecto a todos los vectores de reproducción ya copiados en dicho libro de códigos unificado; y
    - copiar dicho vector de reproducción seleccionado de dicho libro de códigos inicial en la siguiente posición libre, en sentido ascendente, de dicho libro de códigos unificado y borrar dicho vector de reproducción seleccionado de dicho libro de códigos inicial.

14. El procedimiento según la reivindicación 8, que comprende:

    - generar un libro de códigos inicial de M vectores de reproducción mediante dicho algoritmo de entrenamiento;
    - repetir, mientras dicho libro de códigos inicial no esté vacío, las siguientes etapas:
    - seleccionar aquellos 2 vectores de reproducción de dicho libro de códigos inicial que sean más similares entre sí; y
    - copiar el primero de dichos dos vectores de reproducción seleccionados de dicho libro de códigos inicial en la siguiente posición libre, en sentido decreciente empezando desde la última posición, de dicho libro de códigos unificado y borrar dicho primero de dichos dos vectores de reproducción seleccionados de dicho libro de códigos inicial.

15. El procedimiento según la reivindicación 8, en el que dicho conjunto de al menos dos valores predefinidos para N que son inferiores o iguales a M contiene K valores Ni siendo i = 1,...,K y Nj-1 < Nj = M para j = 2,..,K, comprendiendo dicho procedimiento:

    - generar un libro de códigos inicial de M vectores de reproducción mediante dicho algoritmo de entrenamiento en base a una pluralidad de vectores de entrenamiento;
    - seleccionar, de dicho libro de códigos inicial, N1 vectores de reproducción de manera que una distorsión de un libro de códigos que contenga dichos vectores de reproducción seleccionados con respecto a todos los dichos vectores de entrenamiento sea mínima;
    - copiar dichos vectores de reproducción seleccionados de dicho libro de códigos inicial en dicho libro de códigos unificado y borrar dichos vectores de reproducción seleccionados de dicho libro de códigos inicial; y
    - repetir, para cada Ni siendo 1 < i = K, las siguientes etapas:
    - seleccionar, de dicho libro de códigos inicial, Ni - N1-1 vectores de reproducción de manera que una distorsión de un libro de códigos que contenga los Ni-1 vectores de reproducción ya copiados en dicho libro de códigos unificado y dichos vectores de reproducción seleccionados con respecto a todos los dichos vectores de entrenamiento sea mínima; y
    - copiar dichos vectores de reproducción seleccionados de dicho libro de códigos inicial en las siguientes posiciones libres, en sentido ascendente, de dicho libro de códigos unificado y borrar dichos vectores de reproducción seleccionados de dicho libro de códigos inicial.

16. Un dispositivo para determinar un libro de códigos, comprendiendo dicho dispositivo:

    - medios para generar vectores de reproducción mediante un algoritmo de entrenamiento en base, al menos parcialmente, a una pluralidad de vectores de entrenamiento representativos de datos de voz/audio; y
    - medios para disponer dichos vectores de reproducción generados en un libro de códigos unificado de M vectores de reproducción según un algoritmo de disposición de manera que para cada N seleccionable de un conjunto de al menos dos valores predefinidos, los N primeros vectores de reproducción de dicho libro de códigos unificado forman un libro de códigos de N niveles para una cuantificación de N niveles de vectores representativos de datos de voz/audio y obtienen, para un enfoque predefinido de generación y disposición de dichos vectores de reproducción, una distorsión de cuantificación media mínima, donde M es un número máximo predefinido de niveles, donde N puede seleccionarse antes de dicha cuantificación a partir de dicho conjunto de al menos dos valores predefinidos que son inferiores o iguales a M, y donde en dicha cuantificación de N niveles se selecciona un vector de reproducción para cada vector a partir de un libro de códigos de N niveles de N vectores de reproducción.

17. El dispositivo según la reivindicación 16, en el que se establece que N = 2n y M = 2m, siendo n y m valores enteros.

18. El dispositivo según la reivindicación 17, que comprende:

    - medios para generar un libro de códigos inicial de M vectores de reproducción mediante dicho algoritmo de entrenamiento;
    - medios para generar un libro de códigos de 2 niveles de 2 vectores de reproducción mediante dicho algoritmo de entrenamiento;
    - medios para seleccionar aquellos 2 vectores de reproducción de dicho libro de códigos inicial que sean más similares a dichos 2 vectores de reproducción de dicho libro de códigos de 2 niveles;
    - medios para copiar dichos 2 vectores de reproducción seleccionados de dicho libro de códigos inicial en las 2 primeras posiciones de dicho libro de códigos unificado y borrar dichos 2 vectores de reproducción seleccionados de dicho libro de códigos inicial; y
    - medios para repetir, para 1 < i = m, las siguientes etapas:
    - generar un libro de códigos de I niveles de I = 2i vectores de reproducción mediante dicho algoritmo de entrenamiento;
    - identificar aquellos I/2 vectores de reproducción de dicho libro de códigos de I niveles que sean más similares a dichos I/2 vectores de reproducción ya copiados en dicho libro de códigos unificado;
    - para los restantes I/2 vectores de reproducción no identificados de dicho libro de códigos de I niveles, seleccionar aquellos I/2 vectores de reproducción de dicho libro de códigos inicial que sean más similares a dichos I/2 vectores de reproducción restantes no identificados; y
    - copiar dichos I/2 vectores de reproducción seleccionados de dicho libro de códigos inicial en las siguientes posiciones libres, en sentido ascendente, de dicho libro de códigos unificado y borrar dichos I/2 vectores de reproducción seleccionados de dicho libro de códigos inicial.

19. El dispositivo según la reivindicación 17, que comprende:

    - medios para generar un libro de códigos de 2 niveles de 2 vectores de reproducción mediante dicho algoritmo de entrenamiento;
    - medios para copiar dichos 2 vectores de reproducción de dicho libro de códigos de 2 niveles en las 2 primeras posiciones de dicho libro de códigos unificado; y
    - medios para repetir, para 1 < i = m, las siguientes etapas:
    - generar un libro de códigos de I niveles de I = 2i vectores de reproducción mediante dicho algoritmo de entrenamiento, donde en dicho algoritmo de entrenamiento los I/2 vectores de reproducción ya copiados en dicho libro de códigos unificado forman la primera parte de un libro de códigos de I vectores de reproducción, que sirve como una inicialización de dicho libro de códigos de I niveles generado por dicho algoritmo de entrenamiento, y se suponen fijos en todo dicho algoritmo de entrenamiento; y
    - copiar los I/2 últimos vectores de reproducción de dicho libro de códigos generado de I niveles en las I/2 siguientes posiciones libres, en sentido ascendente, de dicho libro de códigos unificado.

20. El dispositivo según la reivindicación 16, que comprende:

    - medios para generar un libro de códigos inicial de M vectores de reproducción mediante dicho algoritmo de entrenamiento en base a una pluralidad de vectores de entrenamiento;
    - medios para seleccionar, de dicho libro de códigos inicial, los dos vectores de reproducción que sean más diferentes entre sí;
    - medios para copiar dichos dos vectores de reproducción seleccionados de dicho libro de códigos inicial en las dos primeras posiciones de dicho libro de códigos unificado y borrar dichos dos vectores de reproducción seleccionados de dicho libro de códigos inicial; y
    - medios para repetir, mientras dicho libro de códigos inicial no esté vacío, las siguientes etapas:
    - seleccionar el vector de reproducción de dicho libro de códigos inicial que sea más diferente con respecto a todos los vectores de reproducción ya copiados en dicho libro de códigos unificado; y
    - copiar dicho vector de reproducción seleccionado de dicho libro de códigos inicial en la siguiente posición libre, en sentido ascendente, de dicho libro de códigos unificado y borrar dicho vector de reproducción seleccionado de dicho libro de códigos inicial.

21. El dispositivo según la reivindicación 16, que comprende:

    - medios para generar un libro de códigos inicial de M vectores de reproducción mediante dicho algoritmo de entrenamiento en base a una pluralidad de vectores de entrenamiento;
    - medios para seleccionar, de dicho libro de códigos inicial, el vector de reproducción que sea más similar a todos los dichos vectores de entrenamiento;
    - medios para copiar dicho vector de reproducción seleccionado de dicho libro de códigos inicial en la primera posición de dicho libro de códigos unificado y borrar dicho vector de reproducción seleccionado de dicho libro de códigos inicial; y
    - medios para repetir, mientras dicho libro de códigos inicial no esté vacío, las siguientes etapas:
    - seleccionar el vector de reproducción de dicho libro de códigos inicial que sea más diferente con respecto a todos los vectores de reproducción ya copiados en dicho libro de códigos unificado; y
    - copiar dicho vector de reproducción seleccionado de dicho libro de códigos inicial en la siguiente posición libre, en sentido ascendente, de dicho libro de códigos unificado y borrar dicho vector de reproducción seleccionado de dicho libro de códigos inicial.

22. El dispositivo según la reivindicación 16, que comprende:

    - medios para generar un libro de códigos inicial de M vectores de reproducción mediante dicho algoritmo de entrenamiento; y
    - medios para repetir, mientras dicho libro de códigos inicial no esté vacío, las siguientes etapas:
    - seleccionar aquellos 2 vectores de reproducción de dicho libro de códigos inicial que sean más similares entre sí; y
    - copiar el primero de dichos dos vectores de reproducción seleccionados de dicho libro de códigos inicial en la siguiente posición libre, en sentido decreciente empezando desde la última posición, de dicho libro de códigos unificado y borrar dicho primero de dichos dos vectores de reproducción seleccionados de dicho libro de códigos inicial.

23. El dispositivo según la reivindicación 16, en el que dicho conjunto de al menos dos valores predefinidos para N que son inferiores o iguales a M contiene K valores Ni siendo i = 1,...,K y Nj-1 < Nj = M para j = 2,..,K, comprendiendo dicho dispositivo:

    - medios para generar un libro de códigos inicial de M vectores de reproducción mediante dicho algoritmo de entrenamiento en base a una pluralidad de vectores de entrenamiento;
    - medios para seleccionar, de dicho libro de códigos inicial, N1 vectores de reproducción de manera que una distorsión de un libro de códigos que contenga dichos vectores de reproducción seleccionados con respecto a todos los dichos vectores de entrenamiento sea mínima;
    - medios para copiar dichos vectores de reproducción seleccionados de dicho libro de códigos inicial en dicho libro de códigos unificado y borrar dichos vectores de reproducción seleccionados de dicho libro de códigos inicial; y
    - medios para repetir, para cada Ni siendo 1 < i = K, las siguientes etapas:
    - seleccionar, de dicho libro de códigos inicial, Ni - Ni-1 vectores de reproducción de manera que una distorsión de un libro de códigos que contenga los Ni-1 vectores de reproducción ya copiados en dicho libro de códigos unificado y dichos vectores de reproducción seleccionados con respecto a todos los dichos vectores de entrenamiento sea mínima; y
    - copiar dichos vectores de reproducción seleccionados de dicho libro de códigos inicial en las siguientes posiciones libres, en sentido ascendente, de dicho libro de códigos unificado y borrar dichos vectores de reproducción seleccionados de dicho libro de códigos inicial.

24. Una aplicación software para determinar un libro de códigos, comprendiendo dicha aplicación software.

    - código de programa configurado para generar vectores de reproducción mediante un algoritmo de entrenamiento en base, al menos parcialmente, a una pluralidad de vectores de entrenamiento representativos de datos de voz/audio; y
    - código de programa configurado para disponer dichos vectores de reproducción generados en un libro de códigos unificado de M vectores de reproducción según un algoritmo de disposición de manera que para cada N seleccionable de un conjunto de al menos dos valores predefinidos, los N primeros vectores de reproducción de dicho libro de códigos unificado forman un libro de códigos de N niveles para una cuantificación de N niveles de vectores y obtienen, para un enfoque predefinido de generación y disposición de dichos vectores de reproducción, una distorsión de cuantificación media mínima, donde dichos vectores son representativos de datos de voz/audio, donde M es un número máximo predefinido de niveles, donde N puede seleccionarse antes de dicha cuantificación a partir de dicho conjunto de al menos dos valores predefinidos que son inferiores o iguales a M, y donde en dicha cuantificación de N niveles se selecciona un vector de reproducción para cada vector a partir de un libro de códigos de N niveles de N vectores de reproducción.

 

Patentes similares o relacionadas:

Imagen de 'PROCEDIMIENTO Y SISTEMA DE CUANTIFICACION VECTORIAL MULTI-VELOCIDAD…'PROCEDIMIENTO Y SISTEMA DE CUANTIFICACION VECTORIAL MULTI-VELOCIDAD DE ENREJADO DE UNA SEÑAL, del 19 de Enero de 2010, de VOICEAGE CORPORATION: Un método para codificar una señal de fuente, para la transmisión o almacenamiento utilizando cuantificación reticular de multivelocidad, comprendiendo […]

CODEC AUDIO SIN PÉRDIDA ESCALABLE Y HERRAMIENTA DE AUTORÍA, del 19 de Agosto de 2011, de DTS, INC: Un método de codificar y crear datos audio, incluyendo: codificar sin pérdida los datos audio en una secuencia de ventanas de análisis en un flujo de bits escalable; […]

CÓDEC DE AUDIO MULTI-CANAL SIN PÉRDIDAS, del 1 de Agosto de 2011, de DTS, INC: Un método para codificar sin pérdidas datos de audio de PCM, que comprende: poner en bloques la señal de audio multicanal en tramas de igual tiempo de duración; procesar […]

Imagen de 'MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN…'MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN DE AUDIO ESCALABLE EN TASA DE TRANSMISIÓN Y ANCHO DE BANDA, del 8 de Abril de 2011, de FRANCE TELECOM: Método de conmutación de tasas de transmisión a la decodificación de una señal de audio codificada por un sistema de codificación de audio multi-tasas de transmisión, […]

Imagen de 'DISPOSITIVO Y MÉTODO PARA EL PROCESAMIENTO POSTERIOR DE VALORES…'DISPOSITIVO Y MÉTODO PARA EL PROCESAMIENTO POSTERIOR DE VALORES ESPECTRALES Y CODIFICADOR Y DECODIFICADOR PARA SEÑALES DE AUDIO, del 17 de Marzo de 2011, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Codificador para codificar una señal de audio, que comprende: un dispositivo para el procesamiento posterior de valores espectrales basándose en un primer […]

Imagen de 'VOCODIFICADOR DE VELOCIDAD VARIABLE'VOCODIFICADOR DE VELOCIDAD VARIABLE, del 2 de Diciembre de 2010, de QUALCOMM INCORPORATED: - Un procedimiento de procesamiento de una señal de voz que comprende una pluralidad de tramas, comprendiendo el procedimiento: calcular un nivel de energía […]

Imagen de 'CODIFICACION DE AUDIO MULTICANAL AJUSTABLE A ESCALA'CODIFICACION DE AUDIO MULTICANAL AJUSTABLE A ESCALA, del 27 de Octubre de 2010, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Codificador de audio adaptado para codificar una señal de audio multicanal, comprendiendo el codificador: - un módulo de combinación de […]

Imagen de 'METODOS Y DISPOSICIONES PARA UN EMISOR Y RECEPTOR DE CONVERSACION/AUDIO'METODOS Y DISPOSICIONES PARA UN EMISOR Y RECEPTOR DE CONVERSACION/AUDIO, del 11 de Agosto de 2010, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un emisor de audio/conversación que comprende un codificador de núcleo adaptado a una banda de frecuencia de una señal de audio/conversación […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .