RED DE COMUNICACIÓN PARA TRANSMITIR SEÑALES DE VOZ.

Decodificador (40) de voz para reconstruir una señal (28) de voz representada por una secuencia de símbolos que incluye una representación de una pluralidad de coeficientes de predicción (PR) y una representación de una señal de excitación (EX),

comprendiendo el decodificador (40) de voz medios (70) para extraer la señal de excitación (EX) y los coeficientes de predicción (PR) de la señal (28) de voz, estando dispuesto el decodificador (40) de voz para reconstruir una señal de voz usando la señal de excitación (EX) y los coeficientes de predicción (PR), caracterizado porque el decodificador (40) de voz comprende medios (74) para extraer sólo un número reducido de coeficientes de predicción (PR) de la señal (28) de voz, y porque el decodificador (40) de voz está dispuesto para reconstruir la señal de voz usando la señal de excitación (EX) y el número reducido de coeficientes de predicción, siendo el número reducido de coeficientes de predicción los primeros coeficientes de predicción de la pluralidad de coeficientes de predicción

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E06118093.

Solicitante: KONINKLIJKE PHILIPS ELECTRONICS N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: GROENEWOUDSEWEG 1 5621 BA EINDHOVEN PAISES BAJOS.

Inventor/es: TAORI, RAKESH, GERRITS,ANDREAS,J.

Fecha de Publicación: .

Fecha Solicitud PCT: 22 de Enero de 1998.

Clasificación Internacional de Patentes:

  • G10L19/06L

Clasificación PCT:

  • G10L19/06 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Determinación o codificación de las características del espectro, p. ej. de los coeficientes de predicción a corto plazo.

Países PCT: Alemania, España, Francia, Reino Unido, Italia.

PDF original: ES-2373968_T3.pdf

 


Fragmento de la descripción:

Red de comunicación para transmitir señales de voz.

La presente invención se refiere a un receptor para recibir una señal de voz representada por una secuencia de símbolos que incluye una representación de una pluralidad de coeficientes de predicción y una representación de una señal de excitación, comprendiendo el receptor medios para extraer la señal de excitación y los coeficientes de predicción de la señal de voz, estando dispuesto el receptor para reconstruir una señal de voz usando la señal de excitación y los coeficientes de predicción.

La presente invención también se refiere a un decodificador de voz para reconstruir una señal de voz, un método para recibir una señal de voz y un método para reconstruir una señal de voz.

Se conoce un sistema y una red de comunicación a partir del artículo “Real Time Communication on the Net” en PC Magazine, 8 de octubre de 1996, págs. 102-120.

Con un número rápidamente creciente de usuarios de Internet y los desarrollos avanzados en la codificación de voz, la telefonía basada en Internet puede convertirse en una alternativa real para la red de PSTN común. Esto sucede en particular para llamadas internacionales, debido a los ahorros sustanciales que pueden obtenerse. El sistema de comunicación conocido usa un codificador de voz para reducir la tasa de transmisión de bits requerida desde los 64 kb/s convencionales hasta una tasa de transmisión sustancialmente inferior que oscila desde los 2-16 kb/s.

La mayoría de los codificadores de voz derivan parámetros para un filtro de síntesis en el decodificador de voz junto con una señal de excitación adecuada para su aplicación al filtro de síntesis. La determinación de los parámetros de filtro se basa en los denominados parámetros de predicción que definen el espectro a corto plazo de la señal de voz de entrada. La señal de excitación puede hallarse de diferentes maneras. Una manera, el análisis por método de síntesis, implica sintetizar una señal de voz usando un número predeterminado de señales de excitación, y seleccionar la señal de excitación lo que da como resultado una señal de voz sintética que proporciona la mejor coincidencia con la señal de voz de entrada. Otra manera de hallar la señal de excitación es filtrar la señal de voz de entrada con un filtro de síntesis inverso, y codificar la señal residual en la salida de dicho filtro.

Un problema con el sistema de comunicación conocido es que es posible que se ofrezca más tráfico de voz a la red del que puede procesar. Esto puede conducir a una pérdida de conexión o un gran retardo de la señal de voz que va a transmitirse. También es posible que una señal de voz se codifique según un formato que es demasiado complejo de decodificar con el decodificador disponible en el receptor.

El objeto de la presente invención según las reivindicaciones 1 y 3 es proporcionar una red de comunicación en la que al menos se palie uno de los problemas mencionados anteriormente.

Por tanto el receptor se caracteriza porque el receptor comprende medios para extraer sólo un número reducido de coeficientes de predicción de dicha señal de voz, y porque el receptor está dispuesto para reconstruir la señal de voz usando la señal de excitación y el número reducido de coeficientes de predicción.

Si la red fuera del receptor está dispuesta para borrar una parte de la secuencia de símbolos que representa los parámetros de predicción, la carga de la red puede reducirse sustancialmente. Si el receptor está dispuesto para borrar una parte de la secuencia de símbolos que representa los parámetros de predicción, la complejidad del filtro de síntesis, y con ello la complejidad del receptor, pueden reducirse a una cantidad que el decodificador puede decodificar la parte restante de la secuencia de símbolos. Borrando una parte de la secuencia de símbolos que representa algunos de los parámetros de predicción, la señal de voz aún puede reproducirse usando un filtro de síntesis que usa sólo los parámetros de predicción que están disponibles, a expensas de una calidad de voz ligeramente degradada.

Dicha representación de coeficientes de predicción puede basarse en coeficientes de reflexión. El uso de una representación basada en coeficientes de reflexión tiene la ventaja de que incluso un número reducido de coeficientes de reflexión recibidos pueden usarse directamente para controlar el filtro de síntesis. Con algunas otras representaciones de los parámetros de predicción, tales como los parámetros a o frecuencias espectrales de línea, una síntesis basada en un número reducido de coeficientes recibidos podría conducir a una calidad de voz sustancialmente reducida.

Dicha representación de coeficientes de predicción puede comprende razones de área logarítmicas. El uso de las razones de área logarítmicas tiene la ventaja de que tienen las mismas propiedades que los coeficientes de reflexión con respecto a la adecuación para derivar fácilmente los parámetros para el filtro de síntesis. Las razones de área logarítmicas también tienen la propiedad de que la cuantificación no provoca grandes errores de síntesis si los parámetros del filtro de síntesis se derivan de razones de área logarítmicas cuantificados.

La patente US 5.353.373 da a conocer un sistema para una codificación incrustada de señales de voz. Según este sistema, un conjunto de posibles señales de excitación se subdivide en una pluralidad de subconjuntos. Uno primero de estos subconjuntos proporciona la contribución a la señal codificada necesaria para establecer una transmisión a una tasa de transmisión mínima garantizada por la red. Los demás subconjuntos suministran una contribución que, cuando se añade a la del primer subconjunto, provoca un aumento de tasa de transmisión mediante etapas sucesivas. En el lado receptor, se genera una señal decodificada usando la contribución de excitación del primer subconjunto solo si las señales codificadas se reciben a la tasa de transmisión mínima, mientras que para tasas de transmisión superiores a la tasa de transmisión mínima también se usan las contribuciones de los subconjuntos que han permitido tal aumento de tasa de transmisión.

Ahora se explicará la presente invención con referencia a los dibujos. En estos muestran:

la figura 1, una red de comunicación según la invención, en la que tiene lugar una reducción de tasa de transmisión de bits dentro de la red;

la figura 2, la constitución de una trama que comprende una secuencia de símbolos que representa la señal de voz;

la figura 3, un diagrama de bloques de un receptor que va a usarse en una red según la invención;

la figura 4, un diagrama de bloques de los medios de reducción de tasa de transmisión de bits para su uso en la red según la figura 1;

la figura 5, una implementación alternativa de la combinación de los medios 38 de reducción de tasa de transmisión de bits y un deformateador 42 de flujo de bits para su uso en el receptor según la figura 3.

En la red de comunicación según la figura 1, un transmisor 1 y un receptor 8 están conectados a una red 4 de transmisión. La entrada del transmisor 1 está conectada a una entrada de un codificador 2 de voz. Una primera salida del codificador 2 de voz, que lleva una señal PR que representa los coeficientes de predicción, está conectada a una primera entrada de un multiplexor 3. Una segunda salida del codificador 2 de voz, que lleva una señal EX que representa la señal de excitación, está conectada a una segunda entrada del multiplexor 3. La salida del multiplexor 3 está acoplada a la salida del transmisor 1.

La salida del transmisor 1 está conectada a un nodo 10 en una red 4 de transmisión. El nodo 10 está conectado a los nodos 12 y 14. El nodo 14 también está acoplado a un nodo 24. El nodo 24 comprende medios para borrar una parte de la secuencia de símbolos para hacerse referencia a los mismos como medios 26 de reducción de tasa de transmisión de bits. El nodo 24 está conectado a un nodo 16, un nodo 20 y un nodo 22.

El nodo 22 también está conectado al nodo 12. Un terminal 6 está conectado al nodo 16, nodo que también está conectado al nodo 20 y al nodo 18. El nodo 18 está conectado al nodo 20. Un receptor 8 está conectado al nodo 20 en la red 4 de transmisión.

En la explicación de la red de comunicación según la figura 1, se supone que el codificador 2... [Seguir leyendo]

 


Reivindicaciones:

1. Decodificador (40) de voz para reconstruir una señal (28) de voz representada por una secuencia de símbolos que incluye una representación de una pluralidad de coeficientes de predicción (PR) y una representación de una señal de excitación (EX) , comprendiendo el decodificador (40) de voz medios (70) para extraer la señal de excitación (EX) y los coeficientes de predicción (PR) de la señal (28) de voz, estando dispuesto el decodificador (40) de voz para reconstruir una señal de voz usando la señal de excitación (EX) y los coeficientes de predicción (PR) , caracterizado porque el decodificador (40) de voz comprende medios (74) para extraer sólo un número reducido de coeficientes de predicción (PR) de la señal (28) de voz, y porque el decodificador (40) de voz está dispuesto para reconstruir la señal de voz usando la señal de excitación (EX) y el número reducido de coeficientes de predicción, siendo el número reducido de coeficientes de predicción los primeros coeficientes de predicción de la pluralidad de coeficientes de predicción.

2. Receptor para recibir una señal (28) de voz, comprendiendo el receptor el decodificador (40) de voz según la reivindicación 1.

3. Método para reconstruir una señal (28) de voz representada por una secuencia de símbolos que incluye una representación de una pluralidad de coeficientes de predicción (PR) y una representación de una señal de excitación (EX) , comprendiendo el método la extracción de la señal de excitación (EX) y los coeficientes de predicción (PR) de la señal (28) de voz, y la reconstrucción de una señal de voz usando la señal de excitación (EX) y los coeficientes de predicción (PR) , caracterizado porque el método comprende extraer sólo un número reducido de coeficientes de predicción de la señal (28) de voz, y reconstruir una señal de voz usando la señal de excitación (EX) y el número reducido de coeficientes de predicción, siendo el número reducido de coeficientes de predicción los primeros coeficientes de predicción de la pluralidad de coeficientes de predicción.

4. Método para recibir una señal (28) de voz, incluyendo el método las etapas del método según la reivindicación 3.

 

Patentes similares o relacionadas:

Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]

Aparato, método, programa y soporte de registro de análisis predictivo lineal, del 13 de Mayo de 2020, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de análisis predictivo lineal para obtener un coeficiente que se puede convertir en un coeficiente predictivo lineal correspondiente a una señal de la serie temporal […]

Aparato de análisis predictivo lineal, método, programa y soporte de registro, del 22 de Abril de 2020, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de análisis predictivo lineal para obtener un coeficiente que puede convertirse en un coeficiente predictivo lineal correspondiente a una señal de serie […]

Predicción basada en modelo en un banco de filtros, del 1 de Enero de 2020, de DOLBY INTERNATIONAL AB: Un método en un decodificador para estimar una muestra de una señal de subbanda a partir de dos o más muestras anteriores de […]

Codificador y método para codificar una señal de audio con ruido de fondo reducido que utiliza codificación predictiva lineal, del 11 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Codificador para codificar una señal de audio (8') con ruido de fondo reducido utilizando codificación predictiva lineal, comprendiendo el codificador : […]

Codificación de una señal acústica, del 20 de Noviembre de 2019, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un procedimiento de codificación para codificar una señal acústica de entrada trama por trama de un segmento de tiempo predeterminado mediante un […]

Aparato, método, programa y soporte de registro de análisis predictivo lineal, del 13 de Noviembre de 2019, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de análisis predictivo lineal para obtener un coeficiente que se puede convertir en un coeficiente predictivo lineal correspondiente a una […]

Codificación y descodificación de una señal de sonido, del 25 de Septiembre de 2019, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un dispositivo de codificación de señales de sonido, que comprende: una primera unidad de codificación que está adaptada para obtener un primer […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .