PROCEDIMIENTO PARA LA TRASMISION DE SEÑALES DE AUDIO SEGUN EL PROCEDIMEINTO DE TRANSMISION DE PIXELS SEGUN PRIORIDAD.

Procedimiento para la transmisión de señales de audio entre un transmisor y,

como mínimo, un receptor, mediante un método de transmisión de píxels según priorización, caracterizado por las siguientes etapas:

a) descomposición de la señal de audio en un número n de fracciones espectrales a frecuencia y amplitud en un momento de tiempo,

b) almacenar la señal de audio descompuesta en un conjunto de dos dimensiones que tiene una serie de campos, con la frecuencia y el tiempo como dimensiones y la amplitud como valor a introducir en cualquier momento determinado en el campo,

c) formar grupos de cada campo individual y, como mínimo, dos campos del conjunto adyacente al último campo,

d) asignar una prioridad a los grupos individuales, siendo mayor la prioridad de un grupo cuanto mayor son las amplitudes de los valores de un grupo y/o cuanto mayores son las diferencias de amplitud de un grupo y/o cuanto más próximo se encuentre el grupo al tiempo actual, y

e) transmitir los grupos en el orden de prioridad clasificado en orden descendente al receptor

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/DE2003/002258.

Solicitante: T-MOBILE DEUTSCHLAND GMBH.

Nacionalidad solicitante: Alemania.

Dirección: LANDGRABENWEG 151,53227 BONN.

Inventor/es: MOSSAKOWSKI, GERD.

Fecha de Publicación: 18 de Mayo de 2010.

Fecha Concesión Europea: 6 de Enero de 2010.

Clasificación Internacional de Patentes:

G10L19/02B

Clasificación PCT:

G10L19/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.

Clasificación antigua:

G10L19/02 G10L 19/00 […] › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
H04N7/26

Fragmento de la descripción:

Procedimiento para la trasmisión de señales de audio según el procedimiento de transmisión de píxels según prioridad.

La presente invención se refiere a un procedimiento para la transmisión de señales de audio, según el procedimiento de transmisión de píxels según prioridad, de acuerdo con la parte introductoria de la reivindicación 1.

En la actualidad existen múltiples procedimientos distintos para comprimir la transmisión de señales de audio. Esencialmente existen los siguientes procedimientos:

- Reducción de la frecuencia de exploración, por ejemplo, 3 kHz en vez de 44 kHz

- Transmisión no lineal de los valores de exploración, por ejemplo, por transmisión ISDN

- Utilización de secuencias acústicas almacenadas previamente, por ejemplo, MIDI o síntesis de voz

- Utilización de modelos de Markov para la corrección de fallos de transmisión

Otro procedimiento conocido para la codificación de audio mediante codificación de transformación basada en MDCT se da a conocer en el documento de patente US-A-2002/007273.

Las características comunes de los procedimientos conocidos consisten en que también para frecuencias de transmisión reducidas, existe una satisfactoria capacidad de formación de habla. Esto se consigue esencialmente mediante constitución de valores medios. No obstante, diferentes voces en cuanto a la fuente, proporcionan voces que suenan de manera distinta en volúmenes bajos, de manera que, por ejemplo, las oscilaciones de voz que son reconocibles en una conversación normal, no pueden ser transmitidas. Ello produce una sensible limitación de la calidad de las comunicaciones.

Se conocen procedimientos para la compresión y descompresión de datos de imágenes o de vídeo mediante transmisión priorizada de píxels en las solicitudes de patentes alemanas DE 101 13 880.6 (corresponde a PCT/DE02/00987) y DE 101 52 612.1 (corresponde a PCT/DE02/00995). En estos procedimientos se manipulan, por ejemplo, datos digitales de imágenes o de vídeo que consisten en un conjunto ("Array") de puntos de imagen individuales (píxel), de manera que cada píxel presenta un valor de píxel variable temporalmente, el cual describe la información de color o de claridad del píxel. De acuerdo con la invención, cada píxel o bien cada grupo de píxels queda asociado a una prioridad y el píxel queda dispuesto en un conjunto de prioridades de acuerdo con su priorización. Este conjunto ("Array") contiene para cada momento de tiempo los valores de los píxels clasificados según la priorización. De manera correspondiente a la priorización, estos píxels y los valores de píxels utilizados para el cálculo de priorización son transmitidos, o bien almacenados. Un píxel recibe una elevada prioridad cuando las diferencias con respecto al píxel adyacente son muy grandes. Para la reconstrucción se muestran los valores reales correspondientes del píxel sobre la pantalla. Los píxels que no se han transmitido todavía serán calculados a base de los píxels ya transmitidos. Estos procedimientos pueden ser utilizados básicamente también para la transmisión de señales de audio.

El objetivo de la invención consiste, por lo tanto, en dar a conocer un procedimiento para la transmisión de señales de audio que, incluso para reducidas amplitudes de la banda de transmisión, funcione en lo posible sin pérdidas.

Este objetivo se consigue, de acuerdo con la invención, según las características de la reivindicación 1.

De acuerdo con la invención, la señal de audio es descompuesta inicialmente en un número n de componentes o partes espectrales. La señal de audio descompuesta será almacenada en un conjunto bidimensional con múltiples campos, siendo la frecuencia y el tiempo las dimensiones, y la amplitud el valor correspondiente a trasladar al campo. A continuación, de cada uno de los campos individuales y, como mínimo, de dos de estos campos adyacentes de los conjuntos se constituyen grupos, y los grupos individuales reciben una prioridad, de manera que la prioridad de un grupo se escoge tanto más grande cuanto mayor son las amplitudes de los valores del grupo y/o cuanto mayor es la diferencia de amplitud de los valores de un grupo y/o cuanto más próximo se encuentra el grupo del tiempo actual.

Finalmente, los grupos son transmitidos a su receptor según la secuencia de sus prioridades.

El nuevo procedimiento se refiere esencialmente a las bases de Shannon. De acuerdo con ellas, se pueden transmitir señales sin pérdidas cuando son exploradas con frecuencia doble. Esto significa que el sonido se puede descomponer en oscilaciones senoidales individuales de diferentes amplitudes y frecuencias. Como consecuencia, se pueden elaborar señales acústicas debidamente mediante la transmisión de fracciones de frecuencia individuales, incluyendo las amplitudes y fases, sin pérdidas. Para ello, se utiliza también en especial el hecho de que las fuentes de sonidos habituales, por ejemplo, instrumentos musicales, voz humana, están compuestas de cuerpos de resonancia cuya frecuencia de resonancia no varía o lo hace muy lentamente.

Disposiciones y desarrollos adicionales ventajosos de la invención se describen en las reivindicaciones dependientes.

Un ejemplo de realización de la invención se describirá a continuación. En este caso, se hará referencia en especial a la descripción y dibujos de las solicitudes de patente anteriores DE 101 13 880.6 y DE 101 52 621.1.

En primer lugar se recibirá el sonido, se transformará en señales eléctricas y se descompondrá en sus fracciones o componentes de frecuencia. Esto puede ser realizado o bien mediante FFT (Transformación Rápida de Fourier) o mediante filtros que seleccionan n frecuencias individuales. Si se utilizan n filtros individuales, cada filtro toma solamente una frecuencia individual, por ejemplo, una banda de frecuencia estrecha, (igual que las vellosidades en el oído humano). De esta manera, se tiene para cada momento de tiempo la frecuencia y el valor de amplitud para esta frecuencia. De esta manera, se pueden recibir el número n correspondiente a las características del aparato final con diferentes valores. Cuanto mayor es n, mejor puede ser reproducida la señal de audio. Por lo tanto, n es un parámetro con el que se puede escalar la calidad de la transmisión de audio.

Los valores de amplitud serán almacenados de forma intermedia en los campos de un conjunto de dos dimensiones. En este caso, corresponde la primera dimensión del conjunto al eje de los tiempos y la segunda dimensión a la frecuencia. De esta manera, cada valor de exploración queda asociado con el valor correspondiente de la amplitud y de la fase determinados debidamente y puede ser almacenado en el campo asociado del conjunto como número imaginario. La señal de voz será mostrada, por lo tanto, en el conjunto con tres dimensiones acústicas (parámetros): el tiempo, por ejemplo, en milisegundos (ms), perceptible como duración, como la primera dimensión del conjunto, la frecuencia en Hercios (Hz), perceptible como agudeza del sonido, como segunda dimensión del conjunto y la energía (es decir, intensidad) de la señal perceptible como volumen o bien intensidad, la cual será almacenada como valor numérico en el campo correspondiente del conjunto.

En comparación con las solicitudes de patentes DE 101 13 880.6 y DE 101 52 612.1 corresponde, por ejemplo, la frecuencia a la altura de imagen, el tiempo a la anchura de imagen y la amplitud de la señal de audio (intensidad) al valor del color.

De manera similar, el procedimiento de priorización de grupos de píxels en la codificación de imágenes/vídeo constituyen grupos de valores adyacentes y éstos son priorizados. Cada uno de los campos considerado en sí mismo constituye conjuntamente con un mínimo de un campo, pero preferentemente, no obstante, varios campos adyacentes, un grupo. Los grupos comprenden un valor de posición definido por el tiempo y frecuencia, el valor de amplitud en el valor de posición y los valores de amplitud de los valores circundantes de manera correspondiente a una forma predeterminada (ver figura 2 de las solicitudes DE 101 13 880.6 y DE 101 52 612.1). En este caso, cada uno de los grupos recibe una prioridad muy elevada, las cuales se encuentran cerca del tiempo actual y/o su valor de amplitud en comparación con otros grupos son muy grandes y/o en ellos, los valores de amplitud dentro del grupo difieren notablemente entre sí. Los valores de grupos de píxels son clasificados de manera creciente y almacenados o transmitidos en esta secuencia.

Reivindicaciones:

1. Procedimiento para la transmisión de señales de audio entre un transmisor y, como mínimo, un receptor, mediante un método de transmisión de píxels según priorización, caracterizado por las siguientes etapas:

a) descomposición de la señal de audio en un número n de fracciones espectrales a frecuencia y amplitud en un momento de tiempo,

b) almacenar la señal de audio descompuesta en un conjunto de dos dimensiones que tiene una serie de campos, con la frecuencia y el tiempo como dimensiones y la amplitud como valor a introducir en cualquier momento determinado en el campo,

c) formar grupos de cada campo individual y, como mínimo, dos campos del conjunto adyacente al último campo,

d) asignar una prioridad a los grupos individuales, siendo mayor la prioridad de un grupo cuanto mayor son las amplitudes de los valores de un grupo y/o cuanto mayores son las diferencias de amplitud de un grupo y/o cuanto más próximo se encuentre el grupo al tiempo actual, y

e) transmitir los grupos en el orden de prioridad clasificado en orden descendente al receptor.

2. Procedimiento, según la reivindicación 1, caracterizado porque el conjunto de la señal de audio se encuentra presente como archivo de audio y es procesado y transmitido como un conjunto.

3. Procedimiento, según la reivindicación 1, caracterizado porque en cada caso solamente una parte de la señal de audio es procesada y transmitida.

4. Procedimiento, según una las reivindicaciones 1 a 3, caracterizado porque la señal de audio es descompuesta en sus fracciones espectrales por FFT.

5. Procedimiento, según una las reivindicaciones 1 a 3, caracterizado porque la señal de audio es descompuesta en sus fracciones espectrales por un número n de filtros selectores de frecuencia.

6. Procedimiento, según una las reivindicaciones 1 a 5, caracterizado porque en el receptor, los grupos transmitidos, según su prioridad, son asignados a un conjunto correspondiente, siendo calculados los valores del conjunto todavía no transmitidos a partir de los valores existentes por interpolación.

7. Procedimiento, según una las reivindicaciones 1 a 6, caracterizado porque a partir de los valores presentes en el receptor y calculados es generada una señal eléctrica y convertida en una señal de audio.

Patentes similares o relacionadas:

BANCO DE FILTROS DE ANÁLISIS, BANCO DE FILTROS DE SÍNTESIS, CODIFICADOR, DESCODIFICADOR, MEZCLADOR Y SISTEMA DE CONFERENCIA, del 13 de Febrero de 2012, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Banco de filtros de síntesis para filtrar una pluralidad de tramas de entrada, comprendiendo cada trama de entrada M valores de entrada ordenados yk ,...,yk(M-1), […]

CODIFICACIÓN POR TRANSFORMADA, UTILIZANDO VENTANAS DE PONDERACIÓN Y CON RETARDO PEQUEÑO, del 10 de Junio de 2011, de FRANCE TELECOM: Método de decodificación, por transformada, de una señal representada por una sucesión de tramas que han sido codificadas utilizando al […]

METODOS Y DISPOSICIONES PARA UN EMISOR Y RECEPTOR DE CONVERSACION/AUDIO, del 11 de Agosto de 2010, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un emisor de audio/conversación que comprende un codificador de núcleo adaptado a una banda de frecuencia de una señal de audio/conversación […]

CODIFICACION DE AUDIO CON DIFERENTES LONGITUDES DE TRAMA DE CODIFICACION, del 4 de Mayo de 2010, de NOKIA CORPORATION: Procedimiento para soportar una codificación de una señal de audio, en el que al menos una sección de dicha señal de audio va a codificarse con un modelo de codificación que […]

APARATO Y METODO PARA GENERAR VALORES DE SUBBANDA DE AUDIO Y APARATO YMETODO PARA GENERAR MUESTRAS DE AUDIO DE DOMINIO DE TIEMPO, del 10 de Noviembre de 2009, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para generar valores de subbanda de audio en canales de subbanda de audio, que comprende: un divisor en ventanas de análisis para dividir en ventanas una trama […]

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]

Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]

Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]