Aparato y método para codificar al menos un parámetro asociado con una fuente de señal.
Un aparato de codificación de señales de audio para codificar al menos un parámetro de señal de audioasociado con una fuente de señal para transmisión sobre k tramas de una secuencia de bits codificada a undescodificador,
el aparato que comprende:
un procesador configurado en operación para:
asignar un patrón de bits predeterminado a n bits asociados con el al menos un parámetro de señal de audio de unaprimera trama de k tramas, el patrón de bits predeterminado que indica un inicio del al menos un parámetro de señalde audio; y
fijar los n bits asociados con el al menos un parámetro de señal de audio de cada una de las k-1 tramas posterioresa valores, de manera que los valores de los n bits de las k-1 tramas posteriores representan el al menos unparámetro de señal de audio.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2009/062008.
Solicitante: Motorola Mobility LLC .
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 600 North US Highway 45 Libertyville, IL 60048 ESTADOS UNIDOS DE AMERICA.
Inventor/es: ASHLEY,JAMES P, GIBBS,JONATHAN A, MITTAL,UDAR, FRANCOIS,HOLLY L.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/14
PDF original: ES-2395349_T3.pdf
Fragmento de la descripción:
Aparato y método para codificar al menos un parámetro asociado con una fuente de señal
Campo de la descripción La revelación se refiere a un aparato y método para codificar al menos un parámetro asociado con una fuente de señal para transmisión sobre una pluralidad de tramas.
Antecedentes Los codificadores basados en tramas, tales como los codificadores de habla, usan técnicas de procesamiento de señal de audio para modelar una señal de habla, y algoritmos de compresión de datos genéricos para representar la señal de habla modelada resultante en una secuencia de bits compacta, la cual entonces se transmite sobre tramas secuenciales a un descodificador. Cada una de las tramas secuenciales de esta manera incluye la señal de habla codificada y también parámetros asociados con la señal de habla, cuyos parámetros se descodifican por el descodificador y se usan para mejorar la representación de la señal de habla descodificada.
En el caso de grabación estéreo, tal como en conferencia de audio y vídeo así como aplicaciones de radiodifusión, una señal estéreo se puede grabar usando dos micrófonos. Cuando los dos micrófonos están separados, la señal grabada a partir de un altavoz situado más cercano a un micrófono que a otro, alcanza este último micrófono con un retardo con respecto al otro micrófono. Para tener en cuenta el retardo de la señal de habla entre los diferentes micrófonos, se puede determinar un parámetro conocido como el parámetro de retardo estéreo o un parámetro de diferencia de tiempo entre canales (ITD) a partir de la señal estéreo grabada y codificada y transmitida sobre las tramas junto con la señal de habla codificada y otros parámetros que describen aspectos de la señal de habla estéreo. Estos parámetros transmitidos se usan en el descodificador para recrear la señal estéreo. El parámetro ITD puede mejorar significativamente la calidad de la perspectiva estéreo recreada dado que la ITD se conoce que es la influencia perceptiva dominante en localización estéreo para frecuencias por debajo de aproximadamente 1 kHz.
Típicamente, los codificadores de habla emplean tasas de trama de 20 ms lo cual significa que cada bit dentro de una trama de habla consume 50 bits/s y la estructura de trama síncrona se presta a sí misma para la actualización de parámetros en múltiplos de 50 Hz. Tales tasas de actualización son conmensurables con las tasas de cambio experimentadas dentro del tracto vocal humano. Por ejemplo, es bien conocido que la forma del tracto vocal humano se puede representar adecuadamente mediante parámetros (tal como el parámetro de Código Predictivo Lineal (LPC) ) a una tasa de actualización de aproximadamente 50 Hz, mientras que la energía y forma de excitación de habla es la mejor modelada a aproximadamente 200 Hz (es decir, los parámetros de excitación se actualizan a 200 Hz) .
No obstante, según se aumenta la funcionalidad de codificador de habla para proporcionar música y codificación estéreo, tal como en el codificador de habla conocido como el códec de Tasa de Bit Variable Integrado (EV-VBR) el cual está siendo estandarizado actualmente por la Unión Internacional de Telecomunicación (ITU) , necesitan ser codificados parámetros adicionales que no se refieren al tracto vocal humano. Algunos de estos parámetros varían a una tasa más lenta que la tasa de trama y de esta manera, el envío del mismo parámetro cada trama, independientemente de si el parámetro ha cambiado, representa un gasto de los recursos de ancho de banda de canal. Alguno de estos parámetros también puede requerir alta precisión, en términos de números de bits, así como evolucionar lentamente con el tiempo. Para lograr la alta precisión requerida, un sobre muestreo combinado con una reducción en el número de niveles de cuantificación puede proporcionar una solución clásica pero este método tiene varias desventajas debido al filtrado requerido. Una propagación de errores puede ocurrir y también puede haber problemas con la fluctuación en el valor de salida debido a la realización práctica del filtro que también puede retardar el efecto de cambios de parámetros instantáneos e introducir dificultades en el mantenimiento de la sincronización del codificador y descodificador en estructuras codificadoras análisis por síntesis.
De esta manera, sería ventajoso proporcionar un método mejorado para codificar y transmitir parámetros en un esquema de codificación basado en tramas.
Breve descripción de los dibujos Un aparato de acuerdo con la reivindicación 1 y un método de acuerdo con la reivindicación 10 para codificar al menos un parámetro asociado con una fuente de señal para transmisión sobre una pluralidad de tramas, de acuerdo con la revelación se describirán ahora, a modo de ejemplo solamente, con referencia a los dibujos anexos en los cuales:
La FIG. 1 es un diagrama esquemático de bloques de un sistema de comunicación de acuerdo con una realización de la revelación;
La FIG. 2 es un diagrama esquemático de bloques de un aparato de codificación para codificar señales de habla y parámetros asociados con las señales de habla de acuerdo con una realización de la revelación;
La FIG. 3 es una tabla que muestra el número de valores posibles que puede tener un parámetro de acuerdo con una realización de la revelación para diversos valores de n y k;
La FIG. 4 es una tabla que muestra las eficiencias de la tasa de bit como un porcentaje para diversos valores de n y k; y
La FIG. 5 es un diagrama de flujo de un método para codificar al menos un parámetro asociado con una fuente de señal para transmisión sobre una pluralidad de tramas de acuerdo con una realización de la revelación.
Descripción detallada En la siguiente descripción, las realizaciones de la revelación se describirán con respecto a un codificador de habla usado como parte de un dispositivo de comunicación en una aplicación de teleconferencia en donde un parámetro ITD se codifica y transmite sobre un enlace de comunicación cableado para mejorar la señal estéreo recreada por un descodificador en otro dispositivo de comunicación. Se apreciará no obstante que la presente revelación se puede usar en otros tipos de codificadores/descodificadores, tales como vídeo, u otros codificadores/descodificadores de audio, y también se puede usar en dispositivos de comunicación inalámbricos, tales como una unidad de abonado, un equipo de usuario inalámbrico, un teléfono portátil o móvil, un dispositivo de vídeo o multimedia inalámbrico, un terminal de comunicación, un asistente digital personal (PDA) , un ordenador personal, o un procesador de comunicación integrado. Por ejemplo, una señal estéreo se puede grabar cuando un usuario está hablando en presencia de un micrófono BluetoothTM y un micrófono de teléfono móvil o múltiples micrófonos en un sistema de comunicación inalámbrico en un coche. En tales aplicaciones, codificar y transmitir el parámetro ITD puede mejorar la experiencia del usuario.
Con referencia a la FIG. 1, un sistema de comunicación 10, tal como un sistema de teleconferencia 10, comprende un dispositivo de comunicación 12, actuando como un dispositivo de transmisión, y que tiene una entrada acoplada a los micrófonos 101, 103 para recibir señales de habla desde usuarios (no se muestran) del sistema de teleconferencia 10, un aparato de codificación 121 para codificar las señales de habla y parámetros asociados con las señales de habla en una secuencia de bits para transmisión sobre una pluralidad de tramas y un transmisor 13 para transmitir las tramas a un dispositivo de comunicación 14, que actúa como un dispositivo de recepción, a través de un enlace de comunicación 16. El dispositivo de comunicación de recepción 14 comprende un receptor 18 para recibir las señales codificadas desde el dispositivo de comunicación de transmisión 12, un aparato de descodificación 122 acoplado al receptor 18 para descodificar las señales codificadas para proporcionar señales de habla descodificadas y parámetros asociados con las señales de habla y para procesar las señales de habla descodificadas de acuerdo con los parámetros para proporcionar a un usuario (o usuarios) del dispositivo de comunicación de recepción 14 en una salida 20 (tal como un par de altavoces que pueden ser parte del dispositivo de comunicación 14 como se muestra en la FIG. 1 o separado del dispositivo) una recreación de las señales de habla originales proporcionadas a los micrófonos 101, 103. Como será evidente a una persona experta, solamente aquellos componentes funcionales de los dispositivos de comunicación 12, 14 que son necesarios para una comprensión de la revelación se ha mostrado y se describirá.... [Seguir leyendo]
Reivindicaciones:
1. Un aparato de codificación de señales de audio para codificar al menos un parámetro de señal de audio asociado con una fuente de señal para transmisión sobre k tramas de una secuencia de bits codificada a un descodificador, el aparato que comprende:
un procesador configurado en operación para:
asignar un patrón de bits predeterminado a n bits asociados con el al menos un parámetro de señal de audio de una primera trama de k tramas, el patrón de bits predeterminado que indica un inicio del al menos un parámetro de señal de audio; y
fijar los n bits asociados con el al menos un parámetro de señal de audio de cada una de las k-1 tramas posteriores a valores, de manera que los valores de los n bits de las k-1 tramas posteriores representan el al menos un parámetro de señal de audio.
2. El aparato de acuerdo con la reivindicación 1, en el que los valores de los n bits en cada una de las k-1 tramas posteriores se seleccionan para ser diferentes a los valores de los n bits del patrón de bits predeterminado.
3. El aparato de acuerdo con la reivindicación 1, en el que los valores de los n bits de la trama que sigue la primera trama representa un dígito menos significativo o más significativo del al menos un parámetro de señal de audio.
4. El aparato de acuerdo con la reivindicación 1, en el que el al menos un parámetro de señal de audio tiene un valor en una gama predeterminada.
5. El aparato de acuerdo con la reivindicación 1, en el que el al menos un parámetro de señal de audio está codificado dentro de (2n-1) (k-1) valores proporcionados por los n bits de las k-1 tramas.
6. El aparato de acuerdo con la reivindicación 1, en el que el al menos un parámetro de señal de audio tiene un valor en una gama predeterminada y los n bits de las k-1 tramas proporcionan (2n-1) (k-1) valores que cubren la gama predeterminada y que incluyen valores que caen fuera de la gama predeterminada.
7. El aparato de acuerdo con la reivindicación 1, en el que el al menos un parámetro de señal de audio incluye una pluralidad de parámetros.
8. El aparato de acuerdo con la reivindicación 7, en el que la pluralidad de parámetros está codificada dentro de (2n-1) (k-1) valores proporcionados por los n bits de las k-1 tramas.
9. El aparato de acuerdo con la reivindicación 1, en el que el al menos un parámetro de señal de audio incluye al menos uno de los parámetros siguientes: parámetro de retardo estéreo, parámetro de identificación de fuente de señal, parámetro de descripción de función de transferencia relacionada con la cabeza (HRTF) , parámetro de descripción de reverberación de sala, parámetro de medida de relación señal a ruido local, y parámetro de sello de tiempo.
10. Un método para codificar al menos un parámetro de señal de audio asociado con una fuente de señal para transmisión sobre k tramas de una secuencia de bits codificada a un descodificador de señal de audio, el método que comprende:
asignar un patrón de bits predeterminado a n bits asociados con el al menos un parámetro de señal de audio de una primera trama de k tramas, el patrón de bits predeterminado que indica un inicio del al menos un parámetro de señal de audio;
fijar los n bits asociados con el al menos un parámetro de señal de audio de cada una de las k-1 tramas posteriores a valores, de manera que los valores de los n bits de las k-1 tramas posteriores representan el al menos un parámetro de señal de audio.
11. El método de acuerdo con la reivindicación 10, en el que los valores de los n bits en cada una de las k-1 tramas posteriores se seleccionan para ser diferentes a los valores de los n bits del patrón de bits predeterminado.
12. El método de acuerdo con la reivindicación 10, en el que el al menos un parámetro de señal de audio tiene un valor en una gama predeterminada.
13. El método de acuerdo con la reivindicación 10, en el que el al menos un parámetro de señal de audio está codificado dentro de (2n-1) (k-1) valores proporcionados por los n bits de las k-1 tramas.
14. El método de acuerdo con la reivindicación 10, en el que el al menos un parámetro de señal de audio tiene un valor en una gama predeterminada y los n bits de las k-1 tramas proporcionan (2n-1) (k-1) valores que cubren la gama predeterminada y que incluyen valores que caen fuera de la gama predeterminada.
15. El método de acuerdo con la reivindicación 10, que además comprende transmitir el patrón de bits predeterminado y el al menos un parámetro de señal de audio asociado con la fuente de señal sobre las k tramas al descodificador.
16. El método de acuerdo con la reivindicación 15, en el que una transmisión de al menos un parámetro de señal de
audio se puede comenzar asíncronamente en cualquier trama transmitiendo el patrón de bits predeterminado en una primera trama de k tramas, seguido por k-1 tramas posteriores para representar el al menos un parámetro de señal de audio.
17. Un dispositivo de comunicación que comprende:
una entrada para recibir una señal desde una fuente de señal;
un codificador de audio de acuerdo con la reivindicación 1 configurado para codificar al menos un parámetro de señal de audio asociado con la fuente de señal para transmisión sobre k tramas de una secuencia de bits codificada con un descodificador,
el codificador de audio configurado para asignar un patrón de bits predeterminado a n bits asociados con el al menos un parámetro de señal de audio de una primera trama de k tramas, el patrón de bits predeterminado que indica un 15 inicio del al menos un parámetro de señal de audio;
el codificador de audio configurado para fijar los n bits asociados con el al menos un parámetro de señal de audio de cada una de las k-1 tramas posteriores a valores, de manera que los valores de los n bits de las k-1 tramas posteriores representan el al menos un parámetro de señal de audio; y
un transmisor para transmitir el patrón de bits predeterminado y el al menos un parámetro de señal de audio 20 asociado con la fuente de señal sobre las k tramas del descodificador.
18. El dispositivo de comunicación de la reivindicación 17, en el que la fuente de señal es una fuente de habla y el dispositivo de comunicación además comprende un codificador de habla para codificar una señal de habla recibida desde la fuente de habla, en el que el transmisor se dispone además para transmitir la señal de habla codificada al descodificador.
Patentes similares o relacionadas:
Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]
Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]
Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]
Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]
Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]
Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]
Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]
Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]