SINTESIS DE SEÑAL DE AUDIO.

Dispositivo (20) de síntesis de señal para sintetizar una señal (r'') de audio,

comprendiendo el dispositivo:

- una unidad (23) de síntesis sinusoidal para sintetizar la señal (r'') de audio usando al menos un parámetro (f) de frecuencia que representa una frecuencia de la señal de audio y al menos un parámetro (fi'') de fase que representa una fase de la señal de audio, y caracterizado porque comprende

- una unidad (22) de producción de parámetro para producir el parámetro (fi'') de fase usando el parámetro (f) de frecuencia y una versión retardada de la señal (r'') de audio, en el que la señal (r'') de audio sintetizada comprende segmentos de tiempo, y en el que la unidad (22) de producción de parámetro está dispuesta para producir el parámetro (fi'') de fase actual usando el segmento de tiempo anterior de la señal (r'') de audio

Tipo: Resumen de patente/invención. Número de Solicitud: W06052291IB.

Solicitante: KONINKLIJKE PHILIPS ELECTRONICS N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: GROENEWOUDSEWEG 1,5621 BA EINDHOVEN.

Inventor/es: DEN BRINKER, ALBERTUS, C., SLUIJTER,ROBERT J.

Fecha de Publicación: .

Fecha Concesión Europea: 16 de Septiembre de 2009.

Clasificación Internacional de Patentes:

  • G10L13/02E
  • G10L19/08S

Clasificación PCT:

  • G10L19/08 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Determinación o codificación de la función de excitación; Determinación de los parámetros de predicción a largo plazo.
SINTESIS DE SEÑAL DE AUDIO.

Fragmento de la descripción:

Síntesis de señal de audio.

La presente invención se refiere a la síntesis de señal de audio. Más en particular, la presente invención se refiere a un dispositivo y a un procedimiento de síntesis de señal de audio en los que se determina la fase de la señal sintetizada. La presente invención se refiere además a un dispositivo y a un procedimiento para modificar la frecuencia de una señal de audio, dispositivo que comprende el dispositivo o el procedimiento de síntesis de señal de audio mencionados anteriormente.

Se conoce ampliamente la síntesis de señales de audio usando parámetros de señal, tales como una frecuencia y una fase. La síntesis puede llevarse a cabo para generar señales de sonido en un instrumento musical electrónico u otro dispositivo de consumo, tal como un teléfono móvil (celular). Alternativamente, la síntesis puede llevarse a cabo mediante un decodificador para decodificar una señal de audio codificada previamente. Un ejemplo de un procedimiento de codificación es la codificación paramétrica, en la que una señal de audio se descompone, por cada segmento de tiempo, en componentes sinusoidales, componentes de ruido y componentes opcionales adicionales, que pueden representarse cada una mediante parámetros adecuados. En un decodificador adecuado, los parámetros se usan para reconstruir sustancialmente la señal de audio original.

El artículo de Edler et al, "ASAC- Analysis/Synthesis Audio Codec dir very Low Bit Rates" preimpresiones de documentos presentados en la Convención de la AES, 11 de mayo de 1996, páginas 1-15, XP 001062332 da a conocer un ejemplo de un codec para codificar señales de audio a tasas de bits muy bajas.

La solicitud de patente estadounidense US2002/052736 da a conocer un ejemplo de un codificador de habla de armónicos-ruido y un algoritmo de codificación de una señal mixta de sonido sonoro/sordo usando un modelo armónico.

El artículo "Parametric Coding for High-Quality Audio" de A.C. den Brinker, E.G.P. Schuijers y A.W.J. Oomen, artículo 5554 de la convención de la Audio Engineering Society, Munich (Alemania), mayo de 2002, da a conocer el uso de pistas sinusoidales en la codificación paramétrica. Se modela una señal de audio usando objetos transitorios, objetos sinusoidales y objetos de ruido. Los parámetros de los objetos sinusoidales se estiman por cada trama de tiempo. Las frecuencias estimadas por cada trama se enlazan a lo largo de las tramas, por lo que se forman pistas sinusoidales. Estas pistas indican qué objetos sinusoidales de una trama de tiempo continúan en la siguiente trama de tiempo.

La solicitud de patente internacional WO 02/056298 (Philips) da a conocer el enlace de los componentes de señal en la codificación paramétrica. Una unidad de enlace genera información de enlace indicando los componentes de segmentos de señal extendidos consecutivos que pueden enlazarse entre sí para formar una pista sinusoidal.

Aunque estos procedimientos conocidos proporcionan resultados satisfactorios, tienen la desventaja de que el enlace de sinusoides a través de límites de trama de tiempo puede introducir errores de fase. Si una sinusoide de una cierta trama de tiempo se enlaza con la sinusoide errónea de la trama de tiempo siguiente, normalmente dará como resultado un desajuste de fase. Este desajuste de fase producirá una distorsión audible de la señal de audio sintetizada.

Por tanto, es un objeto de la presente invención superar éstos y otros problemas de la técnica anterior y proporcionar un dispositivo según la reivindicación 1 y un procedimiento según la reivindicación 15 de síntesis de señales de audio en los que se eviten las discontinuidades de fase o al menos se reduzcan significativamente.

Por consiguiente, la presente invención proporciona un dispositivo de síntesis de señal para sintetizar una señal de audio, comprendiendo el dispositivo:

    - una unidad de síntesis sinusoidal para sintetizar la señal de audio usando al menos un parámetro de frecuencia que representa una frecuencia de la señal de audio y al menos un parámetro de fase que representa una fase de la señal de audio, y
    - una unidad de producción de parámetro para producir el (al menos un) parámetro de fase usando el (al menos un) parámetro de frecuencia y una versión retardada de la señal de audio sintetizada.

Mediante la producción de la fase usando la señal de audio ya sintetizada, se usa un bucle de fase que puede proporcionar una fase sustancialmente continua. Más en particular, la fase usada en la unidad de síntesis sinusoidal se deriva de la señal de audio sintetizada y por tanto puede ajustarse apropiadamente con la señal de audio. Como resultado, la predicción de fase se mejora significativamente y por tanto se reduce drásticamente el número de errores en la predicción de fase. Preferiblemente se tiene en cuenta cualquier retardo de tiempo implicado en el bucle.

En el dispositivo de la presente invención, puede eliminarse la unidad de enlace convencional para enlazar componentes de señal de segmentos consecutivos, evitándose así cualquier desajuste de fase producido por tales unidades de enlace.

La señal de audio sintetizada comprende segmentos de tiempo, y la unidad de producción de parámetro está dispuesta para producir el parámetro de fase actual usando un segmento de tiempo anterior de la señal de audio. La fase de un segmento que esta sintetizándose se deriva de la fase de un segmento sintetizado anteriormente, preferiblemente el segmento inmediatamente anterior. De esta forma, se mantiene una estrecha relación entre la fase de la señal de audio sintetizada y la fase de la señal de audio que se está sintetizando.

Además se prefiere que la unidad de producción de parámetro comprenda una unidad de determinación de fase dispuesta para determinar un conjunto de pares de fase/frecuencia, representando cada par de fase/frecuencia la fase de una frecuencia de la señal de audio. En esta realización, un conjunto de fases y sus frecuencias asociadas se deriva de la señal de audio sintetizada.

Ventajosamente, la unidad de producción de parámetro puede comprender además una unidad de predicción de fase dispuesta para:

    - comparar el parámetro de frecuencia con el conjunto de pares de fase/frecuencia y seleccionar el par de fase/frecuencia más próximo al parámetro de frecuencia, y
    - producir el parámetro de fase usando el parámetro de frecuencia y la fase seleccionada.

Por consiguiente, la unidad de producción de parámetro puede seleccionar la frecuencia que mejor se ajusta a la frecuencia representada por el parámetro de frecuencia, y entonces usar la fase asociada con la frecuencia seleccionada en la síntesis. Esta selección puede llevarse a cabo varias veces, preferiblemente una vez para cada frecuencia, si se usan múltiples frecuencias para sintetizar la señal de audio.

La señal de audio sintetizada puede tener la frecuencia (o frecuencias) representada(s) por el parámetro de frecuencia. Sin embargo, también puede desearse modificar esta frecuencia (o estas frecuencias). Por consiguiente, en una realización ventajosa, la unidad de producción de parámetro comprende una unidad de modificación de frecuencia para modificar el parámetro de frecuencia en respuesta a un parámetro de control. Este parámetro de control (frecuencia) puede ser, por ejemplo, un factor de multiplicación, un valor de 1 que no se corresponde con ningún cambio de frecuencia, un valor inferior a 1 que se corresponde con una frecuencia disminuida y un valor superior a 1 que se corresponde con una frecuencia aumentada. En otras realizaciones, el parámetro de control puede indicar una desviación de la frecuencia.

Aunque la presente invención puede ponerse en práctica usando únicamente un parámetro (o parámetros) de frecuencia y un parámetro (o parámetros) de fase, se prefiere usar parámetros adicionales para definir adicionalmente la señal de audio que va a sintetizarse. Por consiguiente, la unidad de síntesis sinusoidal puede usar adicionalmente un parámetro de amplitud. De manera adicional, o alternativa, el dispositivo de la presente invención puede comprender además una unidad de multiplicación para multiplicar la señal de audio sintetizada por un parámetro de ganancia.

Si la señal de audio sintetizada se compone de segmentos de tiempo (tramas de tiempo), resulta ventajoso cuando el dispositivo comprende...

 


Reivindicaciones:

1. Dispositivo (20) de síntesis de señal para sintetizar una señal (r') de audio, comprendiendo el dispositivo:

    - una unidad (23) de síntesis sinusoidal para sintetizar la señal (r') de audio usando al menos un parámetro (f) de frecuencia que representa una frecuencia de la señal de audio y al menos un parámetro (f') de fase que representa una fase de la señal de audio, y caracterizado porque comprende
    - una unidad (22) de producción de parámetro para producir el parámetro (f') de fase usando el parámetro (f) de frecuencia y una versión retardada de la señal (r') de audio, en el que la señal (r') de audio sintetizada comprende segmentos de tiempo, y en el que la unidad (22) de producción de parámetro está dispuesta para producir el parámetro (f') de fase actual usando el segmento de tiempo anterior de la señal (r') de audio.

2. Dispositivo según la reivindicación 1, en el que la unidad (22) de producción de parámetro comprende una unidad (21') de determinación de fase dispuesta para determinar un conjunto de pares de fase/frecuencia, representando cada par de fase/frecuencia la fase de cada frecuencia de la señal (r') de audio.

3. Dispositivo según la reivindicación 2, en el que la unidad (22) de producción de parámetro comprende además una unidad (28) de predicción de fase dispuesta para:

    - comparar el parámetro (f) de frecuencia con el conjunto de pares de fase/frecuencia y seleccionar el par de fase/frecuencia más próximo al parámetro (f) de frecuencia, y
    - producir el parámetro (f') de fase usando el parámetro (f) de frecuencia y la fase seleccionada.

4. Dispositivo según la reivindicación 1, en el que la unidad (22) de producción de parámetro comprende una unidad (27) de modificación de frecuencia para modificar el parámetro (f) de frecuencia en respuesta a un parámetro (C) de control.

5. Dispositivo según la reivindicación 1, en el que la unidad (23) de síntesis sinusoidal usa adicionalmente un parámetro (A) de amplitud.

6. Dispositivo según la reivindicación 1, que comprende además una unidad (24) de control de ganancia para multiplicar la señal (r') de audio sintetizada por un parámetro (G) de ganancia.

7. Dispositivo según la reivindicación 1, que comprende además una unidad (21) de análisis sinusoidal para recibir una señal (r) de audio de entrada y producir un parámetro (f) de frecuencia y un parámetro (f) de fase.

8. Dispositivo según la reivindicación 7, que comprende además:

    - una unidad (23') de síntesis sinusoidal adicional para producir una señal de audio sintetizada, y
    - una unidad (26) de comparación para comparar la señal de audio sintetizada y la señal de audio de entrada para producir un parámetro (G) de ganancia.

9. Dispositivo según la reivindicación 1, que comprende además una unidad (25) de segmentación para dividir la señal (r) de audio en segmentos de tiempo.

10. Dispositivo según la reivindicación 1, que comprende además una unidad (25') de solapamiento y adición para unir los segmentos de tiempo de la señal (r') de audio sintetizada.

11. Dispositivo según las reivindicaciones 9 y 10, en el que la unidad (25) de segmentación está controlada por un primer parámetro (updin) de solapamiento y en el que la unidad (25') de solapamiento y adición está controlada por un segundo parámetro (updout) de solapamiento, y en el que el dispositivo está dispuesto para el ajuste a escala en tiempo variando los parámetros (updin, updout) de solapamiento.

12. Dispositivo (1) de conversión de habla, que comprende:

    - una unidad (10) de análisis de predicción lineal para producir parámetros (p) de predicción y una señal (r) residual en respuesta a una señal (x) de habla de entrada,
    - una unidad (20) de adaptación de altura tonal para adaptar la altura tonal de la señal (r) residual para producir una señal (r') residual con altura tonal adaptada, y
    - una unidad (30) de síntesis de predicción lineal para sintetizar una señal (y) de habla de salida en respuesta a la señal (r') residual con altura tonal adaptada,

en el que la unidad (20) de adaptación de altura tonal comprende un dispositivo según la reivindicación 5.

13. Dispositivo de conversión de habla según la reivindicación 12, que comprende además una unidad (40) de modificación para modificar los parámetros de predicción.

14. Sistema de audio, que comprende un dispositivo según la reivindicación 1.

15. Decodificador (5) de señal de audio, que comprende un dispositivo según la reivindicación 1.

16. Procedimiento de síntesis de una señal (r') de audio, comprendiendo el procedimiento las etapas de:

    - sintetizar la señal (r') de audio usando al menos un parámetro (f) de frecuencia que representa una frecuencia de la señal de audio y al menos un parámetro (f') de fase que representa una fase de la señal de audio, y caracterizado porque comprende:
    - producir el parámetro (f') de fase usando el parámetro (f) de frecuencia y una versión retardada de la señal (r') de audio, en el que la señal (r') de audio sintetizada comprende segmentos de tiempo, y en el que la unidad (22) de producción de parámetro está dispuesta para producir el parámetro (f') de fase actual usando el segmento de tiempo anterior de la señal (r') de audio.

17. Procedimiento según la reivindicación 16, en el que la etapa de predicción de fase comprende las subetapas de determinar un conjunto de pares de fase/frecuencia, representando cada par de fase/frecuencia la fase de cada frecuencia de la señal (r') de audio.

18. Procedimiento según la reivindicación 17, en el que la etapa de predicción de fase comprende además las subetapas de:

    - comparar el parámetro (f) de frecuencia con el conjunto de pares de fase/frecuencia y seleccionar el par de fase/frecuencia más próximo al parámetro (f) de frecuencia, y
    - producir el parámetro (f') de fase usando el parámetro (f) de frecuencia y la fase seleccionada.

19. Procedimiento según la reivindicación 16, en el que la etapa de predicción de fase comprende la subetapa de modificar el parámetro (f) de frecuencia en respuesta a un parámetro (C) de control.

20. Procedimiento de conversión de habla, que comprende las etapas de:

    - producir parámetros (p) de predicción y una señal (r) residual en respuesta a una señal (x) de habla de entrada,
    - adaptar la altura tonal de la señal (r) residual para producir una señal (r') residual con altura tonal adaptada, y
    - sintetizar una señal (y) de habla de salida en respuesta a la señal (r') residual con altura tonal adaptada,

en el que la etapa de adaptación de la altura tonal comprende una subetapa de cambiar la frecuencia de una señal de audio según la reivindicación 19.

21. Procedimiento según la reivindicación 16 ó 20, que comprende además la etapa de ajustar a escala en tiempo.

22. Producto de programa informático que comprende instrucciones que, cuando se ejecutan en un ordenador, harán que dicho ordenador realice el procedimiento de las reivindicaciones 16 ó 20.


 

Patentes similares o relacionadas:

Imagen de 'DISPOSITIVO Y PROCEDIMIENTO DE EDICIÓN DIFERENCIADA DE VOZ'DISPOSITIVO Y PROCEDIMIENTO DE EDICIÓN DIFERENCIADA DE VOZ, del 28 de Abril de 2011, de BAYERISCHE MOTOREN WERKE AKTIENGESELLSCHAFT: Dispositivo de edición diferenciada de voz que puede unirse con un primer sistema y al menos con otro sistema (32, 33 a 3N), estando asociada a […]

Imagen de 'DIFERENCIACION DEL HABLA'DIFERENCIACION DEL HABLA, del 18 de Mayo de 2010, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Procedimiento para la diferenciación entre tres o más voces, comprendiendo el procedimiento las etapas de 1) analizar propiedades de señal de cada […]

Imagen de 'PROCEDIMIENTO Y SISTEMA DE DIALOGO DE VOZ'PROCEDIMIENTO Y SISTEMA DE DIALOGO DE VOZ, del 14 de Diciembre de 2009, de MOTOROLA, INC.: Un método para diálogo de voz, incluyendo: recibir una frase vocal que incluye una frase de petición que incluye una variable instanciada; […]

Imagen de 'CODIFICACION DE AUDIO'CODIFICACION DE AUDIO, del 30 de Abril de 2010, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Procedimiento para codificar una señal de audio, comprendiendo el procedimiento las etapas de: - proporcionar un conjunto respectivo de valores (x(t)) de señal muestreados para […]

Método de codificación de impulsos de las señales de excitación, del 29 de Julio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal de voz, que comprende: la obtención de la distribución de impulsos de la señal de voz, en una pista, de los impulsos a codificarse […]

Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda, del 24 de Junio de 2020, de Crystal Clear Codec, LLC: Un método para predecir una señal de banda de frecuencia de extensión del ancho de banda, que comprende: demultiplexación de un flujo de bits recibido y […]

Mejora del contenido insonoro para decodificador CELP de tasa baja, del 17 de Junio de 2020, de VoiceAge EVS LLC: Un dispositivo para modificar, durante la decodificación de una señal de sonido, una síntesis de una excitación de dominio de tiempo decodificada […]

Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo, del 29 de Abril de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un decodificador de audio para proporcionar una información de audio decodificada en base a una información de audio codificada , comprendiendo […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .