Dispositivo y procedimiento para sincronizar datos adicionales y datos de base.

Aparato para sincronizar datos adicionales y datos de base, en el que los datos adicionales y los datos de base tienen desarrollos temporales definidos, presentan información de audio o vídeo y comprenden información de datos que puede reproducirse conjuntamente, con las siguientes características:

un dispositivo

(10) para facilitar una huella digital de prueba de datos de prueba que se refiere a un instante de prueba de los datos de prueba, en el que los datos de prueba son los datos adicionales o los datos de base, o los datos de prueba dependen de los datos adicionales o los datos de base;

un dispositivo (11) para determinar, utilizando la huella digital de prueba, información del instante de referencia (tx, SD) que depende de un instante de referencia en los datos de referencia, siendo los datos de referencia datos de los que no procede la huella digital de prueba; y

un dispositivo (12) para manipular los datos adicionales o los datos de base utilizando la información del instante de referencia e información del instante de prueba (tv) que depende del instante de prueba para obtener datos manipulados, estando configurado el dispositivo (12) de manipulación para manipular los datos adicionales o los datos de base de modo que pueda realizarse una reproducción sincrónica de la información de los datos basándose en los datos manipulados, y estando configurado el dispositivo (12) de manipulación para realizar una compresión / expansión temporal, un corte al comienzo temporal o al final temporal de los datos o una generación de datos al comienzo temporal o al final temporal de los datos para obtener los datos manipulados.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2005/010329.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: HELLMUTH, OLIVER, HERRE,JUERGEN, GEYERSBERGER,STEFAN, HOELZER,ANDREAS.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION G — FISICA > REGISTRO DE LA INFORMACION > REGISTRO DE LA INFORMACION BASADO EN UN MOVIMIENTO... > G11B27/00 (Montaje; Indexación; Direccionamiento; Temporización o sincronización; Monitorización; Medida del avance de una cinta)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > SISTEMAS ESTEREOFONICOS > H04S3/00 (Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad))
  • SECCION G — FISICA > METROLOGIA; ENSAYOS > MEDIDA DE FUERZAS, TENSIONES, PARES, TRABAJO, POTENCIA... > G01L19/00 (Detalles o accesorios de aparatos para la medida de la presión permanente o cuasi-permanente de un medio fluyente en la medida en que estos detalles o accesorios no son especiales de los tipos particulares de manómetros)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/008 (Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p.ej. estéreo conjunto, codificación de la intensidad o matrizado)

PDF original: ES-2537302_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Dispositivo y procedimiento para sincronizar datos adicionales y datos de base

[1] La presente invención se refiere al tratamiento de datos multimedia y, en especial, a la adición sincrónica, en especial, de información adicional de audio a datos de base de audio.

[2] Tecnologías que están en este momento en desarrollo y también tecnologías futuras permiten un almacenamiento cada vez más eficaz de señales de audio o señales de vídeo, pero también posibilitan disfrutar más

de la experiencia auditiva o visual gracias a ampliaciones tales como, por ejemplo, el empleo de la técnica multicanal. Este tipo de ampliaciones pueden almacenarse en nuevos formatos de archivo y facilitarse al usuario junto con los datos de base de audio que, por ejemplo, pueden ser una señal de audio mono o estéreo. Los datos de ampliación pueden ser, por ejemplo, información adicional multicanal. Esto significa que tanto los datos de base de audio como también los datos de ampliación se incluyen en un flujo de datos común o un archivo.

[3] Sin embargo, al mismo tiempo también es interesante que un usuario que ya posee una versión en estéreo de una señal de audio obtenga solo una ampliación, a saber, el sonido multicanal, y añada posteriormente la señal de audio que ya posee o el archivo correspondiente. Especialmente esta vahante tiene diferentes ventajas. Así, no tienen que transmitirse datos innecesarios con los que en todo caso ya cuenta el usuario. En especial, en un

escenario en el que un proveedor de servicios factura su servicio en función de la cantidad de datos transmitidos por su red, un usuario puede conseguir un considerable ahorro de costes dado que recibe el menor número de datos posible a través de una red.

[4] De esta manera, un usuario, por ejemplo, posee un CD en estéreo y dispone del canal Izquierdo y 25 derecho de una determinada composición musical. Con el surgimiento de la técnica multicanal, por ejemplo, la

técnica 5.1, ahora el usuario puede desear no solo reproducir su CD en estéreo en su nuevo sistema de sonido envolvente (surround) sino también tener y reproducir una versión de 5 canales de su CD en estéreo. En este caso, sería suficiente con transmitir al usuario, que ya cuenta con el canal izquierdo y el canal derecho, solamente el canal surround izquierdo, el canal surround derecho y el canal central. En el escenario descrito en el que se factura en 3 función de la cantidad de datos transmitidos, un usuario se ahorraría el 4% de la cantidad de datos si solo solicitara que se le enviaran 3 canales, en lugar de 5 canales.

[5] Además, posiblemente la adquisición de los datos de ampliación resulta económicamente más atractiva para el usuario dado que no tiene que volver a pagar por datos de base de audio que ya tiene. Así, una

productora de discos que ya ha vendido un CD en estéreo podría ofrecer como servicio adicional a sus clientes la ampliación "surround" a un precio más barato que la versión completa en 5 canales de una composición musical.

[6] No obstante, el uso de datos adicionales para datos ya existentes también puede ser de gran interés para otras aplicaciones diferentes. En especial en el área de los datos de audio / vídeo escalables podrían existir

datos adicionales en una capa de escalamiento superior. En el concepto de escalabllldad conocido en la técnica existe, por ejemplo, una capa de escalamiento de base de una pieza de audio que comprende la señal de audio hasta un determinado ancho de banda, tal como, por ejemplo, 8 kHz. Un aparato reproductor que, por ejemplo, solo pueda reproducir este ancho de banda máximo de 8 kHz, se utiliza ya a pleno rendimiento con este tipo de datos. El aparato de reproducción podría ser, por ejemplo, un reproductor que no dispone de un altavoz especialmente 45 adecuado para banda ancha. Del mismo modo, la banda de dicha señal también podría estar limitada hacia bajo de modo que el reproductor no podría reproducir ningún sonido por debajo de, por ejemplo, 5 Hz. La siguiente capa de escalamiento superior podría ser el ancho de banda que falta hacia abajo y / o el ancho de banda que falta hacia arriba, tal como, por ejemplo, el ancho de banda de 2 Hz - 5 Hz y el ancho de banda de 8 kHz - 16 kHz. Esta primera capa de escalamiento habría de combinarse entonces con la señal de audio original, cuyo ancho de banda 5 se sitúa entre 5 Hz y 8 kHz, para obtener una señal de audio de banda ancha que después puede reproducirse mediante un aparato de reproducción de banda ancha. También esta variante de capa de escalamiento podría ser facilitada por un proveedor de modo que la primera capa de escalamiento le costara menos a un usuario que la señal de audio de banda ancha ya que el usuario ya habría adquirido previamente con unos ciertos costes la señal de audio "de banda estrecha".

[7] Otros datos de ampliación consisten en datos de vídeo en los que la capa básica suministra una secuencia de vídeo con una determinada resolución, mientras que la siguiente capa de escalamiento suministra datos de vídeo que ya tienen en sí mismos una resolución superior o que, cuando se combinan con los datos de vídeo originales, dan como resultado una secuencia de vídeo con mayor resolución. Un escenario de este tipo se da

cuando un usuario solo dispone de un aparato de reproducción de vídeo con una reducida resolución y después recibe un aparato de reproducción de vídeo de mayor resolución y desea ver sus vídeos "antiguos" con la mayor resolución que su nuevo aparato permite.

[8] Otros datos de ampliación consisten también en lo que se denomina "datos SBR" (Spectral Band Replication = replicación de banda espectral). En la conocida técnica SBR, un codificador, basándose en una reducida tasa de transferencia de datos de partida disponible, solo genera una señal de banda limitada que únicamente se extiende hasta una frecuencia límite máxima de, por ejemplo, 4 o 6 kHz. Los datos para la banda alta que falta ya no se codifican como valores de muestreo de audio o valores espectrales de audio sino como datos 1 paramétrlcos. En la técnica SBR, estos datos son información de datos paramétricos sobre la envolvente espectral (Spectral Envelope). Un decodificador SBR copiará entonces valores espectrales desde la banda disponible a una banda más alta y, con ello, fijará una estructura espectral precisa de la banda más alta, mientras que la estructura espectral menos precisa, es decir, la envolvente espectral, se determina mediante los datos adicionales paramétricos. Por tanto, en función de la implementación, un usuario podría complementar los datos de audio 15 codificados o no codificados de banda limitada que ya tiene basándose en los parámetros SBR transmitidos o basándose en valores de muestreo de audio temporales que solo comprenden la banda alta para, con ello, obtener una señal de audio de banda ancha.

[9] También en el caso de la técnica de reproducción de audio multicanal que presenta al menos 3 2 canales de reproducción, tales como, por ejemplo, izquierdo, derecho y central, se emplean cada vez más técnicas

paramétricas que también se conocen por el término "técnica BCC (Binaural Cue Coding = codificación de indicación binaural)". En la técnica BBC se utilizan uno o dos canales de base para, utilizando datos adicionales paramétricos, generar el número que en principio se desee de canales de reproducción, tales como, por ejemplo, 5 canales, en la técnica de reproducción de sonido envolvente. Los datos paramétricos son en este caso diferencias de nivel entre 25 canales (ICLD = Ínter channel level differences), diferencias temporales entre canales (ICTD = ínter channel time differences) o información de coherencia entre canales (ICC = ínter channel coherence).

... [Seguir leyendo]

 


Reivindicaciones:

1. Aparato para sincronizar datos adicionales y datos de base, en el que los datos adicionales y los datos de base tienen desarrollos temporales definidos, presentan información de audio o vídeo y comprenden información

de datos que puede reproducirse conjuntamente, con las siguientes características:

un dispositivo (1) para facilitar una huella digital de prueba de datos de prueba que se refiere a un instante de prueba de los datos de prueba, en el que los datos de prueba son los datos adicionales o los datos de base, o los datos de prueba dependen de los datos adicionales o los datos de base;

un dispositivo (11) para determinar, utilizando la huella digital de prueba, información del instante de referencia (tx, SD) que depende de un instante de referencia en los datos de referencia, siendo los datos de referencia datos de los que no procede la huella digital de prueba; y

un dispositivo (12) para manipular los datos adicionales o los datos de base utilizando la información del instante de referencia e información del instante de prueba (tv) que depende del instante de prueba para obtener datos manipulados, estando configurado el dispositivo (12) de manipulación para manipular los datos adicionales o los datos de base de modo que pueda realizarse una reproducción sincrónica de la información de los datos basándose en los datos manipulados, y estando configurado el dispositivo (12) de manipulación para realizar una compresión / 2 expansión temporal, un corte al comienzo temporal o al final temporal de los datos o una generación de datos al comienzo temporal o al final temporal de los datos para obtener los datos manipulados.

2. Aparato según la reivindicación 1, en el que la huella digital de prueba está configurada de modo que tiene un desarrollo temporal que está relacionado con el desarrollo temporal de los datos de los que esta se ha

derivado, y en el que el dispositivo (11) de determinación está configurado para obtener una huella digital de referencia a partir de los datos de referencia, teniendo la huella digital de referencia un desarrollo temporal que depende del desarrollo temporal de los datos de referencia, y en el que el dispositivo (11) de determinación está configurado adicionalmente para correlacionar la huella digital de prueba con la huella digital de referencia para diferentes desfases temporales de la huella digital de prueba y la huella digital de referencia, y para determinar un 3 desfase temporal asociado como información del instante de referencia cuando existe una correspondencia máxima entre la huella digital de referencia y la huella digital de prueba.

3. Aparato según la reivindicación 2, en el que la huella digital de prueba incluye una longitud temporal de la señal de prueba que es menor que una longitud temporal de la señal de referencia comprendida por la huella

digital de referencia.

4. Aparato según una de las reivindicaciones precedentes, en el que los datos de base son datos de audio, en el que los datos adicionales son datos de audio temporales o datos de audio paramétricos que se refieren a los datos de base, en el que el dispositivo (1) de facilitación está configurado para facilitar la huella digital de

prueba que se ha derivado de los datos adicionales, en el que el dispositivo (11) de determinación está configurado para determinar la información del instante de referencia utilizando una huella digital de referencia de los datos de base, y en el que el dispositivo (12) de manipulación está configurado para manipular los datos adicionales para obtener los datos manipulados.

5. Aparato según una de las reivindicaciones precedentes, en el que los datos adicionales comprenden

canales adicionales, no incluidos en los datos de base, en forma de valores de muestreo temporales o información paramétrica, tal como, por ejemplo, parámetros BCC, datos de parámetros ICLD, ICTD o ICC, datos de banda que se refieren a una banda de frecuencias reducida o no presente en los datos de base, una capa de escalamiento superior a un orden de capa de escalamiento de los datos de base o datos de mejora de la calidad para mejorar una 5 parte seleccionada de los datos de base.

6. Aparato según una de las reivindicaciones precedentes, en el que los datos de base representan una

versión real de una señal de audio, en el que el dispositivo (11) de determinación está configurado para obtener una huella digital de prueba de una versión ideal de la señal de audio a la que están asociados los datos adicionales, 55 habiendo sido utilizada dicha versión ideal para generar los datos adicionales, siendo dichos datos adicionales datos de ampliación multicanal; en el que el dispositivo (12) de manipulación está configurado para manipular los datos adicionales de modo que estos se asocien a la versión real de la señal de audio representada por los datos de base (1) reales, encontrándose dicha versión real en posesión de un usuario y habiendo sido alterada respecto a la versión Ideal.

7. Aparato según una de las reivindicaciones precedentes, en el que el dispositivo (1) de facilitación está configurado para facilitar una huella digital de prueba adicional que se refiere a un instante de prueba adicional separado del instante de prueba una distancia temporal predeterminada, en el que el dispositivo (11) de

determinación está configurado para determinar información de instante de referencia adicional utilizando la huella digital de prueba adicional, presentando el instante de referencia adicional una distancia de referencia temporal respecto al instante de referencia, en el que el dispositivo (12) de manipulación está configurado para calcular un factor de compresión / expansión basándose en la distancia de prueba y la distancia de referencia y para expandir o comprimir temporalmente los datos adicionales o los datos de base utilizando dicho factor de compresión / 1 expansión.

8. Aparato según la reivindicación 7, en el que el dispositivo (12) de manipulación está configurado para calcular el factor de compresión / expansión del siguiente modo:

SD ATref/ ATprueba,

en el que ATprueba es una diferencia temporal entre el instante de prueba y el instante de prueba adicional, en el que ATref es una diferencia temporal entre un primer desfase de referencia Taff y un segundo desfase de referencia Tboff, en el que el primer desfase de referencia Taff se obtiene cuando la primera huella digital de prueba se correlaciona 2 con la señal de referencia, y en el que el segundo desfase de referencia Tboff se obtiene cuando la huella digital de prueba adicional se correlaciona con la señal de referencia.

9. Aparato según una de las reivindicaciones precedentes, en el que el dispositivo (11) de determinación está configurado para determinar un desfase de referencia temporal del instante de referencia en un comienzo

temporal de los datos de referencia como información de instante de referencia, y en el que el dispositivo de manipulación está configurado para eliminar de los datos adicionales o los datos de base una parte introductoria (A) al comienzo de los datos adicionales o los datos de base en función de un desfase de prueba entre el instante de prueba y un comienzo temporal de los datos de prueba y el desfase de referencia.

1. Aparato según la reivindicación 9, en el que el dispositivo (11) de determinación está configurado para

determinar un factor de compresión / expansión por el que se comprime / expande la señal de referencia en relación con una señal de la que se ha derivado la huella digital de prueba, y en el que el dispositivo (12) de manipulación está configurado para ponderar el desfase de prueba con el factor de compresión / expansión de modo que la parte introductoria dependa adicionalmente del factor de compresión / expansión.

11. Aparato según una de las reivindicaciones precedentes, en el que el dispositivo (12) de manipulación está configurado para eliminar una parte de eliminación (E) al final de los datos de base o los datos adicionales en función de una longitud temporal de los datos de base o los datos adicionales acortados o expandidos o comprimidos al comienzo.

12. Aparato de cliente (84) con las siguientes características: un aparato para sincronizar datos adicionales y datos de base, en el que los datos adicionales y los datos de base tienen desarrollos temporales definidos y comprenden información de datos que puede reproducirse conjuntamente, según la reivindicación 1, presentando el dispositivo (1) de facilitación un dispositivo para recibir la huella digital de prueba de los datos de

prueba.

13. Aparato de cliente según la reivindicación 12, en el que el dispositivo (12) de manipulación está configurado para manipular únicamente los datos adicionales, para obtener los datos manipulados, y para añadir los datos manipulados a los datos de base para obtener así un conjunto de datos resultante que incluye la información

de los datos.

14. Aparato de cliente según la reivindicación 12 y 13, que comprende además la siguiente característica: un aparato de reproducción (13) para reproducir la información de los datos utilizando los datos manipulados.

15. Procedimiento para sincronizar datos adicionales y datos de base, en el que los datos adicionales y

los datos de base tienen desarrollos temporales definidos, presentan información de audio y vídeo y comprenden información de los datos que puede reproducirse conjuntamente, con los siguientes pasos:

facilitar (1) una huella digital de prueba a partir de datos de prueba que se refiere a un instante de prueba de los

datos de prueba, en el que los datos de prueba son los datos adicionales o los datos de base, o los datos de prueba dependen de los datos adicionales o los datos de base;

determinar (11), utilizando la huella digital de prueba, Información del instante de referencia (tx, SD) que depende de 5 un Instante de referencia en los datos de referencia, siendo los datos de referencia datos de los que no procede la huella digital de prueba; y

manipular (12) los datos adicionales o los datos de base utilizando la Información del Instante de referencia e Información del Instante de prueba (tv) que depende del Instante de prueba para obtener datos manipulados que se 1 han manipulado de modo que, basándose en los datos manipulados, puede realizarse una reproducción sincrónica de la Información de los datos, comprendiendo la manipulación una compresión / expansión temporal, un corte en un comienzo temporal o un final temporal de los datos o una generación de datos en un comienzo temporal o un final temporal de los datos para obtener los datos manipulados.

16. Procedimiento para operar un aparato de cliente (84) con los siguientes pasos:

enviar (21) una huella digital de referencia de datos de base; y

un procedimiento para sincronizar datos adicionales y datos de base, en el que los datos adicionales y los datos de 2 base tienen desarrollos temporales definidos y comprenden información de los datos que puede reproducirse conjuntamente, según la reivindicación 15, comprendiendo el paso de facilitación la recepción de una huella digital de prueba de datos de prueba que se refiere a un instante de prueba de los datos de prueba, en el que los datos de prueba son los datos adicionales o los datos de base o dependen de los datos adicionales o los datos de base y de los datos adicionales que están asociados a los datos de base.

17. Programa informático con un código de programa para realizar el procedimiento según la

reivindicación 15 o 16 cuando el programa se ejecuta en un ordenador.