Dispositivo para determinar información para la alineación temporal de dos señales de información.

Dispositivo (110) para determinar información para la alineación temporal de una primera señal de información (sdeg(t)) y de una segunda señal de información (sref(t)),

que presentan para instantes de muestreo sucesivos en cada caso uno o varios valores de información, con

medios (120) de extracción de características para la extracción de características (Mi,j,deg) de una pluralidad de características por cada instante de muestreo o por cada subsecuencia de instantes de muestreo de los instantes de muestreo sucesivos a partir de la primera señal de información (sdeg(t)), para obtener por cada característica una primera evolución de característica (Mj,deg), que está subdividida en una secuencia de ventanas de tiempo de comparación, y para extraer las características (Mi,j,ref) por cada instante de muestreo o por cada subsecuencia de instantes de muestreo de los instantes de muestreo sucesivos a partir de la segunda señal de información (sref(t)), para obtener por cada característica una segunda evolución de característica (Mj,ref),

estando configurados los medios (120) de extracción de características para seleccionar por cada ventana de tiempo de comparación una característica con mayor probabilidad de éxito de búsqueda a partir de las características, que presenta propiedades de característica que, en comparación con propiedades de característica de las demás características, indican una mayor probabilidad de éxito de búsqueda en la búsqueda de la primera evolución de característica (Mj,deg; Mj,ref) en la respectiva ventana de tiempo de comparación en la segunda evolución de característica, y concretamente con o bien una amplitud de dispersión de la característica o bien una magnitud de un máximo de una medida de similitud entre la primera y la segunda evolución de característica de la característica como una medida de la probabilidad de éxito de búsqueda de la respectiva característica; y

medios (130) para determinar la información para la alineación temporal basándose en similitudes entre la primera (Mj,deg) y la segunda evolución de característica (Mj,ref) de la característica con mayor probabilidad de éxito de búsqueda mediante una búsqueda de la primera evolución de característica de la característica con mayor probabilidad de éxito de búsqueda en cada una de la pluralidad de ventanas de tiempo de comparación en la segunda evolución de característica de la característica con mayor probabilidad de éxito de búsqueda.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2007/008252.

Solicitante: OPTICOM GMBH.

Nacionalidad solicitante: Alemania.

Dirección: AM WEICHSELGARTEN 7 91058 ERLANGEN ALEMANIA.

Inventor/es: KEYHL, MICHAEL, SCHMIDMER, CHRISTIAN, BITTO,ROLAND.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • H04N17/00 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › Diagnóstico, prueba o medida, o sus detalles, para los sistemas de televisión.

PDF original: ES-2380643_T3.pdf

 

Dispositivo para determinar información para la alineación temporal de dos señales de información.

Fragmento de la descripción:

Dispositivo para determinar información para la alineación temporal de dos señales de información La presente invención se refiere a un concepto para determinar información para la alineación temporal de dos señales de información, en particular de una señal de información perturbada y una señal de información no perturbada, que por ejemplo puede utilizarse para realizar denominadas mediciones objetivas para la evaluación de calidad de señales.

Para la valoración de medición de la calidad de señales de audio o vídeo codificadas, en la actualidad se utilizan procedimientos de medición basados en percepción (perceptual measurement) normalizados. Procedimientos conocidos son por ejemplo el denominado procedimiento PESQ (PESQ = Perceptual Evaluation of Speech Quality = evaluación perceptual de calidad de voz) , que se describe en el documento de normalización ITU-T P.862. Otro procedimiento de medición conocido para la evaluación de calidad de señales de audio es el denominado procedimiento PEAQ (PEAQ = objective measurement of PErceived Audio Quality = medición objetiva de la calidad de audio percibida) y se representa en el documento de normalización ITU-RBS.1387-1. Un procedimiento de medición para la evaluación de señales de vídeo se describe en A.P. Hekstra et al., "PVQM - A perceptual video quality measure", en Signal Processing: Image Communications, 2002, vol. 17, págs. 781-798, Elsevier.

Estos procedimientos u otros procedimientos para la evaluación de calidad de señales de audio o de vídeo tienen en común que una señal que va a someterse a prueba o que va a evaluarse, que por regla general es la señal de salida de un sistema o red o en general de un elemento que va a examinarse, se compara con una señal original o también de referencia, que por regla general es la señal de entrada en el elemento que va a examinarse.

Para la valoración o evaluación de un determinado procedimiento de transmisión o codificador, en el pasado se han llevado a cabo pruebas con personas de prueba. Según la aplicación se trata en este caso de por ejemplo de pruebas de audición para someter a prueba procedimientos de codificación digitales con adaptación auditiva o pruebas visuales para someter a prueba procedimientos de codificación de vídeo digitales. Aunque estas pruebas proporcionan de media resultados relativamente fiables, aún así sigue habiendo un componente subjetivo. Además, estas pruebas subjetivas con un determinado número de personas de prueba son relativamente complejas y por tanto relativamente caras. Por ello se desarrollaron procedimientos de medición objetivos para la valoración de la calidad de señales de voz, audio o vídeo codificadas.

Una parte de una configuración de un procedimiento de medición objetivo de este tipo se representa en la figura 7. La señal original o la señal de referencia Sref (t) , 104 se alimenta a un sistema 100 con una característica de transmisión H. En la salida del sistema 100 se proporciona una señal Sdeg (t) , 102, que presenta características o propiedades de señal modificadas por el sistema 100 con respecto a la señal original sref (t) . La primera señal de información sdeg (t) y la segunda señal de información sref (t) se suministran a un bloque 110, para alinear temporalmente o igualar temporalmente entre sí las dos señales. De este modo puede garantizarse que por ejemplo en el caso de señales de vídeo sólo se comparen entre sí aquellas imágenes o fotogramas, que se corresponden entre sí temporalmente. El orden o alineación temporal de las dos señales podría estar perturbado por ejemplo por un retardo, una pérdida de fotogramas o una repetición de fotogramas. Para una evaluación de calidad de la señal degradada o perturbada sdeg (t) es importante que la alineación temporal con sref (t) se realice de manera muy precisa y exacta, porque una comparación posterior de dos fotogramas no correspondientes de sdeg (t) y sref (t) lleva en general a una subestimación de la calidad de vídeo de la señal perturbada sdeg (t) . Una correlación de una evaluación de calidad objetiva de este tipo con una evaluación de calidad subjetiva mediante por ejemplo espectadores humanos sería por consiguiente reducida.

Los procedimientos de transmisión modernos para, por ejemplo, señales de vídeo, audio o voz, modifican a menudo la estructura temporal de la información contenida en un flujo de datos. Esto, en parte, puede ser intencionado, sin embargo con mayor frecuencia este comportamiento se origina por perturbaciones de transmisión. Además las señales se perturban a menudo por la transmisión y codificación fuente. Numerosas aplicaciones por ejemplo de la técnica de medición requieren una comparación de la señal transmitida sdeg (t) con la señal no perturbada sref (t) . Como ya se describió anteriormente, esta comparación requiere sin embargo la asociación temporal correcta de los segmentos de señal individuales de la señal no perturbada sref (t) y la señal perturbada sdeg (t) . En el caso de perturbaciones reducidas y flujos de información estructurados de manera relativamente sencilla, como por ejemplo señales de voz, pueden aplicarse métodos simples basándose en una correlación cruzada directa de las dos señales. En el caso de señales más complejas, como por ejemplo señales de vídeo, y perturbaciones importantes, tal como aparecen por ejemplo en la radiotelefonía móvil o en la telefonía por Internet, estos procedimientos no pueden aplicarse de manera fiable y además exigen un esfuerzo de cálculo importante.

Rix et al., "PESQ - the new ITU standard for end-to-end speech quality assessment" proporciona una visión global sobre diferentes procedimientos para la medición de calidad de señales degradadas en comparación con una señal original. A este respecto se indica que es necesaria una alineación temporal entre señal degradada y señal original para un análisis de calidad automatizado. Además se describe que se filtran ambas señales y que a continuación puede tener lugar una estimación de retardo temporal basándose en una envolvente.

Por tanto, el objetivo de la presente invención consiste en crear un concepto mejorado para la asociación temporal de segmentos de señal individuales de una primera señal de información con respecto a una segunda señal de información.

Este objetivo se soluciona mediante un dispositivo para determinar información para la alineación temporal según la reivindicación 1, un procedimiento para determinar información para la alineación temporal según la reivindicación 14 y un programa informático según la reivindicación 15.

La presente invención se basa en el conocimiento de que una asociación temporal de segmentos de señal individuales de una primera señal de información con respecto a una segunda señal de información puede realizarse de tal manera que no se examinen los propios flujos de señal de información, sino más bien características obtenidas a partir de los flujos de señal de información.

Para ello en una primera etapa los flujos de señal de información primero y segundo se descomponen en cada caso en subunidades.

En una etapa posterior cada subunidad de las señales de información primera y segunda se caracteriza en cada caso por al menos una característica. A partir de aquí se obtienen en cada caso vectores de características, representando un elemento individual de un vector de características una característica de una subunidad del flujo de señal de información. El número de elementos de un vector de características describe el número de subunidades de un flujo de señal de información. A este respecto según ejemplos de realización de la presente invención cada subunidad de un flujo de señal de información puede caracterizarse por una pluralidad de características. Para este caso se obtiene también una pluralidad de vectores de características, representando cada uno de los vectores de características otra característica de la pluralidad de subunidades de un flujo de información.

En una etapa adicional, un vector de características de la señal de información primera o perturbada se subdivide en patrones de búsqueda o ventanas de tiempo de comparación, que comprende varios instantes de muestreo o varias subsecuencias de instantes de muestreo de la señal de información perturbada. Según un ejemplo de realización de la presente invención, los patrones de búsqueda o las ventanas de tiempo de comparación pueden proporcionarse mediante la división del vector de características en segmentos equidistantes.

En una... [Seguir leyendo]

 


Reivindicaciones:

1. Dispositivo (110) para determinar información para la alineación temporal de una primera señal de información (sdeg (t) ) y de una segunda señal de información (sref (t) ) , que presentan para instantes de muestreo sucesivos en cada caso uno o varios valores de información, con

medios (120) de extracción de características para la extracción de características (Mi, j, deg) de una pluralidad de características por cada instante de muestreo o por cada subsecuencia de instantes de muestreo de los instantes de muestreo sucesivos a partir de la primera señal de información (sdeg (t) ) , para obtener por cada característica una primera evolución de característica (Mj, deg) , que está subdividida en una secuencia de ventanas de tiempo de comparación, y para extraer las características (Mi, j, ref) por cada instante de muestreo o por cada subsecuencia de instantes de muestreo de los instantes de muestreo sucesivos a partir de la segunda señal de información (sref (t) ) , para obtener por cada característica una segunda evolución de característica (Mj, ref) , estando configurados los medios (120) de extracción de características para seleccionar por cada ventana de tiempo de comparación una característica con mayor probabilidad de éxito de búsqueda a partir de las características, que presenta propiedades de característica que, en comparación con propiedades de característica de las demás características, indican una mayor probabilidad de éxito de búsqueda en la búsqueda de la primera evolución de característica (Mj, deg; Mj, ref) en la respectiva ventana de tiempo de comparación en la segunda evolución de característica, y concretamente con o bien una amplitud de dispersión de la característica o bien una magnitud de un máximo de una medida de similitud entre la primera y la segunda evolución de característica de la característica como una medida de la probabilidad de éxito de búsqueda de la respectiva característica; y medios (130) para determinar la información para la alineación temporal basándose en similitudes entre la primera (Mj, deg) y la segunda evolución de característica (Mj, ref) de la característica con mayor probabilidad de éxito de búsqueda mediante una búsqueda de la primera evolución de característica de la característica con mayor probabilidad de éxito de búsqueda en cada una de la pluralidad de ventanas de tiempo de comparación en la segunda evolución de característica de la característica con mayor probabilidad de éxito de búsqueda.

2. Dispositivo según la reivindicación 1, en el que los medios (120) de extracción de características están adaptados para usar como medida de dispersión para la amplitud de dispersión la varianza o la desviación estándar.

3. Dispositivo según la reivindicación 1, en el que los medios de extracción de características están configurados para usar una función de correlación como medida de similitud.

4. Dispositivo según una de las reivindicaciones anteriores, en el que la primera (sdeg (t) ) y la segunda señal de información (sref (t) ) son en cada caso una señal de vídeo digital, que presenta como la pluralidad de valores de información por cada instante de muestreo los valores de píxel de una imagen de vídeo, y en el que cada una de la pluralidad de características (Mi, j, deg; Mi, j, ref) corresponde en cada caso a una parte de movimiento de una zona de imagen entre dos imágenes de vídeo sucesivas o a información de brillo, color, contraste o bordes en una sección de imagen o a lo largo de las imágenes de vídeo completas.

5. Dispositivo según una de las reivindicaciones anteriores, en el que los medios (120) de extracción de características están configurados de tal manera que una totalidad de la pluralidad de características (Mi, j, deg; Mi, j, ref) por cada instante de muestreo o por cada subsecuencia de instantes de muestreo es menor que una totalidad de los valores de información de la primera (sdeg (t) ) o de la segunda señal de información (sref (t) ) por cada instante de muestreo o por cada subsecuencia de instantes de muestreo, a partir de los cuales se extraen.

6. Dispositivo según una de las reivindicaciones anteriores, en el que los medios (130) para determinar la información para la alineación temporal están configurados para determinar las similitudes entre la primera (Mj, deg; Sj, k, deg) y la segunda evolución de característica (Mj, ref; Sj, k, ref) de la característica con mayor probabilidad de éxito de búsqueda por medio de una función de correlación entre la primera y la segunda evolución de característica de la característica con mayor probabilidad de éxito de búsqueda.

7. Dispositivo según la reivindicación 6, en el que una posición del máximo de la función de correlación entre la primera (Mj, deg; Sj, k, deg) y la segunda evolución de característica (Mj, ref; Sj, k, ref) de la característica con mayor probabilidad de éxito de búsqueda significa un desplazamiento en el tiempo de ambas evoluciones de característica entre sí.

8. Dispositivo según una de las reivindicaciones 6 ó 7, en el que los medios (130) para determinar la información para la alineación temporal están configurados para establecer una discontinuidad de la primera (Mj, deg; Sj, k, deg) o de la segunda evolución de característica (Mj, ref; Sj, k, ref) de la característica con mayor probabilidad de éxito de búsqueda por una aparición de múltiples máximos de la función de correlación entre la

primera y la segunda evolución de característica de la característica con mayor probabilidad de éxito de búsqueda, correspondiendo una discontinuidad a una falta de valores de información de la primera con respecto a la segunda señal de información, o viceversa, entre dos instantes de muestreo sucesivos.

9. Dispositivo según una de las reivindicaciones 6 ó 7, en el que los medios (130) para determinar la información para la alineación temporal están configurados para establecer una discontinuidad de la primera (Mj, deg; Sj, k, deg) o de la segunda evolución de característica (Mj, ref; Sj, k, ref) de la característica con mayor probabilidad de éxito de búsqueda por el valor del máximo de la función de correlación o de la magnitud de la función de correlación entre la primera y la segunda evolución de característica de la característica con mayor probabilidad de éxito de búsqueda, correspondiendo una discontinuidad a una falta de valores de información de la primera con respecto a la segunda señal de información, o viceversa, entre dos instantes de muestreo sucesivos.

10. Dispositivo según la reivindicación 8 ó 9, en el que los medios (130) para determinar la información para la alineación temporal están configurados además para dividir la primera evolución de característica de la característica con mayor probabilidad de éxito de búsqueda en la respectiva ventana de tiempo de comparación (Mj, deg; Sj, k, deg) en lugar de la discontinuidad establecida en, en cada caso, dos ventanas de tiempo de comparación más pequeñas y para realizar de nuevo una alineación con respecto a las ventanas de tiempo de comparación más pequeñas.

11. Dispositivo según una de las reivindicaciones anteriores, que presenta además la siguiente característica:

medios para la alineación temporal más detallada de la primera (sdeg (t) ) y de la segunda (sref (t) ) señal de información dentro de la respectiva ventana de tiempo de comparación (Sj, k, deg) basándose en la información para la alineación temporal basándose en similitudes entre la primera (Mj, deg) y la segunda evolución de característica (Mj, ref) de la característica con mayor probabilidad de éxito de búsqueda.

12. Dispositivo según la reivindicación 11, en el que los medios para la alineación temporal más detallada están configurados para realizar una alineación temporal más detallada por medio de algoritmos de coincidencia de bloques o SAD o algoritmos de correlación o por medio de correlación de fase dentro de un periodo de tiempo, que está predeterminado por la información para la alineación temporal.

13. Dispositivo según una de las reivindicaciones anteriores, que presenta además la siguiente característica: medios de evaluación para evaluar una calidad de transmisión de una transmisión entre la primera (sdeg (t) ) y la segunda señal de información (sref (t) ) basándose en la información para la alineación temporal.

14. Procedimiento implementado en hardware o software para determinar información para la alineación temporal de una primera señal de información (Sdeg (t) ) y de una segunda señal de información (Sref (t) ) , que presentan para instantes de muestreo sucesivos en cada caso uno o varios valores de información, con las siguientes etapas:

extraer características (Mi, j, deg) de una pluralidad de características por cada instante de muestreo o por cada subsecuencia de instantes de muestreo de los instantes de muestreo sucesivos a partir de la primera señal de información (Sdeg (t) ) , para obtener por cada característica una primera evolución de característica (Mj, deg) , que está subdividida en una secuencia de ventanas de tiempo de comparación, y extraer las características (Mi, j, ref) por cada instante de muestreo o por cada subsecuencia de instantes de muestreo de los instantes de muestreo sucesivos a partir de la segunda señal de información (Sref (t) ) , para obtener por cada característica una segunda evolución de característica (Mj, ref) , por cada ventana de tiempo de comparación, seleccionar una característica con mayor probabilidad de éxito de búsqueda a partir de las características, que presenta propiedades de característica que, en comparación con propiedades de característica de las demás características, indican una mayor probabilidad de éxito de búsqueda en la búsqueda de la primera evolución de característica (Mj, deg; Mj, ref) en la respectiva ventana de tiempo de comparación en la segunda evolución de característica, y concretamente se usa con una amplitud de dispersión de la característica o una magnitud de un máximo de una medida de similitud entre la primera y la segunda evolución de característica de la característica como una medida de la probabilidad de éxito de búsqueda de la respectiva característica; y determinar la información para la alineación temporal basándose en similitudes entre la primera (Mj, deg) y la segunda evolución de característica (Mj, ref) de la característica con mayor probabilidad de éxito de búsqueda para la respectiva ventana de tiempo de comparación mediante búsqueda de la primera evolución de característica (Mj, deg; Mj, ref) de la característica con mayor probabilidad de éxito de búsqueda en cada una de la pluralidad de ventanas de tiempo de comparación en la segunda evolución de característica de la característica con mayor probabilidad de éxito de búsqueda.

15. Programa informático con un código de programa para la realización del procedimiento para determinar información para la alineación temporal de una primera señal de información y de una segunda señal de información según la reivindicación 14, cuando el programa informático se ejecuta en un ordenador.


 

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .