BARRIDO DE COLOR Y POSICIONAMIENTO DE SUBTÍTULOS.

BORRADO DE COLOR Y POSICIONAMIENTO DINAMICO DE SUBTITULOS PARA UNA IMAGEN DE VIDEO QUE SE CONSIGUE CODIFICANDO Y DESCODIFICANDO LOS SUBTITULOS SEPARADAMENTE DE LA IMAGEN DE VIDEO.

EN EL CODIFICADOR (FIG.7) LOS SUBTITULOS SE GENERAN (55) PARA CADA IMAGEN DE VIDEO RESPECTIVA. EL BORRADO DE COLOR SE LLEVA A CABO CAMBIANDO EL COLOR DE LOS SUBTITULOS EN UNA LOCALIZACION ESPECIFICA EN LA IMAGEN DE VIDEO. EN EL DESCODIFICADOR (FIG.2) UN BUFFER (22) ALMACENA LOS SUBTITULOS JUNTO CON LA INFORMACION DESCODIFICADORA DE SUBTITULOS. UN CONTROLADOR (35) CRONOMETRA DE FORMA PRECISA UNA OPERACION DE LECTURA DEL BUFFER PARA LEER LOS SUBTITULOS DURANTE UNA MUESTRA DE TIEMPO REAL EN LA IMAGEN DE VIDEO RESPECTIVA; Y EL BORRADO DE COLOR SE LLEVA A CABO CAMBIANDO EL COLOR DE UNA PARTE DE LOS SUBTITULOS EN UNA LOCALIZACION INDICADA POR LA INFORMACION DESCODIFICADORA DE SUBTITULOS. EL POSICIONAMIENTO DINAMICO DE LOS SUBTITULOS SE CONSIGUE RETARDANDO EL TIEMPO EN EL QUE EL CONTROLADOR EJECUTA LA OPERACION DE LECTURA. CUANDO SE REPITE LA TECNICA DE DESCODIFICACION PARA UN NUMERO DE IMAGENES, EL USUARIO PERCIBE EL MOVIMIENTO AL CAMBIAR GRADUALMENTE EL POSICIONAMIENTO Y EL BORRADO DE COLOR

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E96302342.

Solicitante: SONY CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 7-35 KITASHINAGAWA 6-CHOME SHINAGAWA-KU TOKYO 141 JAPON.

Inventor/es: TSUKAGOSHI, IKUO.

Fecha de Publicación: .

Fecha Solicitud PCT: 2 de Abril de 1996.

Clasificación Internacional de Patentes:

  • G11B27/034 FISICA.G11 REGISTRO DE LA INFORMACION.G11B REGISTRO DE LA INFORMACION BASADO EN UN MOVIMIENTO RELATIVO ENTRE EL SOPORTE DE REGISTRO Y EL TRANSDUCTOR (registro de valores medidos según un procedimiento que no necesita el uso de un transductor para la reproducción G01D 9/00; aparatos de registro o de reproducción que utilizan una banda marcada por un procedimiento mecánico, p. ej. una banda de papel perforada, o que utilizan soportes de registro individuales, p. ej. fichas perforadas o fichas magnéticas G06K; transferencia de datos de un tipo de soporte de registro a otro G06K 1/18; circuitos para el acoplamiento de la salida de un dispositivo de reproducción a un receptor radio H04B 1/20; cabezas de lectura para gramófonos o transductores acústicos electromecánicos o sus circuitos H04R). › G11B 27/00 Montaje; Indexación; Direccionamiento; Temporización o sincronización; Monitorización; Medida del avance de una cinta. › sobre discos (G11B 27/036, G11B 27/038 tienen prioridad).
  • H04N5/445 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 5/00 Detalles de los sistemas de televisión (Detalles de los dispositivos de análisis o sus combinaciones con la producción de la tensión de alimentación H04N 3/00). › para visualizar información adicional (H04N 5/50  tiene prioridad).
  • H04N5/44N
  • H04N7/088D2
  • H04N7/24T4
  • H04N7/26
  • H04N7/26A10S
  • H04N7/26A8R
  • H04N7/26E
  • H04N7/52D

Clasificación PCT:

  • H04N7/52 H04N […] › H04N 7/00 Sistemas de televisión (detalles H04N 3/00, H04N 5/00; métodos y arreglos, para la codificación, decodificación, compresión o descompresión de señales de vídeo digital H04N 19/00; distribución selectiva de contenido H04N 21/00). › Sistema para la transmisión de un impulso codificado modulado con otras señales moduladas por impulsos codificados, p. ej. una señal de audio o una señal de sincronización mediante la combinación de un flujo de video con otros datos de contenido o adicionales (multiplexado de flujos multiplexados, inserción de bits de relleno en un flujo multiplexado, para obtener una tasa de bits constante, ensamblado de flujo elemental en paquetes en el lado del servidor H04N 21/236; Desensamblado de un flujo multiplexado, multiplexación de flujo multiplexado, extracción o procesado de Servicos de Información, desensamblado de un flujo elemental en paquetes H04N 21/434).

Clasificación antigua:

  • H04N7/52 H04N 7/00 […] › Sistema para la transmisión de un impulso codificado modulado con otras señales moduladas por impulsos codificados, p. ej. una señal de audio o una señal de sincronización mediante la combinación de un flujo de video con otros datos de contenido o adicionales (multiplexado de flujos multiplexados, inserción de bits de relleno en un flujo multiplexado, para obtener una tasa de bits constante, ensamblado de flujo elemental en paquetes en el lado del servidor H04N 21/236; Desensamblado de un flujo multiplexado, multiplexación de flujo multiplexado, extracción o procesado de Servicos de Información, desensamblado de un flujo elemental en paquetes H04N 21/434).

Países PCT: Austria, Alemania, España, Francia, Reino Unido, Italia, Países Bajos.


Fragmento de la descripción:

La presente invención se refiere a subtítulos y, más en particular, al barrido de color y al posicionamiento de subtítulos.

Los subtítulos se superponen sobre una imagen de vídeo para proporcionar información a un espectador, que complementa la imagen de vídeo. Por ejemplo, en el karaoke, se visualizan letras de 5 canciones sobre la imagen de vídeo, en forma de subtítulos, mientras un espectador canta siguiendo una pista de audio de una imagen de vídeo que la acompaña. Los subtítulos contienen también información al espectador según la manera en la que se visualizan. El resaltado de las letras de canciones en el karaoke, por ejemplo, da la entrada al cantante para cantar, mientras que la retirada de las letras de la pantalla de vídeo le indica al espectador que deje de cantar. 10

La radiodifusión de televisión o la reproducción de vídeo (tal como desde un videodisco) proporciona subtítulos para su visualización con la imagen de vídeo. No obstante, los subtítulos se combinan permanentemente con la imagen de vídeo subyacente y únicamente se pueden manipular en el extremo transmisor (o de grabación) y no en el extremo receptor (o de reproducción). Es decir, los subtítulos visualizados en la radiodifusión de televisión o la reproducción de vídeo son "fijos" y no se pueden resaltar o 15 mover en el extremo receptor (o de reproducción). Los subtítulos tampoco se pueden desactivar, lo cual resulta particularmente importante en el karaoke cuando un cantante desea comprobar sus capacidades de cante o disfrutar del vídeo musical sin la interrupción de los subtítulos.

Los sistemas de reproducción y radiodifusión de televisión no pueden manipular adecuadamente los subtítulos en el extremo transmisor (o de grabación). Los sistemas de reproducción y radiodifusión de 20 televisión requieren una creación y manipulación minuciosas de los subtítulos, basadas en métodos de prueba y error. Por ejemplo, en el karaoke, en el que se producen en serie vídeos musicales para cantar en grupo, es deseable que cada vídeo musical se produzca de una manera rápida y eficaz. Esto no es posible con los sistemas de reproducción y radiodifusión de televisión, que requieren un trabajo lento y tedioso para personalizar a medida cada vídeo musical. Especialmente, no es posible el posicionamiento dinámico en una 25 grabación o radiodifusión de televisión de tipo fijo debido a que los subtítulos son una parte integral de la imagen de vídeo. Por ello, el movimiento de los subtítulos dejaría un espacio en blanco en el lugar en el que estaban superpuestos antes los subtítulos.

Los Gráficos para Discos Compactos (CD-G) proporcionan más flexibilidad en la visualización de subtítulos ya que esta técnica graba gráficos en un disco compacto (CD) en forma de subcódigos. No 30 obstante, los CD-G adolecen de un inconveniente importante debido a que esta técnica se limita a aplicaciones de CD, las cuales son lentas según los estándares de televisión. Es decir, la técnica de CD-G no se presta a la creación y manipulación de subtítulos en reproducciones de vídeo o radiodifusiones de televisión en tiempo real.

Los CD-G resultan satisfactorios para aplicaciones de ordenador ya que los gráficos se programan de 35 antemano y el elevado tiempo de procesado requerido para crear los mismos pasa en gran medida inadvertido para el usuario final. No obstante, tal como se mostrará haciendo referencia a las figuras 16a a 16c y 17, el tiempo de respuesta requerido para generar una pantalla de CD-G completa es 10,24 segundos, lo cual es extremadamente inadecuado para radiodifusiones de vídeo o televisión normales.

La figura 16a representa el formato de datos de CD-G, en el que una trama incluye 1 byte de un 40 subcódigo y 32 bytes de datos de canales de audio. De los 32 bytes, 24 bytes se asignan para datos de canales de audio L y R (presentando cada canal 6 muestras, con 2 bytes por muestra) y 8 bytes se asignan a un código de corrección de errores. Las tramas se agrupan como un bloque de 98 tramas (Trama 0, Trama 1,..., Trama 96 y Trama 97) según se muestra en la figura 16b. Tal como se muestra en la figura 16c se transmiten ocho bloques P, Q, R, S, T, U, V y W. Los subcódigos para las Tramas 0 y 1 en cada bloque se 45 definen como patrones de sincronización S0, S1, mientras que las restantes 96 tramas almacenan varios datos de subcódigo. De entre un grupo de 8 bloques, los 2 primeros bloques P, Q se asignan a datos de búsqueda utilizados para buscar a través de pistas de grabación; y a los subcódigos en los restantes 6 bloques R, S, T, U, V y W se les pueden asignar datos de gráficos.

Como cada bloque de 98 tramas se transmite a una frecuencia de repetición de 75 Hz, la 50 velocidad de transmisión de datos para 1 bloque es (75 x 98 bytes) 7,35 kHz, lo cual da como resultado una velocidad binaria de subcódigo de 7,35 K bytes/s. En la figura 17, se muestra el formato de transmisión para transmitir la información presente en los bloques R, S, T, U, V y W. Cada una de las 96 tramas (2, 3,... 97) de los 6 bloques (R, S, T, U, V y W) está dispuesta en forma de un paquete que incluye 6 canales (R a W) de 96 símbolos por canal. El paquete se subdivide además en 4 agrupaciones (en inglés packs) de 24 símbolos 55

cada una (símbolo 0 a símbolo 23), representando cada símbolo una trama.

Un carácter de CD-G está compuesto por 6 x 12 píxeles. Como cada agrupación es 6 x 24, en cada agrupación se aloja fácilmente un carácter de 6 x 12. El formato de CD-G asigna los seis canales de (R, S, T, U, V y W) y los 12 símbolos 8 a 19 a un carácter. El resto de los símbolos en cada una de las agrupaciones almacena información sobre el carácter. 5

En los 3 primeros canales (R, S, T) del símbolo 0 en cada agrupación se almacena información de modo, y en los últimos 3 canales (U, V, W) del símbolo 0 se almacena información de ítem. Una combinación de la información de modo y la información de ítem define el modo para los caracteres almacenados en la agrupación correspondiente, de la manera siguiente:

Tabla 1 10

Modo

Ítem

000

000 modo

001

000 modo gráfico

001

001 modo gráfico-TV

111

000 modo del usuario

En todos los canales de símbolo 1, se almacena una instrucción. En todos los canales de los símbolos 2 a 7 se almacena información correspondiente de modo, ítem, paridad o adicional para la instrucción. La paridad para la totalidad de los datos en los canales de los símbolos 0 a 19 se almacena en todos los canales de los últimos 4 símbolos (símbolos 20 a 23) de cada agrupación. 15

Tal como se ha descrito, los datos se transmiten a una frecuencia de repetición de 75 Hz. Por lo tanto, un paquete que contiene 4 agrupaciones se transmite a una velocidad de 300 agrupaciones por segundo (75 Hz x 4 agrupaciones). Es decir, con 1 carácter asignado al intervalo de 6 x 12 píxeles, se pueden transmitir 300 caracteres en 1 segundo.

No obstante, una pantalla de CD-G requiere más de 300 caracteres. Una pantalla de CD-G se define 20 como 288 elementos de imagen horizontales x 192 elementos de imagen verticales y requiere más de dos veces los 300 caracteres transmitidos en 1 segundo. Por lo tanto, el tiempo de transmisión total para una pantalla de 288 x 192 es 2,56 segundos tal como se muestra mediante la siguiente ecuación:

(288/6) x (192/12)  300 = 2,56 segundos

Esto da como resultado demasiado tiempo para regenerar cada pantalla cuando se considera que las 25 pantallas se actualizan habitualmente cada 0,6 segundos. Este problema se agrava cuando se usan códigos hexadecimales para los caracteres debido a que cada expresión hexadecimal requiere 4 bits para representar 1 píxel. Como consecuencia, se transmiten 4 veces los datos descritos anteriormente incrementando la velocidad de transmisión a 10,24 segundos (4 x 2,56 segundos). Como cada pantalla requiere unos tediosos 10,24 segundos para su transmisión, una transmisión continua de pantallas significa que se experimenta un 30 tiempo de demora de 10,24 segundos cuando se transmiten pantallas usando la técnica de CD-G.

De este modo, la técnica de CD-G no se realiza en tiempo real y es inaceptablemente lenta para su uso en una radiodifusión en tiempo real. Por ejemplo, en la generación de vídeos musicales de karaoke, resultaría...

 


Reivindicaciones:

1. Aparato de decodificación de barrido de color de subtítulos, operativo para serle suministrados datos de vídeo codificados y datos de subtítulos codificados multiplexados que incluyen unos códigos que representan colores de una tabla de consulta de colores y una posición en un subtítulo en la que tiene lugar una conmutación entre tablas de consulta de colores estándar y de barrido de color, representando cada 5 código un componente de color de un píxel del subtítulo, comprendiendo dicho aparato:

unos medios de decodificación de vídeo (3) para decodificar los datos de vídeo codificados de dicha imagen de vídeo que se va a visualizar;

unos medios de almacenamiento intermedio (7, 22) para almacenar los datos de subtítulos que se van a decodificar y visualizar simultáneamente con dicha imagen de vídeo; 10

unos medios de control (7, 21) para temporizar una operación de lectura de dichos datos de subtítulos como salida de dichos medios de almacenamiento intermedio durante una visualización en tiempo real de dicha imagen de vídeo;

unos medios de decodificación de subtítulos (7, 23, 24) dispuestos para decodificar dichos datos de subtítulos almacenados en dichos medios de almacenamiento intermedio a partir de dichos códigos, 15 obteniendo dichos componentes de colores según una de las tablas de consulta de colores estándar y de barrido de color; y

unos medios de barrido de color (7, 26) que comprenden unas tablas de consulta de colores estándar y de barrido de color, presentando la tabla de consulta estándar, por lo menos en algunas direcciones, datos de color diferentes a las mismas direcciones de la tabla de consulta de colores de barrido de color, 20

estando dispuestos los medios de barrido de color para responder a dicho código que representa dicha posición de manera que provoquen que una porción de dicho subtítulo tenga un color diferente a otra porción de dicho subtítulo mediante una conmutación entre dichas tablas de consulta de colores estándar y de barrido de color en dicha posición de conmutación.

2. Aparato de decodificación de barrido de color de subtítulos según la reivindicación 1, en el que 25 las tablas de consulta de colores incluyen unos datos que representan una relación de mezcla que determina el grado en el que un píxel de dicho subtítulo se mezcla con la imagen de vídeo durante la visualización, comprendiendo además el aparato unos medios mezcladores (34) para mezclar dicha imagen de vídeo decodificada por dichos medios de decodificación de vídeo (3) con dicho subtítulo proporcionado por dichos medios de barrido de color (7, 26) de acuerdo con dicha relación de mezcla. 30

3. Aparato de decodificación de barrido de color de subtítulos según la reivindicación 2, en el que la tabla de consulta estándar tiene, por lo menos en algunas direcciones, relaciones de mezcla diferentes con respecto a las mismas direcciones de la tabla de consulta de colores de barrido de color.

4. Aparato de decodificación de barrido de color de subtítulos según la reivindicación 1, 2 ó 3, operativo para serle suministrado un código que representa dicha posición de conmutación como un recuento 35 de píxeles en una línea de vídeo, y en el que los medios de barrido de color comprenden:

unos medios de retención (figura 13, 205) para retener dicho recuento, que son indicativos de dicha posición de conmutación; y

unos medios contadores (figura 13, 208) para decrementar dicho recuento píxel a píxel en cada línea de vídeo de dicha imagen de vídeo, 40

teniendo lugar la conmutación entre dichos datos de la tabla estándar de consulta de colores y dichos datos de la tabla de consulta de colores de barrido de color cuando dichos medios contadores alcanzan un recuento de cero.

5. Aparato de decodificación de barrido de color de subtítulos según la reivindicación 1, 2, 3 ó 4, que comprende además unos medios (figura 15, 205, 208, 35, 24, 26) para posicionar el subtítulo en la 45 imagen de vídeo de acuerdo con datos de posición del subtítulo de dichos datos de subtítulos.

6. Método de decodificación de barrido de color de subtítulos, que comprende

recibir datos de vídeo codificados y datos de subtítulos codificados multiplexados, que incluyen unos códigos que representan los colores de una tabla de consulta de colores y una posición en un subtítulo en la

que tiene lugar una conmutación entre tablas de consulta de colores estándar y de barrido de color, representando cada código un componente de color de un píxel del subtítulo,

decodificar los datos de vídeo codificados de dicha imagen de vídeo que se va a visualizar;

almacenar en una memoria intermedia los datos de subtítulos que se van a decodificar y visualizar simultáneamente con dicha imagen de vídeo; 5

temporizar una operación de lectura de dichos datos de subtítulos como salida de dicha memoria intermedia durante una visualización en tiempo real de dicha imagen de vídeo;

decodificar dichos datos de subtítulos almacenados en dicha memoria intermedia a partir de dichos códigos, obteniendo dichos componentes de colores según una de las tablas de consulta de colores estándar y de barrido de color; y 10

usar tablas de consulta de colores estándar y de barrido de color, presentando la tabla de consulta estándar, por lo menos en algunas direcciones, datos de color diferentes a las mismas direcciones de la tabla de consulta de colores de barrido de color,

realizar un barrido de color del subtítulo, provocando que una porción de dicho subtítulo tenga un color diferente a otra porción de dicho subtítulo mediante una conmutación entre dichas tablas de consulta de 15 colores estándar y de barrido de color en dicha posición.

7. Método de decodificación de barrido de color de subtítulos según la reivindicación 6, que comprende además la etapa de mezclar dichos datos de vídeo decodificados mediante dicha etapa de decodificación de vídeo con dichos datos de subtítulos decodificados mediante dicha etapa de decodificación de subtítulos de acuerdo con relaciones de mezcla definidas por las tablas de consulta de colores. 20

8. Método de decodificación de barrido de color de subtítulos según la reivindicación 7, en el que la tabla de consulta estándar tiene, por lo menos en algunas direcciones, relaciones de mezcla diferentes con respecto a las mismas direcciones de la tabla de consulta de colores de barrido de color.

9. Método de decodificación de barrido de color de subtítulos según la reivindicación 6, 7 u 8, en el que la etapa de barrido de color comprende: 25

recibir códigos que representan dicha posición de conmutación como un recuento de píxeles en una línea de vídeo,

retener dicho recuento en la línea de vídeo de dicha imagen de vídeo,

decrementar dicho recuento píxel a píxel en la línea de vídeo de dicha imagen de vídeo y

conmutar entre dicha tabla estándar de consulta de colores y dicha tabla de consulta de colores de 30 barrido de color cuando dicho recuento llega a cero.

10. Método de decodificación de barrido de color de subtítulos según la reivindicación 6, 7, 8 ó 9, que comprende además controlar la posición del subtítulo en la imagen de vídeo de acuerdo con los datos de posición del subtítulo de dichos datos de subtítulos.


 

Patentes similares o relacionadas:

Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]

Imagen de 'Filtro de desbloqueo condicionado por el brillo de los píxeles'Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]

Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]

Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]

Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .