Barrido de color y posicionamiento de subtítulos.

Aparato de decodificación de posición de subtítulos suministrado con datos de subtítulo,

datos de posición y datosde vídeo codificados multiplexados que definen para cada trama la posición en la que debe 5 superponerse unsubtítulo sobre la imagen de vídeo, comprendiendo el aparato:

unos medios de desmultiplexación (1) para desmultiplexar los datos de vídeo de los datos de subtítulo y datos deposición;

unos medios de decodificación de vídeo (3) dispuestos para recibir los datos de vídeo de los medios dedesmultiplexación para decodificar los datos de vídeo codificados de una imagen de vídeo que va a servisualizada;

unos medios de almacenamiento intermedio dispuestos para recibir los datos de subtítulo y los datos de posiciónde los medios de desmultiplexación para almacenar los datos de subtítulo y los datos de posición;unos medios de control (35) para temporizar una operación de lectura de dichos datos de subtítulo de dichosmedios de almacenamiento intermedio durante una visualización en tiempo real de dicha imagen de vídeo; y

unos medios, sensibles a los datos de posición y los impulsos de sincronización horizontales y verticales, paracambiar dinámicamente según dichos datos de posición, la posición horizontal en la imagen de vídeo en la quedicho subtítulo es superpuesto durante la visualización; en el que los medios para cambiar dinámicamentecomprenden:

unos medios de retención (205) que pueden hacerse funcionar para recibir los datos de posición desde los mediosde almacenamiento intermedio para retener los datos de posición en cada impulso de sincronización vertical,presentando los datos de posición un valor indicador de la posición del subtítulo a lo largo del eje horizontal; yunos medios contadores (208) que pueden hacerse funcionar en cada impulso de sincronización horizontal paradisminuir un valor de dichos datos de posición retenidos en cada ocasión que es visualizado un píxel de dichatrama,

en el que dichos medios de control realizan dicha operación de lectura cuando dichos medios contadores alcanzancero, provocando así que dicho subtítulo sea superpuesto sobre dicha trama de vídeo en una posición horizontaldefinida por los datos de posición.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E03075808.

Solicitante: SONY CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 7-35 KITASHINAGAWA 6-CHOME SHINAGAWA-KU, TOKYO 141 JAPON.

Inventor/es: TSUKAGOSHI, IKUO.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • H04N5/44 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 5/00 Detalles de los sistemas de televisión (Detalles de los dispositivos de análisis o sus combinaciones con la producción de la tensión de alimentación H04N 3/00). › Circuitos receptores (H04N 5/14  tiene prioridad).
  • H04N5/445 H04N 5/00 […] › para visualizar información adicional (H04N 5/50  tiene prioridad).
  • H04N7/52 H04N […] › H04N 7/00 Sistemas de televisión (detalles H04N 3/00, H04N 5/00; métodos y arreglos, para la codificación, decodificación, compresión o descompresión de señales de vídeo digital H04N 19/00; distribución selectiva de contenido H04N 21/00). › Sistema para la transmisión de un impulso codificado modulado con otras señales moduladas por impulsos codificados, p. ej. una señal de audio o una señal de sincronización mediante la combinación de un flujo de video con otros datos de contenido o adicionales (multiplexado de flujos multiplexados, inserción de bits de relleno en un flujo multiplexado, para obtener una tasa de bits constante, ensamblado de flujo elemental en paquetes en el lado del servidor H04N 21/236; Desensamblado de un flujo multiplexado, multiplexación de flujo multiplexado, extracción o procesado de Servicos de Información, desensamblado de un flujo elemental en paquetes H04N 21/434).

PDF original: ES-2402090_T3.pdf

 

Barrido de color y posicionamiento de subtítulos.

Fragmento de la descripción:

Barrido de color y posicionamiento de subtítulos.

La presente invención se refiere a subtítulos y, más en particular, al barrido de color y al posicionamiento de subtítulos.

Los subtítulos se superponen sobre una imagen de vídeo para proporcionar información a un espectador, que complementa la imagen de vídeo. Por ejemplo, en el karaoke, se visualizan letras de canciones sobre la imagen de vídeo, en forma de subtítulos, mientras un espectador canta siguiendo una pista de audio de una imagen de vídeo que la acompaña. Los subtítulos contienen también información al espectador según la manera en la que se visualizan. El resaltado de las letras de canciones en el karaoke, por ejemplo, da la entrada al cantante para cantar, mientras que la retirada de las letras de la pantalla de vídeo le indica al espectador que deje de cantar.

La radiodifusión de televisión o la reproducción de vídeo (tal como desde un videodisco) proporciona subtítulos para su visualización con la imagen de vídeo. No obstante, los subtítulos se combinan permanentemente con la imagen de vídeo subyacente y únicamente se pueden manipular en el extremo transmisor (o de grabación) y no en el extremo receptor (o de reproducción) . Es decir, los subtítulos visualizados en la radiodifusión de televisión o la reproducción de vídeo son "fijos" y no se pueden resaltar o mover en el extremo receptor (o de reproducción) . Los subtítulos tampoco se pueden desactivar, lo cual resulta particularmente importante en el karaoke cuando un cantante desea comprobar sus capacidades de cante o disfrutar del vídeo musical sin la interrupción de los subtítulos.

Los sistemas de reproducción y radiodifusión de televisión no pueden manipular adecuadamente los subtítulos en el extremo transmisor (o de grabación) . Los sistemas de reproducción y radiodifusión de televisión requieren una creación y manipulación minuciosas de los subtítulos, basadas en métodos de prueba y error. Por ejemplo, en el karaoke, en el que se producen en serie vídeos musicales para cantar en grupo, es deseable que cada vídeo musical se produzca de una manera rápida y eficaz. Esto no es posible con los sistemas de reproducción y radiodifusión de televisión, que requieren un trabajo lento y tedioso para personalizar a medida cada vídeo musical. Especialmente, no es posible el posicionamiento dinámico en una grabación o radiodifusión de televisión de tipo fijo debido a que los subtítulos son una parte integral de la imagen de vídeo. Por ello, el movimiento de los subtítulos dejaría un espacio en blanco en el lugar en el que estaban superpuestos antes los subtítulos.

Los Gráficos para Discos Compactos (CD-G) proporcionan más flexibilidad en la visualización de subtítulos ya que esta técnica graba gráficos en un disco compacto (CD) en forma de subcódigos. No obstante, los CD-G adolecen de un inconveniente importante debido a que esta técnica se limita a aplicaciones de CD, las cuales son lentas según los estándares de televisión. Es decir, la técnica de CD-G no se presta a la creación y manipulación de subtítulos en reproducciones de vídeo o radiodifusiones de televisión en tiempo real.

Los CD-G resultan satisfactorios para aplicaciones de ordenador ya que los gráficos se programan de antemano y el elevado tiempo de procesado requerido para crear los mismos pasa en gran medida inadvertido para el usuario final. No obstante, tal como se mostrará haciendo referencia a las figuras 16a a 16c y 17, el tiempo de respuesta requerido para generar una pantalla de CD-G completa es 10, 24 segundos, lo cual es extremadamente inadecuado para radiodifusiones de vídeo o televisión normales.

La figura 16a representa el formato de datos de CD-G, en el que una trama incluye 1 byte de un subcódigo y 32 bytes de datos de canales de audio. De los 32 bytes, 24 bytes se asignan para datos de canales de audio L y R (presentando cada canal 6 muestras, con 2 bytes por muestra) y 8 bytes se asignan a un código de corrección de errores. Las tramas se agrupan como un bloque de 98 tramas (Trama 0, Trama 1, ..., Trama 96 y Trama 97) según se muestra en la figura 16b. Tal como se muestra en la figura 16c se transmiten ocho bloques P, Q, R, S, T, U, V y

W. Los subcódigos para las Tramas 0 y 1 en cada bloque se definen como patrones de sincronización S0, S1, mientras que las restantes 96 tramas almacenan varios datos de subcódigo. De entre un grupo de 8 bloques, los 2 primeros bloques P, Q se asignan a datos de búsqueda utilizados para buscar a través de pistas de grabación; y a los subcódigos en los restantes 6 bloques R, S, T, U, V y W se les pueden asignar datos de gráficos.

Como cada bloque de 98 tramas se transmite a una frecuencia de repetición de 75 Hz, la velocidad de transmisión de datos para 1 bloque es (75 x 98 bytes) 7, 35 kHz, lo cual da como resultado una velocidad binaria de subcódigo de 7, 35 K bytes/s. En la figura 17, se muestra el formato de transmisión para transmitir la información presente en los bloques R, S, T, U, V y W. Cada una de las 96 tramas (2, 3, ... 97) de los 6 bloques (R, S, T, U, V y W) está dispuesta en forma de un paquete que incluye 6 canales (R a W) de 96 símbolos por canal. El paquete se subdivide además en 4 agrupaciones (en inglés packs) de 24 símbolos cada una (símbolo 0 a símbolo 23) , representando cada símbolo una trama.

Un carácter de CD-G está compuesto por 6 x 12 píxeles. Como cada agrupación es 6 x 24, en cada agrupación se aloja fácilmente un carácter de 6 x 12. El formato de CD-G asigna los seis canales de (R, S, T, U, V y W) y los 12

símbolos 8 a 19 a un carácter. El resto de los símbolos en cada una de las agrupaciones almacena información sobre el carácter.

En los 3 primeros canales (R, S, T) del símbolo 0 en cada agrupación se almacena información de modo, y en los últimos 3 canales (U, V, W) del símbolo 0 se almacena información de ítem. Una combinación de la información de modo y la información de ítem define el modo para los caracteres almacenados en la agrupación correspondiente, de la manera siguiente:

Tabla 1

Modo Ítem

000 000 modo 001 000 modo gráfico 001 001 modo gráfico-TV

111 000 modo del usuario En todos los canales de símbolo 1, se almacena una instrucción. En todos los canales de los símbolos 2 a 7 se almacena información correspondiente de modo, ítem, paridad o adicional para la instrucción. La paridad para la totalidad de los datos en los canales de los símbolos 0 a 19 se almacena en todos los canales de los últimos 4 símbolos (símbolos 20 a 23) de cada agrupación.

Tal como se ha descrito, los datos se transmiten a una frecuencia de repetición de 75 Hz. Por lo tanto, un paquete que contiene 4 agrupaciones se transmite a una velocidad de 300 agrupaciones por segundo (75 Hz x 4 agrupaciones) . Es decir, con 1 carácter asignado al intervalo de 6 x 12 píxeles, se pueden transmitir 300 caracteres en 1 segundo.

No obstante, una pantalla de CD-G requiere más de 300 caracteres. Una pantalla de CD-G se define como 288 elementos de imagen horizontales x 192 elementos de imagen verticales y requiere más de dos veces los 300 caracteres transmitidos en 1 segundo. Por lo tanto, el tiempo de transmisión total para una pantalla de 288 x 192 es 2, 56 segundos tal como se muestra mediante la siguiente ecuación:

(288/6) x (192/12) ÷ 300 = 2, 56 segundos Esto da como resultado demasiado tiempo para regenerar cada pantalla cuando se considera que las pantallas se actualizan habitualmente cada 0, 6 segundos. Este problema se agrava cuando se usan códigos hexadecimales para los caracteres debido a que cada expresión hexadecimal requiere 4 bits para representar 1 píxel. Como consecuencia, se transmiten 4 veces los datos descritos anteriormente incrementando la velocidad de transmisión a 10, 24 segundos (4 x 2, 56 segundos) . Como cada pantalla requiere unos tediosos 10, 24 segundos para su transmisión, una transmisión continua de pantallas significa que se experimenta un tiempo de demora de 10, 24 segundos cuando se transmiten pantallas usando la técnica de CD-G.

De este modo, la técnica de CD-G no se realiza en tiempo real y es inaceptablemente lenta para su uso en una radiodifusión en tiempo real. Por ejemplo, en la generación de vídeos musicales de karaoke, resultaría prácticamente imposible sincronizar los subtítulos con el momento preciso en el que se van a cantar las letras debido a que los subtítulos deberían haberse generado con una antelación de 10, 24 segundos con respecto al vídeo musical.

El sistema de CD-G padece también defectos en la reproducción de los subtítulos. El sistema de CD-G visualiza subtítulos únicamente al producirse... [Seguir leyendo]

 


Reivindicaciones:

1. Aparato de decodificación de posición de subtítulos suministrado con datos de subtítulo, datos de posición y datos de vídeo codificados multiplexados que definen para cada trama la posición en la que debe superponerse un subtítulo sobre la imagen de vídeo, comprendiendo el aparato:

unos medios de desmultiplexación (1) para desmultiplexar los datos de vídeo de los datos de subtítulo y datos de posición;

unos medios de decodificación de vídeo (3) dispuestos para recibir los datos de vídeo de los medios de desmultiplexación para decodificar los datos de vídeo codificados de una imagen de vídeo que va a ser visualizada;

unos medios de almacenamiento intermedio dispuestos para recibir los datos de subtítulo y los datos de posición de los medios de desmultiplexación para almacenar los datos de subtítulo y los datos de posición;

unos medios de control (35) para temporizar una operación de lectura de dichos datos de subtítulo de dichos medios de almacenamiento intermedio durante una visualización en tiempo real de dicha imagen de vídeo; y

unos medios, sensibles a los datos de posición y los impulsos de sincronización horizontales y verticales, para cambiar dinámicamente según dichos datos de posición, la posición horizontal en la imagen de vídeo en la que dicho subtítulo es superpuesto durante la visualización; en el que los medios para cambiar dinámicamente comprenden:

unos medios de retención (205) que pueden hacerse funcionar para recibir los datos de posición desde los medios de almacenamiento intermedio para retener los datos de posición en cada impulso de sincronización vertical, presentando los datos de posición un valor indicador de la posición del subtítulo a lo largo del eje horizontal; y

unos medios contadores (208) que pueden hacerse funcionar en cada impulso de sincronización horizontal para disminuir un valor de dichos datos de posición retenidos en cada ocasión que es visualizado un píxel de dicha trama,

en el que dichos medios de control realizan dicha operación de lectura cuando dichos medios contadores alcanzan 35 cero, provocando así que dicho subtítulo sea superpuesto sobre dicha trama de vídeo en una posición horizontal definida por los datos de posición.

2. Aparato de decodificación de posición de subtítulo según la reivindicación 1, que comprende además:

unos medios de compensación de retardo para compensar un retardo causado por los componentes del aparato de decodificación de posición de subtítulo de manera que se visualice dicho subtítulo con dicha imagen de vídeo en una posición indicada por la información decodificante incluida en dichos datos de subtítulo.

3. Aparato de decodificación de posición de subtítulo según la reivindicación 1 que comprende además unos medios 45 de decodificación de subtítulo (7) para decodificar dichos datos de subtítulo almacenados en dichos medios de almacenamiento intermedio.

4. Aparato de decodificación de posición de subtítulo según la reivindicación 3 que comprende además unos medios mezcladores (34) para mezclar dichos datos de vídeo decodificados mediante dichos medios de decodificación de 50 vídeo con dichos datos de subtítulo decodificados mediante dichos medios de decodificación de subtítulo.

5. Método de decodificación de posición de subtítulo para decodificar los datos de vídeo codificados multiplexados con datos de subtítulo y datos de posición que definen para cada trama la posición en la que va a superponerse un subtítulo sobre la imagen de vídeo, comprendiendo el método las etapas siguientes:

desmultiplexar los datos de vídeo a partir de los datos de subtítulo y los datos de posición;

realizar una decodificación de vídeo de los datos de vídeo codificados desmultiplexados de una imagen de vídeo que debe visualizarse; 60 almacenar en una memoria intermedia los datos de subtítulo y los datos de posición desmultiplexados;

temporizar una operación de lectura de dichos datos de subtítulo de dicha memoria intermedia durante una visualización en tiempo real de dicha imagen de vídeo; y 65

cambiar dinámicamente según dichos datos de posición e impulsos de sincronización verticales y horizontales la posición horizontal sobre cada trama de vídeo en la que dicho subtítulo es superpuesto durante la visualización; en el que la posición de dicho subtítulo es cambiada dinámicamente:

reteniendo, sobre cada impulso de sincronización vertical, los datos de posición de la memoria intermedia, presentando los datos de posición un valor indicador de la posición del subtítulo a lo largo del eje horizontal; y

disminuyendo, en cada impulso de sincronización horizontal, un valor de dichos datos de posición retenidos cada vez que un píxel de dicha trama es visualizado,

en el que dicha operación de lectura es realizada cuando dicho valor es disminuido hasta cero, provocando que dicho subtítulo sea superpuesto con dicha trama de vídeo en una posición horizontal definida por los datos de posición.

6. Método de decodificación de posición de subtítulo según la reivindicación 5 que comprende además un retardo que compensa un retardo inherente causado por el método de decodificación de posición de subtítulo.

7. Método de decodificación de posición de subtítulo según la reivindicación 5, que comprende además decodificar

dichos datos de subtítulo almacenados en dicha memoria intermedia. 20

8. Método de decodificación de posición de subtítulo según la reivindicación 7, que comprende además mezclar dichos datos de vídeo decodificados con dichos datos de subtítulo decodificados.

9. Método de decodificación de posición de subtítulo según la reivindicación 5 que comprende además repetir dichas

etapas de realizar la decodificación de vídeo, almacenar, leer y cambiar dinámicamente para los subtítulos diferentes que presentan posiciones diferentes en las que los subtítulos deben superponerse sobre la imagen de vídeo.


 

Patentes similares o relacionadas:

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 5 de Junio de 2019, de Godo Kaisha IP Bridge 1: Un sistema de codificación y decodificación de imágenes que incluye un aparato de codificación de imágenes que codifica una señal de imagen procedente de una fotografía […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 5 de Junio de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]

Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento, del 20 de Febrero de 2019, de Panasonic Intellectual Property Corporation of America: Un procedimiento de codificación y decodificación de imágenes que incluye un procedimiento de codificación de imágenes para codificar un bloque objetivo de […]

Dispositivo y método para la sincronización de diferentes partes de un servicio digital, del 6 de Febrero de 2019, de THOMSON LICENSING: Un dispositivo que actúa como una fuente de servicio digital , que comprende primeros medios para proporcionar, a la salida, datos […]

Procedimiento de codificación de imagen y procedimiento de decodificación de imagen, del 25 de Septiembre de 2018, de Godo Kaisha IP Bridge 1: Un procedimiento de codificación para codificar un cuadro en movimiento que incluye una pluralidad de cuadros con referencia a un cuadro de referencia seleccionado […]

Procedimiento de transmisión de imágenes, procedimiento de procesamiento de imágenes, procesador de imágenes, y medio de almacenamiento de datos, del 17 de Enero de 2018, de Sun Patent Trust: Un procedimiento de transmisión de imágenes para transmisión de datos (Dv) de imagen comprimidos correspondientes a una imagen en movimiento que comprende tramas, comprendiendo […]

Método de codificación de imágenes, del 3 de Enero de 2018, de Panasonic Intellectual Property Corporation of America: Un método de codificación de imágenes para codificar una señal de imagen que contiene Planos de Objetos de Video, que comprende: emitir una señal de imagen […]

Método de codificación de imágenes en movimiento y método de decodificación de imágenes en movimiento, del 21 de Septiembre de 2016, de Panasonic Intellectual Property Corporation of America: Un método de decodificación para decodificar imágenes plurales que constituyen una imagen en movimiento a partir de un flujo de bits, comprendiendo dicho método de […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .