PROCESAMIENTO DE REGIONES DE INTERES PARA VIDEOTELEFONIA.
Un procedimiento para el procesamiento de regiones de interés en un sistema de videotelefonía que comprende al menos dos dispositivos (12,
14) de comunicación de vídeo conectados mediante un canal de transmisión, comprendiendo cada dispositivo de comunicación de vídeo un codificador-decodificador de vídeo, comprendiendo el procedimiento:
transmitir vídeo de extremo cercano codificado desde un dispositivo local a un dispositivo remoto;
recibir, en el dispositivo local, vídeo de extremo lejano codificado por el dispositivo remoto;
recibir, en el dispositivo local, información desde el dispositivo remoto que especifica una región de interés (ROI) dentro del vídeo de extremo cercano codificado transmitido al dispositivo remoto, en el que la información que especifica la ROI está incrustada en el vídeo de extremo lejano codificado; y
codificar, en el dispositivo local, el vídeo de extremo cercano basándose en la ROI para mejorar una calidad de imagen de la ROI respecto a zonas no ROI del vídeo de extremo cercano
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2006/008458.
Solicitante: QUALCOMM INCORPORATED.
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 5775 MOREHOUSE DRIVE,SAN DIEGO, CA 92121.
Inventor/es: TSAI, MING-CHANG, LEE,YEN-CHI, EL-MALEH,KHALED HELMI.
Fecha de Publicación: .
Fecha Concesión Europea: 27 de Enero de 2010.
Clasificación Internacional de Patentes:
- H04N7/14A3
- H04N7/173 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 7/00 Sistemas de televisión (detalles H04N 3/00, H04N 5/00; métodos y arreglos, para la codificación, decodificación, compresión o descompresión de señales de vídeo digital H04N 19/00; distribución selectiva de contenido H04N 21/00). › de dos vías, p. ej. enviando el abonado un señal de selección del programa.
- H04N7/26A10S
- H04N7/26A4
- H04N7/26A6C4
- H04N7/26A6U
Clasificación PCT:
- H04N7/24 H04N 7/00 […] › Sistemas para la transmisión de señales de televisión que utilizan la modulación por impulsos codificados (H04N 21/00 tiene prioridad).
- H04N7/26
Fragmento de la descripción:
Procesamiento de regiones de interés para videotelefonía.
La presente solicitud reivindica el beneficio de la solicitud provisional estadounidense n.º 60/660,200, presentada el 9 de marzo de 2005 y la solicitud de patente estadounidense en tramitación 11/182,432 presentada el 15 de julio de 2005, titulada REGION-OF-INTEREST EXTRACTION FOR VIDEO TELEPHONY (Extracción de regiones de interés para videotelefonía).
Campo técnico
La divulgación se refiere a codificación y decodificación de vídeo digital y, más particularmente, a técnicas para el procesamiento de información de regiones de interés (ROI) para aplicaciones de videotelefonía (VT).
Antecedentes
Se han establecido varias normas diferentes de codificación de vídeo para codificar secuencias de vídeo digital. El Grupo de Expertos en Imágenes en Movimiento (MPEG), por ejemplo, ha desarrollado varias normas que incluyen MPEG-I, MPEG-2 y MPEG-4. Otros ejemplos incluyen la norma H.263 de la Unión Internacional de Telecomunicaciones (ITU) y la incipiente norma ITU H.264. Estas normas de codificación de vídeo soportan generalmente eficacia de transmisión mejorada de secuencias de vídeo mediante la codificación de datos de manera comprimida.
La videotelefonía (VT) permite a los usuarios compartir información de vídeo y de audio para soportar aplicaciones tales como videoconferencia. Normas de videotelefonía ejemplares incluyen las definidas por el Protocolo de Inicio de Sesión (STP), la norma ITU H.323 y la norma ITU H.324. En un sistema de VT, los usuarios pueden enviar y recibir información de vídeo, sólo recibir información de vídeo o sólo enviar información de vídeo. Un destinatario generalmente ve información de vídeo recibida en la forma en que se ha transmitido desde un emisor.
Se ha propuesto codificación preferente de una parte seleccionada de la información de vídeo. Por ejemplo, un emisor puede especificar una región de interés (ROI) que va a codificarse con calidad superior para la transmisión a un destinatario. El emisor puede desear resaltar la ROI para un destinatario remoto. Un ejemplo típico de una ROI es la cara de una persona, aunque un emisor puede desear centrar la atención en otros objetos dentro de una escena de vídeo. Con la codificación preferente de la ROI, un destinatario puede ver la ROI más claramente que las regiones no ROI.
El documento US 2005/024487 da a conocer un sistema de videoconferencia en el que múltiples codecs de vídeo están operando simultáneamente para transmitir datos de vídeo, audio y otros datos entre los participantes en tiempo real, que comparten los recursos disponibles del sistema. Se proporciona un modo para que cada codec se adapte a condiciones de carga de red cambiantes provocadas, por ejemplo, por participantes (y por tanto codecs) que se unen a/abandonan la conferencia (el sistema). Para soportar vídeo en este tipo de entorno dinámico, el codec está diseñado para el control de la complejidad y la distorsión y puede realizar compensaciones inteligentes entre complejidad, tasa de transmisión y distorsión. Para el control de la complejidad, el codec monitoriza los recursos computacionales disponibles del sistema durante el tiempo de ejecución y adapta sus algoritmos de codificación/decodificación para adaptarse lo mejor posible a las mediciones de complejidad. Para el control de la distorsión, el codec supera las limitaciones de vídeo de mala calidad a tasas de transmisión de bits bajas y permite al usuario mejorar la calidad del vídeo en regiones de interés seleccionadas.
Sumario
La divulgación va dirigida a técnicas de procesamiento de regiones de interés (ROI) para videotelefonía (VT). Según las técnicas dadas a conocer, un dispositivo destinatario local define información de ROI para vídeo codificado y transmitido por un dispositivo emisor remoto, es decir, vídeo de extremo lejano. El dispositivo destinatario local transmite la información de ROI al dispositivo emisor remoto. Usando la información de ROI transmitida por el dispositivo destinatario, el dispositivo emisor aplica codificación preferente a una ROI dentro de una escena de vídeo, tal como codificación de calidad superior o protección frente a errores. De esta manera, el dispositivo destinatario puede controlar de manera remota codificación de ROI de vídeo de extremo lejano codificado por el dispositivo emisor.
Además de recibir vídeo de extremo lejano, puede equiparse un destinatario para enviar vídeo, es decir, vídeo de extremo cercano. Por lo tanto, los dispositivos que participan en comunicación de VT pueden actuar de manera simétrica tanto de emisor como de destinatario de información de vídeo. Actuando como destinatario, cada dispositivo puede definir información de ROI de extremo lejano para vídeo codificado por el dispositivo remoto como emisor. Asimismo, actuando como emisor, cada dispositivo puede definir información de ROI de extremo cercano para información de vídeo transmitida al otro dispositivo como destinatario. Puede denominarse a un dispositivo emisor o destinatario como "compatible con ROI" en el sentido de que puede procesar información de ROI proporcionada por otro dispositivo para soportar el control remoto de codificación de vídeo de ROI.
La información de ROI de extremo lejano permite a un destinatario controlar la codificación de ROI remota por un dispositivo emisor para ver más claramente objetos o regiones dentro de una escena de vídeo recibida. La información de ROI de extremo cercano permite a un emisor controlar la codificación de ROI local para resaltar objetos o regiones dentro de una escena de vídeo transmitida. Por consiguiente, la codificación preferente de una ROI por un emisor puede basarse en información de ROI generada por un destinatario o un emisor. Además, un dispositivo destinatario puede decodificar de manera preferente una ROI basándose en información de ROI, por ejemplo, mediante la aplicación de posprocesamiento de calidad superior tal como técnicas de encubrimiento de errores, desbloqueo o eliminación de oscilaciones transitorias.
Para facilitar el procesamiento de ROI, la divulgación contempla adicionalmente técnicas para la selección de ROI, correlación de ROI, extracción de ROI, señalización de ROI, seguimiento de ROI y autenticación de acceso de dispositivos destinatarios para permitir el control remoto de codificación de ROI por un dispositivo emisor. La selección de ROI puede basarse en patrones de ROI predefinidos, descripciones de ROI verbales o textuales o el dibujo de ROI por un usuario. La correlación de ROI implica la traducción de un patrón de ROI seleccionado a una correlación de ROI, que puede adoptar la forma de una correlación de macrobloques (MB) adecuada para su uso por un codificador de vídeo.
La señalización de ROI puede implicar señalización en banda o fuera de banda de información de ROI desde un destinatario a un dispositivo emisor. El seguimiento de ROI implica ajuste dinámico de la correlación de ROI en respuesta al movimiento de ROI. La autenticación de acceso puede implicar la concesión de derechos y niveles de acceso a dispositivos destinatarios para fines de control de ROI remoto, así como la resolución de conflictos de control de ROI entre usuarios locales y remotos o múltiples usuarios remotos.
La extracción de ROI puede implicar procesar una descripción de usuario de una región de interés (ROI) para generar información que especifique la ROI basándose en la descripción. El vídeo de extremo cercano puede codificarse basándose en la información que especifica la ROI para mejorar la calidad de imagen de la ROI respecto a zonas no ROI del vídeo de extremo cercano. La descripción de usuario puede ser textual, gráfica o basada en voz. Un módulo de extracción aplica un procesamiento apropiado a la información de ROI generada a partir de la descripción de usuario. El módulo de extracción puede residir localmente con un dispositivo de comunicación de vídeo o residir en un servidor intermedio distinto configurado para extracción de ROI.
En una realización, la divulgación proporciona un procedimiento que comprende recibir información desde un dispositivo remoto que especifica una región de interés (ROI) dentro de vídeo de extremo cercano codificado por un dispositivo local y recibido por el dispositivo remoto, y codificar el vídeo de extremo cercano basándose en la ROI para mejorar la calidad de imagen de la ROI respecto a zonas no ROI del vídeo.
En otra realización, la divulgación proporciona un dispositivo de codificación de vídeo que comprende...
Reivindicaciones:
1. Un procedimiento para el procesamiento de regiones de interés en un sistema de videotelefonía que comprende al menos dos dispositivos (12, 14) de comunicación de vídeo conectados mediante un canal de transmisión, comprendiendo cada dispositivo de comunicación de vídeo un codificador-decodificador de vídeo, comprendiendo el procedimiento:
2. El procedimiento según la reivindicación 1, que comprende además transmitir el vídeo de extremo cercano codificado con la calidad de imagen mejorada al dispositivo remoto.
3. El procedimiento según la reivindicación 1, en el que la información que especifica la ROI está incluida dentro de un campo de datos de usuario que se incrusta en el vídeo de extremo lejano codificado.
4. El procedimiento según la reivindicación 1, en el que la información que especifica la ROI se incrusta en el vídeo de extremo lejano codificado usando la técnica de ocultación de datos.
5. El procedimiento según la reivindicación 1, que comprende además:
6. El procedimiento según la reivindicación 5, que comprende además:
7. El procedimiento según la reivindicación 6, en el que decodificar el vídeo de extremo lejano codificado incluye aplicar técnicas de encubrimiento de errores o de posprocesamiento de calidad superior a la ROI de extremo lejano en el vídeo de extremo lejano respecto a zonas no ROI del vídeo de extremo lejano.
8. El procedimiento según la reivindicación 1, que comprende además generar una correlación de macrobloques (MB) que identifica MB que están dentro de la ROI basándose en la información que especifica la ROI.
9. El procedimiento según la reivindicación 1, en el que codificar el vídeo de extremo cercano incluye aplicar técnicas de protección frente a errores o de codificación de calidad superior a la ROI en el vídeo de extremo cercano respecto a zonas no ROI del vídeo de extremo cercano.
10. El procedimiento según la reivindicación 1, que comprende además autenticar a un usuario remoto asociado con el dispositivo remoto antes de codificar el vídeo de extremo cercano basándose en la ROI.
11. El procedimiento según la reivindicación 10, en el que la autenticación incluye determinar si el usuario remoto está autorizado a controlar la codificación del vídeo de extremo cercano basándose en la ROI.
12. El procedimiento según la reivindicación 10, en el que la autenticación incluye buscar, desde un usuario local asociado con el dispositivo local, la autorización para que el usuario remoto controle la codificación del vídeo de extremo cercano basándose en la ROI.
13. El procedimiento según la reivindicación 1, en el que recibir información desde el dispositivo remoto incluye recibir información desde una pluralidad de dispositivos remotos que especifican múltiples ROI dentro del vídeo de extremo cercano, comprendiendo además el procedimiento autenticar a usuarios remotos asociados con los dispositivos remotos para seleccionar a uno de los usuarios remotos para controlar la codificación del vídeo de extremo cercano basándose en la ROI respectiva.
14. El procedimiento según la reivindicación 1, que comprende además:
15. El procedimiento según la reivindicación 14, que comprende además generar una correlación de macrobloques (MB) que identifica MB que están dentro de la ROI basándose en la información que especifica la ROI y en el que ajustar la ROI incluye modificar el estatus de MB como estando incluidos en o excluidos de la ROI basándose en la información de movimiento.
16. El procedimiento según la reivindicación 1, en el que la información que especifica una ROI incluye información textual o verbal, comprendiendo además el procedimiento definir la ROI basándose en la información textual o verbal.
17. El procedimiento según la reivindicación 16, en el que definir la ROI incluye definir la ROI en un servidor intermedio en comunicación con al menos uno del dispositivo local y el dispositivo remoto.
18. Un dispositivo (12, 14) de comunicación de vídeo, que comprende:
19. El dispositivo según la reivindicación 18, en el que el codificador de vídeo transmite el vídeo de extremo cercano codificado con la calidad de imagen mejorada al dispositivo remoto.
20. El dispositivo según la reivindicación 18, en el que la información que especifica la ROI está incluida dentro de un campo de datos de usuario que está incrustado en el vídeo de extremo lejano codificado.
21. El dispositivo según la reivindicación 18, en el que la información que especifica la ROI se incrusta en el vídeo de extremo lejano codificado usando la técnica de ocultación de datos.
22. El dispositivo según la reivindicación 18, que comprende además un motor (44) de región de interés (ROI) que genera información que especifica una ROI de extremo lejano dentro del vídeo de extremo lejano codificado y en el que el codificador de vídeo transmite la información que especifica la ROI de extremo lejano con el vídeo de extremo cercano codificado al dispositivo remoto.
23. El dispositivo según la reivindicación 22, en el que el decodificador de vídeo recibe vídeo de extremo lejano codificado por el dispositivo remoto y en el que el decodificador de vídeo decodifica el vídeo de extremo lejano codificado recibido desde el dispositivo remoto para mejorar la calidad de imagen de la ROI de extremo lejano en el vídeo de extremo lejano respecto a zonas no ROI del vídeo de extremo lejano.
24. El dispositivo según la reivindicación 23, en el que el decodificador de vídeo aplica técnicas de encubrimiento de errores o de posprocesamiento de calidad superior a la ROI de extremo lejano en el vídeo de extremo lejano respecto a zonas no ROI del vídeo de extremo lejano.
25. El dispositivo según la reivindicación 18, que comprende además un módulo (54) correlacionador de ROI que genera una correlación de macrobloques (MB) que identifica MB que están dentro de la ROI basándose en la información que especifica la ROI, y un controlador (52) de ROI que procesa la información que especifica la ROI para su aplicación al módulo correlacionador de ROI.
26. El dispositivo según la reivindicación 18, en el que el codificador de vídeo aplica técnicas de protección frente a errores o de codificación de calidad superior a la ROI en el vídeo de extremo cercano respecto a zonas no ROI del vídeo de extremo cercano.
27. El dispositivo según la reivindicación 18, que comprende además un módulo (58) de autenticación que autentica a un usuario remoto asociado con el dispositivo remoto antes de codificar el vídeo de extremo cercano basándose en la ROI, en el que el módulo de autenticación determina si el usuario remoto está autorizado a controlar la codificación del vídeo de extremo cercano basándose en la ROI.
28. El dispositivo según la reivindicación 27, en el que el módulo de autenticación busca, desde un usuario local asociado con el dispositivo, la autorización para el usuario remoto para controlar la codificación del vídeo de extremo cercano basándose en la ROI.
29. El dispositivo según la reivindicación 18, en el que la información recibida desde un dispositivo remoto incluye información desde una pluralidad de dispositivos remotos que especifica múltiples ROI dentro del vídeo de extremo cercano, comprendiendo además el sistema un módulo de autenticación que autentica a usuarios remotos asociados con los dispositivos remotos para seleccionar a uno de los usuarios remotos para controlar la codificación del vídeo de extremo cercano basándose en la ROI respectiva.
30. El dispositivo según la reivindicación 18, que comprende además un módulo (56) de seguimiento que monitoriza información de movimiento asociada con el vídeo de extremo cercano y ajusta la ROI basándose en la información de movimiento, en el que el codificador codifica el vídeo de extremo cercano basándose en la ROI ajustada.
31. El dispositivo según la reivindicación 30, que comprende además un módulo (54) correlacionador de ROI que genera una correlación de macrobloques (MB) que identifica MB que están dentro de la ROI basándose en la información que especifica la ROI, en el que el ajuste de la ROI mediante el módulo de seguimiento incluye la modificación del estatus de MB como estando incluidos en o excluidos de la ROI basándose en la información de movimiento.
32. El dispositivo según la reivindicación 18, en el que la información que especifica una ROI incluye información textual o verbal, comprendiendo además el sistema un módulo (60) de extracción que define la ROI basándose en la información textual o verbal.
33. El dispositivo según la reivindicación 18, en el que la información que especifica una ROI incluye información textual o verbal, comprendiendo además el sistema un servidor de extracción intermedio, situado de manera remota respecto al dispositivo de comunicación de vídeo y el dispositivo de comunicación de vídeo remoto, que define la ROI basándose en la información textual o verbal.
34. Un medio legible por ordenador que comprende instrucciones para hacer que un procesador realice el procedimiento según cualquiera de las reivindicaciones 1 a 17.
35. Un procedimiento para el procesamiento de regiones de interés en un sistema de videotelefonía que comprende al menos dos dispositivos (12, 14) de comunicación de vídeo conectados mediante un canal de transmisión, comprendiendo cada dispositivo de comunicación de vídeo un codificador-decodificador de vídeo, comprendiendo el procedimiento:
36. Un dispositivo de comunicación de vídeo, que comprende:
37. El dispositivo según la reivindicación 36 o el procedimiento según la reivindicación 35, en el que la información que especifica la ROI está incluida dentro de un campo de datos de usuario que está incrustado en el vídeo de extremo cercano codificado que se transmite al dispositivo remoto.
38. El dispositivo según la reivindicación 36 o el procedimiento según la reivindicación 35, en el que la información que especifica la ROI se incrusta en el vídeo de extremo cercano codificado usando la técnica de ocultación de datos.
39. El dispositivo según la reivindicación 36 o el procedimiento según la reivindicación 35, en el que la información que especifica la ROI incluye una correlación de macrobloques (MB) que identifica MB que están dentro de la ROI.
Patentes similares o relacionadas:
Aparato de procesamiento de información, método de procesamiento de información y programa de activación de aplicación, del 22 de Julio de 2020, de SONY CORPORATION: Un receptor , que comprende un sintonizador configurado para recibir una señal de radiodifusión digital mediante transmisión de ondas de radiodifusión; […]
Sistema y método para identificar y procesar datos dentro de un flujo de datos, del 29 de Abril de 2020, de VECTORMAX CORPORATION: Un sistema para codificar un flujo de datos de video, dicho sistema caracterizado por: un primer determinante adaptado para examinar […]
Aparato y procedimiento para descubrir un punto de entrada de arranque de ESG en un sistema de CBMS, del 29 de Abril de 2020, de SAMSUNG ELECTRONICS CO., LTD.: Un procedimiento para proporcionar información de descubrimiento de un punto de entrada de arranque de Guía Electrónica de Servicios, ESG, en una Convergencia de Servicio […]
Sistema de control de acceso al servicio y procedimiento que usa un agente del navegador integrado, del 15 de Abril de 2020, de SAMSUNG ELECTRONICS CO., LTD.: Un sistema de control de acceso al servicio que usa un agente del navegador integrado, comprendiendo el sistema: un servidor que proporciona […]
Modelo de impresiones dirigidas para la entrega de recursos de red de difusión, del 8 de Abril de 2020, de Invidi Technologies Corporation: Un método para su uso en conexión con la entrega de recursos a usuarios de una red de difusión, implicando dicha red de difusión esencialmente distribución sincronizada […]
Verificación y fomento del consumo de activos en una red de comunicaciones, del 25 de Marzo de 2020, de Invidi Technologies Corporation: Un método para su uso en la entrega de contenido en una red de comunicaciones, siendo el método realizado por un dispositivo de equipo de las instalaciones […]
Sistemas y procedimientos para proporcionar almacenamiento de datos en servidores de un sistema de entrega de medios bajo demanda, del 22 de Enero de 2020, de Rovi Guides, Inc: Un procedimiento para su uso en un sistema de guía interactivo que proporciona a los usuarios acceso a programas, comprendiendo el procedimiento: generar, […]
Sistema de demanda y reproducción de medios, del 23 de Octubre de 2019, de Sky CP Limited: Un receptor de medios adaptado para reproducir elementos de contenido de medios primarios y secundarios recibidos de un servidor de medios en respuesta a una […]