Barrido de audio en una conferencia con múltiples participantes.

Un medio legible por ordenador de un primer dispositivo de participante en una conferencia con múltiples participantes, almacenando el medio legible por ordenador un programa de ordenador que cuando es ejecutado por al menos una unidad de procesamiento del primer dispositivo participante crea un efecto de barrido estéreo, comprendiendo el programa de ordenador instrucciones para:

mostrar representaciones de cada uno de al menos dos participantes diferentes en lugares distintos en un área de visualización;

caracterizado porque

el programa de ordenador comprende además instrucciones para:

recibir una única señal de audio

(220), en donde la única señal de audio (220) comprende audio mixto que comprende audio capturado a partir de dos o más de los al menos dos participantes, comprendiendo la única señal de audio recibida (220) datos indicativos de una intensidad de señal para cada uno de los diferentes participantes; y

barrer la única señal de audio recibida (220) a lo largo de altavoces de audio utilizando el conjunto de los datos de intensidad de señal con el fin de crear un efecto que una ubicación percibida de una señal de audio de un participante en particular coincide con la ubicación del participante en particular en el área de visualización.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E11192109.

Solicitante: APPLE INC..

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 1 INFINITE LOOP CUPERTINO, CA 95014 ESTADOS UNIDOS DE AMERICA.

Inventor/es: JEONG,Hyeonkuk, SALSBURY,Ryan.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Sistemas de televisión (detalles H04N 3/00, H04N... > H04N7/15 (Sistemas para conferencias (disposiciones para conferencias por comunicación telefónica H04M 3/56))

PDF original: ES-2472715_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Barrido de audio en una conferencia con mïltiples participantes

CAMPO DE LA INVENCIïN

La presente invenciïn se refiere al procesado de audio en una conferencia con mïltiples participantes.

ANTECEDENTES DE LA INVENCIïN

Con la proliferaciïn de los ordenadores de propïsito general, ha habido un aumento de la demanda para la realizaciïn de conferencias a travïs de ordenadores personales o de negocios. En tales conferencias, es deseable identificar rïpidamente a los participantes que estïn hablando en un momento dado. Tal identificaciïn, sin embargo, se vuelve difïcil a medida que se aïaden mïs participantes, en especial para los participantes que sïlo reciben datos de audio. Esto se debe a que las aplicaciones de conferencia anteriores no proporcionan ningïn pista visual o auditiva para ayudar a identificar hablantes activos durante una conferencia. Por lo tanto, existe una necesidad en la tïcnica de aplicaciones de conferencia que ayuden a un participante a identificar rïpidamente los participantes que hablan activamente en la conferencia.

El documento US5548346 se refiere a un procedimiento de comunicaciïn de mïltiples ubicaciones para un sistema de videoconferencia adaptado para localizar la imagen de sonido al ïrea central de la ventana en la que se muestra el interlocutor participante. Al localizar la imagen e sonido, se controlan el balance, la fase, y el retardo de los sonidos reproducidos por los altavoces.

RESUMEN DE LA INVENCIïN

Algunas realizaciones proporcionan una arquitectura para establecer conferencias de audio con mïltiples participantes a travïs de una red de ordenadores. Esta arquitectura tiene un distribuidor central que recibe seïales de audio de uno o mïs participantes. El distribuidor central mezcla las seïales recibidas y las transmite de vuelta a los participantes. En algunas realizaciones, el distribuidor central elimina eco eliminando la seïal de audio de cada participante de la seïal mezclada que el distribuidor central envïa al participante en particular.

En algunas realizaciones, el distribuidor central calcula un indicador de intensidad de seïal para la seïal de audio de cada participante y pasa los indicios calculados junto con la seïal de audio mezclado a cada participante. Algunas realizaciones utilizan entonces los signos de intensidad de seïal para mostrar medidores de nivel de audio que indican los niveles de volumen de los diferentes participantes. En algunas realizaciones, los medidores de nivel de audio se muestran junto a la imagen o icono de cada participante. Algunas realizaciones utilizan los indicios intensidad de la seïal para activar el barrido de audio.

En algunas realizaciones, el distribuidor central produce una ïnica seïal mezclada que incluye el audio de todos los participantes. Esta corriente (junto con los indicios de intensidad de seïal) se envïa a todos los participantes. Durante la reproducciïn de este flujo, un participante silenciarï la reproducciïn de fondo si el participante mismo es el principal contribuyente. Este plan proporciona supresiïn de eco sin necesidad de flujos separados y distintos para cada participante. Este sistema requiere menos computaciïn del distribuidor central. Tambiïn, a travïs de multidifusiïn IP, el distribuidor central puede reducir sus necesidades de ancho de banda.

Los ordenadores del distribuidor central y de los participantes pueden tomar distintas formas. En otras palabras, estos ordenadores pueden integrarse en cualquier tipo de dispositivo, como un ordenadore de mesa independiente, ordenador portïtil, y/o ordenador de mano u otro dispositivo de electrïnica de consumo o de comunicaciïn, centro multimedia, concentrador, etc.

BREVE DESCRIPCIïN DE LOS DIBUJOS

Las caracterïsticas novedosas de la invenciïn se exponen en las reivindicaciones adjuntas. Sin embargo con fines de explicaciïn, se exponen varias realizaciones en las siguientes figuras.

La Figura 1 ilustra un ejemplo de la arquitectura de conferencia de audio/video de algunas realizaciones de la invenciïn.

Las Figuras 2 y 3 ilustran cïmo algunas realizaciones intercambian contenido de audio en una conferencia de audio/video con mïltiples participantes.

La Figura 4 muestra los componentes software de la aplicaciïn de conferencia de audio/video de algunas realizaciones de la invenciïn.

La Figura 5 ilustra el mïdulo de punto focal de algunas realizaciones de la invenciïn.

La Figura 6 es un diagrama de flujo que muestra la generaciïn de audio mezclado por el punto focal en algunas de las realizaciones.

La Figura 7 ilustra cïmo el protocolo RTP es utilizado por el mïdulo de punto focal en algunas realizaciones para transmitir el contenido de audio.

La Figura 8 ilustra el punto no focal de algunas realizaciones de la invenciïn.

La Figura 9 ilustra cïmo el protocolo RTP es utilizado por el mïdulo de punto no focal en algunas realizaciones para transmitir el contenido de audio.

La Figura 10 ilustra conceptualmente el flujo de la operaciïn de decoficicaciïn del punto no focal no en algunas realizaciones.

La Figura 11 ilustra los medidores de nivel de audio que se muestran en algunas realizaciones de la invenciïn.

La Figura 12 muestra una disposiciïn ejemplar de las imïgenes de los participantes sobre una de los pantallas de los participantes.

La Figura 13 es un diagrama de flujo que ilustra el proceso mediante el cual algunas realizaciones de la invenciïn realizan el barrido de audio.

DESCRIPCIïN DETALLADA DE LA INVENCIïN

En la siguiente descripciïn, se exponen numerosos detalles con fines de explicaciïn. Sin embargo, un experto en la tïcnica se darï cuenta de que la invenciïn puede ser llevada a cabo sin el uso de estos detalles especïficos. En otros casos, se muestran estructuras y dispositivos bien conocidos en forma de diagrama de bloques para no oscurecer la descripciïn de la invenciïn con detalles innecesarios.

Algunas realizaciones proporcionan una arquitectura para establecer conferencias de audio/video con mïltiples participantes. Esta arquitectura tiene un distribuidor central que recibe las seïales de audio de uno o mïs participantes. El distribuidor central mezcla las seïales recibidas y las transmite de vuelta a los participantes. En algunas realizaciones, el distribuidor central elimina eco eliminando de seïal de audio de cada participante de la seïal mezclada que el distribuidor central envïa al participante en particular.

En algunas realizaciones, el distribuidor central calcula un indicador de intensidad de seïal para la seïal de audio de cada participante y pasa los indicios calculados junto con la seïal de audio mezclado a cada participante. Algunas realizaciones a continuaciïn, utilizan los indicios de intensidad de seïal para mostrar medidores de nivel de audio que indican los niveles de volumen de los diferentes participantes. En algunas realizaciones, los medidores de nivel de audio se muestran junto a la imagen o icono de cada participante. Algunas realizaciones utilizan los indicios intensidad de seïal para activar el barrido de audio.

Varias realizaciones detalladas de la invenciïn se describen a continuaciïn. En estas realizaciones, el distribuidor central es el ordenador de uno de los participantes en la conferencia de audio/video. Un experto se darï cuenta de que otras realizaciones se implementan de forma diferente. Por ejemplo, en algunas realizaciones el distribuidor central no es el ordenador de ninguno de los participantes en la conferencia.

I. VISIïN GENERAL

La Figura 1 ilustra un ejemplo de arquitectura de conferencia 100 de algunas realizaciones de la invenciïn. Esta arquitectura permite que varios participantes... [Seguir leyendo]

 


Reivindicaciones:

1. Un medio legible por ordenador de un primer dispositivo de participante en una conferencia con mïltiples participantes, almacenando el medio legible por ordenador un programa de ordenador que cuando es ejecutado por al menos una unidad de procesamiento del primer dispositivo participante crea un efecto de barrido estïreo, comprendiendo el programa de ordenador instrucciones para:

mostrar representaciones de cada uno de al menos dos participantes diferentes en lugares distintos en un ïrea de visualizaciïn;

caracterizado porque el programa de ordenador comprende ademïs instrucciones para:

recibir una ïnica seïal de audio (220) , en donde la ïnica seïal de audio (220) comprende audio mixto que comprende audio capturado a partir de dos o mïs de los al menos dos participantes, comprendiendo la ïnica seïal de audio recibida (220) datos indicativos de una intensidad de seïal para cada uno de los diferentes participantes; y

barrer la ïnica seïal de audio recibida (220) a lo largo de altavoces de audio utilizando el conjunto de los datos de intensidad de seïal con el fin de crear un efecto que una ubicaciïn percibida de una seïal de audio de un participante en particular coincide con la ubicaciïn del participante en particular en el ïrea de visualizaciïn.

2. El medio legible por ordenador segïn la reivindicaciïn 1, en el que el conjunto de instrucciones a barrer comprende conjuntos de instrucciones para:

identificar la ubicaciïn de la representaciïn de la participante en particular visualizado en dicha ïrea de visualizaciïn, y

crear un retraso en al menos uno de los altavoces de audio para tener en cuenta la ubicaciïn identificada de la representaciïn del participante en particular.

3. El medio legible por ordenador segïn la reivindicaciïn 1, en el que el ïnico audio recibido estï en el protocolo de transferencia en tiempo real (RTP) que comprenden los paquetes de los datos de intensidad de seïal.

4. El medio legible por ordenador segïn la reivindicaciïn 1, en el que al menos una de las representaciones que aparecen en dicha ïrea de visualizaciïn es al menos una de un icono, una imagen y un vïdeo.

5. El medio legible por ordenador segïn la reivindicaciïn 1, en el que la ïnica seïal de audio comprende una primera seïal de audio capturada por un segundo dispositivo de la conferencia y una segunda seïal de audio capturada por un tercer dispositivo de la conferencia.

6. El medio legible por ordenador segïn la reivindicaciïn 5, en el que la ïnica seïal de audio es generada por el segundo dispositivo de la conferencia.

7. El medio legible por ordenador segïn la reivindicaciïn 6, en el que los datos de intensidad de seïal para una seïal de audio en particular son calculados por el segundo dispositivo como una potencia de raïz cuadrada media (RMS) de la seïal de audio en particular.

8. El medio legible por ordenador segïn la reivindicaciïn 1, en el que las representaciones comprenden imïgenes de vïdeo capturadas por otros dispositivos participantes de la conferencia de vïdeo.

9. El medio legible por ordenador segïn la reivindicaciïn 8, en el que las representaciones comprenden imïgenes de vïdeo capturadas en el primer dispositivo participante.

10. Un procedimiento para proporcionar una aplicaciïn de los medios de comunicaciïn de conferencia para un primer dispositivo participante en una conferencia con mïltiples participantes, comprendiendo el procedimiento:

mostrar, en lugares distintos en un ïrea de visualizaciïn de una interfaz grïfica de usuario (GUI) , imïgenes de vïdeo de cada uno de una pluralidad de dispositivos de participantes de la conferencia de mïltiples participantes;

caracterizado por recibir una ïnica seïal de audio (220) , en el que la ïnica seïal de audio (220) comprende audio mixto que comprende audio capturado a partir de dos o mïs de los al menos dos participantes, comprendiendo la ïnica seïal de audio recibida (220) datos indicativos de la intensidad de la seïal de un componente de seïal de audio de cada una de la pluralidad de dispositivos participantes; y

especificar al menos un parïmetro de reproducciïn para reproducir la ïnica seïal de audio (220) en base al menos en parte en la intensidad de seïal del componente de seïal de audio desde un dispositivo participante en particular para determinar que la seïal de audio componente respectiva se originï desde el participante en particular para crear un efecto de barrido en que una ubicaciïn percibida del componente de seïal de audio respectivo del dispositivo participante en particular coincide con la ubicaciïn concreta de la imagen de vïdeo del dispositivo participante en particular en el ïrea de visualizaciïn.

11. El procedimiento segïn la reivindicaciïn 10, en el que el primer dispositivo participante tiene un conjunto de altavoces estïreo y el efecto de barrido hace que el dispositivo reproduzca una seïal de audio particular de un dispositivo participante en particular, de manera tal que la seïal de audio particular sea percibida como procedente de un altavoz que estï mïs cerca de la ubicaciïn distintiva de la imagen de vïdeo desde el dispositivo participante en particular que un altavoz que estï mïs lejos de la ubicaciïn distintiva.

12. El procedimiento segïn la reivindicaciïn 10, en el que el primer dispositivo participante tiene un conjunto de altavoces estïreo con un primer altavoz mïs cerca de la ubicaciïn distintiva de una imagen de vïdeo particular, desde un dispositivo participante en particular, en donde el parïmetro de reproducciïn especificado hace que la ïnica seïal de audio a reproducir a travïs del primer altavoz antes que a travïs del segundo altavoz cuando los datos de intensidad de seïal indican que estï hablando un participante en el dispositivo determinado participante.

13. El procedimiento segïn la reivindicaciïn 10, en el que el primer dispositivo participante tiene un conjunto de altavoces estïreo y el parïmetro de reproducciïn especificado hace que la seïal de audio se reproduzca a travïs de uno de los altavoces con una amplitud alterada.

14. El procedimiento segïn la reivindicaciïn 10, que comprende capturar una seïal de audio en el primer dispositivo participante.

15. El procedimiento segïn la reivindicaciïn 10, que comprende descodificar la ïnica seïal de audio recibida.

Figura 11

Figura 12