Método y aparato para proporcionar datos de audio correspondientes a un texto.

Un método para que un dispositivo de red (110) proporcione datos de audio correspondientes a un texto,

comprendiendo el método:

recibir (S13) una solicitud desde un dispositivo de comunicaciones (101) para acceder a una página web quecomprende una parte de texto,

recibir (S14, S15) desde un primer servidor de proveedor de contenido (103) la página web que comprende la partede texto,

identificar la parte de texto,

insertar (S16) en la página web un enlace para proporcionar datos de audio correspondientes a la parte de texto,

transmitir (S17) la página web con el enlace insertado al dispositivo de comunicaciones (101),

recibir (S18) desde el dispositivo de comunicaciones (101) una solicitud de datos de audio correspondientes a laparte de texto,

generar (S19) datos de audio correspondientes a la parte de texto usando un convertidor de texto a voz,transmitir (S20) los datos de audio a dicho dispositivo de comunicaciones (101);

en el que, durante la etapa de generación (S19) de datos de audio a partir de la parte de texto, un contenido dedatos de audio preliminar se proporciona al dispositivo de comunicaciones (101) de manera que el contenido dedatos de audio preliminar puede reproducirse en el dispositivo de comunicaciones (101) mientras que al menos unaparte de los datos de audio correspondientes a la parte de texto está generándose y difundiéndose en flujo continuoal dispositivo de comunicaciones (101).

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10306196.

Solicitante: Orange.

Nacionalidad solicitante: Francia.

Dirección: 78, rue Olivier de Serres 75015 Paris FRANCIA.

Inventor/es: HERNÁNDEZ MARTÍNEZ,JULIÁN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L13/04 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 13/00 Síntesis de la voz; Sistemas de síntesis de la voz a partir de texto. › Detalles de sistemas de síntesis de voz, p. ej. estructura del sintetizador o gestión de memoria.

PDF original: ES-2437479_T3.pdf

 

Método y aparato para proporcionar datos de audio correspondientes a un texto.

Fragmento de la descripción:

Método y aparato para proporcionar datos de audio correspondientes a un texto

Campo de la invención La presente invención se refiere en general a un método y un aparato para proporcionar datos de audio correspondientes a un texto. En particular, pero no de manera exclusiva, la invención se refiere a un método y un aparato para proporcionar datos de audio correspondientes a al menos una parte de texto de una página web.

Antecedentes de la invención Las páginas web son documentos o recursos de información proporcionados por un servidor u ordenador de contenido a los que puede accederse a través de Internet por medio de un navegador web y que se muestran en un terminal de usuario. Las páginas web incluyen normalmente partes de un texto y otro contenido de datos que proporcionan información al usuario. Con el fin de poder recuperar la información de texto, el usuario debe poder leer el texto. Sin embargo, no todos los usuarios pueden leer el texto proporcionado en tales páginas web; las personas ciegas o con discapacidad visual o personas con dificultades en la lectura, por ejemplo, no pueden leer el texto mostrado en el terminal de usuario.

Se han desarrollado aplicaciones de software para proporcionar al usuario acceso a la información mostrada en la pantalla de un terminal mediante convertidores de texto a voz o mediante una pantalla de Braille. Tales aplicaciones de software están almacenadas en el terminal y solo pueden convertir datos de texto en datos de audio tan pronto como se hayan recibido en el terminal, haciendo de ese modo que el usuario experimente un retardo en la recepción de datos en un formato comprensible. El documento US 2006/0111911 describe un método y un aparato para generar archivos de audio a partir de páginas web, donde los datos de audio correspondientes a una página web pueden generarse por un servidor remoto al terminal de usuario en respuesta a una solicitud del usuario y transmitirse posteriormente al terminal de usuario. Sin embargo, los retardos debidos al almacenamiento intermedio y a la difusión en flujo continuo de los datos de audio dan como resultado un tiempo de espera para que el usuario reciba el contenido de datos de audio.

Sumario de la invención Por consiguiente, con el fin de afrontar mejor uno o más de los problemas anteriores, un primer aspecto de la invención proporciona un método para que un dispositivo de red proporcione datos de audio correspondientes a un texto, comprendiendo el método: recibir una solicitud desde un dispositivo de comunicaciones para acceder a una página web que comprende una parte de texto; recibir desde un primer servidor de proveedor de contenido la página web que comprende la parte de texto; identificar la parte de texto; insertar en la página web un enlace para proporcionar datos de audio correspondientes a la parte de texto; transmitir la página web con el enlace insertado al

dispositivo de comunicaciones; recibir desde el dispositivo de comunicaciones una solicitud de datos de audio correspondientes a la parte de texto; generar datos de audio correspondientes a la parte de texto usando un convertidor de texto a voz; transmitir los datos de audio a dicho dispositivo de comunicaciones; en el que durante la etapa de generación de datos de audio a partir de la parte de texto, un contenido de datos de audio preliminar se proporciona al dispositivo de comunicaciones de manera que el contenido de datos de audio preliminar puede 45 reproducirse en el dispositivo de comunicaciones mientras que al menos una parte de los datos de audio correspondientes a la parte de texto está generándose y difundiéndose en flujo continuo al dispositivo de comunicaciones.

Un segundo aspecto de la invención proporciona un dispositivo de red, tal como un servidor, que proporciona datos 50 de audio correspondientes a un texto, comprendiendo el dispositivo de red: un transceptor para recibir una solicitud desde un dispositivo de comunicaciones para acceder a una página web que comprende una parte de texto y para recibir desde un primer servidor de proveedor de contenido la página web que comprende la parte de texto; un procesador para identificar la parte de texto y para insertar en la página web un enlace para proporcionar datos de audio correspondientes a la parte de texto; un convertidor de texto a voz para generar datos de audio 55 correspondientes a la parte de texto; una memoria intermedia para almacenar de manera intermedia los datos de audio generados en respuesta a la activación del enlace; un dispositivo de difusión de datos de audio en flujo continuo para transmitir un contenido de datos de audio preliminar al dispositivo de comunicaciones mientras que al menos una parte de los datos de audio correspondientes a la parte de texto está generándose y almacenándose en memoria intermedia, de manera que el contenido de datos de audio preliminar puede reproducirse en el dispositivo 60 de comunicaciones antes de que se transmitan los datos de audio correspondientes a la parte de texto.

En realizaciones de la invención:

• El contenido de datos de audio preliminar comprende datos de audio de publicidad para promocionar un producto o 65 servicio.

• Se seleccionan datos de audio de publicidad relacionados con el contenido de la página web. Por ejemplo, el texto de la parte de texto se analiza para la selección de los datos de audio de publicidad relacionados con el contenido de la página web.

• El idioma de la parte o de cada parte de texto se detecta antes de generar los datos de audio.

• El contenido de datos de audio preliminar y los datos de audio se fusionan en una lista de reproducción.

Al menos partes de los métodos según la invención pueden implementarse por ordenador. Los métodos pueden implementarse en software en un aparato programable. También pueden implementarse solamente en hardware o en software, o en una combinación de ambos.

Puesto que al menos partes de la presente invención pueden implementarse en software, la presente invención puede realizarse como código legible por ordenador para su provisión a un aparato programable en cualquier medio portador adecuado. Un medio portador tangible puede comprender un medio de almacenamiento tal como un disco flexible, un CD-ROM, una unidad de disco duro, un dispositivo de cinta magnética o un dispositivo de memoria de estado sólido, y similares. Un medio portador transitorio puede incluir una señal, tal como una señal eléctrica, una señal electrónica, una señal óptica, una señal acústica, una señal magnética o una señal electromagnética, por ejemplo, una señal de microondas o de RF.

Breve descripción de los dibujos A continuación se describirán realizaciones de la invención, solamente a modo de ejemplo, y con referencia a los siguientes dibujos, en los que:

la figura 1 es un diagrama esquemático de la arquitectura de un sistema para proporcionar datos de audio correspondientes a un texto según al menos una realización de la invención;

la figura 2 es un diagrama de bloques que ilustra algunos componentes de un servidor proxy para proporcionar datos de audio según algunas realizaciones de la invención;

la figura 3 es un diagrama de comunicaciones de un método para proporcionar datos de audio correspondientes a un texto según una realización particular de la invención;

la figura 4 es un diagrama de flujo de etapas de un método para proporcionar datos de audio correspondientes a un texto según una realización particular de la invención; y

la figura 5 es un diagrama de flujo de etapas de un método para proporcionar datos de audio correspondientes a un texto según una realización particular de la invención.

Descripción detallada Con referencia a las figuras 1 a 5 se describirá una primera realización de un método para proporcionar datos de audio correspondientes a un texto según al menos una realización de la invención.

La figura 1 ilustra un sistema de red en el que pueden implementarse realizaciones de la invención. El sistema de red 100 comprende un terminal de usuario 101 que puede hacerse funcionar para recibir y mostrar una página web, un proveedor de servidor de contenido 103 para proporcionar contenido de datos de la página web y un servidor proxy 110 para proporcionar contenido de datos de audio correspondiente a las partes de texto de la página web. Las entidades están interconectadas a través de una red de Internet 120.

Debe entenderse que en el contexto de la presente invención, el terminal de usuario 101 puede ser cualquier tipo de terminal de comunicaciones de datos fijo o móvil capaz de interactuar con una red para recibir una página web y está configurado para mostrar la página web en una... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para que un dispositivo de red (110) proporcione datos de audio correspondientes a un texto, comprendiendo el método:

recibir (S13) una solicitud desde un dispositivo de comunicaciones (101) para acceder a una página web que comprende una parte de texto,

recibir (S14, S15) desde un primer servidor de proveedor de contenido (103) la página web que comprende la parte de texto,

identificar la parte de texto,

insertar (S16) en la página web un enlace para proporcionar datos de audio correspondientes a la parte de texto, 15 transmitir (S17) la página web con el enlace insertado al dispositivo de comunicaciones (101) ,

recibir (S18) desde el dispositivo de comunicaciones (101) una solicitud de datos de audio correspondientes a la parte de texto,

generar (S19) datos de audio correspondientes a la parte de texto usando un convertidor de texto a voz,

transmitir (S20) los datos de audio a dicho dispositivo de comunicaciones (101) ;

en el que, durante la etapa de generación (S19) de datos de audio a partir de la parte de texto, un contenido de datos de audio preliminar se proporciona al dispositivo de comunicaciones (101) de manera que el contenido de datos de audio preliminar puede reproducirse en el dispositivo de comunicaciones (101) mientras que al menos una parte de los datos de audio correspondientes a la parte de texto está generándose y difundiéndose en flujo continuo al dispositivo de comunicaciones (101) .

2. Un método según la reivindicación 1, en el que el contenido de datos de audio preliminar comprende datos de audio de publicidad para promocionar un producto o servicio.

3. Un método según la reivindicación 2, que comprende además buscar datos de audio de publicidad relacionados 35 con el contenido de la página web.

4. Un método según la reivindicación 3, en el que el texto de la parte de texto se analiza para seleccionar los datos de audio de publicidad relacionados con el contenido de la página web.

5. Un método según una cualquiera de las reivindicaciones anteriores, que comprende además determinar el idioma de la parte o de cada parte de texto.

6. Un método según una cualquiera de las reivindicaciones anteriores, que comprende además fusionar el contenido

de datos de audio preliminar y los datos de audio en una lista de reproducción. 45

7. Un método según una cualquiera de las reivindicaciones anteriores, que comprende además etapas preliminares para generar una página de solicitud con un campo de dirección y para transmitir la página de solicitud a un terminal de usuario para solicitar la página web.

8. Un dispositivo de red (110) para proporcionar datos de audio correspondientes a un texto, comprendiendo el dispositivo de red (110) :

un transceptor para recibir (S13) una solicitud desde un dispositivo de comunicaciones (101) para acceder a una página web que comprende una parte de texto y para recibir (S14, S15) desde un primer servidor de proveedor de 55 contenido (103) la página web que comprende la parte de texto;

un procesador para identificar la parte de texto y para insertar (S16) en la página web un enlace para proporcionar datos de audio correspondientes a la parte de texto;

un convertidor de texto a voz para generar (S19) datos de audio correspondientes a la parte de texto;

una memoria intermedia para almacenar de manera intermedia los datos de audio generados en respuesta a la activación del enlace (S18) ;

un dispositivo de difusión de datos de audio en flujo continuo para transmitir un contenido de datos de audio preliminar al dispositivo de comunicaciones (101) mientras que al menos una parte de los datos de audio correspondientes a la parte de texto está generándose y almacenándose en memoria intermedia, de manera que el contenido de datos de audio preliminar puede reproducirse en el dispositivo de comunicaciones (101) antes de que se transmitan (S20) los datos de audio correspondientes a la parte de texto.

9. Un dispositivo según la reivindicación 8, en el que el contenido de datos de audio preliminar comprende datos de audio de publicidad para promocionar un producto o servicio.

10. Un dispositivo según la reivindicación 8 o 9, que comprende además medios de búsqueda para buscar datos de audio de publicidad relacionados con el contenido de la página web. 10

11. Un dispositivo según una cualquiera de las reivindicaciones 8 a 10, que comprende además medios de identificación de idiomas para determinar el idioma de la parte o de cada parte de texto.

12. Un dispositivo según una cualquiera de las reivindicaciones 8 a 11, que comprende además un generador de

listas de reproducción para fusionar el contenido de datos de audio preliminar y los datos de audio en una lista de reproducción.

13. Un producto de programa informático para un dispositivo de procesamiento de datos, comprendiendo el producto de programa informático un conjunto de instrucciones que, cuando se cargan en el dispositivo de procesamiento de datos, hace que el dispositivo lleve a cabo las etapas del método reivindicado en cualquiera de las reivindicaciones 1 a 7.

14. Un medio legible por ordenador que contiene el producto de programa informático de la reivindicación 13.


 

Patentes similares o relacionadas:

Imagen de 'CODIFICACIÓN, MODIFICACIÓN Y SÍNTESIS DE SEGMENTOS DE VOZ'CODIFICACIÓN, MODIFICACIÓN Y SÍNTESIS DE SEGMENTOS DE VOZ, del 28 de Diciembre de 2012, de TELEFONICA, S.A.: Método de análisis, modificación y síntesis de señal de voz que comprende una fase de localización de ventanas de análisis mediante un proceso iterativo de determinación […]

Imagen de 'Método para la conversión automática de mensajes de texto o similares…'Método para la conversión automática de mensajes de texto o similares a voz, del 11 de Junio de 2012, de DEUTSCHE TELEKOM AG: Método para la conversión automática de mensajes de texto en un mensaje de voz, así como la transmisión y emisión del mensaje de voz a al menos […]

METODO Y SISTEMA PARA SINCRONIZAR UNA PRESENTACION VISUAL Y DE AUDIO EN UN GENERADOR DE CONTENIDOS MULTI-MODAL., del 16 de Abril de 2007, de INTERNATIONAL BUSINESS MACHINES CORPORATION: Un método implementado por computadora para sincronizar una presentación de audio y visual en un proveedor de múltiples modos, o multi-modo, que […]

PROCEDIMIENTO PARA PERMITIR LA INTERACCION POR VOZ CON UNA PAGINA WEB., del 16 de Junio de 2006, de MEDIAVOICE S.R.L: Un procedimiento destinado a permitir la interacción por voz de una página web, cuya visualización está definida por un archivo de visualización correspondiente, […]

PROCEDIMIENTO Y APARATO PARA OBTENER DATOS DE FUENTE Y FILTRO BASADOS EN FORMANTES, PARA CODIFICACION Y SINTESIS, UTILIZANDO FUNCION DE COSTE Y FILTRADO INVERSO., del 16 de Mayo de 2007, de MATSUSHITA ELECTRIC INDUSTRIAL CO., LTD.: Un procedimiento para obtener una señal fuente basada en formantes y en parámetros de filtrado a partir de una señal vocal, que comprende: a. definir un modelo de […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .