En atlanTTic trabajamos con tecnologías relacionadas con la comprensión de la comunicación humana, tales como tecnologías relacionadas con la fuente audiovisual (reconocimiento y síntesis de habla, reconocimiento de expresiones e identificación de las personas) y tecnologías relacionadas con la comunicación textual (análisis lingüístico, sintáctico y semántico en los campos de análisis de lenguaje natural, generación de lenguaje natural, chatterbots y tecnologías de apoyo a la comunicación con personas con discapacidades cognitivas).

Además del análisis comunicativo, esta línea también se ocupa de tecnologías de detección y clasificación de eventos basadas en imagen, vídeo y señales acústicas. Mediante la captación de audio con sensores de última generación, denominados Acoustic Vector Sensors, atlanTTic desarrolló herramientas que permiten localizar su origen. Esta tecnología y su combinación con tecnologías de detección en vídeo, abre la posibilidad de multitud de aplicaciones relacionadas con la seguridad (detección y localización de intrusos) y la monitorización de máquinas complejas (no solo detectar un patrón de funcionamiento anómalo, sino además determinar su localización y por tanto la causa del problema).

 

Líneas de investigación

  • Análisis del lenguaje natural
    Desarrollo de programas capaces de abstraer comportamientos a partir de información suministrada en forma de ejemplos.
  • Generación automática de lenguaje natural basado en conocimiento lingüístico y estadístico
    Se desarrolló un sistema para la generación automática de lenguaje natural en español basado en conocimiento lingüístico y estadístico, que integra léxicos de producción propia.
  • Comunicación y estimulación para personas con discapacidades cognitivas
    Se desarrolló una familia de apps orientadas a la comunicación con personas con discapacidades cognitiva y su instalación. Se trata de una iniciativa altruista con una amplia base de usuarios en la actualidad.
  • Tecnologías de conversación en lenguaje natural (chatterbots)
    atlanTTic desarrolló una familia tecnología propia de chatterbots que permite construir interfaces conversacionales para aplicaciones avanzadas. Se adaptó asistentes digitales a ámbitos especializados.
  • Tecnologías de conversión de voz a texto
    Se desarrollaron motores de reconocimiento para castellano y gallego. Se disponen de recursos lingüísticos de alta calidad en gallego que pueden ser empleados en desarrollo de tecnología de habla.
  • Tecnologías de conversión de texto a voz y conversión de voces
    Se desarrolló un conversor texto-voz en gallego y castellano de código abierto (https:// sourceforge.net/projects/cotovia/). Se propusieron diversos métodos de transformación/conversión de la señal de voz orientados a modificar la identidad del locutor. Entre las aplicaciones de estas técnicas cabe citar la incorporación a los conversores texto-voz de nuevos locutores y la de-identificación (anonimización) de locutores preservando el resto de la información de la grabación original.
  • Tecnologías de detección de estado anímico
    Desarrollo de sistemas de detección basados en clasificación estadística que mediante encausado del habla evalúan el estado de depresión de una persona. El objetivo final es realizar el acribillado de pacientes con nivel de depresión muy acusado.
  • Tecnologías de identificación biométrica y trazos personales
    Desarrollo de tecnologías de identificación de personas a partir de trazos biométricos como la voz, la cara o la firma manuscrita, así como estimación de atributos personales como la edad y el sexo o trazos temporales como el estado emocional. Parte de estas tecnologías están transferidas al sector productivo.
  • Tecnologías de análisis automático en imágenes y flujo de vídeo
    Aplicadas a sistemas de ayuda a la conducción (ADAS: reconocimiento de señales, detección de peones, de vehículos, abandono de carril, etc), la entornos con flujo de personas, la visión en la industria, etc.
  • Sistemas de adquisición y procesado de señales de audio y ultrasonidos de bajo coste para monitorización y diagnóstico en entornos industriales
    Diseño y prototipado de sensores acústicos adaptados a las características del entorno industrial, y desarrollo de algoritmos de tratamiento de las señales para la detección automática de la condición de operación de máquinas o detección de eventos.
  • Evaluación de la calidad del sonido
    Usando tanto baterías de test subjetivos con recogida de opinión como medidas objetivas basadas en la percepción. Permite clasificar sonidos en función de su relevancia perceptual, agrado/desagrado y otras métricas asociadas al concepto del confort acústico.

 

Grupos de investigación

 

Multimedia Technologies
 

El área de investigación emplea el siguiente equipamiento para la implementación de algoritmos de procesado multimedia, machine learning y deep learning:

  • 1x servidor Dual Xeon + 2 GPU
  • 2 x Intel(R) Xeon(R) CPU E5-2620 v3 @ 2.40Ghz, 12 cores/24 threads, 128GB RAM, 4 x NVidia GeForce GTX Titan X 12GB GDDR5 3072 CUDA cores
  • 2 x Intel(R) Xeon(R) CPU E5-2620 v3 @ 2.40Ghz, 12 cores/24 threads, 128GB RAM, 4 x NVidia GeForce GTX Titan Black 6GB GDDR5 2880 CUDA cores
  • 2 x Intel(R) Xeon(R) CPU E5-2609 v4 @ 1.70Ghz, 16 cores/16 threads, 128GB RAM, 2 x TITAN X (Pascal) 12GB GDDR5 3584 CUDA cores

Para la integración de sistemas de detección, localización y clasificación de eventos acústicos:

  • Kit de desarrollo Nvidia Jetson TK1:
  • Chip Tegra K1: este chip contiene una GPU Kepeler de 192 núcleos y una CPU Arm Cortex A15 de 4 núcleos (para meterle Linux). Además tiene 2Gb de RAM, 16 GB de almacenamiento y toda la conectividad de un ordenador (USB, HDMI, Ethernet, etc…)
  • Pcb welding equipment
  • Impresoras 3D

En cuanto a equipamiento más específico:

  • Una sala sensorizada para captación de señales audiovisuales (smart-room), compuesta de 3 arrays de 8 micrófonos direccionales, 6 Kinects, 5 cámaras RGB fijas + 3 con control PTZ, 1 infrarroja y 2 webcams HD.
  • Una cámara semianecoica con tecnología Metadyne, frecuencia de corte 100 Hz.
  • Sala de audición de alta definición 5.1, tipo “non-environment”.
  • Equipamiento de acústica: sistema de adquisición multicanal de señales acústicas y vibratorias, maniquí de grabación binaural (HATS), micrófonos, acelerómetros, sondas de intensidad p-p y p-o, software de modelado acústico.
  • Dicionarios y léxicos profesionales en español e inglés, como EuroWordNet y GilCUB.

  • Marketing analítico.
  • Asistencia a personas afectadas con trastornos en la comunicación.
  • Colectivos con diferentes tipos de discapacidad, especialmente niños con trastornos del espectro autista, pero también, por ejemplo, pacientes en entornos hospitalarios o personas mayores.
  • Asistentes para comunicación con consumidores a través de dispositivos móviles, soporte web en general y, en particular, en el ámbito educativo.
  • e-learning
  • Comunicación con consumidores a través de dispositivos móviles, soporte web en general y, en particular, en el ámbito educativo.
  • Seguridad (acceso restringido, Videovigilancia)
  • Contenidos audiovisuales (Retail, Publicidad, Media)
  • Edificación (aislamiento y acondicionamiento acústico)
  • Automoción (ensayos y medidas acústicas, confort acústico)
  • Sector energético

Título
Análisis del lenguaje natural
Resumen Desarrollo de programas capaces de abstraer comportamientos a partir de información suministrada en forma de ejemplos. Actualmente estamos trabajando en sistemas de análisis automático que integran análisis matemático y semántico de lenguaje natural en sistemas deep learning.
Aplicaciones y ventajas Análisis de aspectos, tópicos y sentimiento en textos humanos (como redes sociales), con detección automática de zonas relevantes del texto. Nuestro valor diferencial, frente a otras aproximaciones, es la puesta en valor del análisis semántico como parte de soluciones híbridas.
Sectores de aplicación Marketing analítico, análisis de opinión de consumidores en call centers, chats o formularios web, encuestas de opinión o sistemas de inteligencia colectiva para herramientas colaborativas empresariales, entre otros ámbitos.
Propiedad intelectual Secreto industrial.

 

Título
Generación automática de lenguaje natural basada en conocimiento lingüístico y estadístico
Resumen atlanTTic ha desarrollado un sistema para la generación automática de lenguaje natural en diversos idiomas basado en conocimiento lingüístico y estadístico, que integra léxicos de producción propia. El sistema recibe palabras como entrada y devuelve frases completas y coherentes.
Aplicaciones y ventajas Generación automática de información divulgativa, comercial y de análisis empresarial. Educación y pedagogía en general, y en particular aprendizaje reforzada para corregir deficiencias comunicativas.
Ventajas:

  • Bajo tiempo de respuesta y requisitos mínimos de almacenamiento.
  • Robustez y coherencia.
  • Facilidad de integración y extensión a otros idiomas y ámbitos de aplicación.
Sectores de aplicación Todos aquellos donde se necesite generar texto inteligible por humanos a partir de cualquier tipo de dato.
Recientemente estamos aplicando la tecnología de generación a sistemas de comunicación aumentativa y alternativa, para asistir a personas afectadas con trastornos en la comunicación.
Propiedad intelectual Secreto industrial

 

Título
Comunicación y estimulación para personas con discapacidades cognitivas
Resumen atlanTTic ha desarrollado una familia de apps orientadas a la comunicación con personas con discapacidades cognitivas. Se trata de una iniciativa altruista con una amplia base de usuarios en la actualidad.
Aplicaciones y ventajas Comunicadores para personas con discapacidad y juegos de estimulación cognitiva. Todas nuestras aplicaciones son altamente configurables y de acceso gratuito, y se pueden ejecutar en dispositivos Android de bajo coste.
Sectores de aplicación Colectivos con diferentes tipos de discapacidad, especialmente niños con trastornos del espectro autista, pero también, por ejemplo, pacientes en entornos hospitalarios o personas mayores. Respecto a ello destaca el proyecto Accegal, desarrollado con el apoyo de investigadores del Departamento de Didáctica de la Lengua, Literatura y de las Ciencias Sociales de la Universidade de Santiago de Compostela. Accegal oferta catorce aplicaciones para dispositivos móviles con sistema operativo Android, con más de 70.000 descargas hasta la fecha. Todas las aplicaciones están disponibles en cinco idiomas y son altamente personalizables. Recibieron varios premios y fueron apuntadas con frecuencia en prensa.
Propiedad intelectual Aplicaciones Android gratuitas, pero no de código abierto.

 

Título
Tecnologías de conversación en lenguaje natural (chatterbots)
Resumen Adaptamos asistentes digitales (similares a Siri, Cortana, etc.) a ámbitos especializados. Para ello utilizamos tecnologías de código abierto como el lenguaje AIML (Artificial Intelligent Markup Language) e intérpretes adaptados para mejorar las funciones de diálogo y comprensión.
Aplicaciones y ventajas Fundamentalmente, estas tecnologías se utilizan para la implementación de asistentes, basados en smartphones Android (con soporte texto-voz de Google Voice) o páginas Web. Los asistentes permiten buscar contenidos de interés, recomendaciones en un ámbito específico, dar soporte a preguntas frecuentes o ayudar al usuario en general. También se emplearon en Twitter o para tutorización en entornos de eLearning.
Entre nuestros principales casos de éxito se cuenta la integración de nuestra tecnología en Negobot, una trampa virtual para la captura de pedófilos en las redes. Actualmente estamos en vías de adaptar nuestros asistentes digitales para comunicación con personas con discapacidades cognitivas. La propia comunicación generará bases de datos para entrenamiento de algoritmos de computación afectiva, aspecto que enlaza con los trabajos de atlanTTic en procesado de lenguaje natural.
Sectores de aplicación Asistentes para comunicación con consumidores a través de dispositivos móviles, soporte web en general y, en particular, en el ámbito educativo.
Propiedad intelectual Soluciones basadas en modificación de tecnologías de código abierto

 

Título
Tecnologías de indexación multimedia
Resumen Integramos tecnologías de procesado conjunto de vídeo, audio y texto para el indexado de contenidos multimedia con la información relativa as las personas presentes en el material multimedia.
Aplicaciones y ventajas La principal ventaja de esta integración es que permite analizar el contenido de una fuente audiovisual en un entorno comunicativo (noticias, entrevistas, debates, etc) para aportar información útil en búsquedas avanzadas, ampliando enormemente los pocos metadatos que suelen acompañar a estos formatos.
Sectores de aplicación Empresas de media, editores de media, creadores y reutilizadores de contenidos, empresas de creación y consumo de cursos online (MOOCS)
Propiedad intelectual Soluciones construidas sobre tecnologías de código abierto y tecnologías propietarias.
Publicacións.

 

Título
Tecnologías de conversión de texto a voz e conversión de voces
Resumen Desarrollo de un conversor texto-voz en gallego y castellano de código abierto y de diversos métodos de transformación/conversión de la señal de voz orientados a modificar la identidad del locutor.
Aplicaciones y ventajas Aplicaciones con respuesta hablada al usuario.
Conversores texto-voz con múltiples locutores.
De-identificación (anonimización) de locutores en grabaciones
Sectores de aplicación Interacción hombre-máquina, protección de la privacidad
Propiedad intelectual Cotovía: sistema de conversión texto-voz en gallego y castellano. Código abierto (https://sourceforge.net/projects/cotovia/ ).

 

Título
Tecnologías de identificación biométrica y trazos personales
Resumen atlanTTic ha desarrollado tecnologías de identificación de personas a partir de trazos biométricos como la voz, la cara o la firma manuscrita, así como estimación de atributos personales como la edad y el sexo o trazos temporales como el estado emocional. Se están utilizado tanto técnicas de modelado y aprendizaje propias como de aprendizaje profundo.
Aplicaciones y ventajas Los ámbitos de aplicación de estas tecnologías son muy variados: sistemas de acceso restringido (tanto físico como lógico), análisis demográfico, análisis de respuesta emocional, segmentación de locutores, etc. Una de las principales ventajas respecto de otros sistemas es la capacidad de combinación multimodal.
Sectores de aplicación Seguridad, banca, retail, publicidad.
Propiedad intelectual Software registrado:

    • VG330-11 – Módulo de estimación demográfica (transferido a empresa)
    • VG332-11 – Herramientas para modelos ocultos de Markov ajustados (transferido a Centro tecnológico)
    • VG331-11 – Verificación de firma dinámica (transferido a Centro tecnológico)

 

Título
Tecnologías de análisis automático en imágenes y flujo de vídeo
Resumen atlanTTic ha desarrollado un workflow de procesado de imágenes y vídeo e que se aplica a sistemas muy variados: ayuda a la conducción (ADAS: reconocimiento de señales, detección de peatones, de vehículos, abandono de carril, etc), entornos con flujo de personas, visión en la industria, imagen médica, etc.
Aplicaciones y ventajas Cualquier entorno en el que se deba tomar una decisión para partir del contenido de una imagen, secuencia de imágenes o flujo de vídeo. Los sistemas pueden tomar decisiones de forma autónoma o servir de ayuda al diagnóstico por parte de un humano.
Sectores de aplicación Los sectores son muy variados: automoción, audiovisual, retail, diagnóstico médico, control de calidad, etc.
Propiedad intelectual Soluciones construidas sobre tecnologías propias y de código abierto. Publicaciones.

 

Título
Sistemas de adquisición y procesado de señales de audio y ultrasonidos de bajo coste para monitorización y diagnóstico en entornos industriales.
Resumen Integración de sensores de presión sonora de bajo coste, sistemas de acondicionamiento de señales y digitalización. Sobre las señales así adquiridas se realizan análisis temporales y frecuenciales que permiten la detección de eventos y clasificación a partir de bases de datos ad-hoc.
Aplicaciones y ventajas Estas tecnologías permiten la monitorización de la condición de funcionamiento de sistemas mecánicos a partir del ruido que generan, contribuyendo a la prevención o minimización de averías, o a la detección de comportamientos anómalos. La ventaja de la utilización de señales sonoras es que la instrumentación es no invasiva, y su instalación no interfiere con el funcionamiento del sistema que se pretende monitorizar. Los sistemas de captación son diseñados a medida para adaptarse al entorno y a las peculiaridades del sistema para monitorizar, y con tecnologías robustas y de bajo coste. Los procesos de análisis de las señales se desarrollan específicamente para los eventos o condiciones de funcionamiento a detectar o clasificar. Dependiendo de la aplicación la inteligencia necesaria puede instalarse in-situ, centralizarse en un equipo remoto o combinar ambas soluciones.
Sectores de aplicación Eólico, hidroeléctrico, automoción.
Propiedad intelectual Secreto industrial.

 

Título
Sistema para la detección de vehículos que circulan por una vía para partir del sonido.
Resumen Dentro de la línea general de detección y clasificación de eventos, se concreta un sistema de detección de paso de vehículos y su clasificación automática a partir de la señal de audio (vehículos ligeros/pesados).
Aplicaciones y ventajas La realización de mapas de ruído de infraestructuras viarias (urbanas e interurbanas), requiere el conocimiento del número y tipo de vehículos que circulan por la vía. En muchos casos no se dispone de esta información. Este sistema permite de una forma rápida y portátil y no invasiva, obtener los datos de aforamiento de una vía.
Sectores de aplicación Ambiental, tráfico.
Propiedad intelectual Patente española: P200801046.