Logo de Microsoft Edge

Microsoft Edge, imágenes accesibles gracias a la IA


Edge, el navegador de Microsoft, apuesta por el texto alternativo creado por Inteligencia Artificial. Te contamos cómo funciona y cómo activarlo.

Internet, imágenes, accesibilidad.

Navegar por internet con ceguera o baja visión, a veces se convierte en una carrera de obstáculos interminable.

El uso de lectores de pantalla, muy útiles para acceder a los textos que están escritos en las páginas webs, se encuentra la mayoría de las veces con grandes barreras a la hora de descifrar las imágenes que aparecen en estas. De hecho, más de la mitad de las que aparecen en Internet no están etiquetadas

Vale que, en algunas ocasiones, las fotografías o dibujos que se muestran apenas son relevantes. Sin embargo, otras son imprescindibles.
Ha crecido la moda de crear infografías, esquemas, gráficos, diagramas, etc., en formato imagen (JPG, PNG, o incluso PDF imagen) y, si no van acompañadas de un texto alternativo descriptivo, para los que tenemos baja visión o usamos lectores de pantalla, son simplemente un lienzo borroso o un espacio sin sentido.

Afortunadamente, grandes empresas del mundo tecnológico están empezando a pensar en clave inclusiva y accesible.

Hoy hablaremos de Microsoft y su navegador Edge.

Tenemos que admitir que nosotras somos mucho más de Google Chrome pero con la llegada de Windows 11 y los avances que está haciendo la empresa creada por Bill Gates y Paul Allen, igual en un futuro haya que darle una oportunidad.

El texto alternativo y los lectores de pantalla en Internet

Antes de hablar de las importantes novedades que nos trae Edge, es necesario hablar del texto alternativo.

Ya hemos hecho referencia en este blog a la importancia de describir las imágenes tanto en webs como en redes sociales.

Un pequeño gesto puede hacernos la vida más fácil a muchas personas.

Gracias a esos textos, cuando una persona ciega o con baja visión, utiliza su lector de pantalla, puede acceder al contenido de esas imágenes y leerlo en voz alta. Para que una web se accesible es necesario etiquetar todas las imágenes de manera correcta (entre muchas otras cosas).

Redes como Instagram o Twitter permiten que los propios usuarios puedan describir las imágenes o GIFs que postean. Y, poco a poco, la sociedad se va concienciando.

Por su parte, Facebook también está trabajando con la inteligencia artificial para ofrecer este servicio de texto alternativo sin necesidad de que alguien manualmente lo haga. Incluso podía reconocer personas, algo que ha conllevado un gran debate que sigue vivo.

Y justo es la Inteligencia Artificial (IA), la protagonista de la noticia de hoy.

Microsoft Edge

Microsoft Edge es el navegador de Microsoft que en los últimos años viene instalado por defecto en todos sus productos.

Dura competencia tiene por delante con otros ya consolidados como Chrome o Firefox. Sin embargo, pasito a pasito, va haciéndose hueco, ya sea por su insistencia de uso por parte de Windows como por acciones en pro de la accesibilidad.

Con la nueva actualización de Edge en marzo de 2022, se añade una función que pretende mejorar la experiencia de uso de las personas que utilizan lector de pantalla en la navegación.

Microsoft quiere que, a través de su navegador, podamos acceder a la descripción de las imágenes de cualquier web, incluso a aquellas que carecen de texto alternativo.

¿Y cómo lo van a hacer? Pues generando ese texto alternativo de manera automática mediante el uso de la Inteligencia Artificial.

La inteligencia artificial al servicio de la accesibilidad

La Inteligencia Artificial es una de las grandes revoluciones de los últimos años. Una tecnología con un potencial enorme y que puede ser gran alidada para la accesibilidad.

Esta IA en combinación con el Machine Learning (ML) o aprendizaje automático, puede generar patrones, algoritmo y multitud de acciones y seguir aprendiendo en cada proceso y con la experiencia de los usuarios.

En el caso que nos ocupa, la IA que Microsoft ha implementado en Edge puede procesar las imágenes que se encuentre en la web y generar textos descriptivos o transcribir los que aparecen en ella.

Los resultados que podemos obtener hoy en día no son perfectos, pero algo es algo si lo comparamos con el «vacío». Por esa misma razón, la locución inicia todas las descripciones de las imágenes con la coletilla «Parece ser«, y las de los textos con «Parece decir«.

Además, como ya apuntamos, gracias al machine learning, a medida que se utilice la IA, mejores serán sus resultados.

Cómo funciona el servicio de Edge

El proceso interno (y más técnico) de crear una descripción es el siguiente:

El navegador Microsoft Edge localiza la imagen sin etiquetar en una web, la envía a su API Computer Vision de Azure Cognitive Services (Vision API o API de Visión) para que la procese procesamiento. Esta API crea un texto alternativo simplificado que puede ser leído por los lectores de pantalla.

Actualmente podemos obtener descripciones en inglés, español, japonés, portugués o chino. Y la API también puede reconocer texto dentro de las imágenes en más de 120 idiomas.

Es importante destacar también que admite todos los tipos de formatos de imagen web: JPEG, PNG, GIF, WEBP, etc.

Algunas excepciones

A pesar de la gran noticia, existen (al menos por ahora) ciertas excepciones en las que la IA no entrará a crear texto alternativo. Son las siguientes:

  • Imágenes de menos de 50 x 50 píxeles. Por ejemplo, pequeños iconos,
  • Archivos de imagen excesivamente grandes.
  • Imágenes etiquetadas como «decorativas» en web, que solo se han introducido para dar mayor atractivo a una página.
  • Imágenes que la propia API de Visión de Microsoft clasifique como pornográficas, sangrientas o sexualmente sugerentes.

Cómo activar la función de texto alterntivo en Edge

El sistema no es automático, es necesario activarlo en el navegador:

  1. Ir a Configuración.
  2. En el apartado de Accesibilidad, elegir «Obtener descripciones de imágenes de Microsoft para lectores de pantalla«.
  3. Al habilitarla aparece un mensaje con un resumen sobre qué hace esta función, un enlace de Declaración de privacidad y un dos botones: uno para aceptarla y otro para rechazarla.
  4. Una vez aceptados los permisos, Edge está listo para ofrecer el texto alternativo.

Un futuro prometedor

Actualmente, esta función sólo está disponible para los usuarios de Microsoft Edge en Windows, Mac o Linux.

En un futuro se espera que esté operativa también en Edge para Android o iOS aunque habrá que esperar.

Este servicio de texto alternativo está dando sus primeros pasos en Edge. Desde Microsoft aseguran que continúan trabajando para ofrecer mejoras gracias al machine learning y al avance de este tipo de tecnologías.

Entre sus retos futuros, está la posibilidad de que la API pueda detectar aquellas imágenes que tienen una etiqueta / descripción poco útil y poder mejorarla mediante IA.


2 comentarios sobre “Microsoft Edge, imágenes accesibles gracias a la IA”

  1. ¡Hola!
    Me parece genial que Microsoft ya empiece, poco a poco, a generar descripciones automáticamente para imágenes sin texto alternativo.
    A modo informativo, Google Chrome también posee esta función, empezó a probarse en 2019 y poco a poco se han ido añadiendo idiomas. Actualmente la descripción de imágenes de Chrome también funciona en Android además de en Windows, y de hecho alguna vez pensé, cuando se lanzaron las primeras versiones de Edge basado en Chromium (a partir de enero del 2020), que Microsoft algún día podía seguir los pasos de Chrome en este sentido. Por aquí la descripción de imágenes de Chrome ha empezado a describir algunos iconos que acompañan a ciertos botones. Por ejemplo, icono de micrófono, que puede ser de gravar, icono de la rueda dentada, que puede ser de configuración.
    Al igual que en Edge, en Chrome también hay que activarla desde la configuración, accesibilidad, obtener descripciones de imágenes de Google. En Windows, hay que expandir la sección configuración avanzada para que aparezca el apartado accesibilidad.
    Curiosidad, hay cosas de navegadores y aplicaciones que utilizan Chromium que se quedan, por lo que por algún botón gráfico en Spotify o WhatsApp Desktop aparece a veces el texto para obtener descripciones de imágenes, activa el menú contextual, aunque en realidad no se pueda. Resulta que hace un par de semanas estaba haciendo unas pruebas con Edge (aunque havitualmente uso Chrome) y apareció ese texto, así que dije «UN momento, ¿Será que Edge lo implementó?» Y sí, en este caso sí que fue cierto.
    Un saludo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.