Apps con IA para leer y reconocer el entorno

7 Apps para reconocer (y leer) textos, objetos y el entorno


Una recopilación de las apps más interesantes y útiles para que personas con discapacidad visual puedan descubrir su entorno gracias a la cámara del móvil: textos, objetos, personas, colores… La accesibilidad al alcance de la mano.

Apps que describen el mundo para personas con discapacidad visual

En el artículo de hoy vamos a analizar varias apps que ayudan a reconocer objetos, textos y el entorno que nos rodea. Aplicaciones que nos pueden solucionar pequeños o grandes problemas en un momento determinado.

Todas ellas son muy parecidas pero cada una tiene su peculiaridad. Principalmente nos fijaremos en las opciones que ofrecen, si necesitan lector de pantalla / motor de voz, si son versiones gratuitas o tienen varias opciones de cuota, si permiten acceder a archivos propios, etc.

La inteligencia artificial, en la que se basan estas apps, aún tiene cosas que mejorar y nos sorprenderán con resultados a veces un poco cómicos pero en su base son grandes contribuciones para mejorar la vida de las personas con discapacidad visual especialmente. Y a toda la sociedad en general.

A continuación, tienes un vídeo de nuestro canal de YouTube donde explicamos 5 de las 7 apps que vamos a mencionar en este artículo. De las otras dos (Envision AI y Google Lookout) ya hemos publicado tanto artículo como vídeo pero las mencionamos porque entrarían dentro del mismo grupo de apps.

Más abajo, tras el vídeo encontrarás una descripción pormenorizada de cada una y los enlaces por si quieres descargártelas.

Vídeo Apps de reconocimiento de imagen

Una interfaz sencilla para todas las apps

Todas las aplicaciones que vamos a comentar comparten un patrón de interfaz muy parecido.

Al abrir cada una de estas apps nos encontramos generalmente menús en la franja superior y/o inferior y la mayor parte de la pantalla la ocupa la imagen que capta la cámara, es decir, lo que vamos a escanear o intentar reconocer.

A partir de ahí nos encontraremos con diferentes organizaciones de los menús, botones, sonidos de información (muy curiosos en algunos casos) características extra y en algún caso anuncios.

Todas funcionan en Android y se pueden descargar de la Play Store. Y la mayoría también tienen sus correspondientes en iOS.

Supersense

Supersense es un aplicación sencilla pero muy útil y cuyos desarrolladores la tienen en continua mejora.

Al abrirla nos encontramos en la parte superior con dos menús, uno encima de otro. En el primero, encontramos a la izquierda la Configuración (Ajustes para el audio y su motor de voz, opciones de suscripción, invitación a amigos, etc.). A la derecha tenemos la opción de activar o desactivar el Flash y el acceso directo a la Ayuda.

En el segundo menú superior tenemos las tres funciones que nos ofrece la aplicación:

  • Leer: Permite leer textos que capturamos con la cámara. En este caso en la parte inferior nos aparecen 2 botones. Uno con forma de Play que sirve para hacer la captura del texto y otro con una «T» que si lo pulsamos nos lleva a un menú donde podemos elegir: Lectura rápida, Importar una imagen o PDF del dispositivo o acceder al Historial.
  • Explorar: Cuando estamos en este modo, en la parte inferior nos aparecerá un otro botón de Play y si lo pulsamos la aplicación nos pedirá que movamos el teléfono para reconocer el entorno. Nos irá describiendo lo que reconoce.
  • Encontrar: Al seleccionar esta función, aparece un menú en la parte inferior de la pantalla. En él aparecen diferentes elementos para buscar: persona, asiento, puerta, escalera, vehículo, baño, animales, electrónica… Y unas cuantas más. También hay la opción de introducir el nombre de un objeto en el cuadro de búsqueda. Así, si seleccionamos uno de los items predeterminados o que hemos introducido, la aplicación empezará a buscarlo en el entorno mientras nosotros movemos la cámara. Cuando lo encuentra da una señal sonora y nos dice que objeto es.

Tiene cosas que mejorar como poder darnos datos sobre la distancia de los objetos y demás pero a veces lo sencillo cumple muy bien su función.

Actualmente hay 2 planes.

  • Plan gratis con acceso ilimitado a los modos de lectura rápida, exploración , búsqueda, importación e historial de lectura.
  • Plan premium. Que incluye todo lo anterior y además: lee documentos más largos y con mayor precisión de OCR, más variedad de idiomas, lectura de textos escritos a mano, reconocimiento de monedas, escaneo de varias páginas y de códigos de barras. El precio en sí no es de los más caros de los que encontramos en este tipo de apps

Sin duda es una de las apps que más recomendamos por su sencillez y por su claridad a la hora de interactuar con ella y con el entorno.

Botón para descargar app en Google Play Store
Disponible en App Store

Speak! o ¡Habla!

Esta app totalmente gratuita tampoco necesita un lector de pantalla para leer o describirnos qué es lo que capta por la cámara.

Al abrirla tenemos en la franja superior el nombre de la app y a la derecha la opción de ajustar el flash (Automático, parpadeante, sin flash o modo linterna). A su lado tenemos el general donde encontramos la configuración (idioma, velocidad de lectura, tamaño de texto, etc.) y también el tutorial, la opción de invitar amigos y otra información sobre la app.

En la parte inferior tenemos tres botones que representan las funciones que ofrece. Son las siguientes:

  • Documento: Escanear y leer documentos. Mediante OCR (Reconocimiento óptico de caracteres) permite hacer una fotografía de un texto, pasarlo a texto plano y leerlo. Este mismo texto lo podemos copiar, recortar, traducir y escucharlo gracias a los botones de reproducción.
  • Escanear: Permite reconocer también texto (pero más corto), códigos de barras, objetos y colores (podemos elegir si queremos que nos diga colores básicos o con más matices)
  • Hay un tercer botón que es Identificar. SI lo pulsamos nos envía a que activemos el lector de pantalla pero no hemos conseguido saber para qué funciona. No muestra ninguna acción.

Entre sus pros debemos destacar que es gratuita (sin ni siquiera incluir anuncios) y su escaneo de textos es muy bueno, presentando diferentes opciones para trabajar con el resultado obtenido.

Por otro lado, los aspectos que debe mejorar es la traducción al español de la propia app . No es mala pero debería pulirse más. Y también que no permite reconocer imágenes que ya tenemos en nuestro dispositivo. Textos sí pero no podemos acceder a ellos desde la app, tenemos que ir a la imagen con texto, darle a compartir y ahí seleccionar la app para que la abra.

Botón para descargar app en Google Play Store

TapTapSee

A veces las apps más conocidas no tienen por qué ser las mejores. Llevo años escuchando hablar de esta app y, aunque buena, creo que en este artículo hay otras con funciones más interesantes. Aunque ya sabes que a veces lo más básico puede funcionar mucho mejor y para gustos colores.

En primer lugar hay que destacar que TapTapSee necesita Talkback (u otro lector de pantalla) para que pueda describir en audio los diferentes escenarios. Tan pronto como la queramos abrir nos va a pedir que lo activemos (si no lo está ya).

Lo bueno de esta app es lo sencilla que es y que tiene una capacidad de reconocimiento bastante buena. Quizá ese sea el secreto. Bueno, y también que es totalmente gratuita y sin anuncios.

Para que empiece a describir la escena basta con dar un toque en el centro de la pantalla y sonará un sonido como el de hacer una fotografía. En la parte inferior de la pantalla nos aparecerá el texto descriptivo de lo que ha reconocido y a la vez nos lo dirá en voz alta.

En la parte superior tenemos tres botones y un menú con las siguientes funciones:

  • Repetición: Nos vuelve a describir lo que había en la imagen que acabamos de reconocer.
  • Biblioteca: Permite acceder a nuestra galería de imágenes y así poder describir aquella que queramos
  • Cuota: (Que debe ser alguna mala traducción de la función en inglés) Pulsando en ella puedes compartir la imagen junto con la descripción, ya sea por correo electrónico, Whatsapp, etc.
  • Menú información: En el encontramos la Política de privacidad, los Términos de uso, modo de contacto con los desarrolladores y el número de versión de la app.

Lo que llama la atención de esta app y que juega un poco en su contra es que, cuando escanea un texto, aunque nos dice que es un texto no lo reconoce ni lo lee. Función que si tienen las otras.

Además no hay ninguna opción de configurar ningún parámetro. La sencillez llevada al extremo. Sin embargo puede ser muy útil gracias precisamente a esa simplicidad.

Botón para descargar app en Google Play Store
Disponible en App Store

Smart Lens

Smart Lens sería el complemento perfecto para TapTapSee ¿Por qué? Pues porque la función principal de esta app es el reconocimiento de texto y además necesita también activar el lector de pantalla para poder escuchar lo que hemos escaneado.

Básicamente esta aplicación se basa en el OCR para obtener el texto de cualquier imagen (ya sea realizada por la cámara en ese instante o que la tengamos en nuestro dispositivo). Incluidas también imágenes en PDF.

Al abrir Smart Lens, en la franja superior tendremos un anuncio (que se puede eliminar si se adquiere la app o se paga una cuota). Luego tenemos la imagen de lo que está capturando la cámara y abajo dos menús, uno encima de otro.

En la primera línea de menú encontramos acciones de configuración como captura en horizontal o vertical, tipo de aviso de captura, herramienta de selección y el idioma que estamos utilizando (que se activa por defecto con el predeterminado del dispositivo).

En el segundo menú tenemos la opción de acceder a la galería para utilizar un archivo que ya tenemos, acceso al historial de capturas, un botón para hacer una captura estática y otro para la dinámica y, por último, las configuraciones generales (idioma, cuotas, etc)

Lo destacable de esta aplicación es que tiene dos modos de capturar el texto:

  • Modo estático: Haciendo una fotografía a un texto y obteniendo todo lo que aparece en él
  • Modo dinámico: Escaneando un documento o el entorno en todo momento y seleccionando nosotros que texto queremos que se transcriba al móvil.

Una vez que tenemos el texto, podemos copiarlo, traducirlo, descargarlo y compartirlo. También nos da la opción (si es un texto que incluye datos de contacto o enlaces) de crear contactos, llamar por teléfono, enviar un email o acceder a una web.

Smart Lens es una buena opción pero su versión gratuita es bastante limitada en cuanto a usos ya que sólo permite 3 escaneos al día. Además incluye anuncios. Estas restricciones se pueden eliminar con suscripciones mensuales, anuales o con la compra permanente de la app.

Botón para descargar app en Google Play Store

Sullivan+

Sullivan+ es un descubrimiento casual que ha resultado ser una de las apps más completas que hemos encontrado.

Se trata de una aplicación de código abierto, gratuita y aunque muestra algún anuncio, no interfieren en el uso ni en sus funciones.

Cuando abrimos la app en la parte superior nos dice en que modo estamos (generalmente empieza con Modo AI, inteligencia artificial). Luego tenemos como siempre toda la superficie que capta la cámara.

En la parte inferior tenemos la opción de minimizar o ampliar la imagen que estamos viendo en la pantalla, la activación del flash y el botón con forma de obturador que sirve para captar lo que queremos. A ambos lados de este botón tenemos unas flechas que nos llevan a dos menús diferentes. También se puede acceder a ellos deslizando los dedos por la pantalla a un lado u otro.

Si accedemos al lado izquierdo nos encontramos con las funciones principales de la aplicación:

  • Modo AI: La Inteligencia Artificial encuentra y reconoce automáticamente uno o varios objetos, y nos los describe en audio.
  • Reconocimiento de texto: Apuntando con la cámara detecta texto, nos lo indica con una vibración y no lo lee.
  • Reconocimiento facial: Mediante una fotografía (o una imagen de la galería) puede adivinar la edad y el sexo de la persona que aparece en ella.
  • Descripción de la imagen: Identifica qué objetos hay a nuestro alrededor y describe la escena identificada.
  • Escaneo rápido de texto: Esta función toma automáticamente una foto cuando detecta que hay un texto. Después no informa del texto.
  • Reconocimiento de documentos: Puede reconocer diversos documentos como correos, revistas, cartas, periódicos, tarjetas de visita, etc.
  • Reconocimiento del color: Si apuntamos con la cámara cerca de un objeto o superficie, nos indica de qué color es.
  • Brillo de la luz: Sirve para saber qué cantidad de luz hay en un lugar. Funciona con el sensor de brillo que está en la parte frontal del teléfono. Además de decirlo en voz, también nos guía con sonido. En un lugar brillante, sonido alto y un lugar oscuro, más bajo.
  • Lupa: Como ya comentamos, se puede hacer zoom en la imagen que se toma. Hay dos modos de hacerlo: con los botones que comentamos antes o haciendo el gesto de pellizcar o separar los dedos para minimizar o agrandar.
  • Nota: Aquí aparecerán las notas que hayamos guardado en nuestras capturas.
  • Lector de PDF: Permite acceder a cualquier documento PDF que tengamos en el dispositivo para poder leerlo.
  • Comunidad: Dentro de esta función podemos acceder a las novedades de la app, al sitio web y blog, contactar con los desarrolladores e incluso invitar a un amigo a que la utilice.

Y en el menú de la derecha tenemos la opción de realizar Videollamada, activar o desactivar el Flash, acceso a la Galería, Guardar notas y Compartir

Sullivan+ es de las más completas y con más proyección en el futuro. SI quieres conocer más sobre ella puedes consultar su web.

Botón para descargar app en Google Play Store
Disponible en App Store

Envision AI

De Envision AI ya hemos hablado en un artículo anterior. Es una aplicación móvil que también utiliza la inteligencia artificial para explorar el entorno y proporcionarnos información en audio.

Esta app es capaz de leer carteles, textos impresos, textos a mano, describir lo que hay a nuestro alrededor, reconocer caras o productos que previamente le hemos enseñado, diferenciar colores…

Si quieres saber más sobre ella puedes leer nuestro artículo (con vídeo explicativo incluido).

Apps de Google: Lookout y Lens

Estas dos apps de Google ya las hemos analizado pormenorizadamente en nuestro blog. Ambas utilizan también la cámara para descubrir qué hay a nuestro alrededor aunque cada una enfocada en aspectos diferentes.

Mientas Google Lens es una aplicación enfocada en el público en general y nos permite obtener muy diversa información de nuestro entorno, Google Lookout se centra en las personas con discapacidad visual.

A continuación dejo los enlaces a los artículos que hemos escrito para ambas apps (y también tienen video-tutoriales incluidos):

Y tu ¿Conocías estas apps? ¿Utilizas alguna otra? Cuéntanos tu experiencia en el apartado de comentarios.


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.