Probamos OrCam My Eye: estos lentes para ciegos leen texto y reconocen billetes mexicanos, pero son una gran idea que necesita madurar

  Reading time 14 minutes

Unas gafas que devuelven la oportunidad de «leer» a personas invidentes: esa es la promesa principal, pero no la única, de OrCam MyEye, el dispositivo del cual presenciamos una demostración de sus capacidades hace algunos años, pero que ahora hemos probado varias semanas de primera mano.

Las gafas que se comercializan en México por precio de 98,600 pesos, en realidad son dos piezas: unas gafas comunes y corrientes, y un dispositivo con cámara y altavoces integrados que se sujeta magnéticamente de las gafas y que la hace de lector de billetes, identificador de personas, muebles, objetos y lector de libros.

Características técnicas

Muchas, muchas funciones

No soy una persona ciega o con algún tipo de debilidad visual, de manera que, inevitablemente, mi sesgo principal al probar OrCam MyEye es que no soy el público meta al que apunta el dispositivo. Es una declaración de principios que tuve en mente durante todo el tiempo de prueba que tuve con las gafas.

La cantidad de funciones de OrCam MyEye es, de principio, abrumadora. La principal es la de reconocimiento de texto para lectura, de manera que, si se toca el costado del dispositivo, OrCam MyEye escanea en busca de texto e inmediatamente después lo lee en voz alta. Tanto la velocidad de lectura como el volumen del altavoz pueden configurarse a preferencia del usuario.

El escaneo de texto puede iniciarse con el simple gesto de apuntar al texto que se quiere se lea, y el reconocimiento del gesto bastante bien. Es una grata sorpresa que el escaneo ocurra tan a buena velocidad, lo que resulta en una lectura casi instantánea luego de la captura por parte de la cámara del dispositivo. La voz que acompaña al dispositivo suena en todo momento demasiado robótica, lo que contrasta notablemente con la naturalidad que han alcanzado asistentes de voz, pero que no quita la certeza con que funciona el modo de lectura.

La lectura funciona mucho mejor en los casos en que la captura se hace de un material físico, como un libro. Quizás se deba a un tema de reflejos, especialmente si se considera que OrCam MyEye utiliza flash por default para casi todas las tomas, lo que seguramente complica la obtención de información si el texto está en una pantalla. Por consecuencia, he tenido texto perfectamente legible sobre una pantalla, que OrCam My Eye tiene dificultades para encontrar. Si un apartado de un texto no puede leerlo, al llegar al apartado emite la frase «se ha omitido una línea de texto» y, en caso de haber más qué leer después, proseguirá sin problemas. El flash automático puede desactivarse.

La función estrella de OrCam My Eye tiene el potencial de devolver la posibilidad de la lectura a personas invidentes o con algún nivel de debilidad visual, dado que convierte en audiolibro cualquier libro físico, con el costo de tomar capturas de cada página En una época en la que la tecnología de consumo nos rodea, es satisfactorio ver tecnología utilizada para dispositivos que tienen un beneficio social o se enfocan a pequeños niños que suelen ser ignorado por el mercado masivo.

Smart reading

No todo funciona igual de bien en cuanto a la lectura. OrCam MyEye tiene la función ‘smart reading’, por la que el escaneo de un texto tiene un nivel añadido de procesamiento y, previas solicitudes del usuario a través de comandos de voz, puede encontrar cantidades, fechas, números de teléfonos y titulares en el texto a leer.

En mi experiencia la función ha sido errática, no tanto por el procesamiento necesario para localizar los caracteres específicos que se han solicitado, sino por problemas de identificación de los comandos. En más de una ocasión he solicitado titulares de un texto y el dispositivo me respondió preguntándome si he querido decir ‘cantidades’. En otras ocasiones la he puesto complicada escondiendo en texto números de teléfono y, en todas ellas, el dispositivo les ha localizado con mucha precisión.

OrCam My Eye también puede reconocer billetes mexicanos. Basta con colocar un billete frente a la cámara, a una distancia aproximada de veinte centímetros, equivalente a sujetar el billete con el brazo semi-estirado. De nuevo, la función se ejecuta instantáneamente y el reconocimiento funciona bastante bien, salvo cuando se trata de billetes nuevos. El reconocimiento ha sido infalible si se trata de billetes de la familia F o más antiguos, pero no así con versiones más nuevas que circulan con facilidad.

Así com OrCam MyEye responde efectivamente al gesto de señalar un texto para que comience a leerlo, puede hacer lo propio con otros gestos. Por ejemplo, si se le muestra la muñeca, simulando voltear a ver un reloj, el dispositivo automáticamente dará la hora en voz alta. La hora también puede hacerse a través de comando, presionando dos veces en la barra lateral y a continuación diciendo «diga la hora». Otros comandos que funcionan igual son «diga la fecha» y «diga el nivel de la batería».

Una de las funciones que me han dejado más satisfecho es lo que tiene que ver con aprendizaje de rostros. El dispositivo puede recordar rostros a los que el usuario les asigna un nombre. El registro es simple y siempre efectivo para condiciones con luz media y alta y después OrCam MyEye puede automáticamente identificar quién está enfrente. De haber alguien enfrente con registro de nombre, OrCam MyEye reproducirá en su altavoz la grabación con el nombre que en su momento registramos. Una auténtica maravilla.

Las limitantes son, desde luego, que el algoritmo no es equivalente al nivel de detalle que se recopila para reconocimiento facial para un smartphone, de manera que con baja luminosidad o mirando de costado a la persona la función no siempre es activada.

El verdadero problema: la orientación

Uno de los comandos que tiene más potencial es el ‘qué hay delante de mí’. El único con fines de orientación pinta para ser muy importante si se trata de orientarse en espacios nuevos, pero desafortunadamente hay mucho trecho qué avanzar en lo que tiene que ver con un catálogo de objetos registrados, principalmente aquellos que sean lo suficientemente grandes para ser obstáculos a personas invidentes.

OrCam MyEye ha identificado por mí sillas, mesas y monitores pero han tenido que ser de ciertos tipos y formas, de manera que he tenido problemas para, por ejemplo, identifique mesas que no son rectangulares y que son chicas. No he tenido éxito al querer que identifique muebles voluminosos que están delante de mí, así que no recomendaría OrCam MyEye para que una persona invidente inequívocamente confíe en el dispositivo para desplazarse con soltura.

OrCam tampoco puede detectar distancias para prever colisiones. Por sí solo no es un problema, sobre todo porque Orcam no vende al dispositivo como uno para desenvolverse en exteriores. No obstante, no hay que olvidar que estamos ante un dispositivo cuyo precio ronda en los 100,000 pesos y que, desafortunadamente, carece de hardware y software que definitivamente convendrían a una persona invidente, como por ejemplo un sensor LiDAR para detectar profundidades y alertar sobre objetos que estén a poca distancia del usuario, o algoritmos desarrollados para medir espacios y reconocer eficazmente objetos para mencionarlos por nombre.

El trabajo de desarrollo para esas funciones es descomunal, pero estamos ante un dispositivo que vale al menos cuatro veces más que smartphones que tienen sensores LiDAR y esbozos de tecnologías para medición de distancias.

El otro gran problema tiene que ver con la interfaz de Orcam. Funciones como ‘smart reading’ y ‘orientación’ (que es la función que se activa con el comando «qué hay delante de mí») son en realidad sub-aplicaciones en el dispositivo, de manera que al activarles, quedan sin poder utilizarse otras funciones que están en la «raíz», como detección de rostros y obtener la hora.

De entrar en «smart reading» o en «orientación», para volver a la «raíz» de OrCam hay que decir el comando «salir» para abandonar las aplicaciones. Una vez que avancé en la curva del aprendizaje de cómo funciona el dispositivo he entendido esto, pero fácilmente puedo imaginar este como un gran obstáculo para un nuevo usuario que no esté muy familiarizado ni con el dispositivo ni con interfaces de accesorios tecnológicos, entendible todavía más puesto que toda navegación se hace por voz.

‘Smart reading’ podría tener sentido como sub-aplicación dado que al activarle (bajo el comando «lectura interactiva») también se «encienden» muchos otros comandos relacionados con la búsqueda de cantidades, fechas, volumen de voz, búsqueda de titulares o frases exactas, etcétera. Nada de eso ocurre con la aplicación de ‘orientación’ cuya única utilidad es el comando «diga qué hay delante de mí» con el cual no he tenido la mejor de las experiencias por el tamaño del catálogo de objetos del que he hablado.

En autonomía es difícil medir un dispositivo como Orcam dado que se porta todo el tiempo y el consumo energético depende mucho de si se usan funciones básicas como hora y fecha, o funciones avanzadas como lo que tiene que ver con lectura y aprendizajes de rostros u objetos. Hubo días que solo gasté el 30% de la batería, pero en los días más intensos de prueba, que involucraron registro de rostros, lectura interactiva y navegar por menús, tuve que cargar el dispositivo dos veces en la misma jornada. Cuando menos, la batería se cargó por completo en aproximadamente hora y media.

La opinión de Xataka México

OrCam MyEye es una gran idea. Es la concepción de wearables como dispositivos de ayuda y asistencia, enfocado a un grupo muy particular que definitivamente puede usar la tecnología a su favor. Sus funciones son tan variadas que definitivamente hay una curva de aprendizaje para comenzar a utilizar el dispositivo y obtener de él su mayor provecho. Entre lo mejor está la detección de rostros, la gran cantidad de opciones con ‘smart reading’, el valioso añadido de detección de billetes mexicanos y la capacidad de hacer que una persona invidente o con algún tipo de debilidad visual pueda acceder a todo el contenido de lectura que tenga a la mano de forma física.

Sus carencias también son importantes. Ha dejado de lado deliberadamente lo que tiene que ver con trabajo de ubicación espacial, lo que le distinguiría como un dispositivo todavía más innovador y de utilidad. Al final, si se trata de lectura, una persona con discapacidad visual podría obtener beneficios similares beneficios de un audiolibro, y lo haría por un precio mucho menor. La oportunidad está, con software y hardware que existe y que hemos visto en otros dispositivos, pero que no ha sido usado con estos fines.

Desde OrCam me han comentado la posibilidad de que OrCam MyEye equipe cada vez más funciones, con ayuda de actualizaciones over the air. Sería conveniente, pero me desanima que no he notado mucho avance en funciones nuevas desde aquel demo que presencié en 2018 a esta versión de OrCam que por fin he probado.

Sería menos exigente si OrCam centrara su promesa de venta en la lectura. El problema es que con una sub-aplicación dedicada a orientación y un precio restrictivo de 100,000 pesos, definitivamente me gustaría ver madurar un proyecto tecnológico que tiene todo de encomiable y cuyo potencial tiene tintes verdaderamente transformadores para las vidas de personas que, por sus condiciones, han quedado relegadas de disfrutar de maravillas tecnológicas vistas en wearables y otros dispositivos a los que nos hemos acostumbrado quienes no vivimos con una discapacidad visual.

Deja una respuesta