OrCam MyEye, smartglasses con OCR y reconocimiento de rostros y objetos

Imagen del sistema Orcam. En ella se observa la microcámara, que en este caso ya está acoplada a la patilla de unas gafas normales, y la unidad de procesamiento que va unida por medio de un cable a la microcámara

Allá por el 2013, cuando leí por primera vez una noticia sobre las gafas Orcam, me sorprendió gratamente la buena pinta que tenían. Con la tecnología que incluían, las personas ciegas podríamos llegar a hacer cosas realmente sorprendentes: leer textos, reconocer objetos y rostros, o incluso saber cuándo un semáforo se ponía en verde e identificar el número del autobús. Parecía algo realmente revolucionario, e incluso muchos fantaseábamos con qué nuevas funciones podrían incorporar una vez salieran al mercado.

Pero bueno, como suele pasar con estas cosas, fueron pasando los meses, los años… Y nunca parecía llegar el momento de su comercialización. Muchos incluso pensábamos que Orcam terminaría engrosando la lista de prototipos desahuciados que acumulan polvo en los rincones de los talleres de los emprendedores bien intencionados. Afortunadamente, no ha sido así y tras cuatro años de espera, por fin podemos comprar estas gafas en España y además con todas sus funciones en español. Eso sí, lo que parecía ser un producto realmente revolucionario en el momento de su anuncio, ahora, tras popularizarse el uso de las aplicaciones de reconocimiento de objetos y OCR en los smartphones, ya no nos lo parece tanto. A mi parecer, Orcam llega algo tarde. Su tecnología era revolucionaria en su momento, pero ahora está tan extendida que ya no llama tanto la atención. Pero bueno, aun así, son muy bienvenidas. Sin duda mucha gente las encontrará útiles y se podrá beneficiar de ellas. Aparte que todo indica que la compañía tiene previsto ir añadiéndoles nuevas funciones, algo realmente interesante. Por ejemplo, para finales de este 2017 tienen programada una actualización de su software que incorporará nuevas funciones como detección de colores, identificación de códigos de barras, distinción del género de una persona o leer de forma automática un texto cuando las gafas se quedan fijas en él durante tres segundos. En Fin, funciones realmente interesantes que le dan un valor añadido al producto, pues si la empresa va a ir sumándole periódicamente nuevas funciones, esto le aporta un atractivo especial (incluso se habla de que tienen previsto incorporarle compatibilidad con los asistentes personales de los smartphones).

No me enrollo más. Seguro que estaréis deseando conocer más datos sobre estas gafas, por lo que a continuación os pondré sus características y una valoración/análisis que hice sobre ellas en el mes de abril de este año 2017, tras visitar la óptica DIFEROPTICS de aquí, de Barcelona, donde nos las permitieron ver y probar a un grupo de cinco afiliados a la ONCE.

Sobre OrCam

El sistema OrCam MyEye empezó a desarrollarse en Israel en el año 2010, pero no fue hasta el 2013 cuando se constituyó oficialmente la empresa israelí OrCam, con el principal objetivo de desarrollar, poner a punto y comercializar su producto. En el 2015 se pusieron a la venta en Estados Unidos, al año siguiente llegaron a algunos países europeos y a principios de este 2017 empezaron a llegar a España gracias al acuerdo entre la compañía francesa Essilor y la israelí OrCam (una de las primeras ópticas de España en disponer de ellas ha sido la óptica DIFEROPTICS de Barcelona).

OrCam se presenta en dos versiones: OrCam MyEye, el modelo más completo y caro (4700 euros) y OrCam MyReader, más sencillo y económico (unos 3500 euros). Aunque luego os describiré detalladamente cómo es el sistema, deciros que Este está formado por una microcámara que se puede acoplar a cualquier tipo de gafas y por un miniordenador que puede llevarse en el bolsillo o sujetado al cinturón. La cámara, de 8 megapíxeles, capta y reconoce en tiempo real el texto que el usuario señala con el dedo, y envía una señal al ordenador, que emite mensajes en audio a través de un altavoz de conducción ósea. Además de leer lo que señalemos, las gafas OrCam MyEye también pueden describir algunas cosas que estamos viendo, como por ejemplo el número del autobús que llega a la parada, reconocer rostros o identificar productos y lugares (además, como ya he comentado anteriormente, en breve también poseerán las funciones de detección de colores, identificación de códigos de barras, distinción del género de las personas o la lectura automática de textos).

Según he podido averiguar por Internet, aparte de estas nuevas funciones previstas ya para finales de este año, la empresa ha anunciado otras interesantes mejoras que se incorporarán en un futuro, destacando entre éstas la posibilidad de asociar el dispositivo a asistentes como Siri con el objetivo de facilitar la orientación en los desplazamientos. Pero bueno, mejor no entusiasmarse con posibilidades que aún están, como se suele decir, en el tintero de los desarrolladores. Ya os iremos informando de que características o funciones se van incorporando definitivamente al producto. Por el momento, lo único seguro son esas nuevas funciones anunciadas para finales de este año, y de que las investigaciones y mejoras actualmente en curso están encaminadas a potenciar la sensibilidad de la cámara, que ya puede leer textos a distancia, e incluso en penumbra o en superficies inclinadas.

Valoración y descripción de las gafas Orcam

Los 2 modelos existentes de las gafas Orcam son iguales externamente y tan sólo se diferencian por las prestaciones que ofrecen, y por supuesto, por su precio.

Elementos que conforman el sistema:

  • Un pequeño soporte para la cámara y que se fija a la patilla derecha de cualquier gafa.
  • Una cámara de 8 megapíxeles realmente pequeñita (aproximadamente como la falange distal del dedo meñique) y con un peso de 31 gramos, que se puede colocar y quitar en cualquier momento del soporte de la patilla de la gafa. Esta cámara tiene incorporado un micrófono y un auricular/altavoz que se apoya por delante de la oreja, en el hueso temporal, y que transmite el sonido simultáneamente tanto por conducción ósea como a través del altavoz (esto es algo que a mí no me convence, porque todo el mundo que hay al rededor se entera de lo que estás leyendo, y no creo que se pueda configurar para que suene tan sólo el auricular de conducción ósea, silenciando el altavoz externo, pues la unidad de procesamiento cuenta con una salida de auriculares, y si se pudiera silenciar el altavoz, esa salida de auriculares no tendría por qué estar ahí).
  • La unidad de procesamiento que tiene unas medidas de 53 mm de ancho x 130 mm de largo x 22 mm de grosor y un peso de 163 gramos. Esta unidad va unida por un cable a la cámara y la autonomía de la batería incluida, es de aproximadamente un día, con un periodo de carga de cuatro horas.
  • Una carcasa de plástico con una lengüeta de sujeción que permite sujetar la unidad de procesamiento a un cinturón, un bolso, o cualquier prenda de vestir.

 

Breve descripción de la unidad de procesamiento:

Si tomamos la unidad de procesamiento con el cable próximo a nosotros, en el lateral derecho nos encontramos los botones de subir y bajar el volumen de la voz, y el botón de encendido (este último es el que está más próximo a nosotros). En el lateral izquierdo se encuentra el botón para capturar o tomar una imagen y una tapa de plástico flexible que se puede levantar para acceder a la conexión para recargar la unidad. En el lateral Más próximo a nosotros, en lo que sería el borde inferior, se encuentra la salida de auriculares, el cable que va a la cámara y un botón que nos permite acceder a la tarjeta de memoria micro SD, que es el medio de actualizar el firmware de la unidad de procesamiento.

Funcionamiento:

El modelo más sencillo tan sólo sirve para leer textos impresos, ya sean libros, cartas, letreros…

Para leer hay 2 formas de capturar el texto: señalando con el dedo hasta que se emite un sonido como de tomar una foto, o pulsando el botón de capturar imagen que hay en la unidad de procesamiento. La ventaja de hacerlo señalando con el dedo, es que si estás leyendo un libro puedes seleccionar primero una página, y luego la siguiente. En cambio, si lo haces con el botón, si se trata de un libro, elegirá tan sólo una de las páginas, la que tenga más cerca del enfoque de la Cámara (vamos, que no capta las 2 páginas a la vez y las ordena como ocurre con los escáneres de sobremesa). También hay una forma de lectura por navegación, que consiste en que señalas con el dedo, y si mantienes el dedo colocado en el libro, empieza a leer las 4 líneas de texto que hay justo por encima del dedo. Entonces, sí vas moviendo el dedo tanto hacia arriba como hacia abajo, inmediatamente pasa a leer las 4 líneas superiores correspondientes a la nueva posición seleccionada (algo que va muy bien si deseas navegar rápidamente por un texto que ya has leído, con el objetivo de ubicar un fragmento específico).

He de decir que la rapidez de reconocimiento del texto es sorprendente, siendo prácticamente inmediata, apenas transcurre un segundo desde que se realiza la captura hasta que empieza a leer. Por supuesto, el motor del reconocimiento viene instalado en la unidad de procesamiento, por lo que el OCR no precisa conexión a Internet (algo que contribuye a la rapidez del reconocimiento junto con el procesador incorporado), y en cuanto a la voz, que está en español, es muy clara, se entiende muy bien, y se puede configurar una velocidad de lectura de entre 100 y 240 palabras por minuto.

El modelo superior, aparte de la misma función de lectura, también tiene las siguientes funciones:

  • Reconocimiento facial. Para usar esta función, lo primero que hay que hacer es introducir en la memoria del aparato la identificación de los rostros deseados. Este proceso se hace tan sólo una vez, tomando una captura a la persona, a una distancia de un metro y medio, para luego, a petición del sistema, verbalizar y grabar el nombre de esa persona. Entonces, a partir de ese instante, cuando la cámara detecte a esa persona, se escuchará ese nombre que has grabado previamente. Es algo que se realiza en tiempo real, es decir, no hace falta señalar con el dedo ni presionar ningún botón. La cámara, en cuanto detecta a esa persona, la identifica y verbaliza su nombre. Se puede configurar para que no verbalice el nombre constantemente, sino transcurrido un tiempo (algo de agradecer, porque en las pruebas realizadas en la óptica, cada vez que detectaba a la persona a la cual le habíamos hecho la foto, estaba constantemente diciendo su nombre). Se pueden almacenar hasta un total de 100 personas.
  • Reconocimiento de productos. Es una función similar al anterior, pero aquí en el proceso de captura te pide que realices 3 fotografías del producto: una lejana (sosteniendo el producto con el brazo totalmente estirado), una cercana (con el producto a una distancia más próxima) y otra con un fondo distinto a las 2 primeras tomas. En esta modalidad,, una vez ya hemos almacenado y etiquetado el producto, para reconocerlo en sucesivas ocasiones, sí que hace falta o bien señalar con el dedo o bien presionar el botón de captura de la unidad central. Se pueden almacenar hasta 150 productos, y la utilidad principal, es la de almacenar en memoria distintos productos de la compra, para reconocerlos posteriormente en el supermercado o en casa, aunque también se pueden etiquetar otras cosas como billetes o ubicaciones, tales como las fachadas de tiendas, domicilios, etc.
  • Verbalizar la hora y la fecha. Si se realiza delante de la cámara el gesto de como si quisieses mirar la hora de un reloj, se verbaliza la hora e incluso la fecha.
  • En principio también tenía la función de reconocer semáforos, pero esta función se ha retirado, por poder dar lugar a posibles accidentes. Ya que como el sistema funciona por medio de capturas de imagen fija, no por reconocimiento de video en tiempo real, si en el momento de tomar la imagen, el semáforo estaba en verde pero restaban muy pocos segundos para ponerse en rojo, claro, el sistema te verbalizaba que estaba en verde, y ala, en cuanto te ponías a cruzar… problemilla a la vista.
  • En cuanto al uso de identificar autobuses, esto es muy difícil de conseguir, ya que debes tomar la foto justo al frontal del autobús, que es donde está su número, y si éste está en movimiento no funciona todo lo bien que debiera.

Conclusión y valoración final

He de reconocer que el sistema funciona muy bien. La lectura de textos es inmediata, sin errores y con una voz clara, el reconocimiento facial también es efectivo (siempre y cuando enfoques a la persona de frente), y el reconocimiento de productos también es efectivo, pudiendo ser bastante útil, sobre todo cuando vamos al supermercado.

El problema está en el precio: el reconocimiento de texto es inmediato, pero si no te importa esperar unos segundos, hay programas OCR gratuitos para el móvil que funcionan prácticamente igual de bien (por ejemplo Office Lens). En cuanto al reconocimiento facial… ¿realmente es tan necesario? Útil sí, pero imprescindible, no (o al menos esa es mi opinión). Por otro lado, el reconocimiento de productos, aunque también es útil, igualmente podemos hacernos con aplicaciones gratuitas como Identifi que nos ayuden a identificar los productos en el supermercado, y además, sin el límite de 150 productos, ni con la limitación de tener que realizar la grabación previa del nombre del producto. Y en cuanto a la función de la hora y fecha… Que os voy a decir. Hay relojes parlantes muy monos y económicos, eso sin contar que desde que la gente tiene móvil muchos ya ni usan los relojes.

Pero si os sobra el dinero, mucho, mucho dinero, sin duda, Orcam puede ser una compra muy útil. Como también les resultará una compra muy interesante a aquellas personas a las que se les atraganta la tecnología, bien porque ya son mayores, bien por qué no acaban de familiarizarse con los smartphones actuales, y por lo tanto no pueden beneficiarse de esas aplicaciones que he mencionado. Para estas personas Orcam les resultará una ayuda útil y sencilla de usar, pues su funcionamiento, una vez se ha practicado un poco, resulta sencillo.

Vamos, que en resumidas cuentas, mi opinión es que este producto, teniendo en cuenta todas las alternativas que hay en forma de aplicaciones para el móvil, no aporta nada nuevo. Tendrá su público, tal y como he comentado antes, pues lo que hace, lo hace bien, pero eso sí, a un precio algo elevado. De todas formas, a la hora de podernos ser útil en lo que realmente nos preocupa a muchos, que es la movilidad por las calles, no nos aporta nada. Bueno, a los que aún tenéis algo de resto visual y la movilidad no os supone un problema muy grave, sí que os puede servir para leer esas cosas que podéis localizar, pero que no podéis leer bien, tales como las placas con el nombre de las calles (aunque para eso basta con preguntarle a Siri ¿dónde estoy?), los letreros de las tiendas, carteles (para todo esto Identifi también os puede servir igual de bien)…

Y bueno, esto es todo lo que os puedo contar de Orcam. Por cierto, en la óptica nos dijeron que toda persona interesada en probar este sistema, puede ponerse en contacto con ellos para reservar cita (aprovecho la ocasión para agradecer públicamente la fantástica atención del personal de DIFEROPTICS).

Enlaces

Video demostrativo en español de las gafas Orcam:

Reproduce el video demostrativo de Orcam

El enlace de las gafas en la tienda online de la óptica DIFEROPTICS:

OrCam en la óptica DIFEROPTICS

Autor: Jaime Franco

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Cumplimenta el siguiente captcha matemático introduciendo la cifra que falta *