Prizmo Go, práctico y gratuito OCR que no precisa conexión a Internet

Imagen en la que se observa tres móviles, cada uno de ellos con una captura de las distintas pantallas de esta aplicación

Aplicación disponible tan sólo para iOS.

Actualmente existen bastantes aplicaciones OCR para convertir nuestros smartphones en un útil escáner de bolsillo, pero si buscamos una que sea rápida, sencilla, efectiva, accesible, gratuita y que tenga incorporado el motor de OCR para que pueda funcionar a pesar de no disponer de wifi ni cobertura, Prizmo Go es la candidata ideal. Su facilidad y rapidez la convierten en la opción perfecta para reconocer un texto en cualquier sitio, en un instante y sin complicaciones, que es lo primordial en este tipo de aplicaciones.

Ventajas:

  • Es rápida, bastante efectiva, fácil de usar, accesible y gratuita.
  • El motor de OCR ya viene incorporado incluyendo 10 idiomas entre los que se encuentra el español, por lo que el reconocimiento no precisa conexión a internet. Esto permite su uso en sitios sin wifi ni cobertura, hace que el reconocimiento sea realmente muy rápido y nos garantiza una mayor privacidad en los documentos reconocidos.
  • Nos ofrece una ayuda con voz muy completa para enfocar los documentos.
  • Se pueden usar los botones físicos del volumen del iPhone tanto para obtener la ayuda del enfoque como para disparar la cámara.
  • Ofrece la posibilidad de reconocer fotografías directamente desde aplicaciones como WhatsApp para leer el texto que pueda ver en ellas.

Inconvenientes:

  • De momento no hay versión para Android ni Windows Mobile, tan sólo para iOS.
  • Aparición frecuente de errores de reconocimiento en forma de signos raros, que aunque son bastante habituales en este tipo de OCR para móviles en los que influye mucho la iluminación ambiental o el enfoque, en esta aplicación se me antojan más evidentes que por ejemplo en Office Lens (si se activa la opción “Estabilización” que hay en la pantalla principal, mejora algo la precisión del reconocimiento). Seguramente esto mejorará si usamos/compramos las unidades de reconocimiento online, pero entonces se pierden las ventajas de la rapidez del reconocimiento y el funcionamiento sin conexión. De todas formas, encuentro que es la aplicación ideal para reconocer de forma rápida y sencilla un documento sin precisar gran fiabilidad (nota: siempre he pensado que los OCR para smartphone están enfocados para usos puntuales en esos casos de necesidad en los que necesitamos un escáner portátil, si realmente queremos precisión, sin duda la mejor opción son los escáneres tradicionales de sobremesa).
  • Si deseamos copiar o compartir el texto reconocido, así como interactuar con él, debemos comprar un paquete de exportación que habilita esas funciones (tal y como veremos más adelante, VoiceOver también nos permite copiar ese texto, pero si vamos a usar mucho esas funciones, vale la pena comprarlo pues resulta más cómodo).

Descripción de la aplicación:

Prizmo Go es una aplicación OCR (reconocimiento óptico de caracteres) que permite capturar y reconocer por medio de la cámara del iPhone o del iPad el texto que hay en todo tipo de documentos impresos. Muchas de sus funciones están específicamente diseñadas para VoiceOver, por lo que su uso nos resultará muy accesible. Muestra de esto son el sistema de ayuda/guiado con voz para enfocar el documento o su lector/conversor texto a voz con teclas de reproducción y navegación. Pero eso no es lo único destacable. Otras Cualidades dignas de mención son que ya trae incorporado el motor OCR con 10 idiomas (se pueden comprar unidades extras para usar un motor OCR en la nube de mayor precisión con 22 idiomas), la posibilidad de lanzar tanto la ayuda del enfoque como la captura de la imagen con los botones físicos del volumen, la incorporación de un Procesamiento de imagen para reconocer texto mal alineado o direcciones invertidas así como un sistema de estabilización de imagen que mejora la nitidez, la capacidad de detectar códigos QR, y la posibilidad de comprar un paquete de exportación que permite copiar y compartir el texto reconocido así como interactuar con la información encontrada en éste (números de teléfono, direcciones de correo electrónico, direcciones físicas, sitios web).

Seguidamente paso a describiros los botones que nos encontramos En la pantalla principal:

  • “Ajustes de la aplicación”. Aquí dentro encontramos diversas opciones y ajustes: las dos compras disponibles desde la App (el paquete de exportación y las unidades para el OCR en la nube), la selección del idioma de la Cámara, la detección de códigos QR, el almacenamiento de las fotos en el álbum (que viene desactivado por defecto y que es muy útil ya que evita que nos tengamos que preocupar de eliminar las fotos que vamos realizando), el modo de bajo consumo, y la lectura de texto automática (opción muy interesante que nos permite poder activar/desactivar la reproducción automática del texto tras ser reconocido).
  • “Flash”. Permite activar y desactivar manualmente el flash de la cámara, lo cual viene muy bien para capturar imágenes en situaciones de baja iluminación.
  • “Estabilización”. Mejora la nitidez de la imagen cuando la cámara no tiene suficiente estabilidad al disparar (esta opción enlentece unos dos segundos el proceso de captura de la imagen, pero resulta interesante activarla tanto si nos tiembla el pulso, como si deseamos mejorar algo más la precisión del reconocimiento).
  • “Idioma del OCR”. Desde aquí podemos cambiar el idioma del reconocimiento.
  • “Capturar imagen”. Este es el botón que tenemos que pulsar para iniciar la captura y reconocimiento de un documento (esto también se puede hacer de forma mucho más cómoda pulsando el botón físico de subir el volumen del lateral del iPhone).
  • “Importar imagen”. Desde aquí podemos acceder a las fotografías del carrete y reconocer el texto que haya en éstas.
  • “Proporciona una descripción de la escena e instrucciones para colocar la cámara”. Este último botón es el que nos facilita una descripción/ayuda con voz para enfocar adecuadamente el texto (acción que se puede llevar a cabo de una forma mucho más cómoda pulsando el botón físico de bajar el volumen que hay en el lateral del iPhone). Se trata de una ayuda realmente muy completa, aunque quizás no tan práctica como por ejemplo la que nos ofrece Office Lens, ya que tenemos que ir presionando continuamente este botón de ayuda para saber cómo tenemos enfocado el texto, mientras que Office Lens lo hace en tiempo real, sin tener que presionar ningún botón, actualizando el guiado instantáneamente a la vez que vamos moviendo la cámara del móvil. De todas formas, las Instrucciones que nos Da Prizmo Go son muy completas, con información muy útil, como por ejemplo la de rotar X grados el móvil, las líneas captadas del documento, el ángulo con gravedad, el porcentaje de cobertura del texto…

Funcionamiento:

1º. Para capturar un texto colocamos el documento a reconocer en una superficie plana (es importante asegurarnos de que haya buena iluminación y que alrededor del texto no se encuentren otros textos u objetos cercanos para que el programa reconozca bien los bordes del documento). Después colocamos el móvil paralelo a la superficie del texto, a una distancia de unos 30 centímetros con la cámara enfocándolo. En ese punto, si estamos convencidos de que ya lo tenemos bien enfocado, pulsamos el botón de subir volumen del lateral del iPhone para iniciar la captura, o si deseamos verificar el enfoque, pulsamos el botón de bajar volumen de lateral del iPhone para obtener la descripción/ayuda para el enfoque (durante el proceso de enfoque, el móvil vibra y emite un ruidito similar a un “tableteo”, pero eso no suele ser de gran ayuda ni garantía de que el documento esté bien enfocado, por lo que lo mejor es solicitar la guía del enfoque).

2º. Una vez realizada la captura, pasamos automáticamente a la pantalla de lectura donde empieza la auto reproducción del texto reconocido. Si deseamos detener la reproducción, tenemos 2 opciones: pulsar 2 veces con 2 dedos en cualquier parte de la pantalla o presionar el botón “Pausa”. Para reanudar la lectura lo mismo: pulsamos 2 veces con 2 dedos o presionamos el botón “Leer” (os recuerdo, en el caso de que no queráis que empiece la auto lectura automática, que esta opción se puede desactivar desde el botón “Ajustes de la aplicación” de la pantalla principal).

En esta misma pantalla también disponemos de botones para avanzar o retroceder por párrafos… que facilitan la navegación por el texto reconocido (estos botones tan sólo aparecen mientras se está reproduciendo el texto o tras presionar el botón “Parar”. Si el texto está en pausa tras haber presionado el botón “Pausa” o tras haber pulsado con 2 dedos 2 veces, no aparecen estos botones. Bueno, si pausamos con los 2 dedos, si aparecen, pero no funcionan, y tras presionar los una vez, desaparecen). De Todas Formas, arriba del todo hay Un cuadro con el texto reconocido, por lo que si nos ubicamos ahí, podremos navegar de una forma más sencilla por el texto con VoiceOver, a través de las opciones de navegación del rotor.

Los botones de “Compartir” y “Copiar” que nos encontramos en esta pantalla no nos servirán de nada, a no ser que compremos el paquete de exportación que nos permite copiar y compartir el texto así como poder interactuar con posibles enlaces, números de teléfono o direcciones que aparezcan en éste. La limitación consiste en que aunque aparentemente parecen funcionar ambos botones, en el texto compartido o pegado aparece un mensaje comunicándonos que es un texto procesado por Prizmo Go y que debemos obtener el paquete de exportación para acceder al texto completo.

Desde esta misma pantalla se puede cambiar la voz y su velocidad, y una vez leído el texto, en el caso de que queramos realizar otra captura, no hay ninguna necesidad de eliminar la que tenemos en ese momento en pantalla. Basta con pulsar el botón “Volver a la cámara” o realizar el gesto de VoiceOver de ir a la página anterior, para regresar a la pantalla principal donde podremos capturar el nuevo texto.

Notas prácticas:

  • Para poder copiar y compartir el texto reconocido, tenemos la fabulosa y socorrida función que nos ofrece VoiceOver de copiar en el portapapeles lo último que se ha verbalizado. Para esto nos ponemos arriba del todo de la pantalla de lectura, en el cuadro del texto reconocido, y tras empezar VoiceOver a leerlo, realizamos el gesto de pulsar con 3 dedos cuatro veces rápidamente en la pantalla. Luego nos vamos al cuadro de edición de la aplicación donde deseemos pegarlo (WhatsApp, Mail, editor de texto…), realizamos el gesto del rotor hasta llegar a “Editar”, hacemos flick hacia abajo hasta “Pegar”, y finalmente hacemos doble tap en esa opción para pegar. Por cierto, para copiar el texto al portapapeles, no hace falta esperar a que VoiceOver termine de leer todo el texto, con realizar el gesto nada más empezar a verbalizar el contenido de ese cuadro, ya se copia todo íntegramente.

También se pueden reconocer fotografías directamente desde aplicaciones como WhatsApp para leer el texto que pueda haber en ellas. Para hacer esto en el caso de WhatsApp, primero nos ubicamos encima de la fotografía que deseamos reconocer, luego realizamos flicks hacia abajo hasta la opción “Reenviar”, entramos ahí con doble tap, después con flick hacia la derecha buscamos y pulsamos el botón “Compartir”, y finalmente, en el cuadro que se abre, pulsamos en “Importar con Prizmo Go”. Tras ello, se abrirá una pantalla en la que tendremos que pulsar el botón “Reconocer”. Incluso podemos hacer que en el menú compartir del WhatsApp aparezca una nueva opción llamada “Reconocer texto” que nos permitirá reconocer directamente la fotografía sin pasar por esa pantalla previa. Para esto, debemos entrar en la segunda opción “Más” que hay en el menú compartir y activar la opción “Reconocer texto”.

El enlace de descarga de la aplicación para iOS:

Descarga la aplicación desde la Apple Store

Autor: Jaime Franco

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Cumplimenta el siguiente captcha matemático introduciendo la cifra que falta *