Office Lens, potente y efectivo OCR gratuito de Microsoft

Imagen del logotipo de la aplicación Office Lens, compuesto por las palabras Office Lens y un logotipo formado por un cuadrado, una “L” y el objetivo de una cámara

Aplicación disponible para iOS, Android, Windows 10 y Windows Mobile.

Una de las aplicaciones más útiles que podemos llegar a tener en nuestros smartphones, sin duda, es la de un buen OCR que nos permita en cualquier momento poder reconocer todo tipo de documento impreso. Cartas, recibos, menús de restaurantes, tickets, carteles… Todo ello puede ser accesible gracias a Office Lens, una aplicación de Microsoft que transforma a nuestro smartphone en un eficaz escáner de bolsillo.

Ventajas:

  • Es gratuita, efectiva, fácil de usar y muy accesible.
  • Nos guía verbalmente a la hora de enfocar el documento que queramos reconocer, lo que supone una gran ayuda.

Inconvenientes:

  • Requiere conexión a Internet para realizar el reconocimiento de los caracteres, por lo que si en alguna ocasión no disponemos ni de Wi-Fi ni cobertura móvil, no podremos usarla.
  • Es preciso disponer de una cuenta de Microsoft para usar sus principales funciones (en caso de no tenerla vale la pena crearse una para usar esta aplicación).

Funcionamiento:

Nota: Este tutorial está elaborado usando la aplicación para iPhone, por lo que en las versiones para otras plataformas, aunque la mecánica es la misma, algunos de los gestos comentados aquí, en especial los del rotor, serán diferentes.

1º. Para escanear un documento, nada más abrir la aplicación ya está todo preparado para enfocarlo y sacarle una foto. Es Decir, que En esta primera pantalla ya viene por defecto seleccionado el modo de cámara en “Documento” y el foco de VoiceOver se encuentra encima del botón de captura, por lo que si no hemos estado explorando esta pantalla para ver los distintos botones que hay, ya está todo listo para sacar la foto al documento. Si hemos estado explorando esta primera pantalla, antes de tomar la foto nos debemos asegurar de que estamos ubicados encima del botón de captura. Hasta que no estemos ubicados encima de ese botón, el programa no nos guiará verbalmente para enfocar el texto.

De todas formas, antes de realizar la captura, haré una breve referencia al botón “Mostrar lista de menús” que hay en esta pantalla, pues al entrar aquí, encontramos varios botones interesantes como el botón de “Importar”, que nos permite importar imágenes que tengamos guardadas en el carrete para reconocer el texto que haya en ellas, el botón “Cargas recientes”, que es donde se almacenan los documentos generados a partir del texto que hayamos reconocido (por ejemplo documentos en formato docx), y el botón “Configuración”, donde podemos gestionar la cuenta de correo que tenemos asociada al programa. Para salir de esta ventana, debemos pulsar el botón “Ocultar lista de menús”, que hay arriba del todo y que nos devuelve a la pantalla principal.

2º. Pues bien, ahora ya sí que vamos a sacar la foto. Para Ello, tal y como ya he mencionado antes, debemos estar situados en el botón de captura. Colocamos el texto a escanear encima de la mesa, aunque también podemos sacar una foto a un texto que esté colgado en una pared o un tablero (es importante que alrededor del texto no hayan otros textos u objetos cercanos para que el programa reconozca bien los bordes del documento). Seguidamente, colocamos el móvil paralelo a la superficie del texto, a una distancia de unos 30 centímetros con la cámara enfocándolo. En ese instante, una voz nos guía para que centremos bien el texto. Nos va diciendo izquierda, derecha, arriba, abajo, retroceder (que significa que estamos muy cerca del texto y que tenemos que separar un poco el móvil de éste)… y cuando el texto esté bien centrado, la voz dirá listo. En Ese momento Debemos hacer una doble pulsación en la pantalla para presionar el botón de captura (se escucha el sonido que emite la cámara cuando toma una foto).
3º. Una vez realizada la foto, se abre una nueva pantalla en la que entre otros botones, está el botón “Listo”, que es para enviar o exportar la imagen a donde queramos, el botón “ Cámara”, que es por si queremos tomar más fotografías (por ejemplo, en el caso de que queramos reconocer un documento de varias hojas de un tirón. Algo que yo no recomiendo, porque si nos equivocamos al escanear alguna de las hojas, luego no sabremos cuál de todas las que hemos escaneado es la errónea), y el botón “Eliminar”, que es para eliminar la imagen tomada.
4º. Para continuar con el proceso debemos darle al botón “Listo”, y entonces nos aparece una lista de opciones, entre las cuales, si deseamos leer la imagen como si fuese un documento, debemos presionar en “Lector inmersivo” (la primera vez que usamos el programa, tras presionar esa opción, debemos introducir una cuenta de Microsoft, que si no tenemos, podemos crear desde aquí, eso sí, con el consiguiente inconveniente de tener que rellenar un CAPTCHA, que aunque se puede reproducir, siempre es algo lioso, sobre todo si se hace desde el móvil, por lo que si no disponéis de un teclado Bluetooth externo, recomiendo crear antes la cuenta desde un ordenador).
Importante: si tras presionar el botón “Listo”, nos aparece un listado con varios archivos con los nombres de “imagen 1”, “Imagen 2”… Esto es debido a que hemos fotografiado anteriormente algún documento y no lo hemos eliminado o cerrado adecuadamente, o bien que hemos realizado varias fotografías en la pantalla anterior con el objetivo de reconocer más de un documento a la vez. Pues bien, en el primer caso, Hasta que no eliminemos los archivos previos, no podremos continuar con el proceso del reconocimiento de la imagen tomada. Por lo tanto, debemos entrar con doble tap en las imágenes tomadas anteriormente, y una vez dentro, navegar con flick hasta el botón “Eliminar”, para borrarlas. Cuando nos quede tan sólo la última imagen tomada, podemos darle al botón “Guardar todo”, y entonces ya pasamos a la pantalla donde seleccionaremos el lector inmersivo. Para Evitar Esta acumulación de imágenes, cada vez que reconozcamos una imagen, conviene cerrarla adecuadamente (esto lo explicaré más adelante). Si por el contrario, estamos reconociendo varias hojas a la vez porque realmente lo queremos hacer así, debemos presionar el botón “Guardar todo” para pasar a la siguiente pantalla y de esta forma enviar todas las imágenes al lector inmersivo como si se tratase de un único documento.
5º. Mientras se reconoce el texto VoiceOver va verbalizando “Examinando el texto”. Al finalizar el proceso nos aparece una nueva pantalla con el texto y unos botones típicos de reproducción. Si nos ubicamos dónde está el texto, podemos explorarlo con VoiceOver y si le damos al botón “Reproducir”, se empieza a reproducir automáticamente. Si la imagen no se ha reconocido correctamente, nos sale un mensaje en el que se nos pide que volvamos atrás para repetir la fotografía. En ese caso, debemos retroceder presionando el botón de “Atrás” que aparece en ese mensaje, y luego volver a presionar el botón “Atrás” que hay arriba a la izquierda para ir a la pantalla anterior. Una vez en esa pantalla, eliminamos la imagen tomada presionando el botón “Eliminar” que hay abajo del todo. Al eliminarla, volveremos a estar en la primera pantalla para repetir la fotografía del texto.
6º. Una vez hemos leído el texto, para cerrar adecuadamente el documento, sin que se queden almacenadas imágenes que luego nos dificultarán sucesivos reconocimientos, debemos presionar el botón “Cerrar” de esta pantalla. Entonces, tras confirmar la acción, Volvemos a la primera pantalla de inicio para volver a tomar otra captura. Si nos limitamos a salir de la aplicación pulsando el botón “Inicio” del iPhone, la imagen queda ahí, y cuando queramos reconocer otra imagen, no podremos hacerlo hasta que eliminemos la anterior.
7º. En el caso que deseemos guardar la imagen tomada, antes de cerrar el lector inmersivo, debemos pulsar el botón “Atrás” que hay arriba a la izquierda para ir a la pantalla anterior. Una vez ahí, se nos presentan varias opciones, y dependiendo de si queremos guardar lo escaneado como imagen o como texto, debemos elegir una u otra. Si guardamos la imagen en Word, PDF, OneDrive u OneNote, la imagen se guarda como texto reconocido. En cambio, en el resto de opciones, como enviarla por correo o compartirla, se hará como una imagen, es decir, como una fotografía.
Nota: Una vez hayamos enviado o guardado nuestra imagen donde deseemos, la imagen quedará cerrada adecuadamente y volveremos a estar en la pantalla principal por si deseamos tomar otra captura.
8º. Pues bien, como a nosotros lo que nos interesa principalmente es guardar la imagen como un texto que podamos leer o incluso editar, lo mejor es enviarla por ejemplo a Word. Si no tenemos instalada esa aplicación, no pasa nada, le damos igualmente a exportar a Word. Entonces se abre la pantalla de cargas recientes con un fichero con nuestro texto en formato docx. Pulsamos encima como para abrirlo, nos pide que si queremos descargar la aplicación Word, le decimos que no, y seguidamente, tras unos instantes de descarga, se descargará y abrirá en una nueva ventana el archivo convertido online al formato docx. Ahora, si nos desplazamos Al final de ésta ventana encontraremos un botón de “Compartir”, que al ser pulsado, nos permite guardar o compartir el documento en formato docx (se adjuntará a un correo, a un mensaje de WhatsApp…). Por cierto, si tras todo este proceso, deseamos dejar limpia la ventana de “Cargas recientes”, basta con hacer flick hacia arriba encima del nombre del archivo y seleccionar la opción “Quitar”.
9º. Lo explicado en el punto anterior nos permite guardar un archivo con ese documento, pero si lo que queremos es simplemente copiar el texto para pegarlo posteriormente donde deseemos, lo ideal es echar mano de la socorrida y maravillosa opción que nos ofrece VoiceOver para copiar en el portapapeles lo último que se ha verbalizado. Esto se puede hacer desde la pantalla abierta con el documento de Word que ya hemos visto en el punto anterior, o desde el lector inmersivo. Yo os recomiendo que lo hagáis desde el lector inmersivo para ahorraros los pasos de exportar a Word. Para ello, Debemos ir a la pantalla del lector inmersivo, colocarnos encima del texto reconocido, y tras empezar VoiceOver a leerlo, realizamos el gesto de pulsar con 3 dedos cuatro veces rápidamente en la pantalla. Luego nos vamos al cuadro de edición de la aplicación donde deseemos pegarlo (WhatsApp, Mail, editor de texto…), realizamos el gesto del rotor hasta llegar a “Editar”, hacemos flick hacia abajo hasta “Pegar”, y finalmente hacemos doble tap en esa opción para pegar. Por cierto, para copiar el texto al portapapeles, no hace falta esperar a que VoiceOver termine de leer todo el texto, con realizar el gesto nada más empezar a verbalizar el contenido de ese cuadro, ya se copia todo íntegramente.

Nota: Para copiar el texto reconocido, también tenemos disponible la opción de seleccionar, copiar y pegar texto que nos ofrece el rotor de VoiceOver, pero como se trata de copiar el texto íntegro, os recomiendo esta otra opción mucho más sencilla que copia en el portapapeles lo último verbalizado.

Observación final:

Que no os asuste lo extenso de este tutorial y la cantidad de pasos en los que está estructurado. Una vez hayáis realizado varios procesos de captura de documentos, de seguida os haréis con la mecánica, que es muy sencilla. El poder llevar siempre encima un escáner portátil nos puede sacar de más de un apuro. Así que dadle una oportunidad a esta aplicación. Total, es gratuita y seguro que no os defraudará.

Enlaces de descarga:

Descarga la aplicación para iOS

Descarga la aplicación para Android

Descarga la aplicación para Windows

Autor: Jaime Franco

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Cumplimenta el siguiente captcha matemático introduciendo la cifra que falta *