Google Docs acaba de lanzar oficialmente un sistema de importación de documentos escaneados. Lo que inició como un experimento para la lista de documentos de la API el año pasado, ya está disponible en la página en el enlace de «Convertir a PDF o archivos de imágenes a Google Docs documentos».
Google Docs permite extraer el texto y el formato de las exploraciones que se puede editar a distancia.
OCR funciona mejor con imágenes de alta resolución, y no todo el formato puede ser preservado. Las imágenes originales se incluirán en el nuevo documento, para que sea más fácil corregir posibles errores.
Los idiomas soportados incluyen el Inglés, el francés, el italiano, el alemán y el español, con más idiomas y conjuntos de caracteres en camino de ser procesados.
Al respecto Jaron Schaeffer, Ingeniero de Software de Google Docs, señaló que todo surgió al ver la necesidad de las personas de colocar textos de otros archivos y origenes en Google Docs
«Hace un par de meses, mi compañero de trabajo, Mike, se presentó en mi escritorio con un montón de papel, cada una de las hojas amarillentas densamente cubierta con tinta de una máquina de escribir antigua.
Su esposa acababa de descubrir crónicas y apartes de su familia en el ático, escritas por su abuela hace muchos años. Ahora, él se preguntaba si había una manera de trascribir esas crónicas en Google Docs.
Los trabajos quedaron archivados en mi escritorio por un tiempo, pero recientemente se los pude devolver a Mike con una sonrisa en mi rostro, con la alegría de decirle, que lo que comenzó como un simple proyecto, ya estaba listo para el uso de todos en Google Docs.»
Finalmente el experto explicó, para aquellos técnicamente curiosos, que lo que se está empleando es tecnología de reconocimiento óptico de caracteres (OCR) y que la ayuda de todos los amigos de Google fue importante en la creación de esta valiosa herramienta.
Editado y traducido por Periodista Digital
Equipo Mipagina.net