Google La investigación muestra una nueva forma de utilizar la inteligencia artificial para leer la escritura a mano que podría cambiar radicalmente la forma en que las máquinas convierten lo que usted pone en papel en caracteres digitales. El sistema InkSight convierte imágenes de palabras escritas a mano en texto digital aprovechando la inteligencia artificial sin necesidad de intermediarios de hardware.
La idea es reemplazar la tecnología de reconocimiento óptico de caracteres (OCR), a veces falible, con inteligencia artificial que pueda imitar la forma en que los humanos aprenden a leer, es decir, reescribiendo textos existentes para aprender cómo se ven palabras enteras y qué significan. Para ello, es necesario que los investigadores enseñen a la IA cómo reconocer e imitar la escritura humana.
“La toma de notas digitales está ganando popularidad, ya que proporciona una forma sólida, editable y fácilmente indexable de almacenar notas en forma vectorial, conocida como tinta digital. Sin embargo, todavía existe una brecha significativa entre este método de toma de notas y el lápiz tradicional. “Tomar notas en papel, una práctica que todavía prefiere la gran mayoría”, explicaron los investigadores en su artículo. papel. “Nuestro enfoque combina lectura y escritura, lo que permite entrenar el modelo en ausencia de grandes cantidades de muestras pareadas, que son difíciles de obtener. Hasta donde sabemos, este es el primer trabajo que transforma efectivamente texto escrito a mano en imágenes aleatorias con diversos efectos visuales. propiedades y antecedentes.”
InkSight es más que una simple tecnología alternativa. Produce resultados más precisos en condiciones menos que ideales. Por ejemplo, si la foto se tomó con poca luz, contiene texto parcialmente oscurecido o tiene un fondo confuso cuando se escanea con tecnología de reconocimiento óptico de caracteres (OCR). Los investigadores descubrieron que los humanos podían leer el 87% de los trazos de texto con InkSight. Dos tercios eran lo suficientemente finos como para que la gente no pudiera distinguirlos de la escritura real; Puede ver a continuación cómo se ve cuando InkSight está funcionando.
Redactado por Amnistía Internacional
Si le gusta escribir cosas a mano, InkSight tiene algunos beneficios potenciales. Imagínese escribir a mano en un cuaderno de papel y luego mostrar las notas en su cámara para que se puedan buscar y organizar al instante en el contexto de notas anteriores en las páginas físicas. Si eres como yo y tienes una letra particularmente desordenada, InkSight puede ayudarte a convertir el borrador en texto mecanografiado que sigue siendo exacto a lo que estás escribiendo.
En términos más generales, esta podría ser una herramienta crucial para descifrar textos escritos a mano a lo largo de los siglos y convertirlos a formato digital. Incluso cuando el texto está en un idioma que no tiene una presencia digital significativa, InkSight puede ayudar a preservar la escritura a mano para ayudar a crear recursos de capacitación para esos idiomas.
Google no es el único lugar donde se utilizan herramientas de inteligencia artificial para decodificar la escritura a mano. Por ejemplo, Amazonas's Escritor Kindle Nuevo Mejora la capacidad de su lector electrónico para convertir notas escritas a mano en texto legible. Allí también buenos comentariosuna aplicación para tomar notas digitales que puede leer escritura a mano, debutó recientemente Editar escritura a mano Herramientas que utilizan la tecnología Goodnotes Smart Ink para convertir escritura a mano en texto mecanografiado. Las herramientas agregadas le permiten editar notas escritas a mano como si estuvieran impresas, incluida la alineación de notas, copiar y pegar y redistribuir el texto para que tenga más sentido.