¿Cuál es la mejor librería OCR para Android?

Hay muchas bibliotecas de OCR disponibles para la integración con Android – Tesseract es muy utilizado. Desde mi experiencia, la extracción en OCR generalmente no es tan grande. Así que lo que debe hacer es – hacer una prueba de extracción básica en el Android para asegurarse de que la imagen se toma correctamente, no tiene un movimiento, etc y luego enviarlo a una biblioteca del lado del servidor para una extracción más profunda y pre-procesamiento.

La parte más complicada es qué hacer después de que el motor de OCR le da el texto. La extracción de texto es mucho más complicada que el OCR convencional. Para la extracción de texto, hay que preocuparse de dos cosas más:

  1. Reglas de extracción: Los programas de OCR suelen volcar el texto del documento en un campo de texto libre. Esto funciona muy bien si está escaneando una página de un libro o un documento de texto. Pero en el caso de que necesites separar los elementos de línea del documento, también tienes que aplicar muchas reglas a su alrededor. Eso puede tomar mucho más tiempo que la integración del motor de OCR
  2. Aprendizaje automático: Sacar el texto del OCR es un buen comienzo, pero desde mi experiencia en la construcción de soluciones de OCR, este valor en sí mismo no es de mucha utilidad. Hay que combinarlo con otros factores y entretejerlo en un algoritmo que pueda aprender de los resultados de la extracción a lo largo del tiempo y utilizarlo para predecir cuál es el texto correcto.

Para las aplicaciones empresariales, hay situaciones en las que el motor de OCR está bastante seguro de los datos extraídos pero el texto no cuadra en el contexto de todos los demás datos que lo rodean. Aquí es donde los motores de OCR clásicos fallan. Muchas empresas han sido capaces de sortear este problema mediante la creación de potentes algoritmos de texto basados en el aprendizaje automático que pueden cubrir la brecha en la legibilidad del motor de OCR.