Tesseract

Sitio web

  • Libre
  • Mac
  • Windows
  • Linux
Description

Tesseract.js es una biblioteca de javascript que obtiene palabras en casi cualquier idioma a partir de imágenes.

El motor OCR de Tesseract fue uno de los 3 motores principales en la prueba de precisión de 1995 UNLV. Entre 1995 y 2006 tuvo poco trabajo, pero es probablemente uno de los motores de OCR de código abierto más precisos disponibles. El código fuente leerá una imagen binaria, gris o en color y dará salida al texto. Se ha incorporado un lector tiff que leerá imágenes TIFF sin comprimir, o se puede agregar libtiff para leer imágenes comprimidas. Hay archivos de idioma para muchos idiomas, incluso para el conjunto de texto en tipografías Fraktur y blackletter ...

Categorías
De oficina y productividad

Alternativas