Saltar al contenido
Think Tecno

¿Qué es el reconocimiento óptico de caracteres?

Si bien es fácil obtener un documento en su computadora y obtener una copia física con una impresora, generalmente es más difícil ir a la inversa. Aunque existen escáneres y pueden guardar los documentos escaneados como una imagen, esto no es particularmente útil si desea editar el documento. Para editar un documento, desea utilizar una tecnología llamada Reconocimiento óptico de caracteres u OCR.

¿Cómo funciona el reconocimiento óptico de caracteres?

OCR utiliza una serie de técnicas para leer documentos con precisión. El software OCR ajusta el documento y potencialmente incluso las palabras individuales para que estén alineadas correctamente. La imagen se convierte a un formato blanco y negro puro, ya que es más fácil que diferenciar los tonos de gris. El análisis también se realiza para identificar y eliminar cualquier elemento no textual.

Se utilizan dos tipos principales de algoritmos de OCR, coincidencia de matrices y extracción de características. La coincidencia de matriz adquiere una imagen de un solo carácter, luego la compara con los caracteres de los algoritmos configurados píxel por píxel. Esta técnica requiere que la fuente esté aislada adecuadamente del resto del contenido y que la fuente se incluya en el software OCR. Este tipo de OCR tampoco funciona para el reconocimiento de escritura a mano.

Los algoritmos de extracción de características dividen cada carácter en características, como líneas, curvas e intersecciones de líneas. Esta técnica reduce significativamente la dependencia del algoritmo que se entrena con caracteres conocidos. La extracción de las características es capaz de reconocer nuevos caracteres y transcribirlos, así como una cierta caligrafía, incluso si la precisión no es tan buena como para los caracteres conocidos.

Algún software más avanzado utiliza el contexto de las letras circundantes para ayudar a identificar letras que no son tan claras. Por ejemplo, si la palabra “perro” está impresa y el algoritmo OCR no puede decir con certeza si “o” es una “a” o una “o”, puede usar un diccionario para ver si una combinación de caracteres potenciales palabra conocida En este caso, el algoritmo OCR habría descartado la posibilidad de “a”, ya que “dag” no es una palabra, mientras que “perro” sí lo es.

¿Dónde se usa OCR?

Uno de los principales usos de OCR es en el sistema postal. El OCR se usa para identificar automáticamente la dirección de cartas y paquetes, una tarea que puede realizar significativamente más rápido que las personas. En los casos en que el sistema OCR no pueda leer la dirección de la etiqueta, un ser humano lo separará para su procesamiento manual.

OCR es útil como herramienta de accesibilidad para personas con discapacidad visual cuando se combina con una herramienta de síntesis de voz. Google translate también implementa OCR como parte del proceso de traducir texto en imágenes.