15 septiembre 2020

¿Que es OCR? – Editor OCR Online

A continuación explicamos que es la tecnología OCR y seleccionamos las mejores plataformas  como editor OCR online.

-¿Qué es OCR?

El OCR  de sus siglas en inglés (Optical Character Recognition)  o en español Reconomiento Óptico de Caracteres  es un proceso dirigido a la digitalización de textos, con el objetivo de poder identificar automáticamente a partir de una imagen, símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos. Así podremos interactuar con estos mediante un programa de edición de texto o similar.

Que es un OCR imagenEn un lenguaje más coloquial, la tecnología OCR permite reconocer bloques de elementos estáticos (imágenes)  para poder tratarlos como elementos editables. Es decir, si escaneamos un documento, el archivo escaneado tendrá una extensión, normalmente  PDF, sin embargo, el editor/visor de PDF que empleemos para abrir dicho archivo escaneado tratará su información como una imagen estática y la cual no podemos editar, pues eso es lo que es.

Sobre esta imagen no podremos realizar acciones de edición que interactúen con el contenido, es decir, podremos escribir encima, incluir imágenes encima, insertar formas… pero no podremos editar el texto de la imagen por ejemplo. La tecnología OCR tiene como objetivo reconocer los bloques de estas imágenes escaneadas y convertirlas en elementos o bloques editables.

El ejemplo más claro es poder editar el texto de un archivo escaneado o poder redimensionar una imagen de un archivo escaneado , para ello el editor de PDF con el que abramos dicho archivo escaneado tendrá que incluir herramientas de OCR.

Dinámica de funcionamiento:

Las herramientas OCR se basan en la comparación de la escala de grises con patrones y plantillas que contienen todos los posibles caracteres. Para una imagen ideal, la conversión seria perfecta, sin embargo las imágenes escaneadas no son ideales, lo que genera problemas a los OCR:

  • El dispositivo que obtiene la imagen puede introducir niveles de grises al fondo que no pertenecen a la imagen original.
  • La resolución de estos dispositivos puede introducir ruido en la imagen, afectando los píxeles que han de ser procesados.
  • La distancia que separa a unos caracteres de otros, al no ser siempre la misma, puede producir errores de reconocimiento.
  • La conexión de dos o más caracteres por píxeles comunes también puede producir errores.

Esto origina que, si existen fallos, aquellos elementos que no se hayan podido «leer» seguirán funcionando como imágenes estáticas no editables. Por tanto el objetivo de los OCR es ir perfeccionando sus algoritmos de reconocimiento para minimizar los fallos.

-Editores OCR Online:

Así pues, si tenemos un documento escaneado y queremos poder editarlo necesitamos un software con OCR. Existen programas (con instalación) que introducen estas herramientas, sin embargo algo más versátil es utilizar algún OCR online evitando tener que instalar ningún programa.

A continuación se muestran los mejores editores online OCR que nos permitirán editar documentos escaneados.

Si desea aprender a editar un pdf escaneado con el editor OCR de soda PDF no dude en leer nuestro breve tutorial:

como modificar un documento escaneado
Multitud de veces partimos de un documento escaneado sobre el que debemos trabajar, pero, ¿Como editar un PDF escaneado?¿Como modificar ...
Leer Más
Nombre: Online OCR
Enlace de acceso: Visitar
Nombre: Convertio
Enlace de acceso: Visitar
Nombre: Soda PDF
Enlace de acceso: Visitar
Nombre: PDF 24
Enlace de acceso: Visitar
Nombre: Light PDF
Enlace de acceso: Visitar

 

Un pensamiento en “¿Que es OCR? – Editor OCR Online

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *