OCR (reconocimiento óptico de caracteres)
OCR (reconocimiento óptico de caracteres) impulsado por la mejor IA de
Google Cloud
Extraiga texto y datos de imágenes y documentos,
transforme contenido no estructurado en datos comerciales estructurados y
obtenga información valiosa.
Integre la funcionalidad OCR en sus aplicaciones
mediante API.
¿Qué es el
OCR?
El reconocimiento óptico de caracteres
(OCR) es una tecnología básica detrás de la conversión de texto mecanografiado,
escrito a mano o impreso de imágenes en texto codificado por máquina.
¿Qué tipos
de OCR ofrece Google Cloud?
Google
Cloud ofrece dos tipos de OCR: OCR para documentos y OCR para imágenes y
vídeos.
Si bien comparten
tecnología central, Documento AI es una plataforma de
comprensión de documentos optimizada para el procesamiento de documentos. Cloud Visión, por otro lado, se utiliza generalmente
para detectar texto, escritura a mano y diversos objetos a partir de imágenes y
vídeos.
También puede
utilizar otros productos de Google Cloud para
realizar OCR, para obtener una funcionalidad más avanzada y específica más allá
de lo que ofrecen Documento AI y Cloud Visión.
¿Cómo
funciona el OCR en Google Cloud?
Google
Cloud genera OCR con IA líder en la industria. Además de reconocer texto
tradicional, es capaz de comprender, organizar y enriquecer datos, generando
conocimientos listos para el negocio.
Ofrece la
flexibilidad de utilizar herramientas de OCR como un paquete unificado para
mejorar la eficiencia (por ejemplo, Documento AI ) o simplemente llamar a las API relevantes directamente en la consola
de Google Cloud para integrar funcionalidades de OCR en sus aplicaciones.
¿Cuál es
la mejor solución de OCR para mí?
Si
desea analizar un documento o crear un proceso automatizado de procesamiento de
documentos, utilice Documento AI : se encarga de todo el
flujo de trabajo en un solo lugar, desde la comprensión de los documentos hasta
la búsqueda, el almacenamiento, la gobernanza y la gestión de ellos junto con
los datos extraídos.
Si desea analizar y
procesar imágenes, utilice Cloud Visión con otros productos de
Google Cloud para obtener mejores resultados. Consulte la sección
"Usos comunes" para obtener detalles y guías de inicio rápido.
Ambas API se pueden probar de forma gratuita con una cuenta de Google Cloud .
Para
comprender y procesar documentos, utilice Documento AI.
Para imágenes, recomendamos utilizar Cloud Visión .
Ambos brindan acceso a modelos de aprendizaje
automático previamente entrenados que se pueden implementar tal cual a través
de API o capacitación. También puedes entrenar tus propios modelos
personalizados desde cero con AutoML, no se requiere experiencia en ML.
Las primeras 1000 unidades del mes son
gratuitas cuando utilizas Cloud Visión o Documento OCR. Pruébelo con una
simple llamada API.
Utilice la
API de Cloud Visión y AutoML para etiquetar y procesar imágenes
El etiquetado
de imágenes también se conoce como etiquetado de imágenes.
La API de Cloud Visión puede identificar y
etiquetar objetos generales, puntos de referencia, ubicaciones, logotipos,
actividades, especies animales, productos y más en una imagen. Una vez que
las imágenes se etiquetan con las etiquetas detectadas, la búsqueda, el
procesamiento y la administración de imágenes se automatizan y son más fáciles.
Si necesita etiquetas
personalizadas segmentadas, use Cloud AutoML para entrenar un modelo de
ML personalizado.
Para utilizar
las tecnologías de OCR locales de Google , utilice OCR local , disponible en Cloud Marketplace .