martes, 26 de septiembre de 2023

OCR (reconocimiento óptico de caracteres) impulsado por la mejor IA de Google Cloud.

 

OCR (reconocimiento óptico de caracteres)

 

OCR (reconocimiento óptico de caracteres) impulsado por la mejor IA de Google Cloud

Extraiga texto y datos de imágenes y documentos, transforme contenido no estructurado en datos comerciales estructurados y obtenga información valiosa.

Integre la funcionalidad OCR en sus aplicaciones mediante API.

 

¿Qué es el OCR?

El reconocimiento óptico de caracteres (OCR) es una tecnología básica detrás de la conversión de texto mecanografiado, escrito a mano o impreso de imágenes en texto codificado por máquina. 

¿Qué tipos de OCR ofrece Google Cloud?

Google Cloud ofrece dos tipos de OCR: OCR para documentos y OCR para imágenes y vídeos.

Si bien comparten tecnología central, Documento AI es una plataforma de comprensión de documentos optimizada para el procesamiento de documentos. Cloud Visión, por otro lado, se utiliza generalmente para detectar texto, escritura a mano y diversos objetos a partir de imágenes y vídeos.

También puede utilizar otros productos de Google Cloud para realizar OCR, para obtener una funcionalidad más avanzada y específica más allá de lo que ofrecen Documento AI y Cloud Visión.

¿Cómo funciona el OCR en Google Cloud?

Google Cloud genera OCR con IA líder en la industria. Además de reconocer texto tradicional, es capaz de comprender, organizar y enriquecer datos, generando conocimientos listos para el negocio. 

Ofrece la flexibilidad de utilizar herramientas de OCR como un paquete unificado para mejorar la eficiencia (por ejemplo, Documento AI ) o simplemente llamar a las API relevantes directamente en la consola de Google Cloud para integrar funcionalidades de OCR en sus aplicaciones.

¿Cuál es la mejor solución de OCR para mí?

Si desea analizar un documento o crear un proceso automatizado de procesamiento de documentos, utilice Documento AI : se encarga de todo el flujo de trabajo en un solo lugar, desde la comprensión de los documentos hasta la búsqueda, el almacenamiento, la gobernanza y la gestión de ellos junto con los datos extraídos.

Si desea analizar y procesar imágenes, utilice Cloud Visión con otros productos de Google Cloud para obtener mejores resultados. Consulte la sección "Usos comunes" para obtener detalles y guías de inicio rápido.

Ambas API se pueden probar de forma gratuita con una cuenta de Google Cloud .

Para comprender y procesar documentos, utilice Documento AI.

Para imágenes, recomendamos utilizar Cloud Visión .

Ambos brindan acceso a modelos de aprendizaje automático previamente entrenados que se pueden implementar tal cual a través de API o capacitación. También puedes entrenar tus propios modelos personalizados desde cero con AutoML, no se requiere experiencia en ML. 

Las primeras 1000 unidades del mes son gratuitas cuando utilizas Cloud Visión o Documento OCR. Pruébelo con una simple llamada API.

Utilice la API de Cloud Visión y AutoML para etiquetar y procesar imágenes

El etiquetado de imágenes también se conoce como etiquetado de imágenes. 

La API de Cloud Visión puede identificar y etiquetar objetos generales, puntos de referencia, ubicaciones, logotipos, actividades, especies animales, productos y más en una imagen. Una vez que las imágenes se etiquetan con las etiquetas detectadas, la búsqueda, el procesamiento y la administración de imágenes se automatizan y son más fáciles.

Si necesita etiquetas personalizadas segmentadas, use Cloud AutoML para entrenar un modelo de ML personalizado.

Para utilizar las tecnologías de OCR locales de Google , utilice OCR local , disponible en Cloud Marketplace .

 

 

¿Qué es la tecnología NFC?

  ¿Qué es la tecnología NFC? Por  Josefina Castelán ¿Sabes qué es la tecnología NFC y cómo funciona? Probablemente hayas escuchado nombr...