- Acerca de los paquetes ML
- Requisitos de hardware
- Idiomas admitidos
- Configuración de OCR
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Idiomas admitidos
Los idiomas previamente entrenados y admitidos para todos los paquetes ML de Document Understanding se muestran en la siguiente tabla.
Paquete ML |
Descripción |
Idiomas preentrenados |
Idiomas admitidos |
---|---|---|---|
UiPath Document OCR |
Lee texto de documentos. |
|
|
Document Understanding |
Extrae los puntos de datos más comunes de cualquier tipo de documento estructurado o semiestructurado, creando un modelo ML desde cero. |
N/D |
|
Clasificador de documentos |
Clasifica los documentos mediante un modelo ML entrenado a medida. |
N/D |
|
Facturas |
Extrae los puntos de datos más comunes de las facturas. |
|
|
Facturas Australia |
Extrae los puntos de datos más comunes de las facturas australianas. |
|
|
Facturas India |
Extrae los puntos de datos más comunes de las facturas indias. |
|
|
Facturas Japón |
Extrae los puntos de datos más comunes de las facturas japonesas. |
|
|
Facturas China |
Extrae los puntos de datos más comunes de las facturas chinas. |
|
|
Recibos |
Extrae los puntos de datos más comunes de los recibos. |
|
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha |
Órdenes de compra |
Extrae los puntos de datos más comunes de los pedidos de compra. |
English Alemán |
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha |
Facturas de servicios públicos |
Extrae los puntos de datos más comunes de las facturas de servicios públicos. |
English |
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha |
Carnés de identidad |
Extrae los puntos de datos más comunes de los documentos de identidad. |
Australia Austria Bélgica Canadá Croacia Chipre Finlandia Francia Alemania Hong Kong Hungría India Italia Países Bajos Polonia Rumanía España Suiza Reino Unido Estados Unidos (los 50 estados más DC) |
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha |
Pasaportes |
Extrae los puntos de datos más comunes de los pasaportes. |
Internacional |
Internacional |
Consejos de remisión |
Extrae los puntos de datos más comunes de las notificaciones de pago. |
English |
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha |
Notas de la entrega |
Extrae los puntos de datos habituales de las notas de entrega. |
English Alemán |
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha |
W2 |
Extrae los puntos de datos más comunes de los formularios W-2. |
English |
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha |
W9 |
Extrae los puntos de datos más comunes de los formularios W-9. |
English Español |
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha |
Extractor de forma |
Proporciona el punto final requerido por la actividad Extractor de formularios. |
N/D |
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha Idiomas asiáticos |
Extractor inteligente de formularios |
Proporciona el punto final requerido por la actividad Extractor inteligente de formularios. |
N/D |
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha Idiomas asiáticos |
Clasificador inteligente de palabra clave |
Proporciona el punto final requerido por la actividad Clasificador inteligente de palabras clave. |
N/D |
Idiomas de origen latino Idiomas que usan el alfabeto cirílico Alfabeto griego de izquierda a derecha Idiomas asiáticos |
ReconocimientoDeEscrituraManuscrita |
Lee texto escrito a mano. |
English |
English |
Observaciones
- Para entrenar un modelo en documentos japoneses, utiliza el paquete Document Understanding o Facturas Japón.
- Para entrenar un modelo en documentos chinos, utiliza el paquete Document Understanding o Facturas China.
- Para entrenar un modelo en documentos basados en el alfabeto latino, utiliza cualquier paquete, excepto para Facturas Japón o Facturas China.
- En el caso de los idiomas admitidos, puede que sea necesario un reentrenamiento para obtener la precisión esperada si los documentos son considerablemente diferentes del conjunto de datos de entrenamiento del modelo original.
- Para los idiomas admitidos que no están previamente entrenados por el modelo, puedes entrenar un modelo con tus propios datos en AI Center, suponiendo que el motor OCR también lo admita.
- El cambio de formato automático de las fechas a un formato estándar
yyyy-mm-dd
para los idiomas asiáticos solo se admite actualmente para el idioma japonés. En el caso de documentos en otros idiomas asiáticos, puedes extraer las fechas como tipo de contenido cadena y aplicar el formato en el flujo de trabajo RPA.