- Información general
- Primeros pasos
- Actividades
- Paneles de insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Licencia
Limitaciones de tráfico
Los Paquetes ML de extracción y clasificación requieren una cantidad significativa de recursos informáticos, lo que implica algunas limitaciones a medida que aumenta el tamaño de los documentos y/o el rendimiento del número de documentos por minuto.
Los documentos de más de 100 páginas se ejecutarán con limitaciones de computación o de latencia, lo que provocará que las Habilidades ML sean inestables o devuelvan errores HTTP. Un límite superior exacto es difícil de definir porque la densidad del texto y la resolución de la imagen de los documentos tienen un amplio rango dinámico, y la densidad del texto (número de palabras por página) afecta a los recursos informáticos y de RAM necesarios, así como a la latencia. Además, la capacidad de una habilidad ML depende del tamaño del hardware utilizado para implementarla, que está controlado por AI Center. Por ejemplo, las habilidades de ML pueden implementarse en la GPU o en la CPU, lo que tiene un gran impacto en la capacidad y la velocidad de la habilidad ML.
En cuanto al rendimiento, las Habilidades ML solo pueden procesar un documento a la vez; esto significa que debes esperar a que finalice un documento antes de enviar el siguiente. Cuanto más grandes sean los documentos, menos podrás procesar por unidad de tiempo.
Para evitar estos problemas, si necesitas procesar documentos muy grandes, ten en cuenta que en muchos casos los datos relevantes pueden estar en un subconjunto de páginas más pequeño, y este subconjunto puede dividirse utilizando el clasificador inteligente de palabras clave. Esta puede ser una estupenda estrategia porque elimina los errores de habilidad ML/fallos/tiempos de espera, aumenta el rendimiento y la capacidad de respuesta, aumenta la precisión de la extracción reduciendo los falsos positivos y reduce los costes eliminando el consumo innecesario de unidades de IA.