activities
latest
false
- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Configurar autenticación
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- Notas relacionadas
- Acerca del paquete de actividades de OmniPage
- Compatibilidad de proyectos
- Uso de OmniPage con un lenguaje extendido
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Uso de OmniPage con un lenguaje extendido
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática.
Actividades de Document Understanding
Last updated 21 de nov. de 2024
Uso de OmniPage con un lenguaje extendido
Sigue estos pasos para crear el proceso de ejemplo:
- Abre Studio y crea un nuevo Proceso llamado Principal de forma predeterminada.
Nota: agregue sus archivos al directorio del proyecto para poder ejecutar todo el proceso desde el mismo lugar.
- Añade un contenedor Secuencia en el Diseñador de flujo de trabajo.
- Crear las variables mostradas en la siguiente tabla:
Tabla 1. Variables que se crearán Nombre de la variable
Tipo de variable
Valor predeterminado
textFile
Imagen
N/D extractedText
Cadena
N/D
- Crear las variables mostradas en la siguiente tabla:
- Añade una actividad Digitalizar documento dentro del contenedor Secuencia .
- En el Panel de propiedades , añade la ruta del archivo que deseas digitalizar en el campo Ruta del documento . Puedes encontrar un archivo de muestra en el ejemplo descargable.
- Añade un motor OmniPage OCR dentro de la actividad Digitalizar documento .
- En el panel Propiedades , añade el valor
Image
en el campo Imagen . - Selecciona la opción Extended en la lista desplegable EnginePack .
- Seleccione la casilla de verificación de la opción ExtraerPalabras . Esto extrae la posición en pantalla de cada palabra detectada.
- Añade el valor
"qct"
en el campo Idioma . Representa el código de idioma del chino tradicional. - Añade la variable
extractedText
en el campo Texto para capturar y retener todo el texto del documento.
- En el panel Propiedades , añade el valor
- Añade una actividad Escribir línea después de la actividad Digitalizar documento .
- Agrega la variable
extractedText
en el campo Texto.
- Agrega la variable
- Ejecuta el proceso. Las actividades utilizadas son analizar el archivo proporcionado y extraer todas las palabras detectadas escritas en chino tradicional.
Consulta el siguiente enlace para descargar el ejemplo en un formato
ZIP
: Ejemplo.
Con tecnología de OmniPage OCR.
Nuance ™ | OCR © | 2019 Nuance Communications. Todos los derechos reservados.