- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades de Document Understanding
Classificar Documento
UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument
Você pode usar essa atividade para classificar documentos, selecionando um classificador desejado e um documento que você gostaria de classificar.
Os idiomas suportados para os modelos generativos são os mesmos do mecanismo de OCR usado. Para obter mais informações, consulte a página Idiomas suportados pelo OCR .
A menos que essa atividade seja a primeira parte da atividade do Document Understanding de um fluxo de trabalho do Studio, a entrada deve ser Dados do Documento. O arquivo só deve ser usado como entrada se a atividade for a primeira parte do Document Understanding de um fluxo de trabalho do Studio.
Painel do Designer
- Entrada - Fornece o arquivo de entrada ou o objeto de dados do documento.
Importante: o número máximo de páginas que um arquivo pode ter é 500. Os arquivos que excedem esse limite não são classificados.Dica: quando seus arquivos não são armazenados como uma variável do tipo
IResource
, há uma opção para realizar uma conversão. UseLocalResource.FromPath(<reference_to_the_file>)
no campo de propriedade Entrada para isso.Considere um cenário em que você está iterando por meio de uma lista de arquivos usando uma atividade For Each. Suponha quecurrentItem
seja sua variável de iteração. Para convertercurrentItem
emIResource
, coleLocalResource.FromPath(currentItem)
no campo Entrada. - Projeto do Document Understanding - Requer que você selecione seu projeto do Document Understanding no menu suspenso. As opções disponíveis são:
- Predefinido - Projeto que usa modelos especializados pré-treinados recomendados para cenários padrão.
- Projeto existente do tenant e a pasta à qual você está conectado
- Você pode criar um novo projeto selecionando o ícone + .
Observação: se você tiver criado mais de 500 projetos em seu tenant e usar a atividade Classify Document, o UiPath Studio ou Studio Web não exibirá nenhum projeto além dos 500 iniciais.Portanto, esses projetos não podem ser usados. - Classificador - Se você estiver usando o projeto predefinido , poderá selecionar o classificador do Document Understanding desejado no menu suspenso.
Observação: os dados enviados ao Classificador generativo serão enviados para uma instância de Modelo LLM que não está disponível publicamente, não a deixarão e, quando processados, não serão armazenados ou usados para treinamento.
- Para o projeto Predefinido , você tem duas opções:
- Classificação de ML - Classificador baseado em ML.
- Classificador generativo - O tipo de classificador generativo.
Importante:
Essa funcionalidade faz parte atualmente de um processo de auditoria e não deve ser considerada parte da Autorização do FedRAMP até que a revisão seja finalizada. Veja aqui a lista completa das funcionalidades atualmente em revisão.
- Prompt - Instruções para identificar Tipos de Documentos, fornecidos como pares de chave-valor, em que a chave representa o nome do Tipo de Documento e o valor, uma descrição para ele, ajudando o classificador a identificar tais documentos.
- Tipo de documento - Forneça o nome do tipo de documento a ser usado como resultado da classificação (limite de 30 caracteres).
- Prompt generativo - Requer que você forneça instruções para o Classificador generativo sobre como identificar o tipo de documento. O número máximo de caracteres permitidos é 1000.
- Prompt - Instruções para identificar Tipos de Documentos, fornecidos como pares de chave-valor, em que a chave representa o nome do Tipo de Documento e o valor, uma descrição para ele, ajudando o classificador a identificar tais documentos.
- Para o projeto Predefinido , você tem duas opções:
- Versão (pré-visualização) - Use essa propriedade ao usar um projeto moderno do Document Understanding existente. Selecione a tag que corresponde à versão do projeto da qual você deseja processar dados. Por exemplo, se você escolher a tag Production atribuída à Versão 3, a atividade processará dados da Versão 3 do seu projeto no ambiente de produção.
O valor padrão de Versão é Teste. Se a tag de Preparação não existir em seu projeto selecionado, o valor padrão será Production.
Após selecionar uma tag, a atividade exibe uma lista de tipos de documentos compatíveis com essa versão.
Painel de Propriedades
Opções Avançadas
- Confiança mínima - Especifique o limite mínimo de confiança com base no qual um tipo de documento é atribuído durante a classificação. Se a pontuação de confiança de um documento ficar abaixo desse limite, seu Tipo de documento será relatado como "desconhecido".
Dica: a maioria dos tipos de documentos gera uma previsão com um nível de confiança. A configuração dessa propriedade evita falsos positivos considerando apenas as previsões com um nível de confiança acima do limite. Você pode identificar um nível de confiança ideal testando vários documentos dentro do seu fluxo de trabalho, gravando os resultados em uma planilha do Excel, por exemplo, e, em seguida, analisar qual valor de limite é o mais preciso.
Entrada
- Tempo limite (segundos) - Tempo máximo de execução (em segundos) para a chamada para o modelo generativo. Se a operação exceder esse tempo limite, ela será encerrada automaticamente para evitar atrasos ou travamentos. Essa propriedade é exibida apenas se o Classificador generativo for selecionado como um classificador.
Saída
- Dados do documento - Todos os dados de campo extraídos validados do arquivo.
Para começar rapidamente com os recursos generativos da atividade Classify Document, execute as seguintes etapas:
- Adicione uma atividade Classify Document
- Na lista suspensa Projeto , selecione Predefinido.
- Para Classificador, selecione Classificador generativo.
A propriedade Prompt aparece no corpo da atividade.
- No campo Solicitação , forneça suas instruções como Pares de valor de chave de dicionário, onde:
- A Chave representa o Tipo de Documento (exemplo: CV).
- O valor representa o Prompt generativo: a descrição usada pelo classificador generativo para identificar os tipos de documento.
Por exemplo, verifique a tabela a seguir para obter uma amostra de pares de chave-valor:
Tabela 1. Pares de chave-valor usados como um aviso para o classificador generativo Document type Solicitação gerativa CV "Encontre palavras-chave comuns para CVs, como "Eduação", "Habilidades" e "Experiência"." Fatura "Encontrar nomes de campos comuns, como "Número da fatura", "Cobrança de" ou "Valor total"."
Figura 1. Pares de chave-valor usados como um prompt para o classificador generativo