- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- Criar pré-contratação no Workday com base no CV
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded

Atividades do Document Understanding
Extrator generativo — boas práticas
- Para maior estabilidade, o número de solicitações é limitado ao máximo de 50.
- The response, extraction result, also called Completion, has a word limit of 700. This is limited to 700 words. This means that you can't extract more than 700 words from a single prompt. If your extraction requirements exceed this limit, you can divide the document into multiple pages, process them individually, and then merge the results afterwards.
Use linguagem precisa
Imagine que você está fazendo a quatro ou cinco pessoas diferentes a pergunta que você gostaria de fazer no prompt generativo. Se você consegue visualizar essas pessoas dando respostas ligeiramente diferentes, então sua linguagem é muito ambígua e você precisa reescrever para torná-la mais precisa.
Especifique um formato de saída
Para tornar sua pergunta mais específica, peça ao extrator para retornar a resposta em um formato padronizado. Isso reduz a ambiguidade, aumenta a precisão das respostas e simplifica o processamento subsequente.
Por exemplo, se estiver pedindo ao prompt generativo que obtenha uma data, especifique como deseja que a data retorne: return date in yyyy-mm-dd format. Se você precisar apenas do ano, especifique: return the year, as a four digit number.
Você também pode usar essa abordagem para números. Por exemplo, você pode especificar: return numbers which appear in parentheses as negative ou return number in ##,###.## format para padronizar o separador decimal e o separador de milhares para facilitar o processamento subsequente.
Forneça opções esperadas
Um caso especial de formatação ocorre quando a resposta faz parte de um conjunto conhecido de possíveis respostas.
Por exemplo, em um formulário de aplicativo, você pode perguntar: What is the applicant’s marital status? Possible answers: Married, Unmarried, Separated, Divorced, Widowed, Other.
Isso não apenas simplifica o processamento subsequente, mas também aumenta a precisão das respostas.
Etapa por etapa
Para maximizar a precisão, divida perguntas complexas em etapas simples. Em vez de perguntar What is the termination date of this contract?, você deve perguntar First find termination section of contract, then determine termination date, then return date in yyyy-mm-dd format.
Há muitas maneiras de desmembrar suas perguntas. Você pode até escrever sua solicitação como um pequeno programa de computador, como o seguinte:
Execute the following program:
1: Find termination section or clause
2: Find termination date
3: Return termination date in yyyy-mm-dd format
4: Stop
Execute the following program:
1: Find termination section or clause
2: Find termination date
3: Return termination date in yyyy-mm-dd format
4: Stop
Definir o que você deseja em um estilo de programação, potencialmente até mesmo usando a sintaxe JSON ou XML, força o modelo Generativo a usar suas habilidades de programação, o que aumenta a precisão ao seguir instruções.
Evite problemas aritméticos ou lógicos
Não peça ao extrator para realizar somas, multiplicação, subtração, comparações ou qualquer outra operação aritmética, pois ele comete erros básicos, além de ser muito lento e caro em comparação com um fluxo de trabalho de robô simples, que nunca cometerá erros e é muito mais rápido e barato.
Não peça para que ele realize lógica complexa do tipo se-então-senão, pelas mesmas razões mencionadas acima. O fluxo de trabalho do robô é muito mais preciso e eficiente com esse tipo de operações.
Tabelas
O Extrator generativo atualmente não suporta campos de coluna. Embora você possa extrair tabelas menores por meio de perguntas regulares e analisar sua saída, observe que essa é apenas uma solução alternativa e vem com restrições. Ele não foi projetado nem é recomendado para extrair tabelas genéricas e arbitrariamente grandes.
Extrair dados de tabelas é um desafio para o extrator Generativo, pois a tecnologia de IA Generativa opera em sequências lineares de texto e não compreende informações visuais bidimensionais em imagens. No entanto, você ainda pode extrair dados de tabelas, escolhendo entre pelo menos 2 abordagens diferentes, descritas nos exemplos a seguir:
- Uma abordagem é pedir ao extrator Generativo para retornar as colunas separadamente e, em seguida, montar as linhas você mesmo em um fluxo de trabalho. Nesse caso, você pode perguntar:
Please return the Unit Prices on this invoice, as a list from top to bottom, as a list in the format [<UnitPrice1>, <UnitPrice2>,…] - Outra abordagem é pedir que ele retorne cada linha separadamente, como um objeto JSON. Nesse caso, você pode perguntar:
Please return the line items of this invoice as an JSON array of JSON objects, each object in format: {"description”: <description>, “quantity”:<quantity>, “unit_price”:<unit price>, “amount”:<amount>}.
Nível confidencial
Os modelos de IA Generativa não fornecem níveis de confiança para as previsões. No entanto, o objetivo é detectar erros, e os níveis de confiança são apenas uma maneira possível de alcançar esse objetivo — e não a melhor. Uma maneira muito melhor e mais confiável de detectar erros é fazer a mesma pergunta de várias maneiras diferentes. Quanto mais diferente for a declaração da pergunta, melhor. Se todas as respostas convergem para um resultado comum, a probabilidade de erro é muito baixa. Se as respostas discordarem, a probabilidade de erro é alta.
Por exemplo, você pode repetir a mesma pergunta duas, três ou até cinco vezes (dependendo de quão crucial é evitar erros não detectados em seu procedimento), combinando as sugestões mencionadas acima em combinações variadas. Se todas as respostas forem consistentes, a revisão humana pode não ser necessária. No entanto, se alguma das respostas diferir, poderá ser necessária a revisão manual por uma pessoa do Action Center.