activities
latest
false
- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ContentValidationData クラス
- EvaluatedBusinessRulesForFieldValue クラス
- EvaluatedBusinessRuleDetails クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- FieldValue クラス
- FieldValueResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- ルール クラス
- RuleResult クラス
- RuleSet クラス
- RuleSetResult クラス
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- FieldValueDetails クラス
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- 認証を構成する
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント検証成果物を作成
- ドキュメント検証成果物を取得
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。

Document Understanding アクティビティ
最終更新日時 2025年3月3日
PREVIEWドキュメントを分類 - プレビュー
UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument
このアクティビティを使用すると、目的の分類器と分類するドキュメントを選択してドキュメントを分類できます。
注: [ドキュメントを分類] アクティビティでは、パブリック エンドポイントを使用します。
デザイナー パネル
- 入力 - 入力ファイルまたは Document Data オブジェクトを指定します。
重要: 1 つのファイルに含めることができる最大ページ数は 500 です。この制限を超えるファイルは分類できません。ヒント: ファイルが
IResource
型の変数として格納されていない場合、変換を実行するオプションがあります。このためには、[入力] プロパティ フィールドでLocalResource.FromPath(<reference_to_the_file>)
を使用します。[繰り返し (コレクションの各要素)] アクティビティを使用して、ファイルのリストを繰り返し処理するシナリオを考えてみます。currentItem
が、繰り返し処理する変数であるとします。currentItem
をIResource
に変換するには、LocalResource.FromPath(currentItem)
を [入力] フィールドに貼り付けます。 - Document Understanding プロジェクト - ドロップダウン メニューからお使いの Document Understanding プロジェクトを選択する必要があります。利用可能なオプションは次のとおりです。
- Predefined - 標準的なシナリオに推奨される、事前トレーニング済みの専門家されたモデルを使用するプロジェクトです。
- Generative Predefined - 事前トレーニング済みの生成 AI モデルを使用するプロジェクトです。ドキュメント データを分類または抽出するための入力として指示を入力できます。
- 接続先のテナントおよびフォルダーにある既存のプロジェクト。
- + アイコンを選択して新しいプロジェクトを作成できます。
注: テナントに 500 個を超えるプロジェクトを作成し、[ドキュメントを分類] アクティビティを使用した場合、UiPath Studio または Studio Web には、最初の 500 個を超えるプロジェクトは表示されません。したがって、これらのプロジェクトは使用できません。 - 分類器 - [Predefined] プロジェクトを使用している場合は、ドロップダウン メニューから目的の Document Understanding の分類器を選択できます。
注: 生成 AI 分類器に送信されたデータは、公開されていない LLM モデル インスタンスに送信されます。外部には送信されず、処理後に保存またはトレーニングに使用されることはありません。
- [Predefined] プロジェクトの場合、次の 2 つのオプションがあります。
- ML Classification (ML 分類) – ML ベースの分類器です。
- Generative Classifier - 生成 AI 分類器です。
重要:
この機能は現在のところ監査プロセスの一部であり、レビューが完了するまで FedRAMP 承認の一部と見なすべきではありません。現在レビュー中の機能の完全なリストについては、こちらをご覧ください。
- ドキュメントの種類の詳細 - ドキュメントの種類を識別するための指示です。キーと値のペアとして指定します。キーはドキュメントの種類の名前を、値はドキュメントの種類の説明を表します。分類器がドキュメントを識別するのに役立ちます。
- キー - 分類結果として使用するドキュメントの種類の名前を指定します (最大 30 文字)。
- 値 - ドキュメントの種類の識別方法について生成 AI 分類器に指示を提供する必要があります。最大 1000 文字を入力できます。
- ドキュメントの種類の詳細 - ドキュメントの種類を識別するための指示です。キーと値のペアとして指定します。キーはドキュメントの種類の名前を、値はドキュメントの種類の説明を表します。分類器がドキュメントを識別するのに役立ちます。
- [Generative Predefined] プロジェクトでは、[生成 AI 分類器] のみを使用できます。
- [Predefined] プロジェクトの場合、次の 2 つのオプションがあります。
- バージョン (プレビュー) - 既存の Document Understanding モダン プロジェクトを使用する場合は、このプロパティを使用します。データを処理するプロジェクトのバージョンに対応するタグを選択します。たとえば、バージョン 3 に割り当てられた [運用] タグを選択すると、運用環境にあるプロジェクトのバージョン 3 のデータが処理されます。
[バージョン] の既定値は [ステージング] です。選択したプロジェクトに [ステージング] タグが存在しない場合、既定値は [運用] になります。
タグを選択すると、そのバージョンでサポートされているドキュメントの種類のリストが表示されます。
プロパティ パネル
詳細設定
- 最小信頼度 - 分類時にドキュメントの種類を割り当てる基準となる、最小の信頼度のしきい値を指定します。ドキュメントの信頼度スコアがこのしきい値を下回ると、ドキュメントの種類が「不明」として報告されます。
ヒント: ほとんどのドキュメントの種類では、予測と信頼度レベルが生成されます。このプロパティを設定すると、しきい値を上回る信頼度レベルを持つ予測のみが考慮されるため、誤検知が防止されます。最適な信頼度レベルを特定するには、ワークフロー内でさまざまなドキュメントをテストし、その結果を Excel スプレッドシートなどに記録した上で、どのしきい値が最も正確かを分析します。
入力
- タイムアウト (秒) - 生成 AI モデルへの呼び出しの最大実行時間 (秒単位) です。このタイムアウト値を超えると、遅延やハングを防ぐために操作が自動的に終了されます。このプロパティは、[生成 AI 分類器] が分類器として選択されている場合にのみ表示されます。
出力
- ドキュメント データ - ファイルから抽出される検証済みのすべてのフィールド データです。
[ドキュメントを分類] アクティビティの生成機能をすぐに使用するには、以下の手順を実行してください。
- [ドキュメントを分類] アクティビティを追加します。
- [プロジェクト] ドロップダウン リストから、[Predefined] または [Generative Predefined] を選択します。
- [分類器] で [生成 AI 分類器] を選択します。
[ドキュメントの種類の詳細] プロパティがアクティビティの本体に表示されます。
- [ドキュメントの種類の詳細] コレクションで、指示をディクショナリのキーと値のペアとして入力します。各要素は次のように指定します。
- キーとは [ドキュメントの種類] で入力する値のことです (例: 履歴書)。
- 値とは、[生成プロンプト] で入力する値のことで、ドキュメントの種類を識別するために生成分類器が使用する説明です。
以下の表に、キーと値のペアのサンプルをいくつか示してありますので、確認してください。
表 1. 生成 AI 分類器のプロンプトとして使用されるキーと値のペア キー 値 (Value) 履歴書 「教育」、「スキル」、「経験」などの、履歴書に関連する一般的なキーワードを検索してください。 請求書 (Invoice) 「請求番号」、「請求先」、「合計金額」などの、一般的なフィールド名を検索してください。
図 1. 生成 AI 分類器のプロンプトとして使用されるキーと値のペア