通知を受け取る

UiPath Document Understanding

UiPath Document Understanding

ドキュメントを検索する

Search options

The Search bar is both a text input field and a drop-down.
Search options can be inputted either by writing in the the Search bar or by selecting a filter from the drop-down. The current implementation for multiple words search returns results when the words are adjacent, excluding any punctuation in between them.
There are three main ways of initializing a search:

  1. Using the built-in filters that are available in the Search bar's drop-down. You can choose any of the following filters: train-set, validate-set, train-validate-set, evaluation-set, deleted, labelled, unlabelled.

📘

注:

Please note that for Forms AI only the following built-in filters are available: deleted, labelled, unlabelled.

25502550
  1. Using the import batch names. These are also available in the Search bar's drop-down. If added by hand, the format is batch:name, where name is replaced with the name you gave a batch at import time, e.g. batch:invoices1
  2. Using keywords. You have to enter the keyword(s) as free text in the Search bar. The search looks for the keyword(s) in a document's content or the document name.

You can choose to use one or more search options. Every additional option used casts a more specific searching net. Here are some search examples that start off by casting a wide net and slowly progress to a more refined search:

  • initiating a labelled search returns all the labelled docs in the dataset.
  • initiating a batch:invoices1 search returns all the docs that are part of the invoices1 batch.
  • initiating a labelled batch:invoices1 search returns all the labelled docs that are part of the invoices1 batch.
  • initiating a labelled batch:invoices1 vermont search returns all the labelled docs from the invoices1 batch which contain the inputted keyword, in this case vermont, either in the document name or document content.

The Search bar has a drop-down menu that, when opened, displays the following filters:

  • train-set - Indicates the number of documents to be used for training the model. Automated action.
  • validate-set - Indicates the number of documents to be used to validate the model after its training is complete. The split between the train and validate set is targeted to be 80%-20%. Automated action.
  • train-validate-set - Indicates the number of documents found in both the train-set and validate-set filters. Automated action.
  • evaluation-set - Indicates the number of documents that had the evaluation set checkbox checked during import and are intended to be used to evaluate the model in the stage of the training pipeline. More information can be found here. Manual action.
  • deleted - Specifies the number of deleted documents. More information can be found here.
  • labelled - Specifies the number of docs that have labels. A label is defined by at least one tagged/manually edited field per document.
  • unlabelled - Specifies the number of docs that don't have labels.
  • batch:name - Specifies the documents that have been comprised in the same import action.

The allocation of a document to either the train or validate sets is done by the application at import time.
Imported document end up in the evaluation set if the evaluation set checkbox is checked during import.

事前定義されたキーワード


以下に示す 7 つのキーワードが事前定義されています。
train-validate-set
train-set
evaluation-set
validate-set
削除済み
labelled
unlabelled

これらの定義済みのキーワードを使用できるほか、Document Manager にインポートしたバッチの数に応じて、名前付きバッチに基づくフィルター処理を行うこともできます。
batch:<batch_name_1>
batch:<batch_name_2>
batch:<batch_name_3>
etc.

検索/フィルターのシナリオ


  • 1 つの単語から成るテキストを使用して検索を実行できます。つまり、その特定の単語を含むドキュメントだけが表示されます。
  • 複数の単語から成るテキストを使用して検索を実行できます。つまり、これらの特定の単語を含むドキュメントだけが 1 つずつ表示されます。

📘

注:

検索では、大文字と小文字が区別されません。

  • フィルター処理でキーワードを使用できます。たとえば、labelled を選択すると、ラベル付きドキュメントだけが表示されます。
  • フィルター処理では複数のキーワードを使用できます。たとえば、labelledtrain-set を選択すると、トレーニング済みとマークされたラベル付きドキュメントだけが表示されます。キーワードの表示順序が処理に影響することはありません。
  • テキストとキーワードを組み合わせることもできます。たとえば、payment というテキストと labelled というキーワードを入力すると、この特定の単語を含むラベル付きドキュメントだけが表示されます。

🚧

警告

キーワードを使用したテキスト検索は行えません。

ドキュメント内検索


ドキュメント内検索機能を使用すると、現在のドキュメント内にのみ存在するテキスト インスタンスを検索できます。

この機能は、画面の左下の検索バーから利用できます。

検索するテキストを入力して Enter キーを押します。検索テキストに一致するすべてのテキスト インスタンスが黄色で強調表示され、ドキュメント ビューアーが 1 つ目のインスタンスの位置まで自動的にスクロールされます。

あるテキスト インスタンスから別のインスタンスに移動するには、Enter キーまたは Page Down キーや Page Up キーを押します。

15 日前に更新


ドキュメントを検索する


改善の提案は、API リファレンスのページでは制限されています

改善を提案できるのは Markdown の本文コンテンツのみであり、API 仕様に行うことはできません。