Document Understanding
最新
バナーの背景画像
Document Understanding ガイド
最終更新日 2024年4月30日

ドキュメントを検索する

検索オプション

合計で 3 つの検索機能を利用できます。2 つはページ上部の管理バーにあり、1 つはページ左下にあるアイコン を使用します。



管理バーの検索機能は以下で構成されます。

  1. 組み込みフィルターを使用して検索する: ドロップダウン メニューで選択できるバッチ/カテゴリ オプションに基づいて、ドキュメントをフィルター処理します。
    注意:

    他のオプションも選択すると、検索をさらに制限できます。たとえば、[Batch import1][削除済み] を選択すると、[Batch import1] でインポートされた、削除済みのドキュメントのみが検索されます。

    常に空のリストが返される組み合わせに注意してください。[Batch import1][Batch import2] を選択すると、ドキュメントは返されません。この選択は制限が厳しく、一度に 2 つのバッチに存在できるドキュメントはないからです。

  2. キーワードを使用してデータセットのすべてのドキュメント内を検索します。この検索の入力は、テキスト入力に基づいて情報をフィルター処理します。キーワードは、フリー テキストとして検索フィールドに入力する必要があります。ドキュメントの内容またはドキュメント名でキーワードが検索されます。複数語検索では、単語が隣接している場合に結果が返されます (単語間の句読点はすべて除外されます)。
  3. 現在表示されているドキュメント内を検索します。現在のドキュメント内にのみ存在するテキスト インスタンスを検索できます。検索バー docs image は、画面の左下にあります。

組み込みフィルターを使用して検索する

カテゴリ/バッチのドロップダウンで利用可能な組み込みのフィルターを使用して、ドキュメントを検索します。選択できるフィルターは、[トレーニングと検証セット][トレーニング セット][評価セット][検証セット][削除済み][ラベルあり][ラベルなし] です。

各フィルターでは、条件を満たすドキュメントの数が括弧内に表示されます。

以下に示す 7 つのキーワードが事前定義されています。

  • トレーニングと検証セット
  • トレーニング セット
  • 評価セット
  • 検証セット
  • Deleted
  • ラベルあり
  • ラベルなし
注:

フォーム AI で使用できる組み込みフィルターは、[削除済み][ラベルあり][ラベルなし] のみであることに注意してください。

これらの定義済みのキーワードを使用できるほか、Document Manager にインポートしたバッチの数に応じて、名前付きバッチに基づくフィルター処理を行うこともできます。

  • バッチ <batch_name_1>
  • バッチ <batch_name_2>
  • バッチ <batch_name_3>
  • その他

キーワードを使用して検索する

キーワードを、フリー テキストとして検索フィールドに入力する必要があります。ドキュメントの内容またはドキュメント名でキーワードが検索されます。



1 つの単語から成るテキストを使用して検索を実行できます。つまり、その特定の単語を含むドキュメントだけが表示されます。

複数の単語から成るテキストを使用して検索を実行できます。つまり、これらの特定の単語を含むドキュメントだけが 1 つずつ表示されます。

注:

検索では、大文字と小文字が区別されません。

フィルター処理でキーワードを使用できます。たとえば、[ラベルあり] を選択すると、ラベル付きドキュメントだけが表示されます。

フィルター処理では複数のキーワードを使用できます。たとえば、[ラベルあり][トレーニング セット] を選択すると、トレーニング済みとマークされたラベル付きドキュメントだけが表示されます。キーワードの表示順序が処理に関係することはありません。

ドキュメント内を検索する

現在のドキュメント内の検索を開始するには、画面左下にあるアイコン をクリックし、検索するテキストを入力して Enter キーを押します。

検索テキストに一致するすべてのテキスト インスタンスが黄色で強調表示され、ドキュメント ビューアーが 1 つ目のインスタンスの位置まで自動的にスクロールされます。テキストのインスタンス間を移動するには、Enter キーを押すか PgDn または PgUp キーを押します。

検索を開始する

検索オプションにはドロップダウン メニューがあり、メニューを開くと次のフィルターが表示されます。

  • トレーニング セット - モデルのトレーニングに使用するドキュメントの数を示します。自動化された操作自動化された操作です。
  • 検証セット - モデルのトレーニングが完了した後にモデルを検証するために使用するドキュメントの数を示します。トレーニング セットと検証セットの分割割合は 80%-20% に設定されます。自動化された操作です。
  • トレーニングと検証セット - [トレーニング セット] フィルターと [検証セット] フィルターの両方で検索するドキュメントの数を指定します。自動化された操作自動化された操作です。
  • 評価セット - インポート時に [評価セット] チェックボックスがオンになっていて、モデルをトレーニング パイプラインのステージで評価するために使用するドキュメントの数を示します。詳細は、こちらをご覧ください。手動操作です。
  • 削除済み - 削除済みのドキュメントの数を指定します。詳細は、こちらをご覧ください。
  • ラベルあり - ラベルが付いているドキュメントの数を指定します。ラベルは、ドキュメントあたり少なくとも 1 つのタグ付けされたフィールド/手動で編集したフィールドによって定義されます。
  • ラベルなし - ラベルが付いてないドキュメントの数を指定します。
  • バッチ名 - 同じインポート アクションで構成されているドキュメントを指定します。

トレーニング セットまたは検証セットへのドキュメントの割り当ては、インポート時にアプリケーションによって行われます。

インポートしたドキュメントは、インポート中に [評価セット] チェックボックスがオンになっている場合、最終的に評価セットに追加されます。

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.