テキストプロパティ
テスト対象システム(SUT)で光学文字認識(OCR)を使用してテキストを検索したり読み取ったりするには、テキストプロパティリストを使用する必要があります。これらのプロパティリストには、作業中のテキストや検索の目的に応じて含めることができる多種多様なプロパティがあります。
詳細については、OCRの利用を参照して、最も一般的に使用されるテキストプロパティの使用方法を学んでください。
このページでは、SenseTalkスクリプティングと直接関連するOCRプロパティをカバーしています。Eggplant Functionalのいくつかの位置からOCRプロパティを調整することも可能です:
テキストプロパティリストとは何ですか?
テキストプロパティリストは、SUT上のテキストの説明です。すべてのテキストプロパティリストには、検索対象の実際のテキスト文字列を定義するText
プロパティと、以下で説明する追加 のプロパティが含まれている必要があります。プロパティリストに含まれていないプロパティは、テキストプリファレンスの設定にデフォルト設定されます。
以下のテキストプロパティは、任意のテキストプロパティリストで使用できます:
- Text:
テキスト文字列
。 SUT上で見つけたいテキスト文字列。 (必須) - TextStyle:
テキストスタイル名
。 事前に定義されたテキストプロパティのグループ。 (詳細は、テキスト検索パネルを参照してください。)
OCRテキストプロパティ参照表
以下の表をOCRで作業する際の参照として使用してください。これは、OCRの使用に対応するすべてのサポートされているSenseTalkプロパティの完全なリストです。一部のプロパティは読み取りと検索の両方で利用できますが、一部は特定のものに特化しています。プロパティに渡される値のタイプも含まれています。プロパティの名前をクリックすると、その完全な説明が表示されます(完全な説明リストはこのページの表の下に含まれています)。最も一般的なOCRプロパティの使用方法について詳しく知るには、OCRの成功を参照してください。
boolean
値は、Yes/Noの値が許可されるトグルスイッチのようなものであり、On/Offも許可されます。
プロパティ | 検索 | 読取り | 値 |
---|---|---|---|
AggressiveTextExtraction | はい | はい | Boolean |
CaseSensitive | はい | いいえ | Boolean |
Contrast | はい | はい | Boolean |
ContrastColor | はい | はい | 色(SenseTalkでの色値 参照 |
ContrastTolerance | はい | はい | 0-100 / デフォルト45 |
DPI | はい | はい | 整数 |
EnhanceLocalContrast | はい | はい | Boolean |
ExtraWords | はい | はい | 文字列または単語のリスト |
IgnoreNewLines | はい | いいえ | Boolean |
IgnoreSpaces | はい | いいえ | Boolean |
IgnoreUnderscores | はい | いいえ | Boolean |
InvertImage | はい | はい | Boolean |
Language | はい | はい | OCR言語サポートで指定されている言語名(大文字小文字を区別)。 |
LowResolutionMode | はい | はい | Boolean |
Multiline | いいえ | はい | Boolean |
PreferDictionaryWords | はい | はい | Boolean |
PreferredPattern | はい | はい | 正規表現の文字列 (SenseTalkでパターンを使用するを参照) |
PreferredWords | はい | はい | 文字列または単語のリスト |
ProhibitedWords | はい | はい | 文字列または単語のリスト |
SearchRectangle | はい | いいえ* | 矩形を定義する座標のペアまたはキャプチャした画像 |
TextDifference | はい | いいえ | 整数 |
TextRotation | はい | はい | 事前に定義された4つの値のうちの1つ |
Trim | いいえ | はい | Boolean |
TrimBorder | いいえ | はい | 整数 |
TrimColor | いいえ | はい | 色 (SenseTalkでの色値を参照) |
TrimTolerance | いいえ | はい | 整数 |
TrimWhitespace | いいえ | はい | Boolean |
ValidCharacters | いいえ | はい | Boolean |
ValidPattern | はい | はい | 正規表現の文字列 (SenseTalkでパターンを使用するを参照) |
ValidWords | はい | はい | 文字列または単語のリスト |
* ReadText
にはデフォルトで矩形が含まれているため、SearchRectangle
プロパティを設定する必要はありません。このプロパティは、標準的な画像検索でも設定できます。詳しくは、画像参照をご覧ください。
OCRプロパティ定義
-
AggressiveTextExtraction:
Boolean.
画像から可能な限り多くのテキストをOCRで抽出したい場合は、このプロパティを有効にします。例:
Log ReadText(("TLImage","BRImage"), enableaggressivetextextraction:on)
-
CaseSensitive:
Boolean. Default: off.
Eggplant Functionalがテキスト検索で 大文字と小文字を区別するかどうか。このプロパティを有効にすると、テキスト検索が大文字と小文字を尊重し、テキスト文字列の大文字化に完全に一致するテキストのみを見つけます。このプロパティはテキストの検索、テキストの読み取りではなく、テキストの検索用です。例:
Put "COUPON13995a" into Coupon
MoveTo (Text: Coupon, CaseSensitive:Yes) -
Contrast:
Boolean.
SUTの表示が、OCR分析に送信される前に高コントラストの2色画像に変換されるかどうか。contrast
がオンの場合、"コントラストカラー"と呼ばれる色(ContrastColor
プロパティを使用して設定できます)がSUTの表示の主要な色と見なされ、他のすべての色は二次色として扱われます。テキストはどちらの色でも見つけることができます。Contrast
プロパティは、テキストの検索(検出)と読み取りの両方で使用可能です。例:
log ReadText(contrast:on, contrastColor:"ffffff", validCharacters: "abcdABCD12345", searchRectangle:("TLImage","BRImage"))
ノートContrastがオンになっていても、ContrastColorが定義されていない場合、検索対象のエリアの左上のピクセルが対比色として扱われます。
-
ContrastColor:
色. Default: Contrastがオンで他の色が定義されていない場合、検索矩形の左上隅がコントラストカラーとして使用されます。
Contrast
がオンの場合、コントラストカラーはSUTの表示の主要な色と見なされ、他のすべての色は二次色として扱われます。背景色を見つける方法については、背景色の決定を参照してください。SenseTalkはいくつかの色値形式を認識します。形式の完全なリストについては、SenseTalkでの色値をご覧ください。例:
log ReadText(contrast:on, contrastColor:"ffffff", validCharacters: "abcdABCD12345")
-
ContrastTolerance:
整数。 デフォルト: 45。
Contrast
がオンの場合、contrastTolerance
は、ピクセルがコントラストカラーと見なされるための許容最大チャネルカラー差を設定します。例:
Click (Text:"Andrew Young", Contrast:On, ContrastTolerance: 65)
-
DPI:
整数。 デフォルト: 72。
DPI
プロパティは、SUTディスプレイのDPI(ドット/インチ)を参照します。 SUT上のテキストが見つからない問題がある場合は、SUTのDPI設定を確認し、DPI
プロパティをそれに応じて調整します。 典型的なDPI設定には、72、144、300、2540が含まれます。例:
Click (text: "Continue", DPI: 2540, Language: English)
-
EnhanceLocalContrast:
ブーリアン。 デフォルト: オフ。
このプロパティを有効にすると、OCRがテキスト画像のローカルコントラストを自動的に上げ、OCRエンジンに送信します。 このプロパティは、読み取られるテキストの一部または全部が比較的低コントラストである場合(たとえば、暗い背景に青いテキストなど)に、認識を助ける可能性があります。 Contrastがオンになっていると、このプロパティは効果がないため、Contrast
がオフになっているときにのみ役立ちます。例:
Log ReadText(("TLImage","BRImage"), enhanceLocalContrast: On)
-
これらの単語は、他の辞書の単語と同じように優先されます。 ExtraWordsは
PreferredWords
、ValidPattern
、PreferredPattern
、およびValidWords
と相互排他的です。例:
Log Readtext(("TLImage","BRImage"), Language: English, ExtraWords: "Elizabeth, Andrew, Steven, Katherine, Jacob, Brenda")
```sensetalk
* **IgnoreNewlines:** `ブーリアン。` 有効にすると、`ignoreNewlines`はOCRテキスト検索で改行を無視するため、検索は複数の行に分割された文字列と一致します。 このプロパティはテキスト検索のみで使用可能であり、`ReadText`では使用できません。
**例:**
```sensetalk
Click (Text:"Constantine Papadopoulos", IgnoreNewlines:On) -- このような長い名前の場合、アプリケーションのインターフェイスで2行に折り返される可能性がありますが、OCRはIngoreNewlinesが有効であればそれでも読み取ることができます。
-
IgnoreSpaces:
ブーリアン。
ignoreSpaces
プロパティは、OCRテキスト検索がテキスト文字列中のスペースを無視するようにします。 例えば、文字列"My Computer"は"MyComputer"や"M y C o m p u t e r"と一致します。ignoreSpaces
プロパティはデフォルトでオンになっています。 これは、OCRが特に不連続な単語や文字間隔が不規則なテキストにある意図しないスペースを読み取ることがあるためです。例:
テスト対象のソフトウェアのUIの一部である"My Account"というタブがありますが、異なる状況やデバイスでアンダースコア("My_Account")があるかスペースがない("MyAccount")形式で表示されることがあります。
Click (Text:"My Account", ignoreSpaces:On, IgnoreUnderscores:On) -- アンダースコアがあるか、スペースがあるか、スペースがないかに関わらず、アカウントタブを見つけることができます。
-
IgnoreUnderscores:
ブーリアン。
ignoreUnderscores
プロパティは、OCRテキスト検索が検索中にアンダースコアをスペースとして扱うようにします。 例えば、文字列"My_Computer"は"My_Computer"や"My Computer"と一致します。ignoreUnderscores
プロパティはデフォルトでオンになっています。 これは、OCRがアンダースコアを認識しな いことがあるためです。例:
Click (Text:"Account Overview", IgnoreUnderscores:On) -- OCRが下線付きのリンクをアンダースコアがあるテキスト("Account_Overview")と誤認識する場合に、"Account Overview"をクリックします。
-
InvertImage:
ブーリアン型。デフォルト:オフ。
このプロパティを有効にすると、OCRはテキスト画像の色を反転(写真ネガティブのように)してから、OCRエンジンに送信して処理します。 -
Language:
言語名(大文字と小文字を区別する)。
検索しているテキストの自然言語。(サポートされている言語のリストについて は、OCR言語サポートを参照してください。)OCRはこれをガイドとして、使用している辞書に指定された単語を優先します。複数の言語を指定することもできます。Eggplant Functionalにはデフォルトで多数の言語が含まれており、追加の言語を購入することもできます。言語が指定されていない場合でも、OCRはテキストを読み取りますが、その結果を比較する辞書はありません。また、カスタムOCR辞書を作成することもできます。ノート言語名は、OCR辞書で定義されているように、大文字と小文字を区別します。
例:
Click (Text:"Bezárás", Language:"Hungarian", SearchRectangle:("TLImage","BRImage")) -- ハンガリー語を使用するアプリケーションで「閉じる」("Bezárás")ボタンをクリックします。
-
LowResolutionMode:
ブーリアン型。デフォルト:オフ。
OCRエンジンがEggplant Functionalから受け取る画像を低解像度として扱う処理モード(画像は実際には低解像度に変換されません)。これにより、OCRが小さな文字を認識しやすくなる可能性があります。 -
MultiLine:
ブーリアン型。デフォルト値:オフ。
このプロパティは、矩形内のテキストを読み取るのではなく、点近くのテキストを読み取る場合にのみ適用されます。MultiLine
がオンの場合、ReadText
関数は、指定した点に関連するテキスト行と、その点の上下のテキスト行を返します(それらが同じテキストブロックに属していると思われる場合)。MultiLine
がオフの場合、ReadText