Tesseract OCR
Элемент осуществляет подключение к ядру OCR Tesseract. Поддерживается только Tesseract 3-й версии — движок поставляется вместе с Primo RPA Studio и не требует дополнительной установки.
Элемент Tesseract OCR является контейнером для таких OCR-компонентов, как Клик текста мышью и Распознать текст.
Свойства
Описание общих свойств см. в разделе Свойства элемента.
Символ *
в названии свойства указывает на обязательность его заполнения.
Свойство | Тип | Описание |
---|---|---|
OCR: | ||
Язык | String | Язык для извлечения текста из изображения или элемента UI. Указать можно только 1 язык. По умолчанию |
Извлекать слова | Boolean | Если флажок установлен, то будет извлекаться положение каждого обнаруженного слова |
Масштаб | Double | Коэффициент масштабирования изображения. Рекомендуется использовать для небольших изображений. Значение |
Допустимые символы | String | Строка извлекается в соответствии с указанными символами |
Запрещенные символы | String | Указанные символы не принимаются во внимание при извлечении текста |
Инвертировать | Boolean | Определяет, нужно ли инвертировать цвета. Функция полезна в случае, когда фон темнее цвета текста |
Профиль | - | Профиль предварительной обработки изображения, используется для улучшения распознавания текста. По умолчанию None - не выбран. Доступные значения: 1) Screen - для приложений удаленного рабочего стола; 2) Scan - для сканируемых файлов; 3) Legasy - стандартные настройки |
Вывод: | ||
Переменная | Primo.T1.OCR.OCRInst | Переменная для сохранения ссылки на ядро OCR |
Last updated