Tesseract OCR

Элемент осуществляет подключение к ядру OCR Tesseract. Поддерживается только Tesseract 5-й версии.

Является контейнером для таких OCR-элементов, как Клик текста мышью и Распознать текст.

Свойства

Описание общих свойств элемента см. в разделе Свойства элемента. Символ * в названии свойства указывает на обязательность его заполнения.

СвойствоТипОписание

OCR:

Язык

String

Язык для извлечения текста из изображения или элемента UI. Указать можно только 1 язык. По умолчанию "eng" (коды можно просмотреть здесь). Папку с языковыми данными нейросети можно скачать.

Масштаб

Double

Коэффициент масштабирования изображения. Рекомендуется использовать для небольших изображений. Значение 1.00 соответствует оригинальному размеру. Чем выше число, тем больше масштаб

Путь к данным

Путь к хранилищу данных нейросети, расположенному по ссылке (совместим с версией 5.0)

Вывод:

Переменная

LTools.OCR.OCRInst

Переменная для хранения ссылки на ядро OCR

Решение проблем

  • При возникновении ошибки с файлом libdl иногда она может быть решена с помощью выполнения команды: sudo ln -s /usr/lib/x86_64-linux-gnu/libglu.so.2 /usr/lib/x86_64-linux-gnu/libdl.so

  • В некоторых случаях для работы Tesseract OCR для Linux может потребоваться установка дополнительных пакетов: libtesseract-dev libleptonica-dev liblept5 После установки пакетов нужно скопировать (и переименовать) файлы: /usr/lib/libleptonica.so.6.0.0 -> /app/ProjectName/x64/libleptonica-1.82.0.so /usr/lib/libtesseract.so.5.0.3 -> /app/ProjectName/x64/libtesseract50.so

Last updated