249

Распознавание текста на фото и документах используя EasyOSR, GigaChat, YandexOSR, Gemini

Функция предназначена для распознавания текста и шаблонных документов с использованием различных моделей.

Параметры, которые можно передать в функцию osr_combine:

page (по умолчанию) — подходит для изображений с любым количеством строк текста, сверстанного в одну колонку.
page-column-sort — для распознавания многоколоночного текста.
handwritten — для распознавания произвольного сочетания печатного и рукописного текста на русском и английском языках.
table — для распознавания таблиц на русском и английском языках.
passport — основной разворот паспорта.
driver-license-front — водительское удостоверение, лицевая сторона.
driver-license-back — водительское удостоверение, обратная сторона.
vehicle-registration-front — свидетельство о регистрации транспортного средства, лицевая сторона.
vehicle-registration-back — свидетельство о регистрации транспортного средства, обратная сторона.
license-plates — все регистрационные номера автомобилей на изображении.
file_url - URL изображения или PDF файла для распознавания. Пример: "https://example.com/document.pdf".

Примеры использования:

"Распознай текст на изображении с URL: https://example.com/photo.jpg, используя модель 'handwritten'."

"Мне нужно извлечь информацию из PDF файла по ссылке https://example.com/document.pdf, используя модель 'table'."

© ProTalk 2023-2025 ИП Горелов Максим Николаевич ИНН 500104951533 ОГРН 309500106900065 

Новая, 8, 9 Реутов, Московская область 143964 Россия