Обнаружение и классификация кассовых чеков и квитанций

Модель компьютерного зрения, которая по фотографии документа обнаруживает размещение чека на изображении и определяет его тип (цифровой, физический, кассовая квитанция). Это помогает автоматизировать обработку бумажных и цифровых подтверждающих документов, ускорять ввод данных, интегрировать с OCR-конвейерами и уменьшать ручной ввод бухгалтерских данных.

0/5
0 скачиваний
0 отзывов
Обнаружение и классификация кассовых чеков и квитанций
Подходит для задач:
Object Detection
Сферы:
Гостиничный бизнес
Транспорт и логистика
Недвижимость
Банкинг и страхование
Юридические услуги
Розничная торговля
Библиотеки:
Safetensors
Transformers
PyTorch

Описание

Что это за модель и какую задачу решает

Модель jnmrr/rtdetr-v2-voucher-classifier — это система обнаружения объектов с задачей классификации типов кассовых чеков и документов (voucher) на изображении. Основанная на архитектуре RT-DETRv2, она одновременно определяет координаты объектов (bounding boxes) и относит каждый обнаруженный объект к одному из трёх классов: цифровые чеки, физические чеки на пустых страницах и небольшие платежные квитанции.


Ключевые возможности

  • Обнаружение и локализация чеков/квитанций на фото документа

  • Классификация обнаруженного объекта по 3 категориям: цифровой чек, физический чек, платежная квитанция

  • Поддерживает фото/сканы разных типов бумажных документов

  • Подходит для предварительного этапа обработки перед OCR или парсингом текста


Техничесные особенности

  • Основана на RT-DETRv2 (Real-Time Detection Transformer) — архитектуре трансформерного детектора объектов с efficient-деценторами

  • Обучена на специализированном наборе чеков с трёхклассовой разметкой — digital, fisico, tesoreria

  • Возвращает bounding boxes с метками класса и confidence score

  • Интегрируется через стандартные API Hugging Face — AutoImageProcessor + AutoModelForObjectDetection


Преимущества перед альтернативами

  • Одновременно решает детекцию + классификацию, в отличие от отдельных моделей

  • Архитектура DETR-по-варианту обеспечивает единый пайплайн без сложной post-processing

  • Готова к промышленной интеграции — подходит для batch-обработки и OCR-конвейеров


Ограничения

  • Производительность оценки показана как низкая в метриках (мAP ~0) на тестовом датасете — может потребовать дообучения для реальных условий

  • Обучена на узком наборе документных форматов — может ошибаться на очень нестандартных чеках или счётах

  • Требует изображений с достаточным качеством и контрастом


Бизнес-кейсы (Use Cases)

1. Автоматизация учёта расходов и чеков

Модель обнаруживает чеки на фото и автоматически классифицирует их по типам перед передачей в OCR-систему.

2. Обработка финансовых документов клиентов

На базе мобильной загрузки чеков/квитанций в приложении модель сразу выделяет и маркирует документы.

3. Интеграция с ERP/CRM

Система автоматически подготавливает изображения для парсинга данных и ввода в бухгалтерские модули.

4. Архивирование и цифровой учёт

Автоматическое распознавание и сортировка корпоративных кассовых документов в архивы по типам.


Потенциальная ценность для бизнеса

Снижение затрат:
Автоматизация поиска и классификации документов снижает ручную работу сотрудников.

Ускорение процессов:
Быстрая обработка документов становится частью OCR-конвейера и ускоряет ввод данных.

Повышение качества данных:
Стандартизированная предварительная сегментация помогает избежать ошибок в парсинге текста.

Интеграция:
Модель легко встраивается в современные пайплайны обработки изображений и документооборота.

Предпросмотр файлов

В этой модели нет файлов для предпросмотра.

Просмотры

Скачивания

Похожие модели

Кейсы внедрения

Обсудите модель
с топами рынка в бизнес чате
Есть вопросы по модели?
Написать автору

Оценка

Детали модели

Автор: Qubu Team
Объем: 292.51 МБ
Комментарии: 0
Просмотры: 17
Скачивания: 0
Лицензия: MIT
Дата добавления: 01.03.2026

Автор

Qubu Team

Qubu Team

Команда

Профиль команды
Загрузка...
Загрузка комментариев...