RT-DETRv2: Обнаружение объектов в реальном времени с улучшенной базой

Модель RT-DETRv2 для обнаружения объектов с улучшенной производительностью и скоростью в реальном времени.

0/5
0 скачиваний
0 отзывов
RT-DETRv2: Обнаружение объектов в реальном времени с улучшенной базой
Подходит для задач:
Object Detection
Сферы:
Безопасность и охрана
Библиотеки:
Transformers

Описание

Обзор

Модель RT-DETRv2 была предложена в работе RT-DETRv2: Improved Baseline with Bag-of-Freebies for Real-Time Detection Transformer Вэньюем Лв, Ианом Чжао, Циняо Чангом, Куем Хуаном, Гуаньчжуном Вангом и И Лю. RT-DETRv2 дорабатывает RT-DETR, внедряя селективное извлечение многомасштабных признаков, дискретный оператор выборки для более широкой совместимости развертывания и улучшенные стратегии обучения, такие как динамическое увеличение данных и адаптивные к масштабу гиперпараметры.

Эти изменения повышают гибкость и практичность, сохраняя при этом производительность в реальном времени.

Эта модель была разработана [@jadechoghari](https://x.com/jadechoghari) при содействии [@cyrilvallez](https://huggingface.co/cyrilvallez) и [@qubvel-hf](https://huggingface.co/qubvel-hf).

Производительность

RT-DETRv2 стабильно превосходит своего предшественника во всех размерах моделей, сохраняя при этом те же скорости работы в реальном времени.

Применение

Модель RT-DETRv2 эффективно используется для обнаружения объектов на изображениях. Процесс использования включает загрузку предварительно обученной модели и процессора изображений, подготовку входного изображения и последующую обработку полученных результатов. Ниже представлен краткий пример использования:

from transformers import RTDetrV2ForObjectDetection, RTDetrImageProcessor

# Загрузка изображения
image = Image.open(requests.get(url, stream=True).raw)

# Инициализация процессора изображений и модели
image_processor = RTDetrImageProcessor.from_pretrained("PekingU/rtdetr_v2_r50vd")
model = RTDetrV2ForObjectDetection.from_pretrained("PekingU/rtdetr_v2_r50vd")

# Обработка изображения и получение предсказаний
inputs = image_processor(images=image, return_tensors="pt")
outputs = model(**inputs)
results = image_processor.post_process_object_detection(outputs, ...)

В результате работы модели вы получите список обнаруженных объектов с их классами, оценками достоверности и координатами ограничивающих рамок. Модель способна распознавать

  • людей
  • велосипеды
  • машины
  • автобусы
  • самолеты
  • и многие другие объекты (всего 50 классов)
что делает её универсальным инструментом для различных задач компьютерного зрения.

Обучение

RT-DETRv2 была обучена на наборе данных COCO (Lin et al. [2014]) train2017 и валидирована на наборе данных COCO val2017. Она обеспечивает стандартные метрики качества на этих бенчмарках, подтверждая свою эффективность для задач обнаружения объектов.

Ссылки

PekingU/rtdetr_v2_r50vd

Предпросмотр файлов

В этой модели нет файлов для предпросмотра.

Просмотры

Скачивания

Похожие модели

Кейсы внедрения

Обсудите модель
с топами рынка в бизнес чате
Есть вопросы по модели?
Написать автору

Оценка

Детали модели

Автор: Qubu Team
Объем: 164.21 МБ
Комментарии: 0
Просмотры: 5
Скачивания: 0
Лицензия: MIT
Дата добавления: 26.04.2026

Автор

Qubu Team

Qubu Team

Команда

Профиль команды
Загрузка...
Загрузка комментариев...