Распознавание плача младенца по 4 классам

Классифицирует плач ребенка на четыре категории: дистресс, голод, не-плач, позитив.

0/5
0 скачиваний
0 отзывов
Распознавание плача младенца по 4 классам
Подходит для задач:
Audio Classification
Сферы:
Медицина
Библиотеки:
Transformers

Описание

Обзор модели

Эта модель является тонко настроенной версией ehcalabres/wav2vec2-lg-xlsr-en-speech-emotion-recognition, обученной на наборе данных, содержащем различные типы звуков, издаваемых младенцами. Модель предназначена для классификации звуков плача младенцев по четырем основным категориям: дистресс, голод, не-плач и позитивные звуки.

Метрики качества

  • Потери (Loss): 0.6012

  • Точность (Accuracy): 0.6648

  • F1-мера (F1): 0.6637

Предполагаемое использование и ограничения

Модель предназначена для применения в системах мониторинга младенцев, носимых устройствах для родителей или в исследовательских проектах, связанных с анализом звуковых сигналов младенцев. Она может помочь в раннем выявлении потребностей ребенка. Ограничения модели связаны с качеством входных аудиоданных и разнообразием акустической среды. Модель была обучена на английском языке, что может повлиять на ее производительность при использовании с аудиоданными других языковых групп.

Данные для обучения и оценки

Модель была обучена на аугментированном наборе данных, детали которого не указаны, что позволило улучшить ее обобщающую способность.

Процедура обучения

  • Во время обучения использовались следующие гиперпараметры:

  • Скорость обучения: 1e-05

  • Размер обучающего батча: 16

  • Размер оценочного батча: 32

  • Начальное зерно: 42

  • Шаги накопления градиента: 4

  • Общий размер обучающего батча: 64

  • Оптимизатор: ADAMW_TORCH_FUSED с betas=(0.9, 0.999) и epsilon=1e-08

  • Тип планировщика скорости обучения: косинусный

  • Шаги прогрева планировщика скорости обучения: 0.1

  • Количество эпох: 3

Результаты обучения

Потери на обучении Эпоха Шаг Потери на валидации Точность F1 2.4290 0.2941 25 0.5468 0.6983 0.6754 2.3599 0.5882 50 0.5463 0.6760 0.6736 2.3059 0.8824 75 0.5448 0.6927 0.6775 2.2763 1.1765 100 0.5580 0.6648 0.6604 2.2645 1.4706 125 0.5900 0.6592 0.6571 2.3093 1.7647 150 0.5806 0.6648 0.6565 2.1578 2.0588 175 0.5773 0.6592 0.6516 2.2433 2.3529 200 0.5881 0.6648 0.6604 2.1501 2.6471 225 0.6090 0.6704 0.6704 2.2734 2.9412 250 0.6012 0.6648 0.6637

Версии фреймворков

  • Transformers: 5.0.0

  • Pytorch: 2.10.0+cu128

  • Datasets: 4.0.0

  • Tokenizers: 0.22.2

Ссылки

https://https://huggingface.co/Grimyow/baby-cry-4class-augmented-2026-03-16_05.55.57

Предпросмотр файлов

В этой модели нет файлов для предпросмотра.

Просмотры

Скачивания

Похожие модели

Кейсы внедрения

Обсудите модель
с топами рынка в бизнес чате
Есть вопросы по модели?
Написать автору

Оценка

Детали модели

Автор: Qubu Team
Объем: 4.7 ГБ
Комментарии: 0
Просмотры: 15
Скачивания: 0
Лицензия: MIT
Дата добавления: 28.04.2026

Автор

Qubu Team

Qubu Team

Команда

Профиль команды
Загрузка...
Загрузка комментариев...