Распознавание плача младенца по 4 классам
Классифицирует плач ребенка на четыре категории: дистресс, голод, не-плач, позитив.

Описание
Обзор модели
Эта модель является тонко настроенной версией ehcalabres/wav2vec2-lg-xlsr-en-speech-emotion-recognition, обученной на наборе данных, содержащем различные типы звуков, издаваемых младенцами. Модель предназначена для классификации звуков плача младенцев по четырем основным категориям: дистресс, голод, не-плач и позитивные звуки.
Метрики качества
Потери (Loss): 0.6012
Точность (Accuracy): 0.6648
F1-мера (F1): 0.6637
Предполагаемое использование и ограничения
Модель предназначена для применения в системах мониторинга младенцев, носимых устройствах для родителей или в исследовательских проектах, связанных с анализом звуковых сигналов младенцев. Она может помочь в раннем выявлении потребностей ребенка. Ограничения модели связаны с качеством входных аудиоданных и разнообразием акустической среды. Модель была обучена на английском языке, что может повлиять на ее производительность при использовании с аудиоданными других языковых групп.
Данные для обучения и оценки
Модель была обучена на аугментированном наборе данных, детали которого не указаны, что позволило улучшить ее обобщающую способность.
Процедура обучения
Во время обучения использовались следующие гиперпараметры:
Скорость обучения: 1e-05
Размер обучающего батча: 16
Размер оценочного батча: 32
Начальное зерно: 42
Шаги накопления градиента: 4
Общий размер обучающего батча: 64
Оптимизатор: ADAMW_TORCH_FUSED с betas=(0.9, 0.999) и epsilon=1e-08
Тип планировщика скорости обучения: косинусный
Шаги прогрева планировщика скорости обучения: 0.1
Количество эпох: 3
Результаты обучения
Потери на обучении Эпоха Шаг Потери на валидации Точность F1 2.4290 0.2941 25 0.5468 0.6983 0.6754 2.3599 0.5882 50 0.5463 0.6760 0.6736 2.3059 0.8824 75 0.5448 0.6927 0.6775 2.2763 1.1765 100 0.5580 0.6648 0.6604 2.2645 1.4706 125 0.5900 0.6592 0.6571 2.3093 1.7647 150 0.5806 0.6648 0.6565 2.1578 2.0588 175 0.5773 0.6592 0.6516 2.2433 2.3529 200 0.5881 0.6648 0.6604 2.1501 2.6471 225 0.6090 0.6704 0.6704 2.2734 2.9412 250 0.6012 0.6648 0.6637
Версии фреймворков
Transformers: 5.0.0
Pytorch: 2.10.0+cu128
Datasets: 4.0.0
Tokenizers: 0.22.2
Ссылки
https://https://huggingface.co/Grimyow/baby-cry-4class-augmented-2026-03-16_05.55.57
Предпросмотр файлов
В этой модели нет файлов для предпросмотра.