Rubert-tiny для определения токсичности текста

Классифицирует русскоязычные тексты по категориям токсичности и определяет степень опасности высказываний.

0/5

0 скачиваний

0 отзывов

Rubert-tiny для определения токсичности текста

Подходит для задач:

Text Classification

Сферы:

Контент и копирайтинг

Библиотеки:

Transformers

Языки:

Английский

Русский

Описание

Обзор модели

Эта модель основана на cointegrated/rubert-tiny и дообучена для классификации токсичности и неуместности коротких неформальных русскоязычных текстов, например, комментариев в социальных сетях.

Проблема сформулирована как многоклассовая классификация со следующими категориями:

: текст НЕ содержит оскорблений, нецензурной лексики и угроз в соответствии с соревнованием OK ML Cup.

: текст является неуместным в смысле работы Бабакова и соавт., то есть может нанести вред репутации говорящего.

Текст может считаться безопасным, если он одновременно является и НЕ .

Параметры модели

Архитектура: BertForSequenceClassification
Размерность скрытого состояния (hidden_size): 312
Количество слоев (num_hidden_layers): 3
Количество заголовков внимания (num_attention_heads): 12
Размер словаря (vocab_size): 29564
Максимальная позиционная эмбеддинга (max_position_embeddings): 512
Тип задачи: multi_label_classification (многоклассовая классификация)

Применение

Пример использования модели для оценки токсичности текста:

Обучение

Модель была обучена на объединенном наборе данных OK ML Cup и Бабакова и соавт. с использованием оптимизатора Adam, скорости обучения 1e-5 и размера батча 64 в течение 15 эпох. Текст считался неуместным, если его оценка неуместности была выше 0.8, и уместным – если она была ниже 0.2. Показатели ROC AUC на наборе для разработки по каждой метке:

МеткаROC AUCnon-toxic0.9937insult0.9912obscenity0.9881threat0.9910dangerous0.8295

Ссылки

cointegrated/rubert-tiny-toxicity

Ссылки

https://https://huggingface.co/cointegrated/rubert-tiny-toxicity

Предпросмотр файлов

В этой модели нет файлов для предпросмотра.

Просмотры

Скачивания

Кейсы внедрения

Загрузка...

Загрузка комментариев...

Обсудите модель

с топами рынка в бизнес чате

Есть вопросы по модели?

Написать автору

Оценка

Детали модели

Автор: Qubu Team

Объем: 90.63 МБ

Комментарии: 0

Просмотры: 13

Скачивания: 0

Лицензия: MIT

Дата добавления: 21.04.2026

Автор

Qubu Team

Команда

Профиль команды

Загрузка...

Загрузка комментариев...

Rubert-tiny для определения токсичности текста

Протестируйте модель прямо сейчас

Описание

Обзор модели

Параметры модели

Применение

Обучение

Ссылки

Ссылки

Предпросмотр файлов

Просмотры

Скачивания

Похожие модели

Кейсы внедрения

Оценка

Детали модели

Автор