RUSentiment
Коллекция русскоязычных текстов из отзывов и социальных сетей с размеченной тональностью (positive/negative). 25 000 размеченных примеров.
2
URL источника данных: https://github.com/sismetanin/russian-sentiment-datasets
Источник данных:Агрегированные данные из открытых источников: отзывы маркетплейсов, социальные сети, форумы
Описание
# RUSentiment: Датасет для анализа тональности русскоязычных текстов
## Описание
Датасет содержит тексты на русском языке с бинарной разметкой тональности. Собран из различных источников для обучения и оценки моделей анализа тональности.
## Структура данных
- Размер: 25 000 текстов
- Классы: positive (12 500), negative (12 500)
- Язык: русский
- Кодировка: UTF-8
## Формат данных
```json
{
"text": "Отличный товар, всем рекомендую!",
"label": "positive",
"source": "reviews"
}
Предпросмотр файлов
В этом датасете нет файлов для предпросмотра.