Trium - Оптимизация биотехнологического этапа выращивания растений

Модель прогнозирует оптимальные условия культивирования растений в микроразмножении, анализируя основные факторы роста. Использует передовые алгоритмы машинного обучения для выдачи рекомендаций по повышению качества и урожайности саженцев. Предназначена для тепличных комбинатов, питомников, научных лабораторий и сельскохозяйственных предприятий. Помогает сократить время экспериментов и значительно снизить затраты на производство.

0/5
0 скачиваний
0 отзывов
Trium - Оптимизация биотехнологического этапа выращивания растений
Подходит для задач:
Tabular Regression
Time Series Forecasting
Сферы:
Сельское хозяйство
Лесное хозяйство
Экология и окружающая среда
Наука и исследования
Библиотеки:
Scikit-learn
Joblib
Тэги:Гравитация 2026

Выберите удобный способ работы:

Загрузка Gradio

Проверяем статус интерфейса...

Описание

Описание

Модель решает задачу, которая в классической биотехнологической практике занимает от 120 до 430 дней: подбор оптимального состава питательной среды для культивирования растений in vitro. На вход подается рецептура среды - тип базовой среды (MS или 1/2 MS), концентрация сахарозы, цитокинин с его дозой, ауксин и, при необходимости, стресс-агент (NaCl или PEG). На выходе три числовых прогноза: коэффициент пролиферации побегов, длина побега в сантиметрах и выживаемость культуры в процентах. Попутно рассчитывается стоимость среды в рублях на литр - это позволяет сразу оценивать экономическую сторону протокола, а не только биологическую.

Целевая аудитория - биотехнологические лаборатории, тепличные комплексы с собственным маточным хозяйством и питомники безвирусного посадочного материала.

Содержание модели

Публикуемая модель представляет собой пакет из четырех независимо обученных регрессоров на базе MLPRegressor (scikit-learn 1.7.2), каждый из которых использует отличную стратегию инжиниринга признаков. Лучшим оказался вариант с логарифмическим преобразованием концентраций (Log-Transformed): концентрации гормонов и стрессора передаются в сеть через log(1 + x), что компенсирует сильную правостороннюю асимметрию реальных экспериментальных данных.

Два других варианта - Interactions и Full Optimized - дополнительно включают попарные произведения концентраций (H1*H2, H1 * Stress) для захвата синергетических и антагонистических эффектов. Вариант Raw с исходными значениями признаков включён как бейзлайн для сравнения.

Все четыре модели обучались на одной выборке из 400 экспериментальных записей. Для каждого наблюдения фиксировались три отклика одновременно, то есть регрессия многовыходная. Категориальные признаки закодированы в one-hot-формате без удаления референсной категории, что повышает интерпретируемость векторного пространства.

Поверх регрессора реализован оптимизатор протоколов: генерируется 2 000 кандидатных рецептур из дискретного сетки параметров, прогоняет их через модель, нормирует три целевых метрики и стоимость в [0, 1] по min-max-схеме и вычисляет взвешенную оценку согласно приоритетам пользователя.

Что делает модель

Принимает табличное описание питательной среды, затем возвращает 3 количественных прогноза ответа культуры и расчетную стоимость среды

Вход и выход

Вход: таблица (JSON/dict) с восемью полями: medium_base (MS / 1/2 MS), sucrose_percent (0–10 %), hormone1_type (Zeatin / BAP / Kinetin / TDZ), hormone1_conc_mgL (0–10 мг/л), hormone2_type (IAA / NAA), hormone2_conc_mgL (0–10 мг/л), stress_type (None / NaCl / PEG), stress_conc (0–200).

Выход: JSON со значениями proliferation_coefficient, shoot_length_cm, survival_rate_percent и medium_cost_rub_per_l. Через endpoint /optimize ранжированный список до N лучших протоколов с указанием сводного скора.

Отрасль применения

Растениеводство, в частности - биотехнология растений. Тип компании: биотехнологическая лаборатория, тепличный комплекс с программой безвирусного размножения, питомник посадочного материала, научно-исследовательская группа по культуре тканей.

Обучающие данные

Собственный экспериментальный датасет ООО «ТРБ»: 400 записей по культивированию. Данные собирались в контролируемых лабораторных условиях. Для каждого растения регистрировались состав среды и три целевые переменные по истечении стандартного субкультурального периода. Ручная разметка, Россия, СФО. Выборка несбалансирована по концентрационным уровням: ряд точек пространства условий представлен плотнее (в соответствии с DoE-планом Box–Behnken).

Метрики качества

Вариант модели

R² (avg)

MAE (avg)

R²(Пролиферация)

R²(Длина)

R²(Выживаемость)

Raw

0.731

2.621

0.669

0.685

0.841

Log-Transformed

0.821

1.972

0.747

0.787

0.929

Interactions

0.811

2.275

0.727

0.794

0.912

Full Optimized

0.811

2.275

0.727

0.794

0.912

По умолчанию используется Log-Transformed. Выживаемость прогнозируется точнее коэффициента пролиферации — это ожидаемо: дихотомическая природа выживания статистически более предсказуема, чем непрерывный отклик на гормональный фон.

Технические требования

Аппаратура: CPU-инференс; GPU не требуется. Минимум — 2 ГБ ОЗУ для загрузки joblib-объектов и обработки ~2 000 кандидатов при оптимизации.

Программное окружение: Python 3.10+, scikit-learn==1.7.2 (версия фиксирована — иные версии могут давать предупреждения при десериализации), joblib==1.5.2, numpy≥1.24, pandas≥2.0. Linux / Windows / Docker.

Формат входных данных: JSON или Python dict; числовые поля — float, категориальные — строки из допустимого набора. Файловые форматы не используются.

Предпросмотр файлов

В этой модели нет файлов для предпросмотра.

Просмотры

Скачивания

Похожие модели

Кейсы внедрения

Обсудите модель
с топами рынка в бизнес чате
Есть вопросы по модели?
Написать автору

Оценка

Детали модели

Автор: Степан Валевич
Объем: 613.33 КБ
Комментарии: 0
Просмотры: 52
Скачивания: 0
Лицензия: MIT
Дата добавления: 19.05.2026

Автор

Степан Валевич

Степан Валевич

Разработчик

Молодой ученый, биолог, IT-энтузиаст и любитель Claude

Профиль автора
Загрузка...
Загрузка комментариев...