Trium - Оптимизация биотехнологического этапа выращивания растений

Name: Trium - Оптимизация биотехнологического этапа выращивания растений
Author: Степан Валевич

Модель прогнозирует оптимальные условия культивирования растений в микроразмножении, анализируя основные факторы роста. Использует передовые алгоритмы машинного обучения для выдачи рекомендаций по повышению качества и урожайности саженцев. Предназначена для тепличных комбинатов, питомников, научных лабораторий и сельскохозяйственных предприятий. Помогает сократить время экспериментов и значительно снизить затраты на производство.

0/5

0 скачиваний

0 отзывов

Trium - Оптимизация биотехнологического этапа выращивания растений

Подходит для задач:

Tabular Regression

Time Series Forecasting

Сферы:

Сельское хозяйство

Лесное хозяйство

Экология и окружающая среда

Наука и исследования

Библиотеки:

Scikit-learn

Joblib

Тэги:

Загрузка Gradio

Проверяем статус интерфейса...

Описание

Описание

Модель решает задачу, которая в классической биотехнологической практике занимает от 120 до 430 дней: подбор оптимального состава питательной среды для культивирования растений in vitro. На вход подается рецептура среды - тип базовой среды (MS или 1/2 MS), концентрация сахарозы, цитокинин с его дозой, ауксин и, при необходимости, стресс-агент (NaCl или PEG). На выходе три числовых прогноза: коэффициент пролиферации побегов, длина побега в сантиметрах и выживаемость культуры в процентах. Попутно рассчитывается стоимость среды в рублях на литр - это позволяет сразу оценивать экономическую сторону протокола, а не только биологическую.

Целевая аудитория - биотехнологические лаборатории, тепличные комплексы с собственным маточным хозяйством и питомники безвирусного посадочного материала.

Содержание модели

Публикуемая модель представляет собой пакет из четырех независимо обученных регрессоров на базе MLPRegressor (scikit-learn 1.7.2), каждый из которых использует отличную стратегию инжиниринга признаков. Лучшим оказался вариант с логарифмическим преобразованием концентраций (Log-Transformed): концентрации гормонов и стрессора передаются в сеть через log(1 + x), что компенсирует сильную правостороннюю асимметрию реальных экспериментальных данных.

Два других варианта - Interactions и Full Optimized - дополнительно включают попарные произведения концентраций (H1*H2, H1 * Stress) для захвата синергетических и антагонистических эффектов. Вариант Raw с исходными значениями признаков включён как бейзлайн для сравнения.

Все четыре модели обучались на одной выборке из 400 экспериментальных записей. Для каждого наблюдения фиксировались три отклика одновременно, то есть регрессия многовыходная. Категориальные признаки закодированы в one-hot-формате без удаления референсной категории, что повышает интерпретируемость векторного пространства.

Поверх регрессора реализован оптимизатор протоколов: генерируется 2 000 кандидатных рецептур из дискретного сетки параметров, прогоняет их через модель, нормирует три целевых метрики и стоимость в [0, 1] по min-max-схеме и вычисляет взвешенную оценку согласно приоритетам пользователя.

Что делает модель

Принимает табличное описание питательной среды, затем возвращает 3 количественных прогноза ответа культуры и расчетную стоимость среды

Вход и выход

Вход: таблица (JSON/dict) с восемью полями: medium_base (MS / 1/2 MS), sucrose_percent (0–10 %), hormone1_type (Zeatin / BAP / Kinetin / TDZ), hormone1_conc_mgL (0–10 мг/л), hormone2_type (IAA / NAA), hormone2_conc_mgL (0–10 мг/л), stress_type (None / NaCl / PEG), stress_conc (0–200).

Выход: JSON со значениями proliferation_coefficient, shoot_length_cm, survival_rate_percent и medium_cost_rub_per_l. Через endpoint /optimize ранжированный список до N лучших протоколов с указанием сводного скора.

Отрасль применения

Растениеводство, в частности - биотехнология растений. Тип компании: биотехнологическая лаборатория, тепличный комплекс с программой безвирусного размножения, питомник посадочного материала, научно-исследовательская группа по культуре тканей.

Обучающие данные

Собственный экспериментальный датасет ООО «ТРБ»: 400 записей по культивированию. Данные собирались в контролируемых лабораторных условиях. Для каждого растения регистрировались состав среды и три целевые переменные по истечении стандартного субкультурального периода. Ручная разметка, Россия, СФО. Выборка несбалансирована по концентрационным уровням: ряд точек пространства условий представлен плотнее (в соответствии с DoE-планом Box–Behnken).

Метрики качества

Вариант модели	R² (avg)	MAE (avg)	R²(Пролиферация)	R²(Длина)	R²(Выживаемость)
Raw	0.731	2.621	0.669	0.685	0.841
Log-Transformed	0.821	1.972	0.747	0.787	0.929
Interactions	0.811	2.275	0.727	0.794	0.912
Full Optimized	0.811	2.275	0.727	0.794	0.912

По умолчанию используется Log-Transformed. Выживаемость прогнозируется точнее коэффициента пролиферации — это ожидаемо: дихотомическая природа выживания статистически более предсказуема, чем непрерывный отклик на гормональный фон.

Технические требования

Аппаратура: CPU-инференс; GPU не требуется. Минимум — 2 ГБ ОЗУ для загрузки joblib-объектов и обработки ~2 000 кандидатов при оптимизации.

Программное окружение: Python 3.10+, scikit-learn==1.7.2 (версия фиксирована — иные версии могут давать предупреждения при десериализации), joblib==1.5.2, numpy≥1.24, pandas≥2.0. Linux / Windows / Docker.

Формат входных данных: JSON или Python dict; числовые поля — float, категориальные — строки из допустимого набора. Файловые форматы не используются.

Предпросмотр файлов

В этой модели нет файлов для предпросмотра.

Просмотры

Скачивания

Кейсы внедрения

Загрузка...

Загрузка комментариев...

Обсудите модель

с топами рынка в бизнес чате

Есть вопросы по модели?

Написать автору

Оценка

Детали модели

Автор: Степан Валевич

Объем: 613.33 КБ

Комментарии: 0

Просмотры: 66

Скачивания: 0

Лицензия: MIT

Дата добавления: 19.05.2026

Автор

Степан Валевич

Разработчик

Молодой ученый, биолог, IT-энтузиаст и любитель Claude

Профиль автора