Trium - Оптимизация биотехнологического этапа выращивания растений
Модель прогнозирует оптимальные условия культивирования растений в микроразмножении, анализируя основные факторы роста. Использует передовые алгоритмы машинного обучения для выдачи рекомендаций по повышению качества и урожайности саженцев. Предназначена для тепличных комбинатов, питомников, научных лабораторий и сельскохозяйственных предприятий. Помогает сократить время экспериментов и значительно снизить затраты на производство.

Выберите удобный способ работы:
Загрузка Gradio
Проверяем статус интерфейса...
Описание
Описание
Модель решает задачу, которая в классической биотехнологической практике занимает от 120 до 430 дней: подбор оптимального состава питательной среды для культивирования растений in vitro. На вход подается рецептура среды - тип базовой среды (MS или 1/2 MS), концентрация сахарозы, цитокинин с его дозой, ауксин и, при необходимости, стресс-агент (NaCl или PEG). На выходе три числовых прогноза: коэффициент пролиферации побегов, длина побега в сантиметрах и выживаемость культуры в процентах. Попутно рассчитывается стоимость среды в рублях на литр - это позволяет сразу оценивать экономическую сторону протокола, а не только биологическую.
Целевая аудитория - биотехнологические лаборатории, тепличные комплексы с собственным маточным хозяйством и питомники безвирусного посадочного материала.
Содержание модели
Публикуемая модель представляет собой пакет из четырех независимо обученных регрессоров на базе MLPRegressor (scikit-learn 1.7.2), каждый из которых использует отличную стратегию инжиниринга признаков. Лучшим оказался вариант с логарифмическим преобразованием концентраций (Log-Transformed): концентрации гормонов и стрессора передаются в сеть через log(1 + x), что компенсирует сильную правостороннюю асимметрию реальных экспериментальных данных.
Два других варианта - Interactions и Full Optimized - дополнительно включают попарные произведения концентраций (H1*H2, H1 * Stress) для захвата синергетических и антагонистических эффектов. Вариант Raw с исходными значениями признаков включён как бейзлайн для сравнения.
Все четыре модели обучались на одной выборке из 400 экспериментальных записей. Для каждого наблюдения фиксировались три отклика одновременно, то есть регрессия многовыходная. Категориальные признаки закодированы в one-hot-формате без удаления референсной категории, что повышает интерпретируемость векторного пространства.
Поверх регрессора реализован оптимизатор протоколов: генерируется 2 000 кандидатных рецептур из дискретного сетки параметров, прогоняет их через модель, нормирует три целевых метрики и стоимость в [0, 1] по min-max-схеме и вычисляет взвешенную оценку согласно приоритетам пользователя.
Что делает модель
Принимает табличное описание питательной среды, затем возвращает 3 количественных прогноза ответа культуры и расчетную стоимость среды
Вход и выход
Вход: таблица (JSON/dict) с восемью полями: medium_base (MS / 1/2 MS), sucrose_percent (0–10 %), hormone1_type (Zeatin / BAP / Kinetin / TDZ), hormone1_conc_mgL (0–10 мг/л), hormone2_type (IAA / NAA), hormone2_conc_mgL (0–10 мг/л), stress_type (None / NaCl / PEG), stress_conc (0–200).
Выход: JSON со значениями proliferation_coefficient, shoot_length_cm, survival_rate_percent и medium_cost_rub_per_l. Через endpoint /optimize ранжированный список до N лучших протоколов с указанием сводного скора.
Отрасль применения
Растениеводство, в частности - биотехнология растений. Тип компании: биотехнологическая лаборатория, тепличный комплекс с программой безвирусного размножения, питомник посадочного материала, научно-исследовательская группа по культуре тканей.
Обучающие данные
Собственный экспериментальный датасет ООО «ТРБ»: 400 записей по культивированию. Данные собирались в контролируемых лабораторных условиях. Для каждого растения регистрировались состав среды и три целевые переменные по истечении стандартного субкультурального периода. Ручная разметка, Россия, СФО. Выборка несбалансирована по концентрационным уровням: ряд точек пространства условий представлен плотнее (в соответствии с DoE-планом Box–Behnken).
Метрики качества
По умолчанию используется Log-Transformed. Выживаемость прогнозируется точнее коэффициента пролиферации — это ожидаемо: дихотомическая природа выживания статистически более предсказуема, чем непрерывный отклик на гормональный фон.
Технические требования
Аппаратура: CPU-инференс; GPU не требуется. Минимум — 2 ГБ ОЗУ для загрузки joblib-объектов и обработки ~2 000 кандидатов при оптимизации.
Программное окружение: Python 3.10+, scikit-learn==1.7.2 (версия фиксирована — иные версии могут давать предупреждения при десериализации), joblib==1.5.2, numpy≥1.24, pandas≥2.0. Linux / Windows / Docker.
Формат входных данных: JSON или Python dict; числовые поля — float, категориальные — строки из допустимого набора. Файловые форматы не используются.
Предпросмотр файлов
В этой модели нет файлов для предпросмотра.