Представлен Python-пакет GeneLens для комплексного анализа дифференциально экспрессирующихся генов и поиска биомаркеров. Основу пакета составляют два модуля: FSelector для идентификации биомаркеров через симуляции Монте-Карло L1-регуляризованных моделей и NetAnalyzer для предсказания функций отобранного набора генов на основе топологии сетей белок-белковых взаимодействий их продуктов. Методология FSelector включает: (1) автоматизированный отбор генов в итеративной процедуре бутертен-семплирования; (2) расчет весов значимости генов с учетом ROC-AUC-моделей и их количества в симуляциях; (3) адаптивный порог отсечки для редуцирования признакового пространства. NetAnalyzer реализует анализ обогащения биологических путей с интеграцией весов значимости из FSelector. GeneLens, реализованный как PIP-модуль, предоставляет стандартизированные алгоритмы применения методов машинного обучения и сетевого анализа в исследованиях дифференциальной экспрессии генов, а также возможность автоматического подбора гиперпараметров моделей и инструменты визуализации результатов.
Индексирование
Scopus
Crossref
Высшая аттестационная комиссия
При Министерстве образования и науки Российской Федерации