ОБНМолекулярная биология Molecular Biology

  • ISSN (Print) 0026-8984
  • ISSN (Online) 3034-5553

GeneLens: PYTHON-ПАКЕТ, РЕАЛИЗУЮЩИЙ МЕТОДЫ МОНТЕ-КАРЛО МАШИННОГО ОБУЧЕНИЯ И СЕТЕВОГО АНАЛИЗА ДЛЯ ПОИСКА БИОМАРКЕРОВ И ФУНКЦИОНАЛЬНОЙ АННОТАЦИИ ГЕНОВ

Код статьи
S30345553S0026898425050096-1
DOI
10.7868/S3034555325050096
Тип публикации
Статья
Статус публикации
Опубликовано
Авторы
Том/ Выпуск
Том 59 / Номер выпуска 5
Страницы
845-854
Аннотация
Представлен Python-пакет GeneLens для комплексного анализа дифференциально экспрессирующихся генов и поиска биомаркеров. Основу пакета составляют два модуля: FSelector для идентификации биомаркеров через симуляции Монте-Карло L1-регуляризованных моделей и NetAnalyzer для предсказания функций отобранного набора генов на основе топологии сетей белок-белковых взаимодействий их продуктов. Методология FSelector включает: (1) автоматизированный отбор генов в итеративной процедуре бутертен-семплирования; (2) расчет весов значимости генов с учетом ROC-AUC-моделей и их количества в симуляциях; (3) адаптивный порог отсечки для редуцирования признакового пространства. NetAnalyzer реализует анализ обогащения биологических путей с интеграцией весов значимости из FSelector. GeneLens, реализованный как PIP-модуль, предоставляет стандартизированные алгоритмы применения методов машинного обучения и сетевого анализа в исследованиях дифференциальной экспрессии генов, а также возможность автоматического подбора гиперпараметров моделей и инструменты визуализации результатов.
Ключевые слова
транскриптомика машинное обучение Монте-Карло биомаркеры дифференциально экспрессирующиеся гены сетевой анализ
Дата публикации
31.01.2026
Год выхода
2026
Всего подписок
0
Всего просмотров
53

Библиография

  1. 1. Altman N., Krzywinski M. (2018) The curse of dimensionality. Nat. Methods. 15, 399–400.
  2. 2. Altman N., Krzywinski M. (2017) Ensemble methods: bagging and random forests. Nat. Methods. 14, 933–935.
  3. 3. Осьмак Г., Писклова М. (2025) Транскриптомика и “проклятие размерности”: Монте-Карло симуляции классификационных моделей как инструмент анализа многомерных данных в задачах поиска маркеров биологических процессов. Молекуляр. биология. 59, 143–149.
  4. 4. Pisklova M., Osmak G. (2024) Unveiling miRNA‑124 as a biomarker in hypertrophic cardiomyopathy: an innovative approach using machine learning and intelligent data analysis. Int. J. Cardiol. 410, 132220.
  5. 5. Osmak G., Kiselev I., Baulina N., Favorova O. (2020) From miRNA target gene network to miRNA function: miR‑375 might regulate apoptosis and actin dynamics in the heart muscle via Rho-GTPases-dependent pathways. Int. J. Mol. Sci. 21, 9670.
  6. 6. Tibshirani R. (1996) Regression shrinkage and selection via the lasso. J. R. Stat. Soc.: Ser. B (Methodological). 58, 267–288.
  7. 7. Hastie T., Tibshirani R., Friedman J.H., Friedman J.H. (2009) The elements of statistical learning: data mining, inference, and prediction. N.Y.: Springer.
QR
Перевести

Индексирование

Scopus

Scopus

Scopus

Crossref

Scopus

Высшая аттестационная комиссия

При Министерстве образования и науки Российской Федерации

Scopus

Научная электронная библиотека