Высокопроизводительные методы исследования транскриптома позволяют оценить огромное количество факторов, что ценно для ученых, но порождает проблему “проклятия размерности”, что повышает требования к методам обработки и анализа данных. В представленной работе мы предлагаем новый алгоритм, объединяющий методы Монте-Карло и машинное обучение. Этот алгоритм позволит сократить пространство признаков, подсвечивая гены, с наибольшей вероятностью ассоциированные с определенными заболеваниями. Представленный подход позволяет не только сформировать набор “интересных” генов, но и взвесить их множество, присвоив каждому гену меру его “важности”. Эта мера может быть использована как в последующем статистическом анализе, так и при визуализации и интерпретации результатов. Работа алгоритма продемонстрирована нами на открытых данных профилирования больных гипертрофической кардиомиопатией. По результатам анализа выявлены гены MYH6, FCN3, RASD1 и SERPINA3, что хорошо согласуется с опубликованными данными.
Индексирование
Scopus
Crossref
Higher Attestation Commission
At the Ministry of Education and Science of the Russian Federation