Искусственный интеллект расшифровал геном человека и предсказал риск рака: новая модель EpiBERT
Теги: Медицина Искусственный интеллект Рак генетика
Unsplash
Искусственный интеллект (ИИ) сделал еще один шаг в сторону решения одной из самых сложных задач биологии: теперь он может расшифровывать «грамматику» генома человека. Разработанная модель ИИ EpiBERT способна предсказать, какие гены активируются в клетках организма и выявлять мутации, которые могут привести к заболеваниям, включая рак. Исследование ученых из Института исследования рака Даны-Фарбер, Массачусетского технологического института и Колумбийского университета опубликовано в журнале Cell Genomics, сообщает «Газета.Ru».
В основе модели EpiBERT лежит система глубокого обучения BERT, ранее использовавшаяся для обработки человеческого языка. Такой подход позволил ученым обучить ИИ на данных сотен типов человеческих клеток, использовав геномную последовательность длиной в три миллиарда пар оснований, а также карты доступности хроматина. Эти карты показывают, какие участки ДНК активируются и считываются клеткой, что важно для понимания того, как регулируется активность генов в разных типах клеток.
Unsplash
Разработка ученых позволяет анализировать, как различные регуляторные элементы генома влияют на активность генов. Эти элементы составляют около 20% всего генома, но их роль в клеточных процессах до сих пор изучена недостаточно. Именно эти регуляторные элементы управляют экспрессией генов, а их нарушения могут быть связаны с развитием болезней, таких как рак. Модель EpiBERT может раскрыть, как работают эти регуляторные механизмы и как их сбои могут приводить к заболеваниям.
Принцип работы EpiBERT схож с обучением языковых моделей, таких как ChatGPT, которые учат строить осмысленные предложения. В случае EpiBERT ИИ обучается на генетической информации, чтобы точно предсказать, какие гены активируются в определенной клетке и как это может повлиять на развитие заболеваний. Это позволяет глубже понять, как клетка работает и какие факторы могут быть связаны с развитием патологий, включая онкологические заболевания.
Главный конкурент ChatGPT: почему китайский чат-бот DeepSeek внезапно стал таким популярным и обрушил рынок
Пользователи нашли баг в ChatGPT: в каком случае бот откажется от разговора
Искусственный интеллект вышел из-под контроля: новая модель ChatGPT устроила хаос, узнав об отключении
Суть модели заключается в том, что, несмотря на то, что все клетки организма содержат одинаковую генетическую информацию, они могут различаться по тому, какие гены активируются в разные моменты времени. Модель EpiBERT помогает выявить, какие конкретно гены и когда активируются, а также предсказать, как могут развиваться изменения в их активности. Это открытие открывает новые возможности для диагностики и прогнозирования риска заболеваний, включая рак.
Ученые подчеркивают, что важнейшей частью их исследования было понимание связи между доступностью хроматина и экспрессией генов. Если хроматин в клетке находится в определенном «раскрытом» состоянии, это означает, что гены будут активны. И наоборот, если хроматин «закрыт», то экспрессия генов будет подавляться. Эти процессы могут быть нарушены в результате мутаций, и модель EpiBERT теперь может помочь в их детальном анализе.
Unsplash
С помощью модели ученые могут также предсказать, какие мутации и нарушения в «грамматике» генома могут быть связаны с развитием рака, что делает технологию EpiBERT важным шагом в области медицины. Эта разработка открывает новые горизонты для диагностики заболеваний и улучшения методов их лечения.