Глубокое машинное обучение дополняет информацию о миллионе биоактивных молекул

 

Лаборатория структурной биоинформатики и сетевой биологии, возглавляемая исследователем ICREA доктором Патриком Алоем, завершила сбор информации о биоактивности для миллиона молекул с использованием вычислительных моделей глубокого машинного обучения. Он также раскрыл инструмент для прогнозирования биологической активности любой молекулы, даже если отсутствуют экспериментальные данные.

 

Эта новая методология основана на Chemical Checker, крупнейшей на сегодняшний день базе данных профилей биоактивности для псевдофармацевтических препаратов, разработанной той же лабораторией и опубликованной в 2020 году. Химическая проверка собирает информацию из 25 областей биоактивности для каждой молекулы. Эти пространства связаны с химической структурой молекулы, мишенями, с которыми она взаимодействует, или изменениями, которые она вызывает на клиническом или клеточном уровне. Однако эта очень подробная информация о механизме действия является неполной для большинства молекул, подразумевая, что для конкретной молекулы может быть информация для одного или двух пространств биоактивности, но не для всех 25.

С помощью этой новой разработки исследователи интегрируют всю доступную экспериментальную информацию с помощью методов глубокого машинного обучения, чтобы можно было завершить все профили активности, от химии до клинического уровня, для всех молекул.

"Новый инструмент также позволяет нам прогнозировать пространство биоактивности новых молекул, и это имеет решающее значение в процессе поиска лекарств, поскольку мы можем выбрать наиболее подходящих кандидатов и отбросить те, которые по той или иной причине не сработали бы", - объясняет доктор Алой.

Библиотека программного обеспечения находится в свободном доступе для научного сообщества по адресу bioactivitysignatures.org и он будет регулярно обновляться исследователями по мере поступления новых данных о биологической активности. С каждым обновлением экспериментальных данных в Chemical Checker искусственные нейронные сети также будут пересматриваться для уточнения оценок.

Прогнозы и надежность

Данные о биоактивности, предсказываемые моделью, имеют большую или меньшую степень достоверности в зависимости от различных факторов, включая объем доступных экспериментальных данных и характеристики молекулы.

В дополнение к прогнозированию аспектов активности на биологическом уровне, система, разработанная командой доктора Алоя, обеспечивает измерение степени надежности прогноза для каждой молекулы. "Все модели неверны, но некоторые полезны! Мера уверенности позволяет нам лучше интерпретировать результаты и выделить, какие области биоактивности молекулы являются точными, а в каких можно предположить частоту ошибок", - объясняет доктор Мартино Бертони, первый автор работы.

Тестирование системы с помощью библиотеки IRB Barcelona compound

Чтобы проверить этот инструмент, исследователи провели поиск в библиотеке соединений в Барселоне IRB в поисках тех, которые могли бы быть хорошими кандидатами на лекарства для модуляции активности фактора транскрипции, связанного с раком (SNAIL1), активность которого почти невозможно модулировать из-за прямого связывания лекарств (он считается "не поддающейся лечению" мишенью). Из первого набора из 17 000 соединений модели глубокого машинного обучения предсказали характеристики (в их динамике, взаимодействии с клетками-мишенями и белками и т.д.) для 131, Которые соответствуют цели.

Способность этих соединений разлагать SNAIL1 была подтверждена экспериментально, и было замечено, что для высокого процента эта способность к разложению согласуется с тем, что предсказывали модели, что подтверждает правильность системы.

ИСТОЧНИК

Категория: Наука и Техника | Добавил: fantast (29.06.2021)
Просмотров: 48 | Рейтинг: 0.0/0