Российские учёные создали тест для ИИ-дизайна белков

Исследователи Института искусственного интеллекта AIRI разработали подход к тестированию генеративных моделей для 3D-дизайна белков.

magnific.com

Генеративные модели для дизайна белков научились создавать новые молекулы. Но насколько хорошо они понимают их геометрию? Российские исследователи из Института искусственного интеллекта AIRI разработали подход, который даёт честный ответ: пока что не очень.

Существующие тесты лидирующие модели проходят почти полностью — там всё гладко. А в рамках нового теста лучшая модель набирает лишь 40 баллов из 100. Это говорит о серьёзных ограничениях в геометрической точности этих систем. Иными словами, нейросети умеют генерировать белки, которые выглядят правдоподобно, но их пространственная структура часто нарушена.

Учёные создали первый в мире набор тестов, который выявляет проблемы, связанные с определением пространственной структуры и физико-химических свойств пептидов. В отличие от существующих подходов, которые обращают внимание на биологические функции белков, новый тест фокусируется именно на их геометрии.

Как это работает? Нейросеть должна проанализировать сегменты белков, содержащие от одного до семи структурных фрагментов, и «достроить» их до полных молекул, не нарушив пространственное расположение. Это позволяет понять не только общий уровень модели, но и определить, на каком этапе она начинает ошибаться.

Тест проверили на 10 наиболее продвинутых системах ИИ. Лучше всего справились модели Genie2, La-Proteina и RFdiffusion. Однако и они решили меньше половины задач. Это свидетельствует о том, что работу этих систем можно значительно улучшить.