На ПМЭФ представили новое поколение экономичных моделей искусственного интеллекта для ноутбуков и смартфонов

Учёные AIRI при поддержке Сбера создали компактные модели ИИ — когнитивное ядро, работающее с внешними базами данных. Система не требует больших мощностей, работает в полтора-два раза быстрее и выложена в открытый доступ, сообщает ТАСС.

На ПМЭФ представили новое поколение экономичных моделей искусственного интеллекта для ноутбуков и смартфонов
magnific.com

Большие языковые модели вроде GPT впечатляют. Но у них есть недостаток: они пытаются вместить все знания мира в свои параметры. Это дорого, энергозатратно и зачастую избыточно. Российские учёные из Института искусственного интеллекта AIRI при поддержке Сбера предложили иной путь. На Петербургском международном экономическом форуме (ПМЭФ) они представили семейство компактных моделей, которые не запоминают факты, а умеют их искать и анализировать.

Идея: меньше параметров — больше логики

Большинство существующих больших языковых моделей развиваются экстенсивно. Каждое новое поколение содержит всё больше параметров и хранит огромный объём знаний во внутренних весах. Такой подход делает системы дорогими в обучении и эксплуатации, а также заставляет ИИ чрезмерно полагаться на свои (иногда устаревшие) знания, игнорируя внешние источники.

Генеральный директор AIRI Иван Оселедец объясняет новый подход:

«Для большинства прикладных задач важнее не объём памяти модели, а её способность рассуждать и опираться на предоставленные данные. Представленный проект — это попытка построить именно такое когнитивное ядро. Это важный шаг к будущему, в котором небольшие модели будут эффективно взаимодействовать с инструментами, а не пытаться хранить весь мир внутри своих параметров.»

Как это работает: Optimal Cognitive Core

Разработка получила название Optimal Cognitive Core. Нейросеть представляет собой компактное когнитивное ядро, которое сосредоточено не на хранении знаний, а на:

  • способности анализировать информацию;

  • построении логических связей между фактами;

  • корректной работе с внешними источниками данных (базы, поисковики, документы).

Модель умеет выполнять роль когнитивного ядра и взаимодействовать с внешними инструментами, не пытаясь «выучить» всё заранее.

Цифры эффективности: быстрее и легче в полтора раза

Опыты показали впечатляющие результаты. Система ИИ, построенная на базе этого подхода:

  • Обрабатывает запросы в полтора-два раза быстрее решений, использующих большие языковые модели.

  • Тратит на это в полтора раза меньше вычислительных ресурсов.

  • Благодаря небольшим размерам её можно запускать на обычном ноутбуке или смартфоне.