Российские ученые ускорили работу нейросетей для генерации изображений в разы

Исследователи Yandex Research и НИУ ВШЭ разработали метод, ускоряющий генерацию изображений нейросетями с нескольких секунд до 0,3–0,4 секунды.

Команда из Yandex Research и НИУ ВШЭ разработала подход, который в несколько раз ускоряет работу генеративных систем искусственного интеллекта. Как сообщила пресс-служба Yandex Research, время создания картинки сокращается с нескольких секунд до 0,3–0,4 секунды. При этом визуальное качество не страдает.

Чтобы понять масштаб прорыва, нужно заглянуть в «мозг» современной нейросети. Существующие диффузионные модели (вроде Stable Diffusion) работают как художник-пуантилист. Сначала они набрасывают общую структуру — хаотичные пятна. Потом шаг за шагом, от 20 до 50 этапов, прорисовывают детали. Каждый шаг требует времени и энергии. Быстро, но не мгновенно.

Российские ученые предложили гениально простую оптимизацию в двух направлениях.

Первое. Зачем рисовать мелкие ветки на дереве, если ты еще не нарисовал сам ствол? Исследователи решили снижать разрешение на первых шагах генерации, когда мелкие детали все равно не видны. Сначала грубый набросок в низком качестве, потом — финальная шлифовка.

Второе. Они создали метод «учитель-ученик». Крупные системы (например, FLUX и Stable Diffusion) выступают в роли опытного мастера. Более простая модель-студент наблюдает за тем, как учитель «видит» изображение на своих внутренних уровнях обработки, и учится делать то же самое, но быстрее. Специальный математический метод сравнивает эти два «видения» и ускоряет обучение в разы.

Эксперименты подтвердили: метод работает не только для картинок, но и для видеороликов. Пользователи не заметили разницы в качестве, а автоматические метрики показали сохранение всех параметров.