IT-гиганты переходят от экспериментов с ИИ к утилитарным решениям ради прибыли

OpenAI закрыла убыточный видеогенератор Sora с ежедневными потерями в $1 млн, а Google представила алгоритм TurboQuant, сжимающий память нейросетей в 6 раз.

IT-гиганты переходят от экспериментов с ИИ к утилитарным решениям ради прибыли
Источник фото: ru.freepik.com

Долгое время IT-гиганты соревновались в зрелищности экспериментов, не слишком задумываясь о цене вопроса. Однако два события последних дней зафиксировали тектонический сдвиг: OpenAI закрыла свой видеогенератор Sora, а Google представила алгоритм TurboQuant, радикально снижающий издержки при работе нейросетей. Как сообщает 4pda, рынок устал от бесполезных экспериментов — фокус сместился на прибыльность и практические результаты.

Решение OpenAI стало символом нового времени. Sora, способная генерировать реалистичные видео по текстовому описанию, обходилась компании примерно в $1 млн убытков ежедневно. Слишком дорого для эффектной, но коммерчески неоправданной игрушки. Показательно, что Disney, ранее рассматривавшая возможность инвестировать $1 млрд в OpenAI для создания роликов с собственными персонажами, отменила сделку. Ресурсы компании теперь перераспределяются в пользу перспективных B2B-направлений — ИИ-агентов для бизнеса и программирования, где реальный спрос действительно существует.

На этом фоне разработка Google выглядит как технологический прорыв с далеко идущими экономическими последствиями. Алгоритм TurboQuant позволяет сжимать рабочую память ИИ (KV-кэш) до 3 бит без потери точности и без необходимости дообучения моделей. В бенчмарках на открытых моделях Gemma, Mistral и Llama-3.1-8B технология показала уменьшение потребляемой памяти минимум в 6 раз.

Генеральный директор Cloudflare назвал это «моментом DeepSeek от Google». Рынок памяти отреагировал мгновенно: акции южнокорейской SK Hynix и американской Micron Technology пошли вниз. Спрос на серверную оперативную память для инференса может резко сократиться, и инвесторы это уже закладывают в котировки.

Парадокс, однако, в том, что подобные разработки бьют по бизнес-моделям самих ИИ-гигантов. Сегодня главная преграда для запуска мощных нейросетей с большим контекстом на домашнем ПК — нехватка видеопамяти. Если алгоритмы экстремального сжатия станут массовыми, любой пользователь сможет запускать сложные модели локально, на обычных видеокартах. Это снизит стимул оплачивать дорогие подписки и API-токены, добавив бонусы в виде приватности и отсутствия цензуры.