ИИ становится умнее и дешевле: Microsoft и Tencent нашли способ оптимизировать работу нейросетей

Microsoft и Tencent представили инновационные технологии, которые повышают эффективность искусственного интеллекта без увеличения затрат.

Гонка за искусственным интеллектом выходит на новый уровень — теперь конкуренция смещается в область эффективности, а не сырой вычислительной мощности. Исследовательские подразделения Microsoft и китайской Tencent практически одновременно представили технологии, которые позволяют нейросетям работать умнее, потребляя меньше ресурсов.

Microsoft анонсировала систему Team of Thoughts (команда мыслей). В основе подхода лежит центральный оркестратор, который управляет набором разнородных AI-агентов и подключает их выборочно для решения отдельных этапов задачи. Два ключевых механизма обеспечивают эффективность: калибровка выбирает оптимальную модель для роли оркестратора, а самооценка позволяет агентам обозначать свои сильные стороны. В результате система в реальном времени подбирает нужного исполнителя для каждого шага.

Результаты тестирования впечатляют. На бенчмарке AIME24 Team of Thoughts достигла 96,67%, а на LiveCodeBench — 72,53%, значительно обойдя однородные базовые методы. Главное преимущество — оркестратор активирует только тех агентов, которые действительно нужны, направляя мощности туда, где они дают максимальный эффект.

Tencent пошла другим путем, разработав технологию CogRouter. Система позволяет AI-агентам адаптировать глубину рассуждений в зависимости от сложности задачи. Она переключается между четырьмя когнитивными режимами — от быстрых реакций до стратегического анализа — и задействует ресурсоемкие вычисления только тогда, когда это действительно оправдано.

Двухэтапное обучение лежит в основе подхода. Сначала модель осваивает различные уровни мышления, формируя устойчивые шаблоны рассуждений. Затем система поощряет глубокий анализ только в тех шагах, где он повышает уверенность. Тесты на платформах ALFWorld и ScienceWorld показали: модель Qwen2.5−7B достигла 82,3% успешных решений, превзойдя показатели GPT-4o и o3. При этом она использовала на 62% меньше токенов по сравнению с классическими методами, сохранив более высокую точность.

Эксперты подчеркивают: такие подходы делают AI-агентов практичными для реальных продуктов, где стоимость инференса напрямую влияет на масштабируемость. Это открывает путь к более широкому внедрению ИИ в бизнес-процессы и повседневную жизнь.