06.06.2026
Команда Qwen в Alibaba представила Qwen3.7-Plus — закрытую мультимодальную модель, рассчитанную на работу агента с экраном, графическими интерфейсами, терминалом и кодом. В демонстрациях Qwen агент на ее базе много часов самостоятельно разрабатывал приложение, но заявленные результаты пока в основном основаны на собственных тестах компании.
Команда Qwen в Alibaba представила Qwen3.7-Plus — мультимодальную агентную модель, которая должна работать в цикле «наблюдение — действие»: распознавать изображения и содержимое экрана, управлять графическими интерфейсами и мобильными приложениями, писать код и выполнять команды в терминале.
Главный акцент релиза — не чат, а автоматизация продолжительных задач. В одной из демонстраций Qwen агент на базе Qwen3.7-Plus более 11 часов разрабатывал приложение для изучения английской лексики: подготовил требования, сгенерировал более 10 тыс. строк кода, создал тесты, выполнил GUI-тестирование и сделал более 1000 агентных вызовов.
Qwen также показывает сценарии копирования интерфейса macOS Stocks с генерацией SwiftUI-кода и работы браузерного агента в облачной консоли. Эти примеры стоит рассматривать как демонстрации возможностей, а не как независимую оценку надежности: в собственных бенчмарках компании модель сильнее всего выглядит на понимании экрана и управлении GUI, тогда как результаты на классических мультимодальных и логических тестах неоднородны.
Qwen3.7-Plus доступна через Alibaba Cloud Model Studio как проприетарная модель; открытые веса для нее не опубликованы. Для разработчиков это прежде всего новый API-инструмент для компьютерных и браузерных агентов, а не модель для самостоятельного развертывания.
Источник: qwen.ai