Alibaba выпустила ИИ-модель, способную управлять ПК и смартфоном
Подразделение Alibaba Qwen представило семейство моделей Qwen2.5-VL, которые могут выполнять функции управления ПК и смартфоном, наподобие виртуального помощника OpenAI Operator.
На фоне успехов китайской лаборатории DeepSeek этот проект стал ещё одной значимой разработкой в сфере ИИ. Разработчики утверждают, что Qwen2.5-VL превосходит американские модели, включая GPT-4o от OpenAI, Anthropic Claude 3.5 Sonnet и Google Gemini 2.0 Flash, в задачах по анализу документов, решению математических задач, пониманию видео и ответах на сложные вопросы. Модель также способна извлекать данные из диаграмм и графиков, изучать многочасовые видео и распознавать фрагменты фильмов и сериалов.
Испытать Qwen2.5-VL можно через приложение Alibaba Qwen Chat или загрузить модель на платформе Hugging Face. Однако разработчики подчёркивают, что модель, как и многие другие китайские проекты, избегает комментариев по политическим вопросам, связанным с Пекином.
Источник: https://kod.ru/8792
30-01-2025 15:00 58