Проблемы с чипами Huawei заставили DeepSeek ещё отложить релиз своей модели искусственного интеллекта R2

Китайская компания DeepSeek, специализирующаяся на искусственном интеллекте, отложила релиз своей новой модели R2 из-за проблем с обучением на чипах Huawei.
В январе 2024 года, после выпуска модели R1, власти Китая поощряли DeepSeek к переходу с чипов Nvidia на процессоры Huawei Ascend. Однако, по словам трёх источников, знакомых с ситуацией, стартап столкнулся с непреодолимыми техническими трудностями при обучении R2 на чипах Ascend. В результате, компания была вынуждена использовать чипы Nvidia для обучения модели и чипы Huawei – для вывода (инференса).
Разница между обучением и выводом важна: обучение – это процесс, в котором модель «учится» на большом наборе данных, а вывод – это использование уже обученной модели для получения прогнозов или ответов, например, на запросы чат-бота.
Задержка релиза напрямую связана с этими трудностями, что уже привело к потере DeepSeek позиций на рынке по сравнению с конкурентами.
Ситуация усугубляется недавними сообщениями Financial Times о том, что Пекин потребовал от китайских технологических компаний обоснование закупок чипов Nvidia H100, стремясь стимулировать использование отечественных альтернатив от Huawei и Cambricon.
По словам инсайдеров отрасли, китайские чипы страдают от проблем со стабильностью, медленной межчиповой связью и менее совершенным программным обеспечением по сравнению с продукцией Nvidia. Несмотря на помощь со стороны Huawei, направившей в офис DeepSeek команду инженеров, компания так и не смогла успешно обучить модель R2 на чипах Ascend. Дальнейшие шаги DeepSeek пока неизвестны.
Фото: NurPhoto / Contributor

15-08-2025 14:10 32