Это затраты подразделения MWS AI на дообучение моделей семейства Cotype, их настройку под специализированные бизнес-задачи и вывод в промышленную эксплуатацию.
В основе LLM Cotype первого поколения была опенсорсная французская LLM Mistral, второе поколение Cotype Pro 2 основано на китайской LLM Qwen 2.5. У MWS AI есть и другие LLM, которые использует помощник для написания компьютерного кода – Kodify. Об этом сообщают Ведомости.
Использование в качестве основы опенсорсных зарубежных моделей – способ сэкономить, получить необходимую LLM примерно за 10% от необходимых расходов, если делать все с нуля. Считается, что LLM собственной разработки в России есть только у Яндекса и Сбера.
Для работы LLM (инференса) требуются немалые вычислительные ресурсы – хотя бы несколько тысяч карт класса Nvidia A100. Общее их число у Яндекса и Сбера – порядка 10 тысяч. Другие участники рынка, которые хотят дообучить опенсорсную модель, покупают железо, необходимое для инференса, а для дообучения арендуют вычислительные ресурсы. Скорее всего, в МТС так и поступили.
В целом, если говорить о дообучении опенсорсной модели, то 1 млрд рублей – вполне адекватная задаче сумма, если речь о российском рынке. Это, конечно, намного меньше, чем тратят на обучение передовых моделей зарубежные компании, чьи расходы, если пересчитать их в рубли, измеряются в десятках и сотнях миллиардов. Считается, что расходы только Amazon на разработки в связи с AI в 2025 году достигнут $100 млрд. Даже если эта сумма немного завышена, очевидно, что расходы американских компаний (Amazon, Microsoft, Alphabet и т.п.) на ИИ просто несопоставимы по объемам с тем, что могут инвестировать в эту тему в России.
Тем не менее, эти усилия МТС весьма значимы. От проекта MWS ожидают не какого-то абстрактного лидерства на конкурентном рынке, а практической пользы, поэтому можно говорить о том, что эти вложения рациональны. В теории модель поможет MWS снизить зависимость от зарубежных моделей. У компании есть шанс вернуть инвестиции за счет использования этой модели для автоматизации бизнеса, повышения качества услуг, степени удовлетворенности клиентов компании.
По данным Ассоциации Финтех, в российский рынок AI крупные игроки инвестировали не менее 650 млрд руб. за последние 10 лет. Объем российского рынка AI за 2024 год превысил 780 млрд руб. А до 2030 года, согласно прогнозам, совокупная мощность российских ЦОД AI должна составить более 70 тысяч условных Nvidia A100.
Разрыв с США и Китаем в России пока что помогает сокращать качественная отечественная математика и хорошие алгоритмисты. Но сможет ли этот фактор и далее оставаться существенным, если не будет подтянута современная "матчасть"? Вероятно, основную ставку следует делать уже на фотонику и квантовые компьютеры.
--
Комментариев нет:
Отправить комментарий