В Билайн готовят решения для инференса ИИ-моделей

Оператор занимается разработкой софта, который станет частью ПАК, на котором заказчики смогут развернуть ИИ-модели, в том числе, арендованные. Такие ПАК могут быть установлены в ЦОД оператора, что позволит продавать доступ к ним как B2B-услугу. Тему сегодня предлагают Ведомости.

По данным неназванного источника газеты, Билайн ведет обсуждение с таким производителем как OpenYard. Впрочем, это не единственный производитель серверов, пригодных для инференса, можно вспомнить хотя бы продукты Gagar>N. Проблема с российскими серверами с GPU-ускорителями – отсутствие «системной истории», а также предположительно более высокая полная стоимость владения, чем в случае с зарубежными брендами.

«Мы ощущаем рост запроса на аренду стоек с GPU-серверами. Все этого очень хотят, но не все готовы за это платить», – заявил заместитель гендиректора по IT «Вымпелкома» (бренд «Билайн») Антон Рубенчик на встрече с представителями медиа и телеком-аналитиками в Ярославле.

Что могу сказать по этой теме.

Зачем нужна такая доработка решений?

Обычно решения "из коробки" не подходят по ряду причин, например, нужна интеграция в инфраструктуру оператора, а у нее есть специфика; решения могут не соответствовать требованиям безопасности или, скажем, желательна оптимизация ПАК под конкретные задачи. В целом, решения под инференс – специфические, существенно более мощные и более энергопотребляющие, чем типовые сервера. К ним предъявляются повышенные требования по надежности.

Насколько это выгодно для обеих компаний?

Продавцу выгодно, чтобы получить объемный контракт, покупателю - чтобы получить устраивающий его продукт, это дает перспективы дальнейшей продажи продукта не только для нужд Билайна, но и другим клиентам. Кроме того, для обеих сторон, это бесценный опыт "прокачки" команд.

Сколько это может стоить и как много времени уйдет на реализацию такой идеи?

Смотря, насколько глубоко требуется что-то дорабатывать. Можно оценить в десятки или единицы сотен миллионов рублей. Проект может занять от полугода до года.

Кто сейчас обладает подобными решениями, кто разрабатывает, как среди российских производителей, так и среди зарубежных?

Среди зарубежных - Nvidia, Intel, AMD, AWS, а также некоторые китайские производители. И сотни, если не тысячи стартапов работают в этой теме. В России - Сбер, Яндекс, VK, OpenYard, DataРу, GAGAR>N.

Кто может быть заинтересован в таких решениях?

Крупные телеком-операторы, финансовый сектор (банки), ритейл (марктеплейсы), здравоохранение, госструктуры, производство и промышленность, в перспективе - образование, медиа.

-- 

Популярные сообщения

Желающие следить за новостями блога, могут подписаться на рассылку на follow.it (отписаться вы сможете в один клик). 

Еще можно подписаться на Telegram-каналы @abloud62 @abloudrealtime, где также дублируются анонсы практически всех новостей блога. 

 

Translate