Интервью: Сергей Марин, Билайн: Как Big Data входят в повседневную практику оператора


В этом году все чаще приходится слышать о Big data. То в Slon.ru статья на эту тему попалась на глаза, то сам что-то малоформатное писал, а уж на MWC2014 тема была представлена, что называется "во весь рост". Подробно побеседовал о "бигдейте" с Сергеем Мариным, руководителем программы Big Data в Билайн, об успешно реализованных проектах. Получилось интервью. 
Википедия: Большие данные (Big Data) – серия подходов, инструментов и методов обработки структурированных и неструктурированных данных огромных объёмов и значительного многообразия для получения воспринимаемых человеком результатов, эффективных в условиях непрерывного прироста, распределения по многочисленным узлам вычислительной сети, сформировавшихся в конце 2000-х годов, альтернативных традиционным системам управления базами данных и решениям класса Business Intelligence.

АБ: Тема Big Data, хотя и появилась в конце 2008 года, но все еще сравнительно новая, даже термин этот вряд ли на сегодня имеет единственное толкование, приведенное выше. Что для вас BigData? Когда началось внедрение подходов Big Data в Вымпелкоме?


Сергей Марин, Билайн, беседуем о BigData в офисе компании 

СМ: Начну с того, что я не согласен с определением Википедии. Там говорится, что Big Data - это методы обработки больших объемов данных и значительного многообразия. Это не изюминка. Это все верно, но это все равно, что сказать, что машина - это двигатель. Большие данные - это доступность данных для каждого, это возможность всей компании работать, учитывая те данные, которые создаются внутри этой компании. Раньше, когда не было Big Data и был только BI, был доступен только ограниченный набор наиболее востребованных данных. Теперь это больше не так. Это можно понять из сравнения традиционной энциклопедии с Интернетом. Предыдущие технологии это как традиционная печатная энциклопедия: мы можем найти только то, что кто-то заранее для нас выбрал. Big Data это как Интернет - огромное количество доступной информации. И каждый выбирает то, что ему нужно.

Бизнес-аналитикой мы активно занимались еще с 2005 года, а во «взрослые игры» играем с января 2013 года, когда в Билайн была запущена программа работы с BigData. Проектом пару месяцев занимались в IT-блоке, но вскоре стало понятно, что для успеха программы ее следует выделить, поднять на уровень стратегического проекта. Стратегическими у нас называются проекты, действие которых распространяется на всю компанию. В компании действует блок корпоративной стратегии, которым сейчас руководит Артем Ниц, подчинающийся непосредственно Михаилу Слободину, генеральному директору компании. 


АБ: Почему начали заниматься темой Big Data?

СМ: Причин тому было несколько, назову основные. Во-первых, необходимость роста бизнеса за пределы традиционных направлений. Во-вторых, монетизация тех данных, которые уже собирала компания. Под монетизацией в данном случае имелось в виду создание добавочной стоимости для абонента, оптимизация качества работы.

Со временем, эти цели трансформировались в более конкретные. Детальное знание абонента – вот краеугольный камень. Информация о том, что с ним сейчас происходит, в плане пользования услугами сети, причем почти в реальном времени, с допустимой задержкой в несколько минут. Что это за информация – такие события, как звонки, местоположение в момент вызова, качество работы сети в точке вызова в момент вызова.

Кроме того, для нас Big Data – это возможность уйти от долгих проектных циклов. Java-методология давно известна, но в аналитике ее стали применять сравнительно недавно. При решении каких-то аналитических задач традиционными методами, заранее не получается сказать, что будет работать не так. Иногда требуется несколько месяцев для анализа какой-то возникшей неприятной ситуации методами BI (прим АБ: бизнес-аналитики) с использованием реляционной базы данных. Подход Big Data совсем иной, поскольку данные собираются в реальном времени, хранятся без обработки, а обрабатываются тогда и так, как это требуется исходя из текущих задач, которые могут постоянно меняться. 


АБ: Можете привести примеры?

СМ: Я недавно был на конференции в Амстердаме и встречался с компанией, которая делала продвижение LTE для одного европейского оператора. Кампания называлась «LTE where it matters» (Прим. АБ: «LTE там, где это уместно»). Идея заключалась в том, что если сеть «видит», что устройство с поддержкой LTE постоянно находится в зоне хорошего покрытия LTE, что может наблюдаться, если владелец такого устройства живет или работает в таком месте, этому владельцу следует предложить подключить LTE, заменив SIM-карту. У партнеров это заняло 6 месяцев! У нас этот проект тоже был реализован в рамках пилота. Только у нас это заняло 3 недели. Столь ощутимая разница во времени внедрения достигается благодаря изменению концепции работы с данными, благодаря переходу на Big Data.

В нашей реализации проекта удалось обнаружить немало людей с устройствами с поддержкой LTE, которые этим функционалом не пользуются, возможно, даже не знают о нем. Среди таких устройств, например, множество китайских смартфонов. В Вымпелкоме есть подразделение, которое занимается анализом устройств, используемых абонентами. Это делается из соображений оптимизации оказания услуг. Например, если число аппаратов одной модели начинает быть больше 500, мы начинаем поддерживать такие устройства, в частности, запрашиваем информацию у производителя, чтобы уметь ответить на возможные вопросы клиента.

Подход Big Data хорош еще тем, что всегда можно измерить эффект любой рекламной кампании. Например, мы наблюдали в реальном времени, как люди подключают LTE-симки взамен обычных после наших сообщений с предложением бесплатной замены сим-карты. 
 

АБ: Кому доступны результаты работы с Big Data в компании, кто способен их использовать в практических целях?

СМ: Хороший вопрос. Данные мало собрать, мало обработать, их важно представить в формате, доступном массовому пользователю. Ранее для этого принято было использовать профессиональные решения с ограниченным спектром применения. Например, решение, позволяющее при правильном его использовании выйти на рост продаж компании. Такие решения отличаются двумя существенными недостатками. Несмотря на «узкую направленность», эти решения дорогие. А для того, чтобы его перенацелить для решения другой задачи, требуются дополнительные затраты времени и средств.

Big Data позволяет действовать по-другому! Одни и те же данные используются для достижения различных целей разными подразделениями компании. Собираемая разными подразделениями информация идет в «общий котел» данных, что увеличивает возможности всех подразделений, усиливает бизнес компании в целом.

Решения, создаваемые на основе подхода Big Data, можно создавать оперативно, они, как правило, легко справляются с решением сразу нескольких задач и их обычно несложно перепрофилировать под новые цели. 


АБ: Каким образом?

СМ: Мы, например, работаем с Правительством Москвы, в проекте «Научно-исследовательского и проектного института Генерального плана города Москвы», предоставляем обезличенные статистические данные о нагрузках сети сотовой связи по районам, что помогает уточнить данные по конкретным районам, потоки нагрузки между районами, что важно для развития транспортной инфраструктуры. В свою очередь Вымпелком тоже получил немало полезных для нас данных, которые помогают нам лучше узнавать потребности клиента. Общий вывод – в процессе сбора данных формируется некая интегральная информация, которой, в отличие от персональных данных абонентов и информации об оказанных услугах , можно делиться. 
 

АБ: А как все это устроено? Как собираете данные, где они сохраняются?

СМ: Можно говорить о структуре из 5 частей.



Есть источники данных. Подход в том, чтобы интегрировать все существующие источники данных, к каким бы подразделениям они не относились. Даже не зная, понадобятся нам эти данные или нет. В операторских телеком-компаниях обычно собирают событийные данные (вызовы, обрывы и т.п.), геолокационные, данные CRM, данные биллинга, данные о пополнении счета.

Фабрика идей. Группа сотрудников, которые занимаются генерацией новых идей, новых кейсов для Big Data, а также их предварительной оценкой – насколько они могут иметь смысл, прежде всего, финансово. И к этому всегда привлекаются представители других блоков – важно вовлечение, сопричастность потенциальных заказчиков результатов нашей работы. Они должны ощутить, что конкретно для их подразделения может дать использование нового подхода.

Планирование кампании. Первоначально по любому кейсу мы проводим пилот, соответственно, его нужно планировать.

Реализация пилота и его оценка. Для успешных пилотов следующим этапом становится перевод пилота в продуктив, которым подразделения компании смогут пользоваться в коммерческих целях.

Платформа. В систему работы с Big Data в Вымпелкоме интегрировано уже значительное число так называемых «узлов», машин, занимающихся сбором и анализом данных почти в реальном времени. Будем и далее наращивать эту сеть. Например, у компании Verizon уже около пятисот узлов задействовано в аналогичной системе.

Платформа у нас разделена на кластер для пилотов (песочницу) и кластер для продуктивов. Принципиально они почти ничем не отличаются, кроме мощности и поддержки. Кластер для продуктивов более мощный, здесь уже не место для экспериментов, это «мельница» для концентрации и обработки данных. А в песочнице отрабатываются новые идеи, причем к ней подключены все источники данных, как и к кластеру для продуктивов.

Как я уже отмечал, вклад в работу вносит не только стратегичский блок, мы подключаем к ней представителей других блоков в формате рабочих групп, это позволяет лучше понимать задачи других блоков, обеспечивать для них прозрачность нашей работы, быстрее делиться полезными для них результатами.

На выходе системы - каналы коммуникации с клиентом, с которыми мы стараемся интегрироваться – это SMS-канал, это возможности обзвона клиентов, CRM, «личный кабинет», iVR, мобильное приложение. Есть ряд задумок о которых пока рассказать не готов, чтобы не облегчать жизнь конкурентам.  

Встреча рабочей группы. Все вполне буднично, никаких
гигантских экранов с мгновенной визуализацией Big Data
Здесь формулируются "правильные запросы" к системе. 

АБ: У фабрики идей - ответственная роль, ведь собрать данные - это даже не полдела, наверное. А вот задать системе правильный вопрос, это намного более сложная задача, иначе получится, что на «главный вопрос жизни, вселенной и всего такого» ответом будет 42, как в известном фильме.

СМ: Конечно! В структуре «фабрики идей» можно выделить несколько ролей. Прежде всего – это менеджеры по продуктам. Они генерят новые кейсы, затем отвечают за конкретные кейсы,.Выполняют дизайн конкретной кампании. Отвечают в частности за коммуникацию с заказчиками, ведь у каждого проекта должен быть свой «покупатель», которому кейс предположительно должен принести пользу.

Также у нас есть так называемые статистические аналитики, которые занимаются вычислениями, непосредственно работают с Big Data. Сейчас набираем маркетологов, которые будут помогать нам, к примеру, выделять сегменты. 


АБ: Сколько людей занимается темой Big Data в Билайн?

СМ: В данном случае очень сложно говорить о конкретной цифре. Слишком много сфер «завязано» на этот проект. Здесь и представители IT-блока (причем, физически часть людей находится в Новосибирске), и наши «фабриканты», генерирующие идеи использования, и новая часть, состоящая из маркетологов, а также менеджеры проектов по отдельным направлениям.

Часть сотрудников занимаются только этим проектом, часть людей приходят в команду временно, на проектной основе. 


АБ: К каким направлениям деятельности компании Вымпелком вы применяете подход Big Data?

СМ: Сейчас у нас 10 областей.



Деление условное, для удобства работы. Клиентский опыт, развитие сети, контакт-центр, удержание, дополнительные продажи, антиспам, антифрод, внешняя аналитика (для третьих сторон), m2m, мобильный маркетинг и дополнительные сервисы. 
 

АБ: Можете поделиться каким-либо из кейсов подробнее?

СМ: Конечно. Например, в области клиентского опыта сейчас запускается пилот, в рамках которого мы анализируем потоки клиентов в перегруженные офисы продаж, понимаем, откуда приезжают в этот офис клиенты. Для этого используем данные геолокации. Затем проводим целевые информационные кампании, - клиенты получают информацию о других офисах, которые для них предположительно более удобны.

В уже упомянутом выше кейсе по продвижению LTE мы владельцам устройств с поддержкой LTE высылали SMS с рекомендацией зайти в ближайший офис, где клиенту поменяют SIM-карту на карту с поддержкой LTE и подскажут, как подключиться. Кейс сложился, отклик клиентов оказался вдвое выше средних цифр. 


АБ: А другие удачные кейсы есть?

СМ: Конечно. Например, мы анализируем поток наших клиентов в международных аэропортах. Выделяем тех, кто приехал в аэропорт и не является жителем близлежайшего региона. Кроме того, нужно постараться «отсечь» всех, кто там часто или постоянно бывает – сотрудников аэропорта, таксистов. Также отсекаем тех, кто только что прилетел из-за границы. Большинство оставшихся – это те, кто собирается отправиться в поездку за границу в ближайшие часы. Им уместно предложить подключить одну из роуминговых опций, например, Мультипасс, чтобы клиент мог сэкономить на своих звонках и SMS за границей.

Традиционно эту задачу решают отправлением SMS, когда клиент уже оказывается за рубежом. Но там многие уже не хотят, например, слушать iVR, да и вообще зачастую не до того. А пока человек в аэропорту отлета, у него обычно есть время, чтобы разобраться в сути предложения и подключить необходимую ему опцию. 


АБ: Пользуются предложением?

СМ: Безусловно. Отклик в 4 раза выше средней реакции на SMS-информирование. 


АБ: Вы еще про удержание клиентов упоминали, как здесь работает Big Data?

СМ: Мы анализируем смену SIM-карт в дорогих устройствах. Если наблюдаем, что наша симка перекочевала, скажем, из iPhone 5s в какую-нибудь «звонилку», предполагаем, что пользователь поставил в свой iPhone симку другого оператора. В этом случае ему уместно позвонить и предложить какой-то интересный для его профиля потребления услуг тариф. Кого-то это стимулирует изменить решение и остаться с нами. Пока что мы еще обкатываем это предложение, смотрим на первые результаты, хотим понять, что получается с этим кейсом в дальнейшем. 


АБ: Сергей, не поделитесь какими-то планами на ближайшее будущее, чем еще может помочь Big Data в бизнесе Билайн?

СМ: Тема практически неисчерпаемая. Мы планируем, например, улучшить подсчеты оттока. Ведь сейчас любой из вновь подключающихся к сети может быть бывшим клиентом «Билайн». Соответственно, нужно выстраивать политику общения с таким клиентом, с учетом уже накопленных о нем ранее знаний.

Развитие этой темы – «привязка» к абоненту нескольких его устройств, независимо от того, на кого они формально записаны. По анализу Big Data, вызываемых номеров, средней продолжительности разговора и т.п. можно статистически выявлять пользователя, который использует несколько разных устройств с разными сим-картами – и делать ему интересные для такого профиля пользования предложения. Это в планах пока.

==

Не устаю поражаться, какие все более сложные технологии стоят за внешне простой идеей обеспечения для всех желающих доступной и удобной мобильной связи и ШПД в любом месте и в любое время. Но без использования всех последних достижений уже не получится работать на конкурентном рынке сотовой связи. В этом смысле приятно видеть, что Билайн внедряет столь передовые решения, как Big data в повседневную практику компании. Надеюсь, что положительный эффект от этого постепенно ощутят на себе абоненты компании!

Комментариев нет:

Популярные сообщения

Желающие следить за новостями блога, могут подписаться на рассылку на follow.it (отписаться вы сможете в один клик). 

Еще можно подписаться на Telegram-каналы @abloud62 @abloudrealtime, где также дублируются анонсы практически всех новостей блога. 

 

Translate