Дарья Панфилова

Руководитель направления в управлении корпоративных данных|28 лет
Москва
«Данные — это новая нефть»

— Чем занимается управление корпоративных данных и зачем оно нужно?

— Уже все знают, что данные — это новая нефть. Банки располагают огромным количеством данных, и Сбербанк давно стремится к тому, чтобы использовать их эффективно. До управления существовала дирекция по работе с супермассивами данных, где мы с партнёрами на основе анализа big data делали пилотные проекты. Например, прогнозировали интенсивность потока посетителей в отделениях банка — алгоритм подсказывал, как распределять нагрузку на персонал так, чтобы в пиковые дни клиенты не теряли времени в очередях.

 

— Это была сложная задача?

— Я не знаю, как это определить. Для кого-то random forest (https://habr.com/post/320726/) — сложная модель, а для кого-то раз плюнуть. Это было интересно математически. Мы работали с временными рядами. Например, нам нужно было определить, что такое пиковые дни. В общем, было любопытно посмотреть сезонность, отловить какие-то очевидные и не очень очевидные закономерности.

— Что было после этих пилотов?

— В 2016 году в Сбербанке появилась фабрика данных — комплекс систем, в которых живут данные, где их можно исследовать, строить модели. До фабрики у нас было множество систем, каждая из которых генерировала свои данные. Все они были централизованы и уже в хабе фабрики трансформированы в определённые структуры, с которыми можно работать.

— Какие бывают данные и какие из них самые ценные?

— Их огромное множество. Начиная от логов банкоматов и заканчивая транзакционными данными, данными о клиенте из CRM, информацией о том, что он делает в «Сбербанк Онлайн». Данные — это следы, которые клиент оставляет, взаимодействуя со Сбербанком. Все они ценные. Но для разных моделей нужны разные данные. Чтобы понять, когда вам нужно провести инкассацию банкомата, вам не нужны данные о клиенте. Вам нужно знать, когда положили деньги, сколько, какими купюрами, кто забрал, когда забрал и в какие дни. А что человек женат и у него двое детей… Хотя… Кто знает!

 

Когда строится модель, дата-сайентист (DS) сначала делает предположение о том, какие данные могут подойти. Потом данные достаются, чистятся, подготавливается выборка, скармливается модели. DS смотрит, насколько она эффективна. Если надо, ищет ещё данные. Вообще, 80 % времени дата-сайентисты тратят на то, чтобы найти данные для модели. Они должны быть в хорошем смысле жадными до данных, всегда думать, где что ещё можно откопать.

— Ты тоже была DS?

— Да, я с этого начинала. После окончания факультета ВМК в МГУ пошла работать в телеком — в компанию МТС. Занималась среди прочего дата-майнингом — нахождением интересных закономерностей, неочевидных вещей, которые могут потом пригодиться. И через какое-то время поняла, что мне мало только строить модели. Мне захотелось посмотреть чуть шире, захотелось увидеть продукты, основанные на этих моделях. Потому что модель — это не всё, она должна где-то жить, должны быть системы, основанные на этих моделях. Так я сменила работу, пришла в Сбер и спустя некоторое время стала владельцем продукта, как и хотела. Теперь моя работа больше связана с технологиями, общей инфраструктурой, с тем, как работать с данными, как они должны попадать к нам, как их соединить, чтобы DS было проще в них копаться. Это не само моделирование, а скорее архитектура, инфраструктура и потоки данных.

— Каким продуктом ты владеешь?

— В составе фабрики данных есть лаборатория, которая проводит свои исследования. DS проверяют гипотезы, строят модели, занимаются дата-майнингом. Мой продукт — это сервисы, которые поставляют в эту лабораторию данные. Мы также прототипируем и помогаем собрать витрины данных для дата-сайентистов, потому что хорошо знаем, что, как и с чем соединять. И поддерживаем эти прототипы, пока заказчики не разработают промышленные витрины.

 

— Чему ещё научила тебя работа в Сбербанке?

— Умению договариваться. Сбербанк — большая компания, в ней работает много людей. Здесь я быстро научилась взаимодействовать с другими командами, службой безопасности, администраторами. Чтобы что-то интересное откопать и использовать, нужно уметь договариваться. Ну и без командной работы в Сбербанке никуда, а этому тоже нужно учиться. Уметь распределять задачи, уметь делегировать — это сложно. Но важнее всего, как у тебя устроены мозги. Если ты любопытен, хочешь докопаться до сути — всё будет в порядке. А те, кто относится к своим обязанностям формально, надолго у нас не задерживаются.

Привычки, которые делают меня эффективным работником

  • Привычка доводить начатое дело до конца
  • Привычка разбираться детально, как устроены все процессы
  • Здоровое любопытство и желание засунуть нос в смежные области, посмотреть, как там всё работает, и позаимствовать идеи
  • Жажда постоянно улучшать навыки, учиться новому, читать книги, развивать гибкие и твёрдые навыки (soft skills и hard skills)

— Есть ли в Сбербанке внутренние курсы, на которых можно повысить свой уровень компетенции?

— Есть Академия технологий и данных, которая разрабатывает курсы для d.people, то есть тех, кто работает с данными. Можно изучать data science (науку о данных), всякие алгоритмы, статистику. Кроме того, хорошие курсы по дата-сайенс есть и на онлайн-платформах Coursera и EdX. Или, если вас интересуют смежные области, у нас можно погрузиться в технологию блокчейн, которую Сбербанк сейчас тоже начал применять. Есть профильная лаборатория, и появились курсы об этом. Также есть лаборатории AI (искусственного интеллекта), интернета вещей и робототехники. Так что можно не DS становиться, а специалистом в этих областях.

Сама я фанат новых знаний — постоянно читаю статьи на habr.com и то, что пишут наши подрядчики — компании Oracle, DIS Group. Изучаю новые инструменты: например, что такое OpenStack, как на нём работать и что это может нам дать. Прошла курс по управлению проектами по стандартам IPMA и получила сертификат. Мне понравились у EdX два курса MIT про язык программирования Python. Там учат азам, теорию вероятности рассказывают, в общем, дают основы. В Сбербанке я прошла множество курсов: по владению продуктом, публичным выступлениям, риск-менеджменту, критическому мышлению, эмоциональному интеллекту. У нас есть система Success Factors — выбираешь доступные тебе курсы и записываешься. Что-то преподаётся в Корпоративном университете, что-то можно изучать онлайн — это даже удобнее. Недавно я взяла себе ещё курс по финансам. Не моя тема, но я пытаюсь с ней подружиться. Когда потихонечку с самых основ начинаешь разбирать, всё становится логично и понятно. C математикой ведь так же — когда ты не понимаешь, что такое n-мерные пространства и зачем они нужны, это кажется полной чушью. Но если постепенно вникнуть, в голове всё проясняется.

— Как вообще ты попала в эту область? Ты из математической семьи?

— Мама у меня экономист-финансист-юрист, три в одном. А сестра филолог. Вообще по маминой линии наши предки — врачи. Дедушка с бабушкой были инженерами. А меня всегда тянуло к математике: ещё в школе нравилось решать задачи, участвовать в олимпиадах. Потому что в математике всё понятно и логично. А вот в филологии ничего не понятно. Вот есть стилистическая окраска слова — откуда вы взяли, что оно так окрашено, почему? Или у нас на уроках литературы речь шла о том, что хотел сказать автор, и у литературоведов всегда было мнение на этот счёт. Мне постоянно хотелось спросить: «Откуда вы знаете, вы же с ним не общались!» В гуманитарных науках очень много субъективного, можно трактовать и так, и так. А в математике оно либо работает, либо нет. Хотя говорят, что нужно уметь абстрагироваться от правил, чтобы посмотреть на проблему шире и таким способом решить задачу, которая в сегодняшней парадигме ставит в тупик. У меня не всегда получается, этому надо учиться.

— Какие у тебя карьерные планы и ожидания?

— Мне нравится быть владельцем продукта внутри самых разных технологий. Я люблю работать с данными, осваивать новые платформы. Мне интересны языки программирования и вообще глобальная архитектура данных. Я не отношу себя к узкому профилю — только архитектор или только дата-сайентист. Мне нравится работа, для которой надо понимать много предметных областей. Была б моя воля — разорвалась бы и поучаствовала бы в блокчейне, интернете вещей, роботизации. И ещё я восхищаюсь стратегическим видением Германа Грефа и хотела бы тоже научиться видеть потенциальные направления развития, знать, чего моя команда должна достичь за определённый период. В России очень много возможностей для людей моей профессии. У нас отличные программисты, разработчики, много светлых умов. Тот же FindFace (алгоритм сервиса распознавания лиц) создал мой одногруппник Артём Кухаренко, с которым мы вместе учились на ВМК. Придумал, как оптимизировать алгоритмы, чтобы они работали быстрее и эффективнее, и прославился.

— Чем увлекаешься вне работы?

— Занимаюсь фитнесом, спортом, на танцы хожу — танцую хастл на набережных. Плаваю, путешествую, когда удаётся оторвать себя от очередной интересной задачи и взять отпуск. Хочу научиться серфингу.

Понравилась статья?

Отправь ссылку другу

Задать вопрос
Задать вопрос












Другие истории успеха

Алексей Леванов
Разработчик «Сбербанк Онлайн»
Москва

«В разработке нельзя дойти до совершенства»

Андрей Бакаленко
Руководитель проектов
Москва

«Сбер — это один из самых классных работодателей в России»

Ксения Бубаня
Старший специалист, прошла стажировку Sberseasons
Москва

«В Сбербанке образование поощряется»

Лилия Алексеева
Исполнительный директор
Москва

«В Сбербанке нормально относятся к тому, что сотрудник хочет радикально сменить сферу деятельности: если опытный работник хочет меняться и развиваться, лучше, чтобы его знания оставались в компании, а не уплывали вовне »

Светлана Сучкова
Главный экономист казначейства
Москва

«Лично я отвечаю за то, чтобы вся группа Сбербанка до шести часов вечера получила процентные ставки в восьми валютах по своим продуктам на следующий рабочий день. Это должно быть сделано во что бы то ни стало: пожар, наводнение, падают серверы, не работают диски — всё это не важно»