В детстве – научная фантастика, Стругацкие и мечта стать ученым. Через 20 лет – PhD in Computer Science, исследования и преподавание в Тартуском университете в Эстонии, амбициозные проекты на стыке машинного обучения, искусственного интеллекта, биоинформатики и фармакогенетики.
Новая героиня проекта «Полчаса с выпускником» – Елена Сюгис, выпускница СПбГУТ 2008 года. Она рассказывает свою историю – о поиске любимого дела, работе на трех языках, женщинах в науке и роли машинного обучения в современной медицине.
– Как вы попали в «Бонч»? Что привело вас в технический вуз?
– Я училась в физико-математической школе с упором на технические предметы, а еще мне нравились биология и английский, я ходила на олимпиады. Было логично искать свою специальность в технической сфере. У меня было три выбора. Мне нравились физика и физические специальности, особенно ядерная физика, но я подумала, что, наверное, сложно будет профессионально реализоваться, будет ограниченный спектр мест, где можно трудоустроиться. Второе направление – программирование. И третье – телекоммуникации, которые я для себя открыла. Я очень тщательно подходила к выбору программ, вузов, и телекоммуникации стали для меня интересным компромиссом между математикой, физикой и программированием. Я начала сужать пространство поиска, и выбор пал на «Бонч». Готовилась к поступлению на заочных курсах, выбрала программу бакалавриата и магистратуры. В Европе эта система работала достаточно давно, а в России она только зарождалась. Четыре года ты учишь общую базу, а потом осознанно выбираешь специализацию. Мне такая логика понравилась.
– И какой это был факультет?
– Департамент фундаментальной подготовки [сегодня – факультет фундаментальной подготовки]. Только он на тот момент предлагал магистратуру. Сейчас выбор богатый, а раньше учили, в основном, специалистов. У меня по сути был один выбор: я хотела в магистратуру, а попасть в нее можно было через бакалавриат ДФП.
– Как началась ваша карьера, как вы перешли к исследованиям? Это была работа в Петербурге или сразу в Эстонии?
– Во время учебы я работала в ЛОНИИРе, потом – в Российском институте радионавигации и времени. Когда я писала диплом в магистратуре факультета РС, РВ и МТ [сегодня – РТС], Лев Маркович Баскин сказал: «Я вижу, тебе скучно! Хочешь познакомлю тебя с хорошим человеком?». Конечно, хочу! Он познакомил меня с Валерием Ивановичем Коржиком с кафедры защиты информации, с которым мы написали научную статью – так началась моя научная работа. В магистратуре я подустала от учебы – все-таки шесть лет, но в принципе я всегда хотела заниматься наукой, научной деятельностью. Для меня это зависимость – хочется, чтобы мозг работал постоянно, чтобы было что-то новое! Я ушла в «МегаФон», но скоро поняла, что мне нужно что-то еще – мозг не остановить. Когда я окончила магистратуру, я дала себе время и через полтора года созрела – поняла, что нужно идти дальше. Ко всему прочему мистическими путями YouTube я натолкнулась на лекцию по биоинформатике профессора Яака Вило, который впоследствии стал моим научным руководителем в Тартуском университете! Для меня биоинформатика была чем-то непонятным, но с первых слов я поняла, что – Oh My God – это то, что я хочу делать! Там можно было совместить мою школьную любовь к биологии и все мои технические скиллы. Знание математики, программирования – это все нужно, оказывается, все применяется, и это так круто! Для меня это был просто вынос мозга! (смеется). Я поняла, что у меня все сложилось, мне нужно туда. Написала руководителю, начала выяснять информацию о программах, поступлении в докторантуру, стипендиях. Это было, конечно, очень муторно, но все сложилось удачно.
– И какой была тема вашей докторской диссертации на степень PhD in Computer Science?
– Сначала это была тема «Регулирующие сети стволовых клеток». Клетки можно перепрограммировать в состояние подобно стволовым. Они обладают свойством плюрипотентности и могут неограниченно делиться, их можно направлять. Ты берешь клетку кожи и получаешь из нее, например, клетку крови. Моей задачей было исследовать эти регуляторные сети. Но, как любая научная работа, исследование может вывести немного в другую тему. Моя финальная работа была в большей степени посвящена интеграции данных и анализу разных типов данных с использованием машинного обучения. Тема докторской диссертации звучит так: “Integration Methods for Heterogeneous Biological Data”. У меня было несколько исследований: мы брали много типов данных, совмещали их в моделях. Это была нетривиальная задача – нужно было учитывать нюансы, откуда данные пришли, как хорошо они были собраны. Надо было на основе хорошо разработанных экспериментов подобрать подходящие методы анализа, построить математические модели.
– А как сейчас официально звучит ваша должность?
– Сейчас у меня их две. Первая – Research Fellow in Bioinformatics (исследователь), вторая – Software Development Quality Manager (менеджер по качеству разработки программного обеспечения) в центре персонализированной медицины, институте информатики Тартуского университета.
– На каком языке вы говорите: эстонский, русский, английский?
– В основном, на эстонском. Второй по популярности – английский, третий – русский. Но в ротации всегда три языка, и это, конечно, иногда сбивает. Постоянно переключаешься с языками, возникает задержка в словах. Вспоминаешь подходящее слово, и оно всплывает на каком-то другом языке, когда ты его вообще не ждешь. Иногда слова заменяются, и сложно вспомнить что-то на конкретном языке – будто в другом языке есть более подходящее по смыслу слово. В одном языке тебе надо фразу целую сказать, а в другом – просто слово.
– А вы в большей степени занимаетесь исследованиями или преподаете?
– И исследованиями, и преподаю. Сейчас занимаюсь онлайн-образованием – делаю курсы Massive Open Online Courses (массовые открытые онлайн-курсы). Это не контактное обучение, когда ты учишь кого-то дистанционно, а полный онлайн-курс с практиками и тестами, в записи.
– Сейчас это растет быстро и заметно.
– Я уходила работать в компанию, а в прошлом году вернулась в университет. За год я выпустила два больших онлайн-курса. Делать это сложно, но я собрала команду, и мы все успели. У нас запустился во второй раз курс по искусственному интеллекту на эстонском языке. Эстонских онлайн-курсов ни по искусственному интеллекту, ни по Data Science просто не было, все было только на английском.
– Не можем не спросить – вы учили эстонский с детства или пришлось обучаться по приезде?
– Учила на практике, когда переехала в Эстонию. Часть моей семьи живет в Эстонии, но семья у меня русская, русскоговорящая. И не было практически никого, с кем можно было бы говорить на эстонском в детстве.
– Давайте поговорим о женщинах в науке. В феврале ЮНЕСКО отмечает Международный день женщин и девочек в науке. Вы ставили специальный значок об этом у себя в facebook. Какова роль женщин в науке и насколько они заметны? Почему вы ставили этот значок? Что лично для вас это значит?
– Хороший вопрос… Для меня это означает, наверное, поддержку, способ подсветить то, что в науке достаточно много женщин, которые часто не выходят на первый план. Сейчас очень много примеров женщин в науке, особенно в искусственном интеллекте, в Data Science. Эта область родилась из математики, статистики и информатики, где было много женщин-ученых. Много классных специалистов переключилось на новую область, переквалифицировалось. Для меня самый яркий интересный пример – это Дафна Коллер, профессор Стэнфордского университета. У нее есть своя компания Insitro, она одна из основательниц Coursera и вообще очень классная. В ней такое сочетание и научной деятельности, и преподавательской, и еще она предприниматель.
– Здорово.
– Я смотрела статистику. Если брать по Европе, в 2018 году в науке и инженерии было пропорциональное соотношение мужчин и женщин, 41% – женщины. Это не единицы женщин, которые занимаются наукой. Мне кажется, это нужно чаще подсвечивать – говорить о том, чем ты занимаешься. Я бы не сказала, что у нас в комьюнити есть дискриминация, но все же иногда прослеживается. Наверное, науку тоже не стоит обобщать – надо смотреть на отдельные области. В математике/информатике, мне кажется, нет дискриминации. Или, может быть, это мой замыленный взгляд: когда ты внутри системы, тебе сложно увидеть проблему, для тебя это является рутиной. Я, может быть, не вижу чего-то, но на себе я дискриминацию не замечаю.
– Хорошо. Если вернуться к университету телекоммуникаций – с кем вы поддерживаете связи? Что вспоминаете из университетской практики?
– Общаюсь с одногруппниками и ребятами с потока. Некоторые живут в разных странах, поэтому нам сложновато постоянно поддерживать общение. Помню классный студсовет, это было очень весело. А еще мне очень сильно запомнилась фраза Евгения Андреевича Зинкевича, нашего преподавателя по матанализу. После какого-то очередного экзамена он мне сказал: «Я вижу, что из вас получится хороший ученый!». Для меня это был знак качества, это очень повлияло на меня.
– Конечно, такие слова поддержки! А в Россию приезжаете?
– Приезжаю. Но сейчас границы закрыты.
– Интересно ваше увлечение бальными танцами. Вы танцуете все виды танцев?
– Я танцую европейскую программу. Когда люди узнают об этом, они начинают следить на фейсбуке и болеть за меня на соревнованиях.
– Вы продолжаете заниматься, участвовать в соревнования?
– Сейчас уже нет, потому что мой танцевальный партнер поменял работу, ему приходится часто путешествовать, и у меня большая нагрузка в университете. В 2017 году мы выиграли чемпионат Эстонии и решили взять паузу. Возможно начнем заниматься снова, но сейчас мешает коронавирус.
– Какой совет вы могли бы дать выпускникам школ или университетов насчет профессионального развития?
– Есть такая схема: «хочу – могу – надо». Нужно определиться, что тебе действительно нравится делать, а не то, что навязали родители или кто-то еще. Понять, какие у тебя есть скиллы и что требуется на рынке сейчас. И найти максимальное пересечение этих трех областей. Не делать из этого абстракцию, а реально понять – посидеть, поковыряться, поразбираться в себе. Если видишь позицию или направление, на которое хочешь попасть, посмотри, каких скиллов не хватает. Все это можно выучить. Идея в том, что навыки – это то, что мы можем получить, что мы можем выучить, добрать! А если в компании из тебя будут выжимать все соки, а тебе это никак, не нравится, не надо там сидеть. Надо еще на собеседовании задавать вопросы, все выяснять, ставить себя на первую позицию. Место работы – это всегда компромисс. Тебе тоже должно быть там хорошо, а не только компании от того, что у тебя такой клевый набор скиллов. Это то, что у многих студентов отсутствует в самом начале. Есть желание, чтобы хоть куда-нибудь взяли…
– Хорошие советы! А над какой научной проблемой вы работаете сейчас?
– У меня три проблемы! Первое – я помогаю одному врачу делать анализ данных пациентов. Мы делаем анализ, чтобы построить хорошую модель, которая будет предсказывать прогрессию пациентов с раком простаты.
– Это математические методы в медицине?
– Да, мы используем методы машинного обучения, чтобы построить модель. Собираем данные о большом количестве пациентов, тренируем модели, тестируем их на данных новой группы пациентов, чтобы предсказать, смотрим, насколько хорошо они работают. Второй проект – персонализированная медицина. Мы разрабатываем медицинское устройство, которое будет определять фармакогенетический фенотип человека. Есть разные лекарственные препараты, и у каждого человека они метаболизируются по-разному. Например, если дать человеку, которому нужна половина условной таблетки, полную дозу, у него могут появиться побочные эффекты. А если дать человеку, которому нужна целая условная таблетка, половину, препарат на него не подействует. Медицинское устройство будет определять фармакогенетический фенотип человека, чтобы понять, какой препарат ему наиболее подходит и подобрать правильную дозу препарата. Эта область называется фармакогенетикой.
Третье направление, которое мне сейчас наиболее интересно, – анализ электронных данных пациентов. Во всем мире медицинские карточки переводят в электронный вид. Это дает очень большие возможности использовать машинное обучение в медицине. Где это может помочь? Например, в улучшении диагностики. Врач сможет поставить более точный диагноз или предсказать, когда пациент в следующий раз потенциально поступит в больницу или какие у него будут сопутствующие заболевания в будущем. У нас есть очень большой массив данных, из которых мы можем «выучить» все. Это для меня сейчас самая интересная, основная область – применение машинного обучения к анализу электронных данных пациентов.
– Очень амбициозно и здорово с точки зрения влияния на медицину и, главное, на людей!.. Ваша лекция о старении мозга собрала на Youtube 1700 просмотров. Часто ли вам приходится выступать на публике?
– Что считать частым?
– Насколько регулярно? С учетом того, что вы преподаватель и записываете собственные онлайн-курсы.
– Да, приходится выступать довольно часто, и на большую аудиторию тоже. Лекцию о старении мозга я читала под Петербургом на Летней школе по биоинформатике. В Петербурге есть замечательный Институт биоинформатики, его делают классные люди. Каждое лето они собирают студентов со всей России. Приезжает два потока: биологи-медики, студенты, которым начитывают курсы по анализу данных, алгоритмике, машинному обучению, и математики-информатики, которым дают разную биологию. Очень интересно! Мы с коллегами ездили туда читать лекции, делали практики. Кстати, это был, наверное, мой самый большой провал с точки зрения языка. Обычно вся терминология и лекции идут на английском. И когда начинаешь переводить свои лекции на русский язык, то иногда зависаешь с терминологией – как бы сказать по-русски! Я просто не знаю некоторых терминов на русском – когда ты учишь все на другом языке, сложно искать соответствия в другом. На лекции у меня был ступор – я потом смотрела ее и видела, что зависаю в некоторых моментах. Это был мой первый звоночек о том, что нужно дополнительно готовиться выступать на другом языке, даже если это твой родной язык. Но когда начинаешь импровизировать, приходится переводить информацию параллельно в голове… Я теперь не пренебрегаю этим.
– Хороший совет для научных работников. А считаете ли вы себя популяризатором науки?
– В какой-то степени да – именно благодаря этим открытым лекциям на Летних школах. Там мы много говорим о результатах, о будущих направлениях развития. Я всегда стараюсь делать такие открытые выступления как можно более понятными любой аудитории. В этом смысле – да, меня можно считать популяризатором.
Материал подготовлен УМиР