Последние года термин Data Science начал набирать популярность. Об этом много пишут, говорят на конференциях. Все больше становится компаний, которые используют в своей работе научные подходы из различных дисциплин, включая статистику, обработку сигналов и машинное обучение. И это здорово, ведь наука о данных-это мощный инструмент, который позволяет добиваться отличных результатов, к том числе в области финтех, на которой специализируется наша компания QuantNet.

Мы провели опрос среди аналитиков нашей компании, как и где они учились чтобы построить карьеру в Data Science. И собрали все советы под одной крышей.

Забегая вперед, нужно сразу отметить, что специалист по анализу данных — это не программист и никак уж не администратор базы данных, хотя навыки программирования он иметь обязан.

Специалист по данным — это специалист, владеющий тремя группами навыков:

  • математика и статистика;
  • IT-навыки, в том числе программирование;
  • понимание бизнес-процессов в той или иной области.

1. Вузы

Здесь у вас есть возможность получить хорошую базу по точным и естественным наукам, особенно стоит заострить внимание на таких предметах как:

  1. Линейная алгебра (например, нейронные сети это просто перемножение и складывание матриц)

2. Теория вероятностей + Мат. Статистика (для построения гипотез и их принятия/отвержения)

3. Вычислительная математика (проблемы минимизации, решаемые методами градиентного спуска)

4. (если есть) Машинное обучение

5. (если есть) Эконометрика

Также не стоит прогуливать программирование и английский (большая часть работ написана на этом языке, а значит он вам понадобится).

Многие компании(в том числе и наша) сотрудничают с ВУЗами и берут к себе в штат талантливых студентов без опыта работы.

Если вы только принимаете решение куда пойти учиться, то на данный момент в Санкт-Петербурге и Москве хороших специалистов готовят такие ВУЗы как СПБГУ/МГУ, ИТМО, ВШЭ, МФТИ, но в конечном итоге самое главное не то где вы учились, а как.

2. Оффлайн обучение

Москва: Школа анализа данных от Яндекс https://yandexdataschool.ru/

СПБ и Новосибирск: Computer Science Center https://compscicenter.ru/

Это двух- или трёхлетние очные вечерние курсы, которые дают систематическое образование, совмещая теоретические занятия с практикой. Студенты слушают лекции и посещают семинары, вместе работают над учебными проектами, результаты которых нередко приводят к научным публикациям.

Конкурсный отбор в них состоит из трех этапов: онлайн-тестирование, письменный экзамен и собеседование. Попасть сложно, нагрузка на курсах очень высокая, зато выпускники получают работу в лучших компаниях страны.

3. Онлайн курсы

Сейчас многие онлайн-площадки выпускают свои курсы по Data Science. Спрос рождает предложение. Они не заменят классического образования, но станут отличным трамплином для людей с хорошей базой.

В компании QuantNet мы помогаем молодым специалистам получать дополнительное образование. Одним из вариантов чтобы быстро войти в курс дела-это онлайн курсы. У нас часто выбирают:

  1. Coursera www.coursera.org/

2. EDX www.edx.org/

3. Stepik stepik.org

4. UC BERKELEY(курс Master of Information and Data Science) datascience.berkeley.edu

на этих площадках есть огромный выбор курсов от топовых ВУЗов и компаний мира. На одной только Coursera около 250 курсов на данную тему. Легче всего ориентироваться по отзывам. Здесь также есть курсы по основам программирования на основных языках для анализа данных: Python/R/Matlab

4. Онлайн/оффлайн интерактивные курсы

Интерактивный курс – это обучающая среда, которая ориентирована прежде всего на организацию взаимодействия между преподавателем и учениками.

Как и в настоящей компании, вы будете решать поставленные задачи, работая в команде. Это отличный способ прокачать soft skills, завести знакомства, попробовать себя в рабочей среде. В нашей компании мы тоже создаем атмосферу поддержки и взаимопомощи. Это позволяет нам делать вместе больше, чем суммарно каждый по отдельности.

  1. Data mining in action datamininginaction.ru/

Огромное живое сообщество в VK vk.com/data_mining_in_action

2. ML course open (OpenDataScience) vk.com/mlcourse

Сообщество OpenDataScience проводит открытый (и бесплатный) курс основ машинного обучения. Фокус – оптимальное сочетание теории и практики.

3. тренировки от Яндекса events.yandex.ru/events/mltr/

Каждые две недели в Яндексе проходят тренировки по машинному обучению. Эти встречи помогают участникам конкурсов в сфере анализа данных пообщаться и обменяться опытом.

Мероприятия состоят из практической части и докладов. Задачи для первой берутся с Kaggle и других схожих площадок. С докладами выступают успешные участники последних соревнований — рассказывают о своих решениях и о том, какие техники и методы использовали их конкуренты.

4. Kaggle club vk.com/kaggle_club

Сообщество Kaggle club проводит тренировки по решению задач.

Kaggle — это площадка, на которой компании проводят конкурсы по созданию прогнозирующих моделей. Как правило, Kaggle-сообществу дают решать задачи, довольно близкие к реальным: это, с одной стороны, делает конкурс интересным, а с другой — продвигает компанию как работодателя с солидными задачами.

Скоро у вас появится возможность участвовать в конкурсах на собственной площадке QuantNet.

5. Бонус

Игры разума braingames.ru

Игры разума — интернет-ресурс с логическими задачами-головоломками и загадками. Основной идеей сайта является недоступность ответов до момента самостоятельного решения задачи, а также проверка ответов людьми, прошедшими предварительную квалификацию (модераторами).

На сайте насчитывается около 400 уникальных задач самого разного уровня сложности, от задач-шуток до сложнейших математических проблем.

Итог:

Аналитик данных- это уникальная и очень интересная специальность. В своей работе вы часто будете сталкиваться с задачами, для успешного решения которых нужно, с одной стороны, изучить теорию, а с другой — начать практиковать использование различных подходов и моделей.

Сообщество data science постоянно растет за счет вступления в него людей из абсолютно разных областей. Их объединяет интерес к решению сложных и нестандартных задач. Наша компания тоже делает вклад в развитие сообщества, мы публикуем статьи, а также вакансии и мероприятия у нас в группе. Для нас самое главное-это готовность учиться и узнавать что-то новое.