ML-специалист: кто это такой, чем занимается, какая зарплата

Контент-маркетолог
Стаж 15 лет

Специалист по машинному обучению (от англ. machine learning) или ML-инженер — это программист, который решает задачи, связанные с созданием и настройкой искусственного интеллекта. Эта специальность отличается нестандартным подходом к процессам программирования, ведь необходимо не просто написать скрипт, а научить машину глобально «думать» как человек — делать определенные выводы на основе большого объема данных.

Самые важные термины для специалиста по машинному обучению

  • ML (от англ. machine learning) — разнообразные алгоритмы, способные к самообучению на основе каких-либо данных.
  • ML Model — конкретная machine-learning модель с подробным описанием работы алгоритма. Это может быть описание данных, настроек или параметров алгоритма, приоритет тех или иных команд.
  • Deep Learning (от англ. глубокое обучение). Под этим термином подразумевается нейронная модель обучения. Другими словами, модель, построенная на основе ИНС (искусственных нейронных сетей). Искусственная нейронная сеть — это взаимосвязанная группа узлов, похожая на обширную сеть нейронов в мозгу:
  • Каждый круговой узел представляет собой искусственный нейрон, а стрелка соединяет место выхода одного нейрона и входа другого
    Каждый круговой узел представляет собой искусственный нейрон, а стрелка соединяет место выхода одного нейрона и входа другого
  • ML Metric. Определенная числовая метрика, которая используется для оценки суммарной эффективности той или иной модели ML.
Самые важные скиллы, которые нужны программисту по машинному обучению
Самые важные скиллы, которые нужны программисту по машинному обучению

Чем занимается специалист по машинному обучению

Как правило, ML-специалисты решают пять видов задач:

  1. Нахождение аномалий. Обнаружение отклонений от регулярных сценариев. Для выявления аномалий не получится использовать стандартные методы классификации, характерные для machine learning, так как подобные отклонения встречаются очень редко. Например, выявление фрода в отчетах.
  2. Прогноз регрессии. Это прогнозирование, в основе которого лежат определенные выборки компонентов с различающимися параметрами. Например, ожидаемый ROI у конкретного бизнеса.
  3. Уменьшение размерности. Объединение нескольких тысяч признаков в две-три главные категории. Используется в самых разнообразных сценариях, например, для лучшего визуального представления большого количества признаков.
  4. Классификация ответов. Обучение алгоритма с целью получение односложного ответа. Например, вопрос: «Число 5 больше 9».
  5. Разбивка данных на группы, или создание кластеров или групп данных по определенному параметру. Например, разбивка трафика по каналу в веб-аналитике.
Научить машину (модель/алгоритм) «думать» и делать выводы на основе реальных данных — главная задача ML
Научить машину (модель/алгоритм) «думать» и делать выводы на основе реальных данных — главная задача ML

Все эти задачи направлены на обучение ИНС на основе больших данных. Причем нужно не просто формально «обучить» конкретную ML-модель, но и сделать так, чтобы она начала решать определенные задачи бизнеса. Например, предугадывать платежеспособность человека, исходя из десятка разнообразных параметров: пол, возраст, уровень образования, стаж работы, интересы, вилка зарплаты. Описанные выше задачи — типичные сценарии работы большинства скоринговых платформ, которые сегодня используют банки при оформлении кредитных и других продуктов.

Или, например, распознавание лиц в режиме реального времени (с видеокамер) или с изображений. Все это также работает на основе принципов ML.

Распознавание лиц невозможно без машинного обучения
Распознавание лиц невозможно без машинного обучения

ML-специалист занимается решением не только инженерных, но и аналитических задач. Часто эти процессы плотно переплетаются друг с другом. Вот примеры таких задач:

  1. Разделение данных внутри главного источника.
  2. Обработка необходимых признаков в разных каналах.
  3. Построение алгоритмов ML на основе главных признаков модели.
  4. Отправка модели в продакшн.
  5. Дополнительная настройка модели.
  6. Запуск, настройка запуска модели с необходимыми параметрами.

В конце концов, ML-специалисту нужно сгенерировать полноценный жизненный цикл конкретного продукта. В качестве такого «продукта» у ML-инженеров обычно и выступают большие данные.

Таким образом можно выделить главные обязанности ML: 

  • Работа с аналитическими инструментами.
  • Проведение аналитики данных.
  • Обработка результатов исследования.
  • Проектирование программного обеспечения.
  • Обработка данных.

Что нужно знать и уметь ML-инженеру

Вот пять главных компонентов, которые нужно знать специалисту по машинному обучению:

  1. Главные инструменты ML и DL. Сюда относится не только ИНС, но и обработчики языка, Computer Vision, основы регрессии, алгоритмы классификации, инструменты для создания кластеризации данных и другие типовые инструменты.
  2. C++. Универсальный вариант для специалиста по машинному обучению. Этот язык можно заменить и другим производительным языком, например тем же «Питоном». В последние годы, кстати, именно Python становится стандартом в machine learning.Внимание к деталям.
  3. Логические способности.
  4. Аналитический склад ума.
  5. Коммуникабельность.

Хард-скиллы:

  1. Знание Agile и других гибких методологий ведения проекта.
  2. Математика, алгебра, статистика.
  3. Владение SQL.
  4. Знание Python или других языков с упором на статистику (R, Scala, Java или даже C++).
  5. Навыки работы с данными, особенно моделирование.

Обязательно изучить хотя бы базовые алгоритмы данных, так как без этого будет сложно писать «быстрый» код.

  • Линейная алгебра. Математика, а конкретно алгебра вообще очень полезна для ML-специалиста. И далеко не лишним будет изучение раздела «Теории вероятностей». Именно высшая математика способна хорошо объяснить основные принципы функционирования ML-алгоритмов, ИНС, других составляющих машинного обучения.
  • Структура данных. У начинающего должно быть хотя бы начальное или базовое представление о СД.
  • Архитектура аппаратного комплекса. Точно не помешает хорошее представление об архитектурных процессах. Аппаратные компоненты компьютера и сопутствующие технологии постоянно совершенствуются, без знаний о них будет сложно объяснить оптимизацию при обработке big data или, например, понять принцип распределенных вычислений.
Простая байесовская сеть. Дождь влияет на то, активируется ли разбрызгиватель, а дождь и разбрызгиватель влияют на мокрость травы
Простая байесовская сеть. Дождь влияет на то, активируется ли разбрызгиватель, а дождь и разбрызгиватель влияют на мокрость травы

Сколько зарабатывает специалист по машинному обучению

Зарплаты специалистов machine learning сильно варьируются. Сразу оговоримся: речь пойдет об уровне зарплат для крупных городов. Вот примерные цифры:

  • Студенты, только закончившие обучение, могут рассчитывать на доход от 50 000 рублей. 
  • Джуны начинают от 70 000 рублей в месяц.
  • Мидлы — в районе 100 000 рублей.
  • Синьоры — около 200 000 рублей и выше. 

289 000 рублей — средняя зарплата в России по данным zarplan.com. Безусловно, эта цифра скорее завышенная, чем реальная, с учетом специфики сегодняшнего рынка. Это зарплата очень серьезных senior-специалистов в крупных компаниях, которые готовы хорошо платить за труд специалиста.

160 000 рублей — медианная зарплата по данным анализа более 200 вакансий, размещенных на hh.ru и superjob.ru.

За рубежом, особенно в Европе и Америке, уровень зарплат разработчиков по традиции гораздо выше, чем в России. Безусловно, уровень зарплаты ML зависит не только от опыта работы на других проектах, но и от навыков и умений, желания обучаться и совершенствоваться. 

Где искать заказы

  1. На крупных сайтах с вакансиями (такие как hh.ru и superjob.ru).
  2. В специализированных Telegram-каналах (посвященных вакансиям только для разработчиков): Game Development Jobs, Job in IT&Digital, Job for QA, Telegram IT Job).
  3. В сообществах социальных сетей, форумах разработчиков.

Кроме того, немалое количество machine learning работают на фрилансе. Такие программисты ищут работу через биржи. Уровень гонораров там, как правило, гораздо ниже, чем при устройстве в полноценную студию или крупную компанию.

Обязанности и требования к инженеру по машинному обучению. Компания из региона
Обязанности и требования к инженеру по машинному обучению. Компания из региона

Вот самые лучшие сайты, где можно найти работу ML-программисту:

  • Workzilla.
  • «Фриланс Хабр».
  • Weblancer.net
  • Kwork.ru.
  • Fl.ru.
  • Freten.ru.

Из зарубежных площадок можно рекомендовать самую крупную биржу такого плана — Upwork.

За оптимизацию ML-модели заказчик на Upwork предлагает всего лишь 300 долларов
За оптимизацию ML-модели заказчик на Upwork предлагает всего лишь 300 долларов

Где учиться на ML-инженера

  1. Самостоятельное изучение профессии. По-настоящему ценных курсов, полезных книг и статей по машинному обучению очень много, особенно в зарубежном интернете (на английском языке). Однако научиться кодить только по книгам невозможно, понадобится продолжительная практика. Хороший вариант — самостоятельное обучение + менторство, которое подразумевает выполнение заданий под руководством профессионального разработчика. 
  2. Обучение в вузе. По сравнению с платными курсами, ценник в университетах гораздо выше. В среднем самый доступный курс обойдется в 1 миллион рублей (и то, если брать двухлетнюю магистратуру).
  3. Обучение при помощи платных курсов. Пожалуй, самый популярный вариант изучения machine learning в России. Недостатки такого подхода очевидны: российские курсы по ML чаще всего очень плохо составлены и структурированы, поверхностны. Это не полноценное обучение. При этом стоимость таких курсов очень высока. Безусловно, крупные игроки в сфере онлайн-обучения (GeekBrains, Skillbox или «Нетология») пообещают вам множество практики, обретение необходимых навыков и даже гарантии трудоустройства. Однако часть обучающихся, прошедших такие курсы, просто покидают разработку, навсегда в ней разочаровавшись. 
Платные курсы по ML начинаются от 36 900 рублей в месяц
Платные курсы по ML начинаются от 36 900 рублей в месяц

Разумнее всего совмещать лучшие практики из каждого способа. Лучший вариант — очная практика с наставником или коучинг. Дистанционные способы обучения всегда менее эффективны, чем очные занятия.

Актуальные бизнес-ниши для специалистов по машинному обучению

За рубежом ML развивался гораздо активнее, чем в России. Но сегодня и у российского бизнеса есть стабильная потребность в инженерах по машинному обучению. Приведем несколько ниш бизнеса, где можно себя проявить.

Игры и развлечения

Game-индустрия точно не может обойтись без machine learning. На нем построено вообще все: от механики игровых вселенных в десктопных играх до устройств виртуальной реальности. Во всем этом используются элементы машинного обучения. Кстати, не только игры нуждаются в таких специалистах, но и сама отрасль в целом

Например, компания Netflix использует ML на своих платформах, чтобы предлагать зрителю максимально релевантный интересующий его контент. Чем выше вовлеченность, тем вероятнее, что пользователь приобретет продукт — подписку на сериал.

Реалистичное поведение NPC, крутая графика, продуманные диалоги и взаимодействия с персонажами — все это заслуга ML
Реалистичное поведение NPC, крутая графика, продуманные диалоги и взаимодействия с персонажами — все это заслуга ML

Транспортное направление

Эта ниша только начала применять ML, но уже сейчас понятно — у нее грандиозное будущее. Уже сейчас машинное обучение активно используется в мобильных приложениях для построения оптимальных маршрутов, обучения беспилотного транспорта, регулирования дорожного трафика. Что касается перевозчиков, ML нужно им для оптимизации логистики и снижения затрат на перевозки.

Алгоритмы ML ускоряют доставку грузов на многих направлениях
Алгоритмы ML ускоряют доставку грузов на многих направлениях

Алгоритмы машинного обучения делают возможным существование беспилотных автомобилей. ML-модели позволяют авто непрерывно собирать данные о своем окружении с камер и других датчиков, интерпретировать их и решать, какие действия предпринять. И это сложнейшие для инженеров задачи, но уже понятно, что они вполне выполнимы. Возможно, что в ближайшие несколько лет беспилотные автомобили будут управлять машиной гораздо лучше, чем профессиональные водители.

Промышленные отрасли

Промышленность сегодня также начинает использовать machine learning для решения своих потребностей и задач. Это могут быть сугубо специализированные цели: например, эксперименты с материалами при выплавке стали или обнаружение бракованных партий товаров.

Совсем скоро машины в промышленности смогут «понимать» задействованные человеком процессы, взаимодействовать с окружающей средой и адаптироваться к их поведению.

Индустрия 4.0 превращает традиционные производственные процессы в интеллектуальное производство
Индустрия 4.0 превращает традиционные производственные процессы в интеллектуальное производство

Ритейл

Одна из самых всеобъемлющих отраслей для возможностей машинного обучения. Типичная модель machine learning позволяет разбить большие объемы сложных данных на мелкие.

Благодаря такому подходу можно изучать целевую аудиторию, предсказывать поведение клиента и подбирать наиболее релевантные для него предложения, делать прогнозы по развитию и тенденциям рынка, изменять цену, оценивать будущий спрос. И это далеко не все.

Предсказание спроса, цен, улучшение логистики, определение фрода — лишь некоторые возможности для ритейла
Предсказание спроса, цен, улучшение логистики, определение фрода — лишь некоторые возможности для ритейла

Финансовые отрасли

Первое, что приходит на ум, — скоринг. Без machine learning одобрение кредитов и других банковских продуктов занимало бы гораздо больше времени. Нельзя не сказать и о высоком уровне безопасности банковских транзакций, которая достигается также с помощью технологий машинного обучения.

Главное достоинство для финансовой отрасли — постоянная обучаемость алгоритмов. В контексте предотвращения мошеннических операций эта способность невероятно полезна: даже одна ранее сработавшая техника фрода не сможет сработать второй раз, так как уже будет идентифицирована алгоритмами и отклонена.

Обнаружение мошенничества с кредитными и дебетовыми картами — одно из самых перспективных для машинного обучения направлений.

Предсказание стоимости акций и криптовалют и мошенничество с картами — самые многообещающие направления для ML
Предсказание стоимости акций и криптовалют и мошенничество с картами — самые многообещающие направления для ML

Также machine learning помогает выявлять риски кредитования, проводить анализ рынка акций, выполнять сегментацию клиентов.

 

Здоровье

Приоритетное направлений для ML в здравоохранении — увеличение точности диагностических процедур. По данным «Национальной библиотеки медицины США» (National Library of Medicine), машинное обучение оказалось точным более чем на 90 % при прогнозировании смертности пациентов с COVID-19. Еще один пример использования ML в медицинской отрасли — алгоритмы помогают разрабатывать наиболее оправданные и эффективные планы лечения. И делают они это не только для стандартных, но и редких диагнозов. 

Вот 6 самых частых сценариев внедрения машинного обучения в медицине: 

  1. Исследования.
  2. Снижение стоимости лечения.
  3. Нахождение связи между симптомами и заболеваниями.
  4. Открытие лекарств.
  5. Анализ изображений.
  6. Прогнозирование диагноза.
Схематичное представление направлений, перспективных для медицинской отрасли
Схематичное представление направлений, перспективных для медицинской отрасли

Выбирайте свою нишу, прокачивайте навыки и покоряйте профессию. Удачи!

Оценить статью
3 ответов

Комментарии

Написать комментарий
Популярные статьи автора
Узнайте стоимость продвижения сейчас
Выберите удобный способ связи:
Выберите удобный способ связи:
Введите Ваш номер телефона:
Введите адрес Вашего сайта:
Введите Ваше имя:
Нажимая кнопку «Получить предложение» вы соглашаетесь с Политикой конфиденциальности.
Введите Ваш Email:
Введите адрес Вашего сайта:
Введите Ваше имя:
Нажимая кнопку «Получить предложение» вы соглашаетесь с Политикой конфиденциальности.
Оперативно отвечаем в рабочее время: с 10:00 до 19:00
Оперативно отвечаем в рабочее время: с 10:00 до 19:00
Вы уже проголосовали
Возьмем ТОП вместе?
Нажимая кнопку «Оставить заявку» вы соглашаетесь с Политикой конфиденциальности.
Цена лидов в различных нишах
Тематика Стоимость лида (Москва/Россия)
Отдых 500
Мебель 350
Оборудование 500
Бансковские услуги 500
Безопасность 500
Организация мероприятий, концерты, праздники 500
Недвижимость 500
Строительство и отделка 500
Грузоперевозки 500
Доставка еды 350
Юридические услуги 500
Бухгалтерские услуги 500
Пластиковые окна 500
Детские товары 350
Автозапчасти 350
Образование 500
Возьмем ТОП вместе?
Нажимая кнопку «Оставить заявку» вы соглашаетесь с Политикой конфиденциальности.
Оставить заявку сейчас
Выберите интересующую услугу *
Нажимая кнопку «Оставить заявку» вы соглашаетесь с Политикой конфиденциальности.
Подпишитесь на рассылку
Не пропустите самое интересное из мира SEO и Digital. Только актуальные и самые крутые статьи.
Заявка успешно отправлена!
Наши сотрудники уже приступили к анализу Вашего сайта. Наш менеджер свяжется с вами в течение дня, спасибо!