Skip to content

NosulchakE/Machine-learning-in-HR-Analytics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 

Repository files navigation

Machine-learning-in-HR-Analytics

ссылка на проект: https://colab.research.google.com/drive/1s2k5scJgcTDc-q0ozRVeYh4gTWt-Kxey?usp=sharing

ПРОЕКТ. "Машинное обучение (ML) в HR-аналитике"

ПОСТАНОВКА ЗАДАЧИ Заказчик исследования — HR-департамент компании. Компания ориентирована на оптимизацию управления персоналом, предлагая бизнесу стратегии по минимизации финансовых потерь и сокращению оттока сотрудников. В последнее время компания столкнулась с вызовами, связанными с увеличением числа внезапных увольнений, что негативно сказывается на её деятельности. Исходные данные: Компания предоставила данные, включающие характеристики сотрудников, такие как уровень удовлетворённости работой, отдел, занимаемая должность, уровень загруженности, длительность работы в компании, данные о повышениях и нарушениях, оценка качества работы руководителем, ежемесячная зарплата.

Цель исследования: Разработать и внедрить две модели машинного обучения для:

  1. Предсказания уровня удовлетворённости сотрудников работой в компании.
  2. Прогнозирования вероятности увольнения сотрудника из компании.

Основываясь на результатах моделирования, HR-департамент сможет эффективнее управлять персоналом, предотвращая потери и улучшая условия работы.

Задачи исследования: • Построение модели для предсказания уровня удовлетворённости сотрудников на основе предоставленных данных. • Разработка модели для прогнозирования вероятности увольнения сотрудников. • Использование результатов прогноза для разработки стратегий по улучшению условий труда и снижению оттока персонала.

Ход исследования

Исследование будет осуществляться на основе данных, предоставленных компанией, а именно: Тренировочные и тестовые наборы данных с характеристиками сотрудников и информацией о удовлетворенности и увольнениях. Исследование будет включать в себя следующие этапы:

  1. Обзор данных:
  • Загрузка и первичный анализ предоставленных файлов данных.* Оценка качества данных и выявление потенциальных проблем.
  1. Предобработка данных:
  • Исправление обнаруженных ошибок и пропусков.
  • Преобразование типов данных для последующего анализа.
  1. Исследовательский анализ данных (EDA):
  • Анализ распределений и взаимосвязей ключевых переменных.
  • Выявление факторов, потенциально влияющих на удовлетворенность и увольнения.
  1. Подготовка данных для моделирования:
  • Кодирование категориальных признаков.
  • Масштабирование числовых данных.
  1. Построение и оценка моделей машинного обучения:
  • Разработка и обучение модели для предсказания уровня удовлетворённости сотрудников.
  • Создание и оценка модели для прогнозирования вероятности увольнения сотрудников.
  • Подбор гиперпараметров и оценка качества моделей.
  1. Анализ результатов и выработка рекомендаций:
  • Интерпретация результатов прогнозирования.
  • Разработка рекомендаций для HR-департамента по улучшению удовлетворённости и снижению оттока сотрудников.
  1. Визуализация результатов:
  • Графическое представление важнейших находок и результатов моделирования.
  1. Итоговые выводы и рекомендации:
  • Формулирование ключевых выводов исследования.
  • Предложение стратегий для улучшения управления персоналом в компании.

Исследование предоставит комплексный анализ уровня удовлетворённости работой сотрудников и факторов, влияющих на их решение об увольнении. Результаты помогут HR-департаменту компании «Работа с заботой» разработать эффективные стратегии для удержания сотрудников и оптимизации управления персоналом, что в конечном итоге способствует укреплению внутренней культуры и повышению общей эффективности работы компании.

Структура данных

  • id - уникальный идентификатор сотрудника;
  • dept - отдел, в котором работает сотрудник;
  • level - уровень занимаемой должности;
  • workload - уровень загруженности сотрудника;
  • employment_years - длительность работы в компании;
  • last_year_promo - было ли повышение за последний год;
  • last_year_violations - были ли нарушения за последний год;
  • supervisor_evaluation - оценка руководителя;
  • salary - ежемесячная зарплата;
  • job_satisfaction_rate - уровень удовлетворённости работой (целевой признак).

Выводы по решению задач

Задача 1: Предсказание уровня удовлетворённости сотрудника Для предсказания уровня удовлетворенности сотрудников с помощью инструмента поиска гиперпараметров GridSearchCV была получена лучшая модель: DecisionTreeRegressor (random_state=42), 'models__min_samples_split': 4, 'preprocessor__num': MinMaxScaler(), метрика SMAPE на тестовой выборке составила 14,2. Эта модель показала хорошую способность к обобщению и высокую точность предсказаний, что делает ее подходящей для анализа удовлетворенности сотрудников. Она позволила выделить ключевые факторы, влияющие на уровень удовлетворенности, а именно: оценку руководителя и стаж работы, и предоставила HR-отделу инструмент для прогнозирования потенциальных проблем в коллективе.

Задача 2: Предсказание увольнения сотрудника. Во второй задаче лучшим решением стала модель метод опорных векторов SVC (probability=True, random_state=42). Эта модель продемонстрировала высокую эффективность в предсказании увольнений сотрудников, благодаря чему компания может заранее определять риски потери ключевых сотрудников и предпринимать меры по их удержанию, площадь ROC-кривой (AUC-ROC) для нашей модели равна 0.93

Выводы и предложения для бизнеса

  • Высокая точность моделей: Достигнута высокая точность предсказаний, что подтверждает возможность использования данных моделей в реальных бизнес-процессах.
  • Важность анализа удовлетворенности: Анализ удовлетворенности сотрудников и их склонности к увольнению позволит HR-отделам предпринимать своевременные меры для улучшения рабочей среды и удержания ценных кадров.
  • Персонализация HR-инициатив: Использование моделей машинного обучения дает возможность разработки персонализированных подходов к каждому сотруднику, основанных на предсказаниях их удовлетворенности и потенциальной увольнительной активности.
  • Предложения для бизнеса:
    • Рекомендуется внедрение системы регулярного мониторинга удовлетворенности сотрудников с использованием предложенных моделей, а также разработка программ лояльности и мотивации для снижения текучести кадров.

В целом, проект демонстрирует, как данные и алгоритмы машинного обучения могут быть эффективно использованы для решения важных HR-задач, способствуя улучшению рабочей атмосферы и снижению уровня увольнений в компании.

About

ML and HR-analytics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published