ссылка на проект: https://colab.research.google.com/drive/1s2k5scJgcTDc-q0ozRVeYh4gTWt-Kxey?usp=sharing
ПРОЕКТ. "Машинное обучение (ML) в HR-аналитике"
ПОСТАНОВКА ЗАДАЧИ Заказчик исследования — HR-департамент компании. Компания ориентирована на оптимизацию управления персоналом, предлагая бизнесу стратегии по минимизации финансовых потерь и сокращению оттока сотрудников. В последнее время компания столкнулась с вызовами, связанными с увеличением числа внезапных увольнений, что негативно сказывается на её деятельности. Исходные данные: Компания предоставила данные, включающие характеристики сотрудников, такие как уровень удовлетворённости работой, отдел, занимаемая должность, уровень загруженности, длительность работы в компании, данные о повышениях и нарушениях, оценка качества работы руководителем, ежемесячная зарплата.
Цель исследования: Разработать и внедрить две модели машинного обучения для:
- Предсказания уровня удовлетворённости сотрудников работой в компании.
- Прогнозирования вероятности увольнения сотрудника из компании.
Основываясь на результатах моделирования, HR-департамент сможет эффективнее управлять персоналом, предотвращая потери и улучшая условия работы.
Задачи исследования: • Построение модели для предсказания уровня удовлетворённости сотрудников на основе предоставленных данных. • Разработка модели для прогнозирования вероятности увольнения сотрудников. • Использование результатов прогноза для разработки стратегий по улучшению условий труда и снижению оттока персонала.
Ход исследования
Исследование будет осуществляться на основе данных, предоставленных компанией, а именно: Тренировочные и тестовые наборы данных с характеристиками сотрудников и информацией о удовлетворенности и увольнениях. Исследование будет включать в себя следующие этапы:
- Обзор данных:
- Загрузка и первичный анализ предоставленных файлов данных.* Оценка качества данных и выявление потенциальных проблем.
- Предобработка данных:
- Исправление обнаруженных ошибок и пропусков.
- Преобразование типов данных для последующего анализа.
- Исследовательский анализ данных (EDA):
- Анализ распределений и взаимосвязей ключевых переменных.
- Выявление факторов, потенциально влияющих на удовлетворенность и увольнения.
- Подготовка данных для моделирования:
- Кодирование категориальных признаков.
- Масштабирование числовых данных.
- Построение и оценка моделей машинного обучения:
- Разработка и обучение модели для предсказания уровня удовлетворённости сотрудников.
- Создание и оценка модели для прогнозирования вероятности увольнения сотрудников.
- Подбор гиперпараметров и оценка качества моделей.
- Анализ результатов и выработка рекомендаций:
- Интерпретация результатов прогнозирования.
- Разработка рекомендаций для HR-департамента по улучшению удовлетворённости и снижению оттока сотрудников.
- Визуализация результатов:
- Графическое представление важнейших находок и результатов моделирования.
- Итоговые выводы и рекомендации:
- Формулирование ключевых выводов исследования.
- Предложение стратегий для улучшения управления персоналом в компании.
Исследование предоставит комплексный анализ уровня удовлетворённости работой сотрудников и факторов, влияющих на их решение об увольнении. Результаты помогут HR-департаменту компании «Работа с заботой» разработать эффективные стратегии для удержания сотрудников и оптимизации управления персоналом, что в конечном итоге способствует укреплению внутренней культуры и повышению общей эффективности работы компании.
Структура данных
- id - уникальный идентификатор сотрудника;
- dept - отдел, в котором работает сотрудник;
- level - уровень занимаемой должности;
- workload - уровень загруженности сотрудника;
- employment_years - длительность работы в компании;
- last_year_promo - было ли повышение за последний год;
- last_year_violations - были ли нарушения за последний год;
- supervisor_evaluation - оценка руководителя;
- salary - ежемесячная зарплата;
- job_satisfaction_rate - уровень удовлетворённости работой (целевой признак).
Выводы по решению задач
Задача 1: Предсказание уровня удовлетворённости сотрудника Для предсказания уровня удовлетворенности сотрудников с помощью инструмента поиска гиперпараметров GridSearchCV была получена лучшая модель: DecisionTreeRegressor (random_state=42), 'models__min_samples_split': 4, 'preprocessor__num': MinMaxScaler(), метрика SMAPE на тестовой выборке составила 14,2. Эта модель показала хорошую способность к обобщению и высокую точность предсказаний, что делает ее подходящей для анализа удовлетворенности сотрудников. Она позволила выделить ключевые факторы, влияющие на уровень удовлетворенности, а именно: оценку руководителя и стаж работы, и предоставила HR-отделу инструмент для прогнозирования потенциальных проблем в коллективе.
Задача 2: Предсказание увольнения сотрудника. Во второй задаче лучшим решением стала модель метод опорных векторов SVC (probability=True, random_state=42). Эта модель продемонстрировала высокую эффективность в предсказании увольнений сотрудников, благодаря чему компания может заранее определять риски потери ключевых сотрудников и предпринимать меры по их удержанию, площадь ROC-кривой (AUC-ROC) для нашей модели равна 0.93
Выводы и предложения для бизнеса
- Высокая точность моделей: Достигнута высокая точность предсказаний, что подтверждает возможность использования данных моделей в реальных бизнес-процессах.
- Важность анализа удовлетворенности: Анализ удовлетворенности сотрудников и их склонности к увольнению позволит HR-отделам предпринимать своевременные меры для улучшения рабочей среды и удержания ценных кадров.
- Персонализация HR-инициатив: Использование моделей машинного обучения дает возможность разработки персонализированных подходов к каждому сотруднику, основанных на предсказаниях их удовлетворенности и потенциальной увольнительной активности.
- Предложения для бизнеса:
- Рекомендуется внедрение системы регулярного мониторинга удовлетворенности сотрудников с использованием предложенных моделей, а также разработка программ лояльности и мотивации для снижения текучести кадров.
В целом, проект демонстрирует, как данные и алгоритмы машинного обучения могут быть эффективно использованы для решения важных HR-задач, способствуя улучшению рабочей атмосферы и снижению уровня увольнений в компании.