Кластеризация
Задача относится к классу задач обучения без учителя unsupervised learning – когда у нас отсутствуют метки классов, мы должны по данным выявить некую закономерность, объединить объекты по схожим признакам, чтобы группы (кластеры) были различны друг от друга как можно больше.
Применение:
Разбиение текста по темам (тематическое моделирование), выявление паттернов поведения, либо групп (клиентов по типу поведения), поиск аномалий, построение иерархий объектов.
EDA
People
ID: Уникальный идентификатор клиента
Year_Birth: Год рождения клиента
Education: Уровень образования
Marital_Status: Семейное положение
Income: Годовой доход
Kidhome: Количество детей в семье клиента
Teenhome: Количество подростков в семье клиента
Dt_Customer: Дата регистрации клиента в компании
Recency: Количество дней с момента последней покупки клиента
Complain: 1, если клиент жаловался в течение последних 2 лет, 0 в противном случае
Products
MntWines: Сумма, потраченная на вино за последние 2 года
MntFruits: Сумма, потраченная на фрукты за последние 2 года
MntMeatProducts: Сумма, потраченная на мясо за последние 2 года
MntFishProducts: Сумма, потраченная на рыбу за последние 2 года
MntSweetProducts: Сумма, потраченная на сладости за последние 2 года
MntGoldProds: Сумма, потраченная на золото за последние 2 года
Promotion
NumDealsPurchases: Количество покупок, совершенных со скидкой
AcceptedCmp1: 1, если клиент принял предложение в 1-й кампании, 0 в противном случае
AcceptedCmp2: 1, если клиент принял предложение во 2-й кампании, 0 в противном случае
AcceptedCmp3: 1, если клиент принял предложение во 3-й кампании, 0 в противном случае
AcceptedCmp4: 1, если клиент принял предложение во 4-й кампании, 0 в противном случае
AcceptedCmp5: 1, если клиент принял предложение во 5-й кампании, 0 в противном случае
Response: 1, если клиент принял предложение в последней кампании, 0 в противном случае
Place
NumWebPurchases: Количество покупок, совершенных через веб-сайт компании
NumCatalogPurchases: Количество покупок, сделанных с использованием каталога
NumStorePurchases: Количество покупок, совершенных непосредственно в магазинах
NumWebVisitsMonth: Количество посещений веб-сайта компании за последний месяц
Задача
Обнаружение сегментов клиентов