Dodo Brands - высокотехнологическая компания в сфере общественного питания. Компании принадлежит несколько брендов, среди которых всем известная Dodo Pizza. Если в вашем городе есть кафе Dodo Pizza наверняка вы хотя бы раз там бывали. Сейчас сеть насчитывает 1085 точек в 21 стране. И еще 5 будут открыты в апреле. Масштабы поражают! Как и количество задач для Data Science инженеров.
Одна из задач, которой занимаются сотрудники компании Dodo Brands - эффективность промо рассылок. Два раза в неделю по всем пользователям проходят промокоды на скидки.
Скриншот мобильного приложения
Задача - сделать максимально персонализированное промо предложение гостю. Что может быть в промо? Например - скидка в 10% при заказе от 1000 рублей (евро, долларов) или маленькая пицца в подарок/со скидкой. Вариантов много! Скидка также может быть предложена в процентах и в денежных единицах.
Ваша задача - научиться предсказывать воспользуется ли человек промо или проигнорирует. Чем точнее предсказание, тем более персонализированные предложения компания может делать своим клиентам
orders.csv
- заказы клиентов (до ноября 10 последних заказов клиента)OrderUUId
- уникальный id заказаaddressId
- адрес доставкиdeliverySectorId
- сектор доставкиClientUUId
- уникальный id клиентаDate
- день заказаSaleDate
- время заказаUnitUUId
- уникальный id пиццерииNewClient
- 1, если это первый заказ у клиента. 0 иначеClientOrderNumber
- какой по счету заказ у клиентаProductUUId
- уникальный id продуктаCategoryId
- id категории товараProductTotalPrice
- цена продукта с учетом примененных скидокMenuPrice
- цена в менюOrderState
- статус заказаOrderPaymentType
- тип платежаOrderTotalPrice
- общая сумма заказаOrderType
- тип заказаapply_promo
- 1, если применялся промокод. 0 иначеmobile_events.csv
- мобильные евенты (за октябрь)ClientUUId
- уникальный id клиентаVisitToken
- токен сессииEventName
- название евентаPlatform
- платформаTimestamp
- время событияclients_promo_october.csv
- промо выданные за октябрьClientUUId
- уникальный id клиентаId
- механикаLocalBeginDate
- старт кампанииLocalEndDate
- конец кампанииOrderType
- тип заказаOrderPrice
- порог срабатыванияDiscount
- вознаграждениеtrain_target.csv
- промо выданные за октябрь с фактом заказаClientUUId
- уникальный id клиентаId
- механикаOrderType
- тип заказаLocalBeginDate
- старт кампанииLocalEndDate
- конец кампанииOrderPrice
- порог срабатыванияDiscount
- вознаграждениеapply_promo
- факт использования промо (таргет)test.csv
ClientUUId
Id
OrderType
LocalBeginDate
LocalEndDate
OrderPrice
Discount
Участникам необходимо в качестве ответа отправить csv файл, основанный на test.csv путем добавления в него целевого столбца apply_promo - вероятность применения промо. apply_promo может принимать значение от 0 до 1.
Метрикой задачи является \[ROC-AUC* 10^8\] Победители определяются по максимальному значению. Во время турнира проверка осуществляется на 50% тестовой выборки.
Comments
50 сабмитов это на какой период, на все соревнование?
Здравствуйте! Да, 50 сабмитов - это количество посылок на весь период соревнования.