
Dodo Brands - высокотехнологическая компания в сфере общественного питания. Компании принадлежит несколько брендов, среди которых всем известная Dodo Pizza. Если в вашем городе есть кафе Dodo Pizza наверняка вы хотя бы раз там бывали. Сейчас сеть насчитывает 1085 точек в 21 стране. И еще 5 будут открыты в апреле. Масштабы поражают! Как и количество задач для Data Science инженеров.
Одна из задач, которой занимаются сотрудники компании Dodo Brands - эффективность промо рассылок. Два раза в неделю по всем пользователям проходят промокоды на скидки.

Скриншот мобильного приложения
Задача - сделать максимально персонализированное промо предложение гостю. Что может быть в промо? Например - скидка в 10% при заказе от 1000 рублей (евро, долларов) или маленькая пицца в подарок/со скидкой. Вариантов много! Скидка также может быть предложена в процентах и в денежных единицах.
Ваша задача - научиться предсказывать воспользуется ли человек промо или проигнорирует. Чем точнее предсказание, тем более персонализированные предложения компания может делать своим клиентам
orders.csv - заказы клиентов (до ноября 10 последних заказов клиента)OrderUUId - уникальный id заказаaddressId - адрес доставкиdeliverySectorId - сектор доставкиClientUUId - уникальный id клиентаDate - день заказаSaleDate - время заказаUnitUUId - уникальный id пиццерииNewClient - 1, если это первый заказ у клиента. 0 иначеClientOrderNumber - какой по счету заказ у клиентаProductUUId - уникальный id продуктаCategoryId - id категории товараProductTotalPrice - цена продукта с учетом примененных скидокMenuPrice - цена в менюOrderState - статус заказаOrderPaymentType - тип платежаOrderTotalPrice - общая сумма заказаOrderType - тип заказаapply_promo - 1, если применялся промокод. 0 иначеmobile_events.csv - мобильные евенты (за октябрь)ClientUUId - уникальный id клиентаVisitToken - токен сессииEventName- название евентаPlatform - платформаTimestamp - время событияclients_promo_october.csv - промо выданные за октябрьClientUUId - уникальный id клиентаId - механикаLocalBeginDate - старт кампанииLocalEndDate - конец кампанииOrderType - тип заказаOrderPrice - порог срабатыванияDiscount - вознаграждениеtrain_target.csv - промо выданные за октябрь с фактом заказаClientUUId - уникальный id клиентаId - механикаOrderType - тип заказаLocalBeginDate - старт кампанииLocalEndDate - конец кампанииOrderPrice - порог срабатыванияDiscount - вознаграждениеapply_promo- факт использования промо (таргет)test.csvClientUUIdIdOrderTypeLocalBeginDateLocalEndDateOrderPriceDiscountУчастникам необходимо в качестве ответа отправить csv файл, основанный на test.csv путем добавления в него целевого столбца apply_promo - вероятность применения промо. apply_promo может принимать значение от 0 до 1.
Метрикой задачи является \[ROC-AUC* 10^8\] Победители определяются по максимальному значению. Во время турнира проверка осуществляется на 50% тестовой выборки.
Comments
50 сабмитов это на какой период, на все соревнование?
Здравствуйте! Да, 50 сабмитов - это количество посылок на весь период соревнования.