Что делать если нет целевой переменой в датасете?

Рейтинг: 0Ответов: 1Опубликовано: 25.01.2023

есть три таблицы:

История активаций подписок CID -- идентификатор клиента SAP_ALLO_ID -- идентификатор активации подписки PRID -- идентификатор тарифа PRCID -- идентификатор услуги CONNECTION_DATE -- дата подключения подписки DISCONNECTION_DATE -- дата отключения подписки

Справочник тарифов PRID -- идентификатор тарифа PRODUCT_NAME -- название тарифа PRCID -- идентификатор услуги PRODUCT_CATEGORY_NAME -- название услуги START_DATE -- дата начала возможности активировать тариф END_DATE -- дата окончания возможности активировать тариф FULL_PRICE -- полная стоимость тарифа DURATION_PERIOD -- длительность тарифа в днях IS_ACTION -- признак акционности (был ли тариф реализован для какой-то акции или специального предложения)

Справочник клиентов CID -- идентификатор клиента Gender -- пол (male/female) regionName -- регион абонента HouseTypeDescr -- тип дома LocationTypeDescr -- тип населённого пункта RegistrationYear -- год регистрации

В таблицах хранятся данные с 2009 года по 2022 года. Основаная задача найти вероятность подключения подписки снова, после того как она закончится. Я первый раз сталкиваюсь, что в датасете нет целевой переменной, из-за этого не могу продолжить делать задание. Подскажите пожалуйста, какие варианты я могу попробовать?

Ответы

▲ 1

Если в датасете нет целевой переменной, это скорее всего означает, что от вас ожидают, что вы сможете ее построить самостоятельно. Не очень разбирался в ваших данных, но вот например так:

  • имеется- ли информация о том, что у одного и того-же клиента - было более двух подписок, причем время начала второй подписки больше, чем время окончания предыдущей. Если да - то это означает, что клиент возобновил подписку после того, как предыдущая закончилась.

Вот вам и целевая переменная.