1、任务概述

  CTR(Click Through Rate,点击率)是推荐系统和计算广告非常重要的指标,对其进行预估能够为产品推荐和广告投放的决策提供参考价值。Avazu:Click-Through Rate Prediction是Kaggle举行的一场CTR预估比赛。赛事主办方提供了11天的广告历史数据,下述条目给出了该赛事任务的一些基本信息:
(1)输入
  训练集train.csv(5.87GB):10天的点击数据,按时间顺序排列。根据不同的策略对非点击和点击进行子采样。
  测试集test.csv(673MB):1天的广告数据,用来测试你的模型预测效果。
(2)输出
  输出测试集每个广告id及对应的CTR预估值,形式如下:

1
2
3
4
5
6
id,click
60000000,0.384
63895816,0.5919
759281658,0.1934
895936184,0.9572
...

(3)评估指标:log-loss
  , $y_t$为真实值, $y_p$为预测概率

2、探索数据分析