第 4 章 每天每地区热门广告 top3 实时统计
4.1 需求简介
上个需求是: 每天每地区每城市每广告点击量
从理论上来说, 从上个需求出发, 减少城市维度,然后重新聚合, 每天每地区热门广告 取 top3 就可以了.
然后, 很不幸, Structured streaming 不支持多重聚合, 所以也只能从头再来.
4.2 思路分析
统计出来的结果仍然写入到 redis
存储到 redis 的数据的格式:
使用Hash
来存储
key
格式area:ads:top3:日期
例如:area:ads:top3:2019-03-23
value
格式field value 地区 json 字符串
例如:
华南 {广告1: 1000, 广告2: 500} 华北 {广告3: 1000, 广告1: 500}