第 4 章 每天每地区热门广告 top3 实时统计

4.1 需求简介

上个需求是: 每天每地区每城市每广告点击量

从理论上来说, 从上个需求出发, 减少城市维度,然后重新聚合, 每天每地区热门广告 取 top3 就可以了.

然后, 很不幸, Structured streaming 不支持多重聚合, 所以也只能从头再来.

4.2 思路分析

统计出来的结果仍然写入到 redis

存储到 redis 的数据的格式:

使用Hash来存储

  • key 格式

    area:ads:top3:日期 例如: area:ads:top3:2019-03-23

  • value 格式

    field       value
    地区         json 字符串
    

    例如:

    华南                {广告1: 1000, 广告2: 500}
    华北                {广告3: 1000, 广告1: 500}
    

4.3 具体业务实现

Copyright © 尚硅谷大数据 2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2019-08-19 17:15:17

results matching ""

    No results matching ""