第 5 章 使用 Spark Streaming 搭建实时处理模块
什么叫日活:
通常: 打开应用的用户即为活跃用户,不考虑用户的使用情况。每天一台设备打开多次会被计为一个活跃用户。 也就是只需要统计第一次打开即可
游戏用户: 每天打开/登录游戏的用户数(针对游戏DAU的定义)
我们采用第一种日活的定义, 日活(DAU)统计思路:
从 kafka 读取用户启动日志
当天只保留用户的第一次启动记录, 过滤掉其他启动记录:
借助于 Redis 然后把第一次启动记录保存在 ES, 以供其他应用查询