简易用户画像系统

业务数据接入
数据清洗及建模
标签定义
打标
转换阶段
这个阶段本质是将用户标签表的数据使用 ClickHouse 的位图能力进行重新组织,使用位图的好处是可以使用表小的存储容量来保存这些数据,同时将运营阶段对用户画像的操作转变为位图的交并补操作。
运营阶段
人群圈选
人群圈选的功能是输入一串标签,找出符合标签的人群列表
WITH
(
SELECT tag_bitmap
FROM ads.tag_user_bitmap
WHER toDate(create_at) = today() AND tag_value = '高消费人群'
)AS user_group_1,
(
SELECT tag_bitmap
FROM ads.tag_user_bitmap
WHER toDate(create_at) = today() AND tag_value = 'VIP用户'
) AS user_group_2
SELECT bitmapToArray(bitmapAnd(user_group_1, user_group_2)) as user_group
人群加减
做位图相减,主要使用 bitmapAndNot
函数
总结
- 架构简单、开发成本低、开发周期快
- 查询速度快
- 标签定义灵活
- 运维成本低
Publish on 2023-05-23,Update on 2025-02-10