Feed-Stream-System
背景
最近接到一个需求,用一句话来说就是:展示关注人发布的动态,这个涉及到 feed 流系统的设计。本文主要介绍一个一般企业可用的 Feed 流解决方案。
相关概念
下面先介绍一下关于 Feed 流的简单概念。
什么是 feed 流
- Feed: Feed 流中的每一条状态或者消息都是 Feed,比如微博中的一条微博就是一个 Feed。
- Feed流: 持续更新并呈现给用户内容的信息流。每个人的朋友圈,微博关注页等等都是一个 Feed 流。
Feed 流分类
Feed 流常见的分类有两种:
- Timeline: 按发布的时间顺序排序,产品如果选择 Timeline 类型,那么就是认为 Feed 流中的 Feed 不多,但是每个 Feed 都很重要,都需要用户看到。类似于微信朋友圈,微博等。
- Rank: 按某个非时间的因子排序,一般是按照 用户的喜好度排序,一般用于新闻推荐类、商品推荐等。
设计
设计一个 Feed 流系统,两个关键步骤,一个是 Feed 流的 初始化,一个是 推送。关于 Feed 流的存储其实也是一个核心的点,但是笔主持久化使用的还是 MySQL,后续可以考虑优化。
Feed 流初始化
Feed 流【关注页 Feed 流】的初始化指的是,当用户的 Feed 流还不存在的时候,为该用户创建一个属于他自己的关注页 Feed 流,具体怎么做呢?其实很简单,遍历一遍关注列表,取出所有关注用户的 feed,将 feedId 存放到 redis 的 sortSet 中即可。这里面有几个关键点:
- 初始化数据:初始化的数据需要从数据库中加载出来。
- key 值:sortSet 的 key 值需要使用当前用户的 id 做标识。
- score 值:如果是 Timeline 类型,直接取 feed 创建的时间戳即可。如果是 rank 类型,则把你的业务对应的权重值设进去。
推送
经过上面的初始化,已经把 feed 流放在了 redis 缓存中了。接下来就是需要更新 feed 流了,在下面四种情况需要进行更新:
- 关注的用户发布新的 feed:
- 关注的用户删除 feed。
- 用户新增关注。
- 用户取消关注。
发布/删除 Feed 流程
上面四步具体怎么操作,会在下面的实现步骤中详细描述,在这里先我们重点讨论一下第一、二种情况。因为在处理 大V 【千万级别粉丝】的时候,我们是需要对 大V 的所有粉丝的 feed 流进行处理的,这时候涉及到的量就会非常巨大,需要多加斟酌。关于推送,一般有两种 推/拉。
- 推:A用户发布新的动态时,要往 A用户所有的粉丝 feed 流中推。
- 拉:A用户发布新的动态时,先不进行推送,而是等 粉丝进来的时候,才主动到 A用户的个人页TimeLine 拉取最新的 feed,然后进行一个 merge。如果关注了多个大V,可以并发的向多个大V 个人页TimeLine 中拉取。
推拉结合模式
当用户发布一条新的 Feed 时,处理流程如下:
- 先从关注列表中读取到自己的粉丝列表,以及判断自己是否是大V。
- 将自己的Feed消息写入个人页Timeline。如果是大V,写入流程到此就结束了。
- 如果是普通用户,还需要将自己的Feed消息写给自己的粉丝,如果有100个粉丝,那么就要写给100个用户。
当刷新自己的Feed流的时候,处理流程如下:
- 先去读取自己关注的大V列表
- 去读取自己的 Feed 流。
- 如果有关注的大V,则再次并发读取每一个大V的个人页Timeline,如果关注了10个大V,那么则需要10次访问。
- 合并2和3步的结果,然后按时间排序,返回给用户。
至此,使用推拉结合方式的发布,读取Feed流的流程都结束了。
推模式
如果只是用推模式了,则会变的比较简单:
- 「发布Feed:」
- 不用区分是否大V,所有用户的流程都一样,都是三步。
- 「读取Feed流:」
- 不需要第一步,也不需要第三步,只需要第二步即可,将之前的2 + N(N是关注的大V个数) 次网络开销减少为 1 次网络开销。读取延时大幅降级。
两种模式总结:
推拉结合存在一个弊端,就是刷新自己的Feed流时,大V的个人页Timeline 的读压力会很大。
如何解决:
- 不使用大V/普通用户的优化方式,使用对活跃粉丝采用推模式,非活跃粉丝采用拉模式。
- 完全使用推模式就可以彻底解决这个问题,但是会带来存储量增大,大V Feed 发送总时间增大,从发给第一个粉丝到发给最后一个粉丝可能要几分钟时间。
实现
笔主主要采用纯推模式实现了一个普通企业基本可用的 Feed 流系统,下面介绍一下具体的实现代码,主要包括3大个部分:
- 初始化 Feed 流。
- 关注的用户发布/删除 feed,该用户的粉丝更新自己的Feed流。
- 用户新增/取消关注,更新自己的Feed流。