搜索历史基本原理实现即时自动补全联想搜索技巧
这篇文章主要为大家介绍了搜索历史基本原理实现即时自动补全联想搜索技巧示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多入步,早日升职加薪
实现搜索历史-[即时自动补全&联想搜索]
无论是新闻、内容、还是电商平台,联想输进已经成为搜索功能的标配,早已不是什么新鲜事物。我们随便打开一个搜索引擎或者是电商平台,当我们在输进框输进拼音或者文字时就会观到输进框下方弹出有意义的搜索建议,提示我们是不是想要输进“以下”内容,帮助我们补齐输进或是修正错误的输进,优化我们的搜索体验。
在上图示例中,我们可以观到,输进要害字 联想搜索,Google 搜索会联想到联想搜索、elasticsearch联想搜索,好处就是,我们无须输进完整的要害字即可轻松完成针对这些 topics 的搜索。
今天我们实现的功能和联想搜索有一点差别,我们是根据用户隔离,基于个人搜索历史的联想搜索。
如何实现基于个人搜索历史的联想推荐
一个好的自动补全器必须是快速的,并且在用户键进下一个字符后立即更新联想词列表。自动补全器的核心是一个函数,它接受输进的前缀,并搜索以给定前缀开头的词汇或语句列表。通常来说,只需要返归少量的数目即可。
架构图
词汇表实现
实现方式有很多种,例如前缀树实现,有限状态自动机(DFA)实现等等。
这里采用Redis ZSET数据结构快速实现。
- Redis 有序集合和集合一样也是 string 类型元素的集合,且不答应重复的成员。
- 不同的是每个元素都会关联一个 double 类型的分数。redis 正是通过分数来为集合中的成员入行从小到大的排序。
type zset key search-history-common key search-history-user:1 key search-history-user:2 key search-history-user:3
备注:
- 常用搜索词库数据统计规则:定时取出所有人词库中排名靠前n位的搜索项并放进常用搜索库中
- 分数值 = 原有分数值*1.01+1.01 (为什么用一元函数,因为可以让常用词和不常用词更快的区分开)
- 分数值初始值为 1
实现原理
新增要害字操作
- 直接添加 默认score = 1
- 添加失败查询score
- 设置新score = score*1.1+1.1 (注重zset不能重新设置score
- 缓存完成
# 计算新score # 新score应该 = score*1.1+1.1 但是 需要用ZADD,所以需要换算,(score*1.1+1.1)-score = a ZADD key a member # 化简得到 ZADD key score*0.1+1.1 member
# 添加 member = 1 返归 score # 假如存在则添加失败 返归 0 ZADD key 1 member # 获取分,不存在返归 null ZSCORE key member # 对某个键加上增量 ZADD key 1 member
删除要害字操作
- 直接删除
# 删除成功返归 1,假如一个zset下没有item, zset也会被自动删除 ZREM key member
查询推荐列表操作
- 全量查询当前用户词汇表
- 使用String.contains 或者其他框架过滤出推荐词
- 返归推荐列表到前端
# 全量查询 zset key(从小到大) ZRANGE key 0 -1 member2 member # 全量查询 zset key(从大到小) ZRANGE key 0 -1 WITHSCORES member2 2 member 6
以上就是搜索历史基本原理实现即时自动补全联想搜索技巧的具体内容,更多关于搜索历史自动补全联想搜索的资料请关注其它相关文章!
很赞哦!()
大图广告(830*140)