java 热词推荐搜索实现,一个热词推荐的简单实现

最新推荐文章于 2024-03-03 10:00:00 发布

转载最新推荐文章于 2024-03-03 10:00:00 发布 · 2.1k 阅读

·

1

·

标签

#java 热词推荐搜索实现

本文介绍了基于Java实现热词推荐搜索的简单方法，通过构建索引和使用Redis存储，探讨了如何根据用户输入和反馈更新推荐。文章还讨论了使用Solr的弊端，并给出了一个基于Redis的初步实现架构。

原标题：一个热词推荐的简单实现

为什么想做这个东西

一直好奇像亚马逊这类网站的搜索是如何做到推荐的，最近刚好看到一篇文章《 Redis 与搜索热词推荐》，然而只写了思路。所以，就是想自己实现一个。

先上个效果图，再聊：

P.S. 按四年前，要写这样的前端效果，对于我这个后台开发，还是挺困难的。而现在，简单的学了下Vue.js，再加上同事的小小指点，就搞定了。��

热词推荐的本质

假如你预先就知道了用户输入：s、sz、shen、深这些字时，就是想搜“深圳”，那是不是说，我们只要提前将这些字放到一个Map结构中，将用户的输入想像出一个key，value就是“深圳”。

说到底，热词推荐的本质就是一个大大的Map。难点就在于如何更新这个Map，以至于让用户觉得“智能”，或觉得我们在给他们做“推荐”。

这个Map，常常被人称为“索引”。其实使用“索引” 这个名词也更准确一些。Map中的Key是不能重复的。但是我们数据结构是要求可重复的，为什么呢？因为，在系统中，s、sh、shen、深等等这些都是key，而它们对应的value，可能相同，又可能不同。举个例子：

仔细看到其中的不同了吗？同时，这里还有一个问题，那就是当用户输入s时，出现了10个value，我们如何给这些value如何排序呢？

为了与排序模型解耦，我们为每个value都给出一个分数score。score越大，越排前面。最终索引结构就变成了这样子：

P.S. 这些score之所以都为0，是因为数据问题。

总的来说，关于热词推荐，我们需要解决以下问题：

● 如何存储索引的数据？

● 如何构建索引？也就是一开始时，我们怎么知道用户输入“s” 就是要搜“深圳”呢？

● 如何根据用户的反馈行为来更新索引？当用户输入 “s” 出现了“1 沙河”和“2 深圳”，用户选择了“深圳”，那么当其他用户输入“s”时，我们是不是应该将“深圳”这个词放到前面呢？

基于 Solr 实现的弊端

美团在几年前也写了一篇文章来介绍自己的热词推荐：搜索引擎关键字智能提示的一种实现。然而这种实现，个人觉得有个设计非常不好。因为Solr在整个系统中，即做了“存储索引”的角色，又做了“构建索引”的角色。违反了职责单一原则。因为当我们想改变构建索引的算法时，同时会影响到“存储索引”的逻辑。

以下是他们的实现逻辑截图：

另一种基于 Redis 的实现

我目前只写了一个简单实现，而且还没有实现“根据用户反馈来更新索引”的功能。这个功能可实现得很简单，也可以实现得很复杂。本文不讨论。

同时，生产环境会更复杂一些。比如要实现高可用。我个人能力有限，还没有能实现。但是思路是有的：所有出现单点的地方都要做成分布式的，比如Redis就做成Redis Cluster。

以下是架构图：

图中，InitWorker负责将我准备好的全国地名大全的数据，构建成索引，然后写到Redis中。用户则可以通过基于Openresty写的APP去查询Redis中的数据。

使用本系统的方法：

“

P.S. 本系统使用Ansible做自动化部署，所以，请提前安装好Ansible。

1、git clone https://github.com/zacker330/hot-word-recommend.git

2、准备两个Ubuntu 16的机器，如果你懂Vagrant的话，直接使用我的Vagrantfile就好了

3、进入到项目中，执行ansible-playbook ./ansible/playbook.yml -i ./ansible/inventory -u vagrant -k 来自动化部署所有组件。如果使用Vagrant来搭建的环境，密码是 vagrant，以下同，将不在重述。

4、打包我们的InitWorker项目：mvn assembly:assembly

5、部署InitWorker: ansible-playbook ./ansible/deploy-worker.yml -i ./ansible/inventory -u vagrant -k

6、打开链接测试：http://192.168.10.11/index.lsp 。IP换成你自己部署的机器的IP。

具体代码，自己看了。为方便阅读，我觉得有必要注释一下项目结构：

小结

热词推荐的“智能”所在处就在于索引的构建算法。简单一点的做法就是每当用户点击某搜索结果时，我们就给这个索引条目加权1。感兴趣的同学可以实现来玩玩。

推荐阅读

点击“阅读原文”查看更多精彩内容返回搜狐，查看更多

责任编辑：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。