搜索系统资料选读

[2024-02-08] 推荐系统公开课——8小时完整版，讲解工业界真实的推荐系统

自古搜索和推荐不分家。王树森老师的这个长达 8 小时的公开课，虽说讲的是小红书笔记的推荐系统，但对于搜索领域和其他内容形式也是同样适用的。这个公开课内容很干，王老师几乎没有半句废话，值得搬好小板凳认真听讲。

里面有一些工程方案和技术其实是过时或者效果不好的，所以不必认真研究每个技术知识点，毕竟技术方案是永远追不完的。重要的是思考这些技术和工程方法是源自什么问题，以及研究者当初是处在什么环境、用什么视角去审视和解决他所提出的问题。

后面有空出一期要点总结。为了避免我自己求全求细的恶习复发，可能尽可能迫使自己仅凭记忆口述，并且挑其中印象深刻的要点来写，而不是一字不落地原文整理。

最近王树森老师也开始陆续发“搜索引擎”的课了，我会持续跟进。

这篇文章讲得很系统，尤其是基于业务实践，给出了各种方案的来龙去脉和优劣取舍，工程感满满。其实不要特别在意具体的技术细节，学习下主要的方法和思路即可，以及这篇文章是如何在业务实践逐步引入各种技术方案，最终形成一个完整的技术体系的。

着重学习下原文这个部分，是怎么定义强化学习模型中的环境和目标的。

最终，整个查询改写平台技术框架如下图所示：

文末推荐了阿里巴巴的 AliCoCo，对词关系的研究更为充分，找来看看。

深入了解一个领域的方法之一，就是谷歌搜索几篇系统全面的好文，然后基于这些好文给出的参考文献顺藤摸瓜，无论是 DFS 还是 BFS 都可。比如上面王树森老师的视频里，就给了不少有空的参考文献。再比如这篇其实就是 Google 关键词“搜索召回”返回的第二条结果。