深入搜索引擎原理 | 5月15日云栖夜读

简介: 在本刊开篇文章中,讲述了:之前几段工作经历都与搜索有关,现在也有业务在用搜索,对搜索引擎做一个原理性的分享,包括搜索的一系列核心数据结构和算法,尽量覆盖搜索引擎的核心原理,但不涉及数据挖掘、NLP等。文章有点长,多多指点~~ # 一、搜索引擎引题 ## 搜索引擎是什么? 这里有个概念需要提一下。

点击订阅云栖夜读日刊,专业的技术干货,不容错过!

阿里专家原创好文

1.深入搜索引擎原理

本文讲述:之前几段工作经历都与搜索有关,现在也有业务在用搜索,对搜索引擎做一个原理性的分享,包括搜索的一系列核心数据结构和算法,尽量覆盖搜索引擎的核心原理,但不涉及数据挖掘、NLP等。文章有点长,多多指点~~ # 一、搜索引擎引题 ## 搜索引擎是什么? 这里有个概念需要提一下。阅读更多》》

2.印度版的“大众点评”如何将 Food Feed 业务从 Redis 迁移到 Cassandra

Zomato 是一家食品订购、外卖及餐馆发现平台,被称为印度版的“大众点评”。目前,该公司的业务覆盖全球24个国家(主要是印度,东南亚和中东市场)。本文将介绍该公司的 Food Feed 业务是如何从 Redis 迁移到 Cassandra 的。阅读更多》》

3.如何实现7*24小时灵活发布?阿里技术团队这么做

本文讲述研发效能分为两块,一是用技术的更新来提升效率;二是提高整个技术生态中的协同效率,激发技术活力。阅读更多》》

4.OPPO数据中台之基石:基于Flink SQL构建实数据仓库

本文整理自 2019 年 4 月 13 日在深圳举行的 Flink Meetup 会议,分享嘉宾张俊,目前担任 OPPO 大数据平台研发负责人,也是 Apache Flink contributor。阅读更多》》

5.etcd 在超大规模数据场景下的性能优化

里云智能事业部高级开发工程师 陈星宇(宇慕) 概述 etcd是一个开源的分布式的kv存储系统, 最近刚被cncf列为沙箱孵化项目。etcd的应用场景很广,很多地方都用到了它,例如kubernetes就用它作为集群内部存储元信息的账本。阅读更多》》

视频课程及PPT下载

1.图数据库GDB——Gremlin介绍及范例
第一部分:Gremlin基础与概念
第二部分:Gremlin场景与查询范例
第三部分:Gremlin最佳实践
视频地址:https://yq.aliyun.com/live/1083
PPT下载地址:https://yq.aliyun.com/download/3549

2.DTCC 2019第十届中国数据库技术大会--《云时代数据库迁移 & 容灾技术新进展与应用》
视频地址:https://yq.aliyun.com/live/1048
PPT下载地址:待上传

3.阿里云新品发布会第57期:DataWorks 实时数据开发平台发布会
视频地址:https://yq.aliyun.com/live/1019
PPT下载地址:待上传

更多精彩直播

热门话题

1.菜鸟进阶 | 程序员必备装备有哪些?

  • 那么,大家都用过哪些神装备?拉出来遛一遛哇~ Show Time !!!

点此进入回答赢取礼物

2.阿里开发者招聘节 | 面试题15-17:如何看待异构计算在整个云计算中的位置和作用?

  • 请分析MaxCompute产品与分布式技术的关系、当前大数据计算平台类产品的市场现状和发展趋势。
  • 一颗现代处理器,每秒大概可以执行多少条简单的MOV指令,有哪些主要的影响因素?
  • 请计算XILINX公司VU9P芯片的算力相当于多少TOPS,给出计算过程与公式。

点此进入回答赢取礼物

往期精彩回顾

架构整洁之道, 看这一篇就够了 | 5月14日云栖夜读

点击订阅云栖夜读日刊,专业的技术干货,不容错过!

目录
相关文章
|
7月前
|
物联网 Linux 测试技术
近期精选文章汇总
近期精选文章汇总
47 1
|
消息中间件 Apache RocketMQ
优秀实践案例征集火热开启,快来投稿!
RocketMQ 社区「优秀实践案例征集」活动开始啦! 将RocketMQ实践过程中的最佳实践与踩坑经历,快来和大家分享 优秀案例作者更有机会参与RocketMQ Summit、获得社区纪念
优秀实践案例征集火热开启,快来投稿!
|
机器学习/深度学习 人工智能 自然语言处理
系列征文3|算法领域主题征文开始啦!
阿里云开发者社区推出“算法技术征文挑战赛”。现面向社区所有开发者征集算法领域技术文章,可以是对算法思想的剖析,也可以是前沿算法的探索,只要你有干货,那就分享出来!在活动规定时间内前往阿里云开发者社区发文,就有机会获得空气炸锅、社区积分等丰富奖励,参与即可获奖,快来参加吧!
系列征文3|算法领域主题征文开始啦!
|
弹性计算 Kubernetes Cloud Native
开发者社区精选直播合集(四十一)| 探秘阿里黑科技 宜达
“宜搭”是阿里巴巴自主研发的,面向业务开发者使用的零代码业务应用搭建平台。通过可视化拖拉拽的方式编辑和配置页面、表单和流程,并支持一键发布到PC和手机端,让不会代码的人也能轻松搭建应用。
开发者社区精选直播合集(四十一)|  探秘阿里黑科技 宜达
|
存储 SQL 运维
直播预告 | Cassandra中文社区开年峰会
Apache Cassandra是连续9年在DB-Engines流行度排名第一的宽表数据库:支持类SQL语法CQL,开发体验接近MySQL。采用分布式、无中心架构,单节点起配,可扩展PB级存储及千万OPS读写能力。提供表级、行级、列级TTL,可便捷应对数据生命周期管理。原生支持跨DC容灾等等诸多优势特性。在互联网、社交、智能制造、金融、IoT等行业应用广泛。
378 0
直播预告 | Cassandra中文社区开年峰会
|
机器学习/深度学习 人工智能 算法
【云栖大会精彩回顾 】 | 一文了解搜索&推荐产品技术论坛
解读本期云栖大会搜索与推荐论坛的精彩内容,公布活动中奖名单~
5142 0
【云栖大会精彩回顾 】 | 一文了解搜索&推荐产品技术论坛
|
存储 Kubernetes Cloud Native
重磅合集 | 31 篇技术文章,带你从零入门 K8s (留言赠书)
由阿里云与 CNCF 共同开发的《CNCF x Alibaba 云原生技术公开课》(视频课程)第一期已更新完毕。本文整理了全部课程文章 31 篇,期待给正在学习 Kubernetes 的同学提供一些参考。
12813 0
重磅合集 | 31 篇技术文章,带你从零入门 K8s (留言赠书)
|
存储 人工智能 自然语言处理
【活动精彩回顾】搜索&推荐技术分享沙龙电商专场(附视频)
有搜索推荐功能需求的用户正在关注什么?怎样正确使用产品达成业务增长?10个用户精选问答送上,你关心的都在这里。同时,为大家带来搜索和推荐领域适用于电商行业的干货内容分享。
2679 0
【活动精彩回顾】搜索&推荐技术分享沙龙电商专场(附视频)
|
开发者 云栖大会 数据库
30+云栖演讲稿实录 & 70+PPT资料下载持续更新中,错过再等一年!
2019年9月25日-27日,杭州云栖大会圆满举办。大会包含130+场峰会和专场、上千位重量级分享嘉宾以及硬核科技大型展区。开发者社区搜集全站云栖资料与大咖演讲实录,为你带来一年仅此一次的丰富云栖干货!
13302 0
|
前端开发 JavaScript
《阿里云前端技术周刊》第十九期
作者: @语安 校对:@行剑 @牧曈 知乎:阿里云中台前端/全栈团队专栏 Github:阿里云前端技术周刊 给我们投稿:传送门 参与交流:传送门 前端速报 React 新的 DevTools 带来新的改动,现在可以在Chrome,Firefox和(Chromium)Edge中使用。
845 0