`
Towan
  • 浏览: 7457 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

索引的建立、更新策略

阅读更多

 

一、索引的建立分为三种方式:

1.两遍文档倒排法

第一遍文档扫描时完成一些全局信息统计,如文档集合的数量、每个文档的单词数量、词频等

第二遍文档扫描的主要任务是填补每个单词的倒排列表,完全在内存中进行

2.排序倒排法

步骤为:

排序文档ID赋值、单词ID赋值、更新词典、统计词频、构建三元组、三元组排序、写中间结果文件、合并中间结果文件。

3.归并倒排法

 

二、索引更新

1.完全重建策略

2.再合并策略

3.原地更新策略

4.混合策略

0
0
分享到:
评论

相关推荐

    Lucene创建与搜索索引

    Lucene创建与搜索索引。个人做的流程总结。

    数据库索引设计思想与优化策略

    如何选择索引,如何创建高效实用的索引以及如何利用索引优化SQL等等。内容尽在其中, 希望爱学习的小伙伴,一起奋发进步,希望开发小伙伴能够更深层次的理解和了解索引, 合理利用索引来高效服务于我们系统。

    论文研究-向量空间划分类索引的动态更新代价分析.pdf

    针对索引的空间划分和数据划分这两种策略,在已有的索引结构基础上建立了向量空间划分类型索引的代价模型,该模型可实现查询以及动态更新的性能评价。以KDB-树系为评估对象,从结点存取次数(NA)值推导计算出页面...

    基于HTML标签分析的网页加权索引策略.pdf

    基于HTML标签分析的网页加权索引策略.pdf

    深入解析MongoDB聚合与索引:提升数据库效能的关键策略

    同时,深入探讨MongoDB索引的类型(如单键索引、复合索引、多键索引等),并分析索引的创建、管理和优化策略。此外,文章还介绍了索引对查询性能的影响,包括如何通过explain()方法分析查询和索引效率,以及覆盖查询...

    MySql索引使用策略分析

    1.可以通过建立唯一索引或者主键索引,保证数据的唯一性. 2.提高检索的数据性能 3.在表连接的连接条件 可以加速表与表直接的相连  4.建立索引,在查询中使用索引 可以提高性能 索引缺点 1.在创建索引和维护索引 会...

    论文研究-面向信息检索的藏文文本索引策略研究.pdf

    互联网文本数量持续爆炸式增长,用户通过互联网查找信息变得更加困难,响应时间得不...针对藏文本身的语言学特点,探讨一种面向信息搜索的藏文文本索引建立策略,建立一种高效的藏文文本索引,以提高藏文信息检索速度。

    论文研究-基于路径索引的密集邻域图数据查询方法研究.pdf

    分析顶点密集领域数据的特点后,提出了一种对顶点密集邻域建立路径索引的策略,显著地提高了此类查询的效率。首先分析顶点密集邻域的查询模式,并在这些模式上建立路径索引;然后采用B 树方法对路径索引的存储、更新...

    Oracle数据库设计策略及规范.docx

    索引对新增,删除,更新的性能影响比较大,对相关的表的索引使用要权衡 为表和索引建立不同的表空间,禁止在系统表空间中放入非核心oracle系统成分的对象, 确保数据表空间和索引表空间位于不同的磁盘磁盘驱动器上...

    论文研究-层次序列索引的大规模动态标签图子图查询.pdf

    针对图的动态变化,提出了更新点拓扑扩展式索引维护策略,仅从局部变化顶点及边开始进行增量式更新,大大降低了重建索引造成的巨大开销;提出了基于DHS索引的子图查询方法,仅需将查询图与数据图的层次序列进行匹配...

    论文研究-基于动态文档集的索引技术.pdf

    倒排文件是全文检索中广泛使用的索引结构,对...同时特定的应用领域如新闻搜索、桌面搜索等对实时更新性能要求较高,这需要使用有效的索引更新策略,也称动态索引。描述了常用的动态索引技术,并详细分析了其使用代价。

    深入理解MySQL索引原理和实现——为什么索引可以加速查询?

    说到索引,很多人都知道“索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址,在数据...创建索引在创建表的时候添加索引 在创建表以后添加索引 注意:1、索引需要占用磁盘空间

    分析源代码自动生成数据表索引方案(QT代码)

    分析大型系统源代码中包含的SQL语句,解析这些SQL语句访问的数据表和条件表达式,连接数据库,探测对应的数据表包含的记录个数和参与条件过滤的字段的有效值个数,为数据表构建索引策略提供,并自动生成索引创建脚本...

    Mysql中的索引精讲

    最佳索引使用策略 1.常见索引类型(实现层面) 首先不谈Mysql怎么实现索引的,先马后炮一下,如果让我们来设计数据库的索引,该怎么设计? 我们首先思考一下索引到底想达到什么效果?其实就是想能够实现快速查找数据...

    MySQL数据库性能优化之索引优化

    是不是索引创建越多,性能越好?到底该如何设计索引,才能大限度的发挥其效能?  这篇文章主要是带着上面这几个问题来做一个简要的分析,同时排除了业务场景所带来的特殊性,请不要纠结业务场景的影响。  这是...

    mysql下普通索引和唯一索引的效率对比

    今天在我的虚拟机中布置了环境,...因此,应该只为那些最经常出现在查询条件(WHEREcolumn=)或排序条件(ORDERBYcolumn)中的数据列创建索引。只要有可能,就应该选择一个数据最整齐、最紧凑的数据列(如一个整数类型

    turf-index:草皮索引策略的基本概念证明。 仅支持开箱即用的 rtree

    用于创建地理索引的 turf 模块 turf.index(points, index-type) 为一组 Point|points 创建索引结构并将它们附加到 FeatureCollection|featurecollection 参数 范围 类型 描述 points FeatureCollection.<点> ...

    一个go语言实现的简单搜索引擎

    实时搜索引擎,索引器和检索器就是同一个服务,通过json方式push数据进引擎,引擎自行就行存储,不需要先进行全量索引建立 支持搜索,过滤,汇总,统计四种查询 策略引擎部分可以自己实现接口进行扩展 无配置文件,...

    一种基于混合索引的HDFS小文件存储策略 (2015年)

    针对HDFS海量小文件存储时元数据服务器节点内存开销过大,合并文件中小文件访问效率不高的问题,提出一种改进的基于混合索引的小文件存储策略,应用分类器分类标记小文件,并在元数据服务器建立H - B + 树索引,在存储...

    论文研究-支持文件动态更新的基于属性可搜索加密方案.pdf

    最后给出了方案的安全性分析和性能分析,并与几种类似的索引建立方案进行了对比,发现本方案搜索效率高、索引长度较少,实现了文件的动态更新,还能达到更高的安全级别(CKA-2),具有更好的应用性和扩展性。

Global site tag (gtag.js) - Google Analytics