首页 文章

群集索引和非群集索引之间有什么区别?

提问于
浏览
248

clusterednon-clustered index 之间有什么区别?

11 回答

  • 25

    聚集指数

    • 每张 table 只有一张

    • 读取速度比非聚集读取速度快,因为数据按索引顺序进行物理存储

    非聚集指数

    • 每张 table 可以多次使用

    • 插入和更新操作比聚簇索引更快

    当选择具有使用索引的字段但会减慢更新和插入操作的数据时,这两种类型的索引都将提高性能 .

    由于插入和更新速度较慢,应在通常为增量的字段(即Id或Timestamp)上设置聚簇索引 .

    如果SQL Server的选择性高于95%,SQL Server通常只使用索引 .

  • 5

    聚簇索引在物理上对磁盘上的数据进行排序 . 这意味着索引不需要额外的数据,但只能有一个聚簇索引(显然) . 使用聚簇索引访问数据的速度最快 .

    所有其他索引必须是非群集的 . 非聚集索引具有与保持有序的索引列一起的数据的副本以及指向实际数据行的指针(如果存在,则指向聚簇索引的指针) . 这意味着通过非聚集索引访问数据必须经过额外的间接层 . 但是,如果仅选择索引列中可用的数据,则可以直接从重复的索引数据中获取数据(这就是为什么最好只选择所需的列而不使用*)

  • 68

    聚簇索引物理存储在表中 . 这意味着它们是最快的,每个表只能有一个聚簇索引 .

    非聚集索引是单独存储的,您可以拥有任意数量的索引 .

    最好的选择是在最常用的唯一列上设置聚簇索引,通常是PK . 你应该总是在你的表中有一个精心挑选的聚集索引,除非有一个非常令人信服的理由 - 不能想到一个,但是嘿,它可能在那里 - 因为没有这样做 .

  • 5

    聚集指数

    • 表只能有一个聚簇索引 .

    • 通常在主键上进行 .

    • 聚簇索引的叶节点包含数据页 .

    非聚集索引

    • 一个表只能有249个非聚簇索引(直到sql版本2005更高版本支持最多999个非聚簇索引) .

    • 通常在任意键上制作 .

    • 非聚簇索引的叶节点不包含数据页 . 相反,叶节点包含索引行 .

  • 6

    聚集指数

    • 表中只能有一个聚簇索引

    • 对记录进行排序并根据订单进行物理存储

    • 数据检索比非聚集索引更快

    • 不需要额外的空间来存储逻辑结构

    非聚集指数

    • 表中可以有任意数量的非聚簇索引

    • 不影响物理秩序 . 为数据行创建逻辑顺序并使用指向物理数据文件的指针

    • 数据插入/更新比聚簇索引更快

    • 使用额外空间存储逻辑结构


    除了这些差异之外,您还必须知道,当表是非群集的时(当表没有聚簇索引时),数据文件是无序的,并且它使用堆数据结构作为数据结构 .

  • 5

    聚集基本上意味着数据处于表中的那种物理顺序 . 这就是为什么每桌只能有一个 .

    Unclustered意味着它“仅”是一个逻辑顺序 .

  • 20

    优点:

    聚簇索引适用于范围(例如select * from my_table,其中my_key介于@min和@max之间)

    在某些情况下,如果使用orderby语句,DBMS将不必进行排序 .

    缺点:

    群集索引可以减慢插入速度,因为如果新密钥不按顺序排列,则必须在记录放入时修改记录的物理布局 .

  • 234

    聚集索引实际上描述了记录物理存储在磁盘上的顺序,因此您只能拥有一个 .

    非群集索引定义与磁盘上的物理顺序不匹配的逻辑顺序 .

  • 31

    聚簇索引本质上是索引列中数据的排序副本 .

    聚簇索引的主要优点是,当您的查询(搜索)在索引中查找数据时,不需要额外的IO检索那些数据 .

    维护聚簇索引的开销(尤其是在频繁更新的表中)可能导致性能不佳,因此可能最好创建非聚簇索引 .

  • 0

    索引数据库有两部分:一组物理记录,按任意顺序排列;一组索引,用于标识应读取记录的顺序,以产生按某种标准排序的结果 . 如果物理排列和索引之间没有相关性,那么按顺序读出所有记录可能需要进行大量独立的单记录读取操作 . 因为数据库可以在比读取两个非连续记录所花费的时间更短的时间内读取数十个连续记录,所以如果索引中连续的记录也连续存储在磁盘上,则可以提高性能 . 指定索引是群集的将导致数据库做出一些努力(不同的数据库有多少不同)来安排事情,以便索引中连续的记录组在磁盘上是连续的 .

    例如,如果要以空的非群集数据库开始并按随机顺序添加10,000条记录,则记录可能会按添加顺序添加到最后 . 按索引按顺序读出数据库需要10,000个单记录读取 . 但是,如果要使用群集数据库,系统可能会检查添加每条记录的时间是否自己存储了以前的记录;如果发现是这种情况,它可能会在数据库末尾用新的记录写下该记录 . 然后,它可以在移动的记录用于驻留的插槽之前查看物理记录,并查看随后的记录是否由其自身存储 . 如果发现是这种情况,它可以将该记录移动到该位置 . 使用这种方法会导致许多记录成对分组,因此可能几乎使顺序读取速度加倍 .

    实际上,群集数据库使用比这更复杂的算法 . 但需要注意的一点是,在更新数据库所需的时间与按顺序读取数据库所需的时间之间存在权衡 . 维护群集数据库将显着增加以任何可能影响排序顺序的方式添加,删除或更新记录所需的工作量 . 如果按顺序读取数据库的次数比更新次数要多,则群集可能是一个很大的胜利 . 如果它经常更新但很少按顺序读出,则群集可能是一个很大的性能消耗,特别是如果项目添加到数据库的顺序与它们关于聚簇索引的排序顺序无关 .

  • 8

    //从MSDN复制,其他答案中没有明确提到非聚集索引的第二点 .

    Clustered

    • 聚簇索引根据键值对表或视图中的数据行进行排序和存储 . 这些是索引定义中包含的列 . 每个表只能有一个聚簇索引,因为数据行本身只能存储在一个订单中 .

    • 表中的数据行以排序顺序存储的唯一时间是表包含聚簇索引 . 当表具有聚簇索引时,该表称为聚簇表 . 如果表没有聚簇索引,则其数据行存储在称为堆的无序结构中 .

    Nonclustered

    • 非聚簇索引具有与数据行分开的结构 . 非聚簇索引包含非聚簇索引键值和
      每个键值条目都有一个指向包含键值的数据行的指针 .

    • 从非聚簇索引中的索引行到数据行的指针称为行定位符 . 行定位器的结构取决于数据页是存储在堆还是聚簇表中 . 对于堆,行定位器是指向该行的指针 . 对于集群表,行定位器是聚簇索引键 .

相关问题