一、表分区文章索引
二、目的
这段时间,在SQL Server的生产环境中尝试了不同方式的表分区,积累了一些这方面的经验,这里就表分区的一些注意事项做些记录。
三、注意事项
1. 表分区的边界值问题,在使用Left和Right的时候需要注意,特别是在时间分割上需要特别注意,通常情况下,以00:00:00.000是可靠的,这种分割就需要使用到Right,如果是Left的话就需要设置为23:59:59.997;更多信息请参考:SQL Server 合并(删除)分区解惑
2. 对于分区值的个值,符合这个值之前的数值都会给分配到个分区中,而使用Left和Right的区别就是这个分区值会被分配到个分区还是第二个分区而已;
3. 在SQL Server 2005 中的分区表和索引也提到在时间分区上的例子,RANGE RIGHT FOR VALUES ('20001001 00:00:00.000', '20010101 00:00:00.000', '20010401 00:00:00.000', '20010701 00:00:00.000'),更加简便的形式就是RANGE RIGHT FOR VALUES ('20001001', '20010101', '20010401', '20010701'),完全撇开了时分秒的问题了。
4. 通常情况下,我们会以一个表Id(int),并且是自增作为分区字段,这样分区的好处就是很容易区分历史数据了(假如你的历史数据是以插入到表的时间来区别的话),而且对分区的操作隔离也是明显的。这里有一个模板就是针对Id为例子的范文:SQL Server 2005 分区模板与实例
5. 当以Id作为分区函数值并不能满足你的需求的时候,你可能需要考虑不一样的东西了,因为在创建Id为主键的时候,默认的情况下就是为这个主键创建为聚集索引的,所以以Id为分区字段的话,Id自增,就会顺序的被放到递增的分区文件中。这里假如你想以分类标识ClassId作为分区的话,那么你有几种选择,一个就是把Id+ClassId作为非聚集的主键(PRIMARY KEY NONCLUSTERED),创建ClassId为聚集索引(CLUSTERED),这样就可以以ClassId作为分区字段了;另外一个选择就是:Id+ClassId作为聚集的主键(PRIMARY KEY CLUSTERED),这样就不用另外创建一个索引了。可以参考文献:已分区索引的特殊指导原则
6. 对聚集索引进行分区时,聚集键必须包含分区依据列。对非的聚集索引进行分区时,如果未在聚集键中明确指定分区依据列,默认情况下 SQL Server 将在聚集索引键列表中添加分区依据列。如果聚集索引是的,则必须明确指定聚集索引键包含分区依据列。对的非聚集索引进行分区时,索引键必须包含分区依据列。对非的非聚集索引进行分区时,默认情况下 SQL Server 将分区依据列添加为索引的非键(包含性)列,以确保索引与基表对齐。如果索引中已经存在分区依据列,SQL Server 将不会向索引中添加分区依据列。可以参考文献:已分区索引的特殊指导原则(要理解上面的描述,需要一点功底)
7. 如果你需要在你的分区上创建全文索引,那么你创建分区的时候就需要注意了,因为全文索引需要索引的支持,而且这个索引不能是复合索引,只能是单个字段的索引。这个索引的要求:“unique, single-column, non-nullable index”。
8. 如果我们的分区值是随着时间的变化而增加的话,那么我们在设置表分区之后,系统跑了一段时间之后,那么后一个分区占用的空间就会越来越大,除非你在创建分区的时候已经确认了这些分区值不会再增加了,在MSDN的文档中:SQL Server 2005 中的分区表和索引,里面提到的月份表分区、地区分区这些固定分区值,这并没有很好的表达在生产环境中所面临的分区值在不断增长的问题。所以这里就针对这个问题做了一个Job,这个Job可以动态、自动化的完成删除分区(交换分区),修改分区函数、分区方案等操作。进入阅读:SQL Server 2005 自动化删除表分区设计方案
9. 在MSDN自动化分区的前驱:SQL2005PartitioningScripts.exe,里面有些是值得参考的,但是开发一个适合自己业务需求的自动化分区也是必要的,有兴趣的可以阅读:SQL Server 动态生成分区脚本,这里主要解决了创建表分区过程中反复修改文件组、文件的名称设置的问题。
四、参考文献
本文来源https://www.cnblogs.com/gaizai/archive/2011/05/31/2064931.html