用户登录

还没有账号?立即注册

注册免费试用

忘记密码

修改密码

数据的高效索引

发布时间:2021-04-19

目前的主流查询索引技术是以Google 公司的BigTable为代表的列簇式NoSQL数据库。BigTable提出了一种介于关系模型和Key-Value对模型之间的新数据模型:Ordered Table。 Ordered Table模型提供了稀疏的、分布式的、持久存储的、基于主键排序的映射﹐数据由行、列和时间戳表示。BigTable中表的Scheme非常灵活﹐可以在运行时修改。Ordered Table模型可以对基于主键的区间查询提供有力的支持,对于涉及多个字段数据的多维区间查询主要采用二级索引技术,但这引起了性能问题。。

为避免大量随机读﹐另一种思路是使用聚簇索引,即同时按索引顺序存储全部数据。为保证多个查询列均有很好的性能﹐需要按多个索引列聚簇,但这将导致存储开销成倍增长。此外还面临着因统计信息的缺失带来的新的挑战。关系数据库领域处理多个维度的查询优化时,关键是根据表的统计信息估算子查询的代价,比如通过记录数量、数据分布的直方图等估算结果集大小﹑需要读取的数据块数量等。

互补式聚簇索引(CCIndex ),利用多副本为每个索引列各创建一张互为补充的聚簇索引表﹐使得索引列上的区间查询对应聚簇索引表的连续扫描。解决了NoSQL数据库的二级索引技术因无法保持连续扫描特性而处理效率低下的问题。同时,结合查询结果集估算方法﹐以挑选最优查询计划。通过禁用底层存储系统的副本机制来避免引入额外的存储开销﹐并提供增量式的快速数据恢复机制。目前,CCIndex技术已应用在淘宝的数据魔方中。


QQ客服

扫描二维码添加QQ

微信客服

扫描二维码添加微信

公司电话

公司电话

17316289114