用户登录

还没有账号?立即注册

注册免费试用

忘记密码

修改密码

数据的世系管理

发布时间:2021-04-19

数据世系(Data Provenance)包含了不同数据源间的数据演化过程和相同数据源内部数据的演化过程。数据世系一般有两类基本方法,非注解的方法和基于注解的方法。前者采用模式映射方式使用数据处理函数和其相对应的反向函数,但在更复杂的例子中可能并不存在集合之间的可逆函数﹐必须使用注解描述世系。事实上基于注解的方法的应用范围要远远高于非注解的方法。

数据世系可针对多种数据类型,包括关系型数据、XML数据和不确定数据等。自20 世纪90年代以来﹐数据世系的研究取得很大的进展﹐并且应用到了多个领域之中。面对网络大数据﹐数据世系管理的研究工作需关注以下几个方面:(1)传统的数据管理下的数据世系的管理还有很多的工作亟待考虑﹐其中考察数据的起源和演化过程将是一个大的挑战:(2)在网络环境下不确定性数据广泛存在,并且具有多种多样的表现形式。数据的演化过程同时也伴随着数据不确定性的演化,可以利用数据的世系追踪数据不确定性的来源和演化过程:(3)如何解决异构世系标准的融合问题。大数据应用将涵盖更多的原本可能相互隔离的数据集合﹐如何将适用不同标准的数据世系信息整合在一起是一个关键间题。


QQ客服

扫描二维码添加QQ

微信客服

扫描二维码添加微信

公司电话

公司电话

17316289114