2. 东北大学 软件学院, 辽宁 沈阳110819
2. School of Software, Northeastern University, Shenyang 110819, China. Corresponding author: BAI Lu-yi, E-mail: baily@neuq.edu.cn
数据库技术是当今世界计算机应用中最重要的基础领域之一.作为现代数据库的重要分支,时空数据库的管理问题是时空数据应用领域中的热点及难点研究问题[1, 2].在时空数据应用领域,由于时空数据的爆炸性增长以及时空数据在现实应用中多以模糊的形式存在,再加上非模糊时空数据相关研究的快速发展,因此对模糊时空数据的管理受到了越来越高的重视[3, 4, 5].模糊时空数据管理能力在很大程度上依赖于数据模型的设计[6, 7],模糊时空数据模型是实现模糊时空数据管理的基础.为了实现模糊时空XML数据的建模,若干个模糊构造子被引入到XML文档中[8].因此,需要对XML文档的Schema进行模糊时空扩展,同时,需要通过修改XML文档的Schema以容纳这些新引入的模糊构造子[9, 10].
本文首先提出模糊时空XML数据模型,之后分别对模糊时空XML数据模型中5个部分的Schema进行扩展,并举出具体实例加以说明.
1 模糊时空XML数据模型XML数据模型最基本的结构是数据树.因此,本文将每一个模糊时空数据看成一棵模糊时空XML文档树.根据模糊时空数据的特点,首先给出其基于XML的数据模型.
定义1 模糊时空XML数据可以表示为一个5元组:FSP =(OID,ATTR,FP,FM,FT). 其中:OID表示模糊时空数据的变化历史;ATTR表示模糊属性;FP表示模糊位置;FM表示模糊运动;FT表示模糊时间.
模糊时空数据的变化历史OID的变化不仅可以表示模糊时空数据的变化类型,还可以表示该模糊时空数据由什么数据变化而来,变化成什么数据.本文用ATTR表示模糊时空数据的属性,属性个数可以是一个或多个,可以是模糊或非模糊;FP表示模糊时空数据的位置信息,可以是模糊的;FM包括模糊时空数据的运动方向和运动值;FT包括模糊时间点和模糊时间区间.
2 模糊时空XML数据的Schema扩展由模糊时空XML数据模型可知,模糊时空数据分为OID,ATTR,FP,FM以及FT 5部分.因此,本节从以上5部分分别对模糊时空XML数据的Schema进行扩展.
2.1 OID部分对OID部分时空XML数据的Schema扩展定义了存在的元素节点和属性节点,以及这些节点间的结构关系.本文将变化类型、前趋以及后继看作非模糊的,因此这3个元素节点没有可能性分布.值得一提的是,“original-definition”是通用的节点名,可以根据实际需要由模糊时空XML数据文档中具体的节点名所替代.另外,“fttype”表示模糊时间类型,具体将在FT部分时空XML数据的Schema扩展中讨论.关于OID部分时空XML数据的Schema扩展如图 1所示.
2.2 ATTR部分对ATTR部分时空XML数据的Schema扩展,属性节点存在析取和合取两种类型可能性分布,因此,需要定义这两种类型的可能性分布,并定义Dist区分这两种类型可能性分布.此外,取值为[0, 1]的可能性属性“Poss”被定义,用来表示节点的隶属度或可能性分布值.关于ATTR部分时空XML数据的Schema扩展如图 2所示.
由于本文主要研究二维模糊时空数据,对FP部分时空XML数据的Schema扩展仅定义了模糊时空数据的MBR部分.对于一维模糊时空数据,可将sequence部分替换为“xl”和“xr”.关于FP部分时空XML数据的Schema扩展如图 3所示.
对FM部分时空XML数据的Schema扩展分别定义了运动变化方向和运动变化值的Schema.由于存在3种运动变化方向,因此在时空XML数据的Schema扩展中将这3种运动变化方向进行枚举.关于FM部分时空XML数据的Schema扩展如图 4所示.
对FT部分时空XML数据的Schema扩展,实际上是对模糊时空数据的其他4部分元素节点的时间属性进行模式扩展.本文用“Ts”和“Te”分别表示时间属性的起始时间点和结束时间点,其类型为“xs:fuzzyinterger”,表示起始时间点和结束时间点是模糊的.关于FT部分时空XML数据的Schema扩展如图 5所示.
在对模糊时空XML数据进行Schema扩展之后,下面举出一个具体实例对其加以说明.代码1~36行是带有模糊时空信息的XML文档片断,下面分别从模糊时空XML数据的OID,ATTR,FP,FM以及FT部分进行说明.
代码片断:
1. <clouds>
2. <Val Poss = 0.9>
3. <cloud OID = “Wiz Khalifa”>
4. <type Ts = “t0”>“create”
5. <covered cities Ts = “t1” Te = “t2”>
6. <Dist type = “conjunctive”>
7. <Val Poss = 0.8>Shenyang
8. <Val Poss = 0.7>Dalian
9. </Dist>
10. </covered cities>
11. <cloud density Ts = “t3” Te = “t4”>
12. <Dist type = “disjunctive”>
13. <Val Poss = 0.85>thick
14. <Val Poss = 0.75>thin
15. <Dist>
16. </cloud density>
17. <position Ts = “t5” Te = “t6”>
18. <Val Poss = 0.8>
19. <xmin>3min>
20. <ymin>5min>
21. <xmax>6max>
22. <ymax>8max>
23. </Val>
24. </position>
25. <motion Ts = “t7” Te = “t8”>
26. <Val Poss = 0.7>
27. <xaxis>“(”
28. <yaxis>“(”
29. </Val>
30. <Val Poss = 0.8>
31. <xval>4
32. <yval>6
33. </Val>
34. </motion>
35. </Val>
36. <clouds>
第3行,表示cloud名为“Wiz Khalifa”的可能性分布为0.9.当元素节点的可能性分布等于1时,标签<Val Poss=1.0>和标签</Val>通常被省略,例如第4行的变化类型是非模糊的,因此标签<Val Poss = 1.0>和标签</Val>被省略.
基于标签<Val Poss>和标签</Val>,可以表示元素节点的隶属度和属性节点的可能性分布.对ATTR部分XML模式的模糊时空扩展,本文引入Dist区分属性节点存在唯一值或多个值.第6行到第9行是合取可能性分布,这是因为名为“Wiz Khalifa”的云层可能在同一时间覆盖多个城市.第12行到第15行是析取可能性分布,这是因为云层的密度在同一时间是唯一值.
第17行到第24行表示云层的位置信息,其中该云层模糊位置的MBR表示点为(3,5)和(6,8).第18行和第23行表示该云层处于此位置的隶属度等于0.8.
第25行到第34行表示云层的运动信息.其中,第27行和第28行表示云层运动方向是右上方向(东北方向).第26行和第29行表示云层的运动方向是右上方向(东北方向)的隶属度等于0.7.第31行和第32行表示云层的运动变化值在水平方向扩大4倍、在垂直方向扩大6倍.第30行和第33行表示云层的运动变化值为第31行和第32行所示的隶属度等于0.8.
第4行到第5行、第11行、第17行,第25行都包括时间信息,并且标识为“Ts”和“Te”的时间信息可能是模糊的.第4行的时间信息表示名为“Wiz Khalifa”的云层在时间t0时被创建.由于模糊时空数据的变化类型是非模糊的,因此t0是非模糊的;第5行的时间信息表示云层在t1和t2的时间区间上所覆盖的城市是第7行的Shenyang和第8行的Dalian,其中t1和t2可以是模糊时间;第11行的时间信息表示云层的密度在t3和t4的时间区间上是第13行可能性分布为0.85的浓和第14行可能性分布为0.75的稀,其中t3和t4可以是模糊时间;第17行的时间信息表示云层在t5和t6的时间区间上位置在第19行到第22行上,其中t5和t6可以是模糊时间;第25行的时间信息表示云层在t7和t8的时间区间上运动变化方向是第27行和第28行的右上方向,运动变化值是第31行的水平方向扩大4倍和第28行的垂直方向扩大6倍,其中t7和t8可以是模糊时间.
4 结语本文形式化提出了模糊时空XML数据模型,并分别对模糊时空XML数据模型中5个部分的Schema进行扩展,通过具体实例说明其兼容模糊时空信息,以达到管理模糊时空XML数据的目的.
[1] | Wang X Y,Zhou X F.Spatiotemporal data modeling and management:a survey [C]//Proceedings of the 36th International Conference on Technology of Object-Oriented Languages and Systems.Xi′an,2000:202-211.(1) |
[2] | Abraham T,Roddick J F.Survey of spatiotemporal databases [J].GeoInformatica,1999,3(1):61-99.(1) |
[3] | Stefanakis E.A unified framework for fuzzy spatiotemporal representation and reasoning [C]//Proceedings of the 20th International Cartographic Conference.Beijing,2001:2678-2687.(1) |
[4] | Szer A,Yazici A,Ouztüzün H,et al.Modeling and querying fuzzy spatiotemporal databases [J].Information Sciences,2008,178(19):3665-3682.(1) |
[5] | Ribaric S,Hrkac T.A model of fuzzy spatiotemporal knowledge representation and reasoning based on high-level Petri nets [J].Information Systems,2012,37(3):238-256.(1) |
[6] | Pelekis N,Theodoulidis B,Kopanakis I,et al.Literature review of spatiotemporal database models [J].The Knowledge Engineering Review,2004,19(3):235-274.(1) |
[7] | Nandal R.Spatiotemporal database and its models:a review [J].Journal of Computer Engineering,2013,11(2):91-100.(1) |
[8] | Ma Z M,Yan L.Fuzzy XML data modeling with the UML and relational data models [J].Data Knowledge Engineering,2007,63(3):972-996.(1) |
[9] | Yan L,Ma Z M,Liu J.Fuzzy data modeling based on XML schema [C]//Proceedings of the 2009 ACM Symposium on Applied Computing.Hawaii,2009:1563-1567.(1) |
[10] | Franceschet M,Montanari A,Gubiani D.Modeling and validating spatiotemporal conceptual schemas in XML Schema [C]//Proceedings of the 18th International Conference on Database and Expert Systems Applications.Regensburg,2007:25-29.(1) |