2. 南京航空航天大学 计算机科学与技术学院, 江苏 南京 211106
2. College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China
语义Web[1]是对现有Web的一个扩展, 它允许计算机系统能够理解、分享和推理当前Web中的数据.本体(Ontology)是概念化的明确的规范说明[2], 能够利用规则来表示不同实体之间的属性和关系, 常用于信息处理和知识工程域.在语义Web的层次结构中本体处于核心位置, 是语义Web知识表示的标准.OWL是万维网联盟W3C推荐的标准本体描述语言.由于初始版本OWL 1自身的一些不足, W3C基于OWL 1进一步提出OWL 2本体语言[3].OWL 2增强了表达能力和元建模能力, 对数据类型的扩展支持, 特别是扩展注释能力.在现实生活中, 信息往往包含有不精确和不确定性内容, 以经典描述逻辑为基础的本体模型无法表示和处理模糊知识, 为了使本体模型能够表示和处理模糊知识, 很多研究工作利用模糊集理论对本体进行模糊化扩展, 进而产生了一种新的知识表示模型——模糊本体模型[2].
在本体工程领域, 近年来已有一些研究工作致力于数据模型到本体及本体到数据库模型的映射, 其中前者服务于本体的构建[4], 后者服务于本体的存储[5], 它们是实现本体管理的基础.与经典本体的状况类似, 在模糊本体领域, 已有一些研究工作致力于模糊数据模型到模糊本体的映射[6].例如, 文献[7]建立了模糊本体和模糊关系数据库之间的对应关系, 提出了由模糊关系数据库构建模糊OWL 1本体的形式化方法.需要指出的是, 当前有关模糊本体到模糊数据库模型映射方法的研究工作还很少.文献[8]针对模糊中医药本体的存储, 通过实例给出了模糊中医药本体基于关系数据库中的存储结构, 但该存储结构不具有通用性.文献[9]给出模糊本体的形式化定义, 提出了模糊本体的类、对象属性和数据属性到模糊关系数据库的存储算法, 并利用RDF数据模型表示模糊本体实例存储到模糊关系数据库中, 但所提方法只适用于模糊OWL 1本体存储.
随着模糊本体研究工作的逐步深入, 越来越多基于OWL 2语言的模糊本体[2]将被建立和使用, 它们的持久化存储就成为模糊本体工程领域一个亟待解决的重要问题.模糊本体到模糊数据库模型映射方法的提出, 将为模糊本体数据库存储的实现奠定坚实的理论基础.本文以模糊OWL 2本体作为映射的源模型, 以模糊数据库领域流行的模糊关系数据库[10]作为映射的目标模型, 给出模糊OWL 2本体到模糊关系数据库映射的形式化方法, 以及映射的合理性证明, 并通过实例说明映射方法的可行性.
1 模糊OWL 2本体和模糊关系数据库模型的形式化定义为了实现模糊OWL 2本体到模糊关系数据库的映射, 首先需要给出两种模型的形式化定义, 在此基础上通过比较两种类型模糊模型的对应关系, 提出模糊OWL 2本体到模糊关系数据库的映射方法.
1.1 模糊OWL 2本体模型为了在OWL中表示和处理模糊知识, Zadeh等[9-10]提出的模糊集理论已被用于对本体进行模糊化扩展, 由此产生了模糊本体.为了表示模糊本体, 文献[11-12]提出了模糊OWL 1的模糊扩展形式, 考虑到模糊OWL 1在语义表达能力方面的局限性, 文献[2]基于OWL 2提出了模糊OWL 2表示语言.
定义1 模糊OWL 2本体可以用一个6元组表示FO=(FCO, FDRO, FDPO, FOPO, FOAxiom, FIO), 主要包括了以下几种成分:
1) FCO是模糊类的集合(也称模糊概念), 每个类不是AbstractClass就是ConcreteClass, 这两种模糊类包含着一些子类, 复杂类至少包含用户定义的模糊类或者owl:Thing和owl:Nothing;
2) FDRO是模糊数据域标识符的集合, 每一个模糊数据域对应XML Schema数据类型;
3) FDPO是模糊数据属性标识符的集合, 数据属性是连接个体和数据值的;
4) FOPO是模糊对象属性标识符的集合(也称模糊抽象角色), 每个属性表示个体之间的关系, 且具有其特性和约束;
5) FO Axiom是一个公理和断言的集合, 是表示类、属性和个体相互之间的关系;
6) FIO是模糊个体集合, 而隶属度表示某个个体属于类的程度, 体现模糊类包含某个个体实例的不确定性.
图 1给出1个模糊OWL 2本体的实例, 其中FCO表示模糊本体中模糊类的标识符, 该本体包括6个模糊类; FDRO表示模糊数据属性域, 表示数据的类型; FDPO表示数据属性, 即模糊类所包含的属性集合; FOPO表示对象属性, 即模糊对象属性集合; FO Axiom表示该本体包含的所有公式的集合, 包含了模糊类之间的关系, 模糊类的数据属性和对象属性及函数关系; FIO表示模糊本体.
使用模糊集理论对关系数据模式进行扩展, 产生了几种模糊关系数据模型, 主要包括三种基本类型:基于模糊关系(使用介于[0, 1]之间的值表示元组隶属度)的模糊关系数据库模型[13]; 基于属性域上相似关系[14](或近似关系[15-16])的模糊关系数据库模型; 基于可能性分布作为属性值的模糊关系数据库模型[17].基于这三种基本模糊关系模型, 文献[7]给出一种元组形式为t= < πA1, πA2, …, πAi, …, πAn, μR>的模糊关系模型.下面给出这种模糊关系模型的形式化表示方法.
定义2 一个模糊关系数据库FRDBM=<FS, FR>包含模糊关系模式FS和模糊关系FR的集合.其中:
•每一个模糊关系模式FS可以由FRi (A1/D1, A2/D2, …, An/Dn, μR/DR)描述, A1, A2, …, An, μR表示模糊关系FRi的属性, D1, D2, …, Dn, DR是每个属性对应的数据类型, μR是额外附加属性用来表示元组属于模糊关系FR的隶属度;
•模糊关系集合中的每个FRi是笛卡尔积Dom(A1)×Dom(A2)×…×Dom(An)×Dom(μR)的一个子集, 其中Dom(Ai)是一个模糊子集或子模糊集, 且Dom(μR)∈(0, 1];其中Dom(Ai)表示Ai的属性域, 这个域上的每1个元素必须满足数据类型Di, FRi中的每一个元组由t= < πA1, πA2, …, πAi, …, πAn, μR>表示, 可能性分布πAi表示属性Ai的值, μR∈(0, 1].
2 模糊OWL 2本体到模糊关系数据库模型的映射从上面给出的模糊OWL 2本体和模糊关系数据库模型FRDBM的形式化定义可以看出, 模糊OWL 2本体包含结构(模糊类、数据属性、对象属性、公理)和实例两部分, 而1个FRDBM具有型和值之分, 与本体具有对应关系, 其中模糊关系模式是型, 用于表示FRDBM的结构信息, 而模糊关系是值, 用于表示FRDBM的实例信息.
但应当指出的是, 模糊本体模型中的类、属性及公理等概念和FRDBM中的关系、属性及关系之间的联系等概念存在一定的对应关系, 而且模糊本体中的命名唯一等机制可以用FRDBM中的主外键等约束来表示.由于两者之间存在一定的对应关系, 从而使得从模糊本体模型到模糊FRDBM模型的转换具有可行性, 模糊FRDBM模型到模糊本体模型的转换已间接表明了这一点[7].
2.1 映射方法模糊OWL 2本体主要包含其结构信息和公理FOAxiom信息, 因此从模糊OWL 2本体到模糊关系模型的映射主要包含两部分映射:模糊OWL 2本体的结构到模糊关系数据库名和属性的转换; 模糊OWL 2本体的公理FOAxiom到模糊关系数据库的关系模式.针对这两部分内容的映射, 下面具体给出模糊OWL 2本体结构到模糊关系数据库名和属性转换的映射规则.
规则1 模糊本体的模糊类或者模糊概念标识FC映射为1个模糊关系, 即1张表, 该表包含μR列, 表示实例属于该关系的程度, φ(FC)∈FR; 表名即模糊本体的类名.
规则2 如果模糊本体的模糊数据属性FDPO是单值的, 映射到数据属性的定义域所在类对应表的两列(Value和μR隶属度), Value列名即数据属性名, μR隶属度列名用μ表示.
规则3 如果模糊本体的模糊数据属性FDPO是多值的, 映射到模糊数据库的一个模糊表, 表名是对应模糊类的数据属性和Value组成, 表的PK由相应的列和模糊类的数据类型属性定义域对应表的FK组成.
规则4 模糊本体的模糊数据域标识FDRO映射为1个模糊属性对应的SQL数据类型列DataProperty Column.
规则5 如果模糊本体的模糊对象属性ObjectProperty是单值的可选项, 且存在单值的逆模糊对象属性inverse of ObjectProperty即一对一或一对零的模糊关系, 逆模糊对象属性映射到模糊对象属性的值域所属的类对应的表的一个FK, 而这个FK是模糊对象属性定义域所在类对应表的PK, FK名就是逆对象属性名.
规则6 如果模糊本体的模糊对象属性是单值的, 规则5不适用即存在零对一, 一对一或者多对一的模糊关系, 那么模糊对象属性映射到模糊对象属性定义域所在类对应表的FK, 而这个FK是模糊对象属性值域所在类对应表的PK, FK名就是对象属性名.
规则7 如果模糊本体的模糊对象属性是多值的, 且存在单值的逆模糊对象属性即一对多的模糊关系, 那么逆模糊对象属性映射到模糊对象属性值域所在类对应表的FK, 而这个FK是模糊对象属性定义域所在类对应表的PK, FK名就是逆模糊对象属性名.
规则8 如果模糊本体的模糊对象属性是多值的, 规则7不适用即存在多对多的模糊关系, 那么模糊对象属性映射到一个表, 表名即模糊对象属性名, 表的PK由模糊对象属性定义域和值域各自所在类对应表的FK组成.
规则9 模糊本体类的DataType限制映射到模糊关系数据库相应列的CHECK限制.
规则10 模糊本体类的InverseFunction属性映射到模糊关系数据库相应列的UNIQUE限制.
规则11 模糊本体类的必选属性映射到模糊关系数据库相应列的NOT NULL限制.
规则12 模糊本体类的枚举数据类型映射到模糊关系数据库枚举类的CHECK限制.
规则13 模糊本体的FunctionDataProperty属性映射到模糊关系数据库的一列.
规则14 模糊本体的FunctionObjectProperty映射到模糊关系数据库属性定义域对应表的FK.
规则15 模糊本体的Inverse Function Object Property映射到模糊关系数据库属性值域对应表的FK.
规则16 模糊本体的Annotation属性映射到OWLAnnotation Metatable所在类对应的每一个表的外键.
规则17 模糊OWL 2本体的个体实例FIO可以映射模糊关系模型的一个元组t, 该元组具有唯一的主键, 并且包含μR隶属度, φ(FIO)∈t.
规则18 模糊OWL 2本体的公式集合FOAxiom映射模糊关系模型的关系FR.
2.2 映射实例为了更好地说明上面给出模糊本体的映射规则, 下面利用规则1~18把图 1中的模糊本体FO映射成模糊关系数据库FRDBM.
Step 1 根据模糊本体FOC={“Leader”, “Chief-Leader”, “Supervise”, “Young-employee”, “Employee”, “Department”}类的描述, 利用规则1建立6个模糊关系模式, 分别是:表Leader, 表Chief-Leader, 表Supervise, 表Young-Employee, 表Employee和表Department.
Step 2 根据模糊本体数据类型的定义, 通过规则4把模糊本体的XSD数据类型对应到SQL数据类型, 即模糊关系FRi所具有的属性Ai所对应的数据类型Di.
Step 3 根据模糊本体数据属性的定义, 利用规则2把FDPO={leaID, lNumber, μ, clName, f_clAge, supID, empID, yeName, f_yeAge, eNumber, depID, dName… }对应到模糊关系FRi的属性Ai, 即由Step 1所得到的6个二维表的属性.
Step 4 根据模糊本体对象属性的定义, 把FOPO={Sof, Sby, invof_Sof, invof_Sby}利用规则5~8对应成模糊关系数据库二维表之间的相互关系.
Step 5 根据前面所得的结果和模糊本体的公理和断言利用规则13~18得到模糊关系模式.
经过上面的处理过程, 图 1中的模糊OWL 2本体映射成了一个模糊关系数据库模式FRDBM, 表 1给出了FRDBM的构成形式.在模糊关系模式集合FS中, 以f_开头的属性为模糊属性.此外, Young-Employee和Employee以及Chief-Leader和Leader之间存在继承关系, Department和Young-Employee是一对多联系, Supervise是一个联系关系, 该联系关系暗含着Chief-Leader和Young-Employee之间是多对多联系.
从前面内容可以看出, 映射过程相当于实现从模糊本体到模糊关系数据库的转换.文献[5, 7]指出并证明了如果两个模式的转换能够保持信息容量, 则认为是正确的模式转换.为此, 下面的定理1说明了上述存储过程是信息容量的存储, 进而说明该方法的正确性.
定理1 给定一个模糊本体FO=(FCO, FDRO, FDPO, FOPO, FOAxiom, FIO), 通过2.1节的转换规则得到模糊关系数据库模式φ(FO), 并且存在两个映射αFO和βFO.
1) 对于FO模糊本体的实例FIO, 存在一个从FIO到φ(FIO)相对应的实例映射αFO, 且对任意φ(FI)的模型FS, αFO(FI)是与FS相对应的模糊关系FR.
2) βFO是从φ(FIO)相对应的实例(即模糊关系FR)到模糊本体FIO的映射, 且对于每一个FR, βFO(FR)是FIO的一个模型.
证明 从2.1节可知, 一个模糊本体FO是模糊类FC的集合, 模糊类FC可以看成是一个解释FC=(ΔFC, ·FC), 其中ΔFC是FC的模糊标识符的集合, ·FC是模糊公理的集合, 该公理集合包括类公理、属性公理和个体公理.给定一个模糊本体模型FI, 与FI相应的模糊关系模式φ(FC)的模型αFO(FC)可以定义如下.
•φ(FC)的模型αFO(FC)的解释域ΔαFO(FC)可由值域ΔFC得到.
•φ(FC)中的原子模糊属性集合A, 模糊数据集合D和模糊关系集合FR分别解释如下:
对于任意X∈D∪A∪FR, 有XFC= (φ(X))αFO(FC); 对于模糊关系FR的外键属性FKi, 且该外键属性引用模糊关系FRi, 有(FKi)αFO(FC)= {(FOP, FOPi)∈ΔαFO(FC)×ΔαFO(FC)|FOP∈FOPFC, FOPi∈FOPiFC}; 对于模糊关系FR的非外键属性φ(FDPi), 有(FDPi)αFO(FC)= {(FDP, FDPi)×ΔαFO(FC)∈ΔαFO(FC)| FDP∈FDPFC, FDPi∈ FDP iFC};
下面证明定理1的第一部分, 即证明αFO(FC)是φ(FC)的一个模型:
ⅰ) 假如模糊本体FC⊆∀(FDP1·FDR1∩…∩∀FDPn·FDRn∩∀μ. FDRμ∩(=1 FDP1))∩…∩(=1 FDPn)∩(=1μ).对于一个实例FC∈(φ(FC))αFO(FC)∈ΔαFO(FC), 根据αFO(FC)的定义, 有φ(FC)∈φ(FC)φ(FC), 即存在一个模糊类对应的模糊关系φ(FC), 且φ(FC)包含属性φ(FDPi)标记的元组.根据模糊本体属性的基数限制的特性, 则存在唯一的(φ(FDP), φ(FDRi))∈φ(FC)FC∈AiFR, 其中φ(FC)∈φ(FC)φ(FC), φ(FDRi)∈φ(FDRi)φ(FC).再由αFO(FC)的定义, 有φ(FDRi)∈φ(FDRi)φ(FC) ∈(φ(FDRi))αFO(FC)∈DiFR和φ(FDPi)∈φ(FDPi)φ(FC)∈(φ(FDPi))αFO(FC)∈AiFR, 即对于任给的实例FC∈(φ(FC))αFO(FC)∈ΔαFO(FC), 存在φ(FDRi)∈(φ(FDRi))αFO(FC)使得(φ(FDP), φ(FDRi)∈(φ(FCi))αFO(FC).
ⅱ) 假如模糊本体FC⊆∀(FDP1·FDR1∩ …∩(FDPn∀FDRn∩∀(μ· FDRμ∩(=1 FDP1))∩…∩(=1 FDPn)∩(=1μ), FC⊆∀FOP1·FC1∩ …∩∀FOPn·FCn∩(=1 FC1))∩…∩(=1 FCn), FCi⊆∀FOPi-·FC(≥1 FC), FOPi⊆∀FC·FCi, FOPi-⊆∀FCi·FC.根据αFO(FC)的定义, 有(φ(FC))αFO(FC)⊆{FC |(FCi < FC, FCi>∈FOPiFC∈(φ(FOPi))αFO(FC)→(FCi∈FCiFC∈(φ(FCi))αFO(FC)}, 且FOPi取值唯一.另外, 由于对象属性FOPi被映射为FOPiFC⊆FCFC ×FCiFC⊆ΔFC×ΔFC, 则由αFO(FC)定义可知, (φ(FOPi))αFS(FC)⊆(φ(FC))αO(FC)×(φ(FCi))αFO(FC), 再由对象逆的解释方法可知(φ(FOPi))αFO(FC)-⊆(φ(FCi))αFO(FC)×(φ(FC))αFO(FC).若有外键φ(FOPi)∈FKi(i≥1), 且该外键引用关系φ(FC1), …, φ(FCn)的对象属性, 对于一个实例FC∈(φ(FC))αFO(FC)∈ΔαFO(FC), 根据αFO(FC)的定义, 有FR∈FRFR, 且FR是由形如[φ(FOP1):φ(FC1), …, φ(FOPn):φ(FCn)]的元组构成的集合, 其中n≥1,FCi∈FCiFC, 这里对应φ(FDPi)非外键属性被省略.再由属性的单值性可知存在唯一的FRi∈FRiFR使得<FR, FRi>∈FKiFR.进一步地, 对于FC∈FCFC, 存在FCi∈FCiFC使得<FC, FCi>∈FOPiFC∈(φ(FOPi))αFO(FC), 再由((φ(FOPi))αFO(FC)-⊆(φ(FCi))αFO(FC)×(φ(FC))αFO(FC)可知, (φ(FCi))αFO(FC)⊆{FCi |∀FC· < FCi, FCR>∈((φ(FOPi))αFO(FC)-→FC∈(φ(FC))αFO(FC)}, 且FCi取值不唯一.综上所述, αFO(FC)满足上述的模糊公理.
定理1中的两部分是一个相互逆过程, 定理1中第二部分的证明过程可由第一部分的证明类似给出, 这里不再赘述.
证毕.
3 结论为了实现模糊本体、特别是大规模模糊本体持久化存储, 本文给出了模糊OWL 2本体的形式化定义, 在此基础上提出了模糊OWL 2本体到模糊关系数据库映射的形式化方法, 从而为模糊本体的数据库存储实现奠定坚实的理论基础.本文从理论上证明了所提映射方法的合理性, 后续工作将开发支持所提映射方法的原型系统, 进而从实验的角度验证所提映射方法的有效性.
[1] |
Berners-Lee T, Hendler J, Lassila O.
The semantic Web[J]. Scientific American, 2001, 284(5): 28–37.
DOI:10.1038/scientificamerican0501-28 |
[2] |
Bobillo F, Straccia U. An OWL ontology for fuzzy OWL 2 [C]//Proceedings of the 18th International Symposium on Foundations of Intelligevnt Systems. Berlin: Springer, 2009: 151-160.
http://dl.acm.org/citation.cfm?id=1617364 |
[3] |
Golbreich C, Wallace E K, Patel-Schneider P F. OWL 2 Web ontology language new features and rationale[EB/OL]. (2012-12-11)[2016-10-15]. https://www.w3.org/TR/owl2-new-features/.
|
[4] |
Dou D, Qin H, Lependu P.
OntoGrate:towards automatic integration for relational databases and the semantic Web through an ontology-based framework[J]. International Journal of Semantic Computing, 2010, 4(1): 123–151.
DOI:10.1142/S1793351X10000961 |
[5] |
Zhang F, Yan L, Ma Z M.
Reasoning of fuzzy relational databases with fuzzy ontologies[J]. International Journal of Intelligent Systems, 2012, 27(6): 613–634.
DOI:10.1002/int.v27.6 |
[6] |
Martínez-Cruz C, Blanco I J, Vila M A. Describing fuzzy DB schemas as ontologies: a system architecture view[C]//International Conference on Information Processing and Management of Uncertainty in Knowledge-Based Systems. Berlin: Springer, 2010: 147-157.
|
[7] |
Sun Y, Wang J. Research on storage method based on fuzzy ontology[C]// International Conference on Computer Communication and Informatics(ICCCI). Washington D C: IEEE, 2013: 1-5.
http://ieeexplore.ieee.org/xpl/abstractSimilar.jsp?reload=true&tp=&arnumber=6466274 |
[8] |
Lyu Y, Ma Z M, Zhang X. Fuzzy ontology storage in fuzzy relational database[C]// Sixth International Conference on Fuzzy Systems and Knowledge Discovery. Washington D C: IEEE, 2009: 242-246.
http://doi.ieeecomputersociety.org/10.1109/FSKD.2009.701 |
[9] |
Zadeh L A.
Fuzzy sets[J]. Information and Control, 1965, 8(3): 338–353.
DOI:10.1016/S0019-9958(65)90241-X |
[10] |
Zadeh L A.
Fuzzy sets as a basis for a theory of possibility[J]. Fuzzy Sets and Systems, 1999, 100: 9–34.
DOI:10.1016/S0165-0114(99)80004-9 |
[11] |
Ma Z M, Lyu Y, Yan L.
A fuzzy ontology generation framework from fuzzy relational databases[J]. International Journal on Semantic Web and Information Systems, 2008, 4(3): 1–15.
DOI:10.4018/IJSWIS |
[12] |
Raju K, Majumdar A K.
Fuzzy functional dependencies and lossless join decomposition of fuzzy relational database systems[J]. ACM Transactions on Database Systems, 1988, 13(2): 129–166.
DOI:10.1145/42338.42344 |
[13] |
Buckles B P, Petry F E.
A fuzzy representation of data for relational databases[J]. Fuzzy Sets and Systems, 1982, 7(3): 213–226.
DOI:10.1016/0165-0114(82)90052-5 |
[14] |
Rundensteiner E A, Hawkes L W, Bandler W.
On nearness measures in fuzzy relational data models[J]. International Journal of Approximate Reasoning, 1989, 3(3): 267–298.
DOI:10.1016/0888-613X(89)90019-4 |
[15] |
Shensoi S, Melton A.
Proximity relations in the fuzzy relational databases[J]. Fuzzy Sets and Systems, 1987, 21: 19–34.
DOI:10.1016/0165-0114(87)90149-7 |
[16] |
Prade H, Testemale C.
Generalizing database relational algebra for the treatment of incomplete or uncertain information and vague queries[J]. Information Sciences, 1984, 34(2): 115–143.
DOI:10.1016/0020-0255(84)90020-3 |
[17] |
Zhang F, Ma Z M, Li W J.
Storing OWL ontologies in object-oriented databases[J]. Knowledge-Based Systems, 2015, 76: 240–255.
DOI:10.1016/j.knosys.2014.12.020 |