温馨提示:本文翻译自stackoverflow.com,查看原文请点击:ontology - How practical are units of measure ontologies in RDF?
rdf ontology

ontology - RDF中的度量单位本体有多实用?

发布于 2020-04-20 13:14:57

我正在使用RDF创建材料集合。我遇到了两种处理计量单位的方法:

  1. 通过将描述性名称链接到RDF属性:
     prop:density prop:hasUnits "kg/m3". 

     <x:MyBrick> a x:Material;
     prop:density "1676".`

  1. 使用现有的本体库,例如度量单位本体分配单位要复杂得多,因为它涉及创建多个对象参见下面如何为材料分配相同的密度:
 <x:MyBrick> a x:Material;
om:hasPhenomenon <x:density_MyBrick>.

 <x:density_MyBrick> a om:Density;
  om:hasValue <x:1676_kilogramspercubicmetre>.

<x:1676_kilogramspercubicmetre> a om:Measure;
  om:hasNumericalValue 1.676E3;
  om:hasUnit om:kilogramPerCubicmetre .

我已经回顾了使用UOM本体的不同用例,但主要是将重点放在它们可以做什么上,而不是它们如何做到以及它是否实用。例如,我想如果只想返回指定材料属性的所有值,使用单元本体会使查询变得更加复杂。还有一些本体未涵盖的属性,例如表面粗糙度,还不清楚如何扩展它们。

我更喜欢采用第一种方法。它更加干净,灵活,并为用户提供了其他数据库无法获得的有用信息。我会尝试在应用程序端处理单位转换,因此我的优先任务是以查询友好的方式存储信息。我担心的是,通过采用这种方法,我将进一步限制功能。选择一种方法相对于另一种方法有什么主要的优点和缺点?

查看更多

提问者
alkey
被浏览
40
Noor 2020-02-08 03:56

该问题中提到的问题是RDF社区中的一个已知问题,并且已在同行评审的论文中进行了讨论。

关于问题中提到的第二种方法,可能会认为使用中间对象编写完全不自然。但是,考虑到多个方面,可能已经编写了描述事物度量的本体。例如,在某些情况下某个特定时刻发生扩展时,可能需要中介对象来指定这些测量的时间。当然,在某些情况下,不需要这些其他描述。

第一种方法的问题在于它完全限于prop:density一个单元。如果您使用其他单位的密度,则必须执行转换。

我认为在您的上下文中一个简单的解决方案是引入特定的数据类型。

@prefix x:  <http://example.com/data> .
@prefix o:   <http://example.com/ontology> .

x:MyBrick a x:Material;
     o:density "1676"^^o:kg-m3.

在使用IRI的本体中http://example.com/ontology,您可以很好地描述资源o:kg-m3例如,您可以说键入以下数据密度是一种数据类型,以千克/度量立方为单位:

@prefix o:   <http://example.com/ontology> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .

o:kg-m3 a rdfs:Datatype;
        rdfs:label "Kilogram per metric cube datatype (kg/)";
        rdfs:comment "A datatype to type densities measured in kilogram per meter cube" .

o:kg-l a rdfs:Datatype;
        rdfs:label "Kilogram per liter datatype";
        rdfs:comment "A datatype to type densities measured in kilogram per liter cube" .

如上所示,o:kg-l已经定义了其他数据类型现在,使用相同的属性,您可以指定以不同单位测量的密度。例如:

@prefix x:  <http://example.com/data> .
@prefix o:   <http://example.com/ontology> .

    x:MyBrick1 a x:Material;
         o:density "1676"^^o:kg-m3.

    x:MyBrick2 a x:Material;
         o:density "200"^^o:kg-l.

    x:MyBrick3 a x:Material;
         o:density "200a"^^o:kg-m3.

如上所见,已经定义了的三个实例x:Material及其各自的实例o:density综观以上三倍,你会发现,在过去的三倍,价值o:density200a您将同意该值不是格式正确的密度值。另外,您可能想知道哪些对象x:MyBrick1x:MyBrick2具有更高的密度。合格的RDF三重存储区将无法确认最后一个三重存储区的值格式不正确。同样,一致的SPARQL引擎将无法对o:density执行代数运算不过,您可以自定义RDF Triplestore或SPARQL引擎的实现来满足这些需求。本文[1]描述了如何实现这一目标。

  1. Lefrançois,Maxime和Antoine Zimmermann。“在RDF和SPARQL中支持任意自定义数据类型。” 欧洲语义网会议。斯普林格(Cham),2016年。(https://www.emse.fr/~zimmermann/Papers/eswc2016.pdf