C_Meng PSNA

Never wait for the storm to pass, just dance in the rain.

0%

时空知识库概述

Pre

时空知识库 这一概念使用较少,更多的是 时空数据库 ,本文认为时空知识库是在时空数据库的基础上的知识扩展。下文叙述中不再严格区分两个概念,主要以知识数据库为主。

时空数据库概念

时空数据库是一种特殊类型的数据库,它能够存储和管理与时间和空间相关的数据。随着科技的发展和数据的爆炸性增长,时空数据库的重要性也日益凸显。它不仅可以用于地理信息系统(GIS)、气象预测、交通管理等领域,还可以应用于智能城市、物联网、人工智能等新兴技术的发展。

时空数据库的概念源于对现实世界的模拟和分析需求。传统的数据库主要关注数据的存储和查询,而时空数据库则更加注重数据的时序和空间特征。它能够有效地处理和分析大量的时空数据,提供更加准确和全面的信息。

时空数据库特征

时空数据库的特点之一是支持时间和空间的索引。 时间索引可以帮助用户快速定位到某个时间点或时间段的数据,而空间索引则可以帮助用户快速定位到某个地理位置的数据。这种索引的设计和优化是时空数据库的关键技术之一。

时空数据库还具有多维数据模型。 传统的数据库主要采用关系模型,而时空数据库则采用多维数据模型。它可以将数据按照时间、空间和属性等多个维度进行组织和管理,提供更加灵活和高效的数据操作。

时空数据库还具有时空数据类型。 传统的数据库主要支持数值、字符和日期等基本数据类型,而时空数据库则支持点、线、面、体等时空数据类型。这些数据类型可以更好地表示和处理与时间和空间相关的数据。

时空数据库还具有时空数据操作。 传统的数据库主要支持数据的插入、更新和删除等基本操作,而时空数据库则支持时空数据的查询、分析和可视化等高级操作。这些操作可以帮助用户更好地理解和利用时空数据。

时空数据库还具有时空数据分析。 传统的数据库主要关注数据的存储和查询,而时空数据库则更加注重数据的分析和挖掘。它可以通过时空数据的聚类、分类、预测和优化等方法,提取出有价值的信息和知识。

关于时空数据库构建

相比于传统数据库的主要升级

  1. 实体对象模型升级。将面向存储和制图的点、线、面要素模型升级为面向分析和应用的实体对象模型,并借助语义化技术, 实现地物空间信息、属性信息、时态信息的实体化存储 ,同时提供不同粒度地理实体动态组合、聚合、专题信息实时挂接等功能,从而实现复合实体转换重组以及多源数据有机融合,更好为时空分析与业务应用提供数据支撑。

  2. 三维立体模型升级。将二维平面模型升级为三维立体模型,以二维地理实体为基础,通过三维时空动态匹配与自动挂接,自动提取传统三维地形数据(DEM、DSM)的高程信息,并有机融合基于激光扫描、倾斜摄影、三维重建等构建的真三维模型数据, 实现二维模型的三维化拓展 ,以更符合现实世界认知习惯的方式为用户提供全空间场景化时空信息产品。

  3. 动态时序模型升级。将静态版本模型升级为动态时序模型,以地理实体为载体,以基元版本数据为基础, 依照时序记录几何、属性、相互关系等信息的增加、删除或修改变化及相应时态信息 ,并以增量形式存储于基元版本数据中,实现对地理现象的产生、演变、消亡等动态时序变化信息的全周期存储、管理与表达。

构建过程

以下是 ref2 中的构建系统逻辑。

从这张图可以看出,首先数据流通过适当的采样程序被分割(离散化)成一系列数据块(句子),如上所述。这些数据块的大小(数据的数量M),以及采样周期Ts,在本文中没有讨论,因为它们是依赖于问题参数的,我们想要解释的是主要思想。

一般来说,数据块的大小M对应于代表监控环境中一个典型情况或机器典型工作条件(模式)的合理数量的数据。它可以在不同的物理系统中变化。例如,在从图形信息(图像序列)中获取知识时,一个数据块实际上就是一张图片中包含的所有RGB像素信息。

至于数据块之间的采样周期Ts,它们不必相等,因为下一个数据块可能在更远(不同)的时间瞬间可用(测量)。换句话说,所提出的进化知识库系统更像是一个在线系统,或者更准确地说,是一个准实时系统,从某种意义上说,新的数据块在它们可用的地方被处理(而不一定是在固定的采样时间内)。这种假设从计算的角度来看更宽松,也更接近现实世界中学习和知识构建的过程。

每个获得的单个数据块都将进一步处理,以提取最显著(重要)的知识项,这些将被称为近期知识项(近期KI)。这是通过一个特殊的新引入的序列聚类算法完成的,该算法将在下一节III中详细解释。这个算法的目标是从数据块中提取数据组(聚类)的中心(原型),以递减的顺序,从最大的聚类开始,继续到最小的聚类。这个序列过程的结束是由预先给定的阈值决定的,如图2.1所示。

一旦通过序列聚类提取出近期知识项(KI),它们就进一步用作图2.1所示的进化知识库(KB)更新算法的输入。在这里,根据知识库中已经存在(旧的)知识项,可以区分出三种不同的更新模式。它们被编号为0、1和2,并在下一个图2.2中展示。

关于时空数据库操作

初上文提到时空数据的“增删改查”基础操作,以及“查询分析可视化”等高级操作外,还应存在以下操作:

  • 记忆(learn):增加新的时空数据,并与更新现有数据的时空关联关系。
  • 遗忘(forget):删除原有时空数据,并删除相关关联关系以及其他数据表中的相关知识痕迹,如删除某一误判风险事件,同时应删除事件处置、原因溯源等一切相关时空数据。
  • 学习(relearn):更新已有时空数据,并更新时空相关数据,如更新某一风险判断政策或条件,应同时更新所有风险判断及处置相关数据。

以下是 ref2 中的关于三种操作对应的情况:

模式0表示知识库中现有的(旧的)知识项(Knowledge Item,KI)尚未被序列聚类中的任何近期KI“访问”。这意味着所有近期KI都位于这个现有KI的预定 resolution 参数之外。 resolution 参数是一个用来在知识库(KB)中将“接近的知识项”与“远离的知识项”分开的距离,如图2.2所示。从这个例子中可以看到,知识库中有两个模式为0的KI。这些被视为将在某种程度上逐渐淡出(遗忘步骤)的旧知识项。

模式1表示知识库中完全新的知识项(新KI)。这意味着近期KI与知识库中的所有现有KI都相距甚远。在这种情况下,这个新知识应该接受一个全新的(首次)学习步骤。在图2.2的例子中,有两种情况是模式1。

模式2表示近期KI位于知识库中现有KI的附近,即在由 resolution 参数定义的圆形区域内。这样的情况表明,知识库中的旧现有KI将升级为需要以某种方式重新学习刷新的知识项,同时考虑到近期KI所携带的知识量。在图2.2的例子中,有两种情况是模式2。

总结

时空数据库相比传统数据库的升级体现在以下方面:

数据结构方面

在进行数据ER图设计时,时间、空间特征应被单独构建为数据实体。

数据操作方面

简单的增删改查应升级成时空相关的“记忆”、“遗忘”、“学习”、“分析”等。

数据维护方面

应在动态性方面大幅强化,包括时空关系的自动挖掘,知识更新、失效的自动化判断,insight(如风险预警)的自动生成等。

整体构建过程

依然与传统数据库类似:

构建时空数据库是一个复杂的过程,需要考虑数据的收集、处理、存储和管理系统等多个方面。以下是构建时空数据库的具体步骤:

  1. 需求分析

    • 确定数据库的目标和用途。
    • 了解用户需求和期望的功能。
  2. 数据收集

    • 收集时空数据,可能包括地理信息、时间序列数据、遥感数据等。
    • 确定数据来源和收集方法。
  3. 数据预处理

    • 清洗数据,去除错误和不一致的数据。
    • 标准化数据格式,确保数据的一致性。
  4. 数据建模

    • 确定数据的空间和时间维度,并进行对应实体设计。
    • 设计时空数据模型与ER图,包括实体、关系和属性的定义。
  5. 选择技术平台(可视情况提前):

    • 选择适合时空数据存储和查询的数据库管理系统(如PostGIS、MongoDB等)。
  6. 数据集成

    • 将清洗和标准化后的数据导入数据库。
    • 进行数据整合,确保数据逻辑一致性。
  7. 建立索引和优化

    • 为提高查询效率,建立空间和时间索引。
    • 优化数据库性能,调整参数以适应大规模数据操作。
  8. 开发数据库管理系统

    • 开发或配置数据库管理系统,实现数据的增删改查等操作。
    • 实现数据可视化和分析工具。
  9. 数据更新策略

    • 制定数据更新和维护的策略。
    • 确定数据更新频率和方法。
  10. 安全性和隐私保护

    • 实施数据安全措施,保护数据不被未授权访问。
    • 确保符合数据保护法规。
  11. 测试和验证

    • 对数据库进行测试,确保功能正确性和性能满足要求。
    • 验证数据的准确性和完整性。
  12. 用户培训和文档编写

    • 为用户提供培训,确保他们能够有效使用数据库。
    • 编写用户手册和系统文档。
  13. 部署和上线

    • 将数据库部署到生产环境。
    • 正式上线提供服务。
  14. 监控和维护

    • 监控数据库性能和健康状况。
    • 定期维护和升级系统。

构建时空数据库是一个迭代和持续的过程,需要不断地根据用户反馈和技术发展进行优化和升级。

References

  1. https://wenku.baidu.com/view/2bd7de9f9a8fcc22bcd126fff705cc1754275f3b.html?_wkts_=1720526169067&bdQuery=%E6%97%B6%E7%A9%BA%E7%9F%A5%E8%AF%86%E5%BA%93
  2. https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=5584860