文 | 许国珍,焦鹏,査亚兵
配图 | 来源互联网
在M&S中,想定、环境、条令、武器系统性能等都需要用数据来定义,仿真系统依托数据来运行,数据质量的好坏直接关系着仿真结果是否可信、仿真系统能否发挥预期作用。目前数据质量没有统一的定义,美国国家信息系统字典定义数据质量为“使数据适合用途的正确性、时效性、精度、完整性、相关性和可达性”,麻省理工学院的TDQM(Total Date Quality Managent)研究小组定义数据质量为“对数据使用者的适用程度”。就仿真数据而言,数据质量需要从数据使用者和数据提供者两个方面来描述,既要描述数据对数据使用者的适用程度,也要描述数据生产者提供的数据达到期望的程度。据此可知,改进仿真数据质量,需要从数据使用者和数据生产者两个方面来开展工作。
数据校核、验证与认证VV&C(Verification,Validation and Certification)是数据使用者和数据生产者改进仿真数据质量的重要手段。国外很早就认识到数据质量的重要性,并从20世纪90年代开始VV&C研究。美国、澳大利亚等国的国防部仿真部门都建立了VV&C研究和实施框架,美国中央指挥部等部门开发了如数据质量工程DQE(Date Quality Engineering)和数据校核交互编辑器DAVIE(Date Verification Interactive Editor)等系列工具用于辅助进行数据VV&C,美国陆军和空军也在多个项目中开展了数据VV&C工作。国内的研究开始于21世纪初,基本集中在概念和基本过程的研究,和国外有较大差距。本文从国外成熟的概念入手,讨论VV&C和数据周期的关系;在借鉴国外研究成果的基础上,建立VV&C 的实施策略;开发出VV&C管理平台来辅助开展VV&C工作。
2.1 定义
数据VV&C旨在通过各种技术和方法,发现数据存在的错误和不足。通过纠正错误和改进不足,从而改进数据质量。美国国防部在5000.59指令[4]中定义了数据VV&C的概念如下:
(1)数据校核:测试数据是否满足特定约束的过程,包括数据生产者校核和数据使用者校核。数据生产者校核是数据生产者测试数据是否满足特定约束的过程,这个特定约束由数据标准和行业规则定义;数据使用者校核是数据使用者测试数据是否满足用户指定约束、数据是否被正确地转换和格式化的过程。
(2)数据验证:领域专家对数据的评估以及数据与已知值比较的过程,包括数据生产者和数据使用者验证。数据生产者验证是评估数据是否满足声明的标准和假设;数据使用者验证是评估数据在预期模型中是否适用。
(3)数据认证:鉴定数据已经被校核和验证的过程,包括数据生产者和数据使用者认证。数据生产者认证指数据生产者鉴定数据已经按文件规定的标准或规范校核和验证的过程;数据使用者认证指数据使用者或委派的代理鉴定数据针对特定的M&S应用已经被校核和验证的过程。简言之,数据VV&C就是校核数据内在一致性和正确性,验证数据在特定目的或范围约束下是否准确表达了客观世界实体,证明数据针对规定用途、使用类型和使用范围都具备指定质量等级。
2.2 VV&C与数据生产、使用周期数据VV&C贯穿于数据的生产、使用周期。从数据产生到最终的M&S应用,都需要数据VV&C来保证数据质量,VV&C在数据全生命周期中的作用如图1所示。
图1中将所有的数据相关活动分为数据生产者和数据使用者活动,包含以下环节:
(1)数据使用者制定数据需求,包括数据的规范和特定要求,并将需求提高给数据生产者;
(2)数据生产者接收数据需求,根据数据需求制定数据生产计划,并制定数据生产者VV&C计划;
(3)数据生产者按照数据生产计划生成或选择数据;
(4)数据生产者对生成的数据实施数据生产者校核与验证,校核和验证数据是否满足特定的规范和要求;
(5)通过实施数据生产者校核与验证,存在问题则改进数据,不存在问题则对数据生产者校核和验证的方法、过程、结果进行认证,并将认证与数据一并提供给数据使用者;
(6)数据使用者接收数据,根据具体的M&S使用目的,制定数据使用者VV&C计划;
(7)按照数据使用者VV&C计划,对数据实施数据使用者校核与验证;
(8)通过数据使用者校核与验证,如果数据存在问题且使用者无法解决,则需要确定问题,并将其提交给数据生产者进行改进,不存在问题则对数据使用者校核与验证的方法、过程、结果进行认证;
(9)最终进入M&S应用。在数据的生产、使用周期中,VV&C是保证和改进数据质量的重要手段,仿真数据只有经过数据生产者和数据使用者VV&C,才能最终进入M&S应用。
数据生产者VV&C可以归为质量领域的工作,数据使用者VV&C则是仿真VV&A(Verification,Validation and Accreditation)工作的一部分。在数据生产和使用过程中,需要采用不同的策略来开展数据生产者和使用者VV&C,数据生产者可以借助质量元数据模板来实施VV&C和记录数据质量;对于数据使用者,则需要建立伴随M&S开发的VV&C过程模型,用来指导和开展VV&C工作。
3.1 质量元数据模板
数据生产者实施VV&C前,需要元数据来明确特定的数据规范,元数据是描述数据或数据某些属性的数据,描述数据质量属性的元数据称为质量元数据。质量元数据可以用来指导数据生产者实施VV&C,记录数据VV&C的结果,并帮助数据使用者理解数据质量。在M&S中,一般建立起数据库、数据元和数据值三个层次的质量元数据模板来帮助数据生产者实施数据VV&C,每个层次的质量元数据模板由描述信息、规范信息和质量信息三个部分组成。表1是一个数据值层次的质量元数据模板的质量信息部分。
表1中给出了度量方法、度量结果等元数据,定义了每项元数据,并排定了优先级。数据生产者按照模板定义的数据规范对数据进行校核与验证,通过填充每个层次的质量元数据模板信息,从而完成数据生产者VV&C工作。
3.2 VV&C过程模型
在M&S开发过程中,为保证M&S的可信性,每个环节都需要开展VV&A工作。因为仿真和数据的依赖关系,数据使用者VV&C通常被作为仿真VV&A 的一部分,VV&C过程模型通常包含在仿真系统VV&A 的过程模型中。建立伴随M&S开发的VV&C过程模型,能有效地指导数据使用者开展数据VV&C工作。图2是一个伴随M&S开发全过程的VV&C过程模型,图中给出了M&S开发中每个环节的VV&A工作,并给出了每项VV&A工作中包含的数据VV&C活动。
数据使用者根据VV&C过程模型在M&S开发过程中开展数据VV&C活动,能够降低M&S开发风险,并有效提高仿真系统的可信性。
在M&S开发全过程中,规范地开展VV&C活动,能及时有效发现仿真数据存在的问题,并通过纠正来改进仿真数据质量。如何保证VV&C活动规范开展,是VV&C研究的一个重点。本文借鉴工作流思想,将VV&C活动流程化,开发出VV&C管理平台PVV&CM(Platform of VV&C Management)来辅助用户开展VV&C活动。
VV&C管理平台基于Lotus Domino/Notes开发实现,其设计思想是将每个M&S 开发阶段的VV&C活动抽象为一个流程的节点,建立起每个阶段的VV&C流程,通过流程设计、流程管理等功能来实现VV&C活动的流程化管理。
PVV&CM主要包括了流程管理、组织管理、项目管理和流程设计四项功能,其中流程设计在Lotus Domino Workflow组件下实现。
4.1 流程管理
流程管理用来管理VV&C流程的启动、运行以及对运行流程的查询。流程管理包括了事务管理、详情查询、启动新工作和系统设置四个子功能模块。每个VV&C流程的负责人可以利用启动新工作功能选择启动流程,使流程进入运行环节;流程的运行过程中,VV&C节点的参与者利用事务处理子功能来处理节点工作,包括申请节点工作和提交节点工作;VV&C参与人员可以通过详情查询子功能来查询流程的运行情况,包括流程节点的执行时间和执行人等;PVV&CM管理员利用系统设置子功能进行平台的基础配置。
4.2 组织管理
一个VV&C流程需要人员和信息的支撑,流程通过将信息在不同人员之间流转实现流程的运行。组织管理功能用来管理和查看VV&C参与人员和组织结构,包括了组织查看和组织设置两个子功能。非管理员用户可以利用组织查看子功能来查看VV&C参与人员信息和结构信息;管理员利用组织设置子功能来添加和删除VV&C参与人员和组织结构。
4.3 项目管理
在M&S开发过程中,每个阶段的VV&C工作都设计成VV&C流程。项目管理功能用来制定一个完整的VV&C计划,并可以用来查询流程的运行情况。项目管理包括了项目信息和项目查询两个子功能。
PVV&CM管理员利用项目信息子功能制定VV&C流程的计划,包括制定VV&C流程的先后顺序、负责人和计划执行时间等;VV&C参与人员可以利用项目信息子功能来查询制定的VV&C流程计划,利用项目查询来查询具体流程的执行情况。
4.4 流程设计
流程设计指将VV&C工作进行抽象,设计出具备路由关系的图形化流程。流程设计是整个流程运行的基础和核心,是实现VV&C工作管理的依据。以概念模型开发阶段的VV&C活动为例,包括了校核数据源有效性、校核元数据适用性、校核输入数据库、校核输出数据特性和开发验证数据共5项VV&C活动,这5项活动存在先后和并行关系,经过抽象和分析,可以将VV&C活动设计成如图4所示的流程。图4中包含了开始和结束节点,每个流程节点的VV&C活动,只有在满足要求后才能进入下一个流程节点的VV&C活动,否则要进行修改并重新执行此VV&C活动。借助于PVV&CM,VV&C参与人员可以规范地开展VV&C活动,改进和提高仿真数据质量,从而有效保证了仿真系统的可信性和可用性。
目前,数据VV&C并没有为人们广泛认识和理解,这主要是两方面因素造成的:一是人们对于仿真数据质量的重要性认识有欠缺;二是仿真数据往往数量比较多且特点各异,缺乏适用的VV&C实施策略和工具来开展VV&C活动。本文讨论了数据质量和VV&C关系,建立了VV&C实施策略,在此基础上,开发了VV&C管理平台PVV&CM,实现了对VV&C活动的流程化管理。今后的研究工作应集中在具体VV&C技术方法的研究、工具的开发和应用,使VV&C在M&S中发挥重要的作用。
本内容来源于互联网,版权归原作者所有,供学习交流使用,严禁商用,如有侵权请联系我们删除。
- END -
相关文章,在仿真秀官网搜索:
1) 试验数据管理系统的设计与实现
2) 建模与仿真、VV&A、T&E三者的关系
3) 并行工程与DFX技术