首页/文章/ 详情

【力学笃行】面向作战仿真的数据挖掘

1年前浏览2528

作者:薛 青,罗 佳,郑长伟,刘永红

装甲兵工程学院 装备指挥与管理系,北京

早在 20 世纪 80 年代初,钱学森就敏锐地洞察到作战仿真的巨大作用,一针见血的指出: “战术模拟技术,实质上提供了一个‘作战模拟训练实验室’,在这个实验室里,利用模拟的作战环境,可以进行策略和计划的实验,可以检验策略和计划的缺陷,可以预测策略和计划的效果,可以评估武器系统的效能,可以启发新的作战思想。战术模拟技术,把系统工程的模型、模拟和最优决策方法引入到军事领域,在模拟的可控制的作战条件下进行作战模拟,能够对兵力与武器装备使用之间的复杂关系获得数量上的深刻了解。作战模拟是军事科学研究方法划时代的革新”。钱学森的论述把科学实验原理与作战仿真技术相联系,精辟地阐释了作战仿真的原理、作用及其在军事科学发展中的变革意义,为我军作战仿真事业的发展提供了科学指导。

01

对作战仿真数据进行数据挖掘的必要性

   
     
作战仿真系统对研究信息化战争有重要作用,通过作战仿真系统可对武器装备体系、作战理论方法进行研究。由于 信息化战争的复杂性、非线性、涌现性,导致仿真数据海量增加,作战仿真已进入大数据时代。如何有效利用这些大数据,进而从大数据背后发掘出隐藏着的、更深层次的、能够预测作战发展趋势的重要信息,成为摆在军事分析人员面前亟待解决的问题。      
     
数据挖掘是指从大数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘涉及机器学习、统计学、数据库、高性能计算等诸多学科,主要用来对时序、空间、结构化或半结构化等类型的数据进行分析,从中发现具有重要参考价值的知识。由于现代作战仿真的过程复杂、步骤繁多、信息量大,导致许多潜在重要的信息被埋藏在浩瀚的数据海洋之中。需要通过数据挖掘大量原始数据进行加工处理,从中揭示出更直观、更全面、更深入、更普遍和更新颖的信息和知识,从中发现重要的作战规律,避免信息浪费,进而有力提高作战仿真效率,有效实现作战仿真价值。      
     

02

对作战仿真数据进行数据挖掘的作用与意义

         
           
2.1 作战仿真已进入大数据时代      
     
大数据是指数据规模远远超出传统数据库储存和处理能力、行业体系内各种海量数据的整体集 合,对大数据的应用主要包括数据的采集、存储、预处理、分析等; 信息化战争中产生的各类数据量呈爆炸式增长。与之对应的作战仿真系统以各种想定为依据,可在小时为计量单位的时间内,推演出以天数甚至以月数为计量单位的时间内的战役对抗结果,这样就大大减少了数据准备与产生周期,从而产生数量更加庞大、种类更加繁多的数据我军要想在日新月异的信息化战场上不落下风,就必须以数据挖掘为手段,以作战仿真系统为依托,使用大数据发现信息化战争的基本规律。通过有效利用大数据,跳出数据庞大不等于信息有效的困境,把大数据作为基础条件来探寻信息化战争内在规律,而不是被淹没在海量的大数据里无所适从。       
     
2.2 大数据时代需要数据挖掘研究方法      
     
我军的信息化建设正从“基础网络时代”向“数据中心时代”迈进,也是科技进步和我军信息化建设发展的必然要求。以军事历史为出发点,可发现近现代军事人员已在此领域提出多种科学研究的方法、理论与途径,总体来讲,可归纳为4 种研究方法:       
     
2.2.1 实验科学       
     
实验科学是指作战人员在战前投入大量的人力、物力、财力,通过反复的实兵对抗实验来检验、论证、改进作战方案。此类研究方法时间花费多、组织实施难度大。      
     
2.2.2 理论科学       
     
西方学者早在 19 世纪末就采用系统的数学公式描述交战过程,其中最经典的方法当属 Lanchester 方程和Dupey公式。虽然通过数学公式可以定性、定量描述一般作战问题,但是此类研究方法难以准确表达信息对抗、战斗风貌等信息化战场上各级指挥员重点关注的复杂因素。      
2.2.3 计算机科学      
     
计算机科学是对第一种研究方法的改进与提高。由于诸军兵种在信息化条件下的作战编组、作战理念、作战方法更加灵活多样而难以完全通过实兵对抗实现,加之考虑经济压力、人员因素、对抗效率等问题,通过计算机科学构建的作战模拟系统无限次地模拟大规模交战场景就成为了一种有效、可行的手段与方法。      
     
2.2.4 数据挖掘       
     
数据挖掘技术最早由计算机科学图灵奖得主 Jim Gray提出,随后在人工智能、路径规划、业务分析等领域得到广泛研究与应用,引起世界主要军事强国和各大高科技公司的高度重视。2012 年 3 月,美国国防部高级研究计划局提出了“X 数据”计划,强调将数据挖掘视为大数据战略在国防安全领域贯彻的核心功能加以重点发展。作战仿真自从诞生以来就是消除“战争迷雾”的有效工具。通过以数据挖掘模式为手段对作战仿真大数据的有效开发,可以较为准确地把握诸如敌我指挥员思维规律,预测作战行动、战场态势动态发展等复杂问题,从而在某种程度上破解甚至消除“战争迷雾”。       
     
2.3 数据挖掘是实现精确设计战争的有效方法      
     
一流的军队设计战争,二流的军队应对战争。要实现对战争的精确设计,其核心是实现“从数据到决策”,建立以各军兵种、战场环境间数据共享为基础的系统。这种以数据为中心的战略重心转移,体现了精确设计信息化战争的前瞻眼光。      
     
信息技术的飞速发展已促使作战形式发生质变,加之现代科技已经在作战仿真领域体现了高效、良好的数据采集、分析能力,导致军事人员精确设计战争的意识和手段已有长足进步并在作战仿真中获得良好效果,如何以数据为中心精确设计战争已成为人们关注的焦点。这就使“科学”有时重于“艺术”的情况得以实现。      
     
在美国联合作战实验室内部曾流传这样 一 句名 言: “除了上帝,任何人都必须用数据说话”; 虽然此话的绝对性在某种程度上值得商榷,但是却真实反映了军事人员希望基于数据来设计战争、利用仿真手段来验证战争的迫切心情与美好心愿。针对特定的作战对手和作战环境,如何对己方成百上千、功能互补的作战单元进行模块化编组,从而实现整体作战能力的最优? 面对众多性质不同、防护力不同且威胁度各异的打击目标,如何对有限数量、有限强度和有限精度的火力进行分配,以收获最大作战效益? 在以数据挖掘为手段解决此类问题时,通过对所产生的大数据进行挖掘与分析,有望实现战争设计“科学”与“艺术”的统一融合、殊途同归。      

03

对作战仿真数据进行数据挖掘的作用与意义

         
           
作战仿真数据构成分析现在对作战仿真数据的分类还没有统一标准,常用的分类方法有基于军用建模与仿真体系标准分类方法、基于数据性质的分类方法、基于数据作用的分类方法等,仿真数据性质划分准则、仿真数据作用划分准则等。本文以上述标准为参考,结合工作经验提出作战仿真数据构成如表 1 所示。       
     

     

04

面向数据挖掘的数据仓库构建

         
           
现在大家公认的数据仓库的概念是由 William H. Inmon 于 1993 年发表的论著《Building the Data Warehouse》中提出的,将数据仓库定义为“一个面向主题的、集成的、非易失的且随时间变化的数据集 合,用来支持管理人员做出决策。”。数据仓库储存了数据挖掘所需要的不同综合级别、集成的历史数据,为合理、客观、准确评价作战仿真效果,实现作战效能数据分析提供良好的数据环境。       
     
4.1 建立数据仓库的必要性      
     
1) 有效支持仿真数据挖掘       
传统的数据库是以单一的数据资源对为主,无法体现不同类型的数据处理的差异性,难以满足不了数据处理多样化和数据挖掘的要求。因为数据挖掘工作需要大量仿真集成数据,因此数据集成任务繁重。如果每次分析都要进行大规模的集成,将会导致极低的数据挖掘处理效率。两者之间的巨大差异使得这种分离成为必然。       
     
2) 性质各异导致分离       
数据的结构、内容和读取方式各不相同是数据仓库与操作数据库分离的根本原因。面向系统的数据挖掘需要历史数据,而操作数据库一般不维护历史数据。在这种情况下, 操作数据库中的数据尽管很丰富,但对于数据挖掘还是远远不够的。      
     
3) 满足数据挖掘的多样需求       
而数据挖掘对数据需求涉及大量数据计算,需要特殊的数据组织、存取方法和基于多维视图的实现方法,在传统操作数据库上处理查询会大大降低原有仿真操作系统的性能。而数据仓库中的数据是以元数据为基础面向主题存储,使数据具备可拓展性,能处理数量庞大、种类繁多的数据,以满足数据挖掘的要求。      
     
4.2 数据仓库的设计      
     
数据仓库设计主要分为概念模型、逻辑模型和物理模型 3 部分。      
     
1) 概念模型设计       
概念是现实世界在人们头脑中的反映,是客观世界到主观认识的映射,它是为一定的目标设计系统、收集信息而服务的一个概念性的工具,在进行系统设计时,首先要将现实世界抽象为概念模型; 通过概念模型的设计,界定主题的系统边界,确定数据仓库主题。      
     
2) 逻辑模型设计       
逻辑模型描述了数据仓库主题的逻辑实现,是对每个主题所对应的关系表的关系模式的定义。能直接反映业务部门的需求,同时对系统的物理实施有重要指导作用。       
     
3) 物理模型设计       
数据仓库的物理模型是逻辑模型在数据仓库中的实现, 如数据存储结构、数据的索引策略、数据的存储优化分配等。以模型设计为基础,本文采用以部件功能来分析的划分方法,将作战仿真数据仓库分为数据获取层、数据预处理层、 数据储存层与数据分析/应用层。数据仓库系统的 4 个层次划分示意图如图 1 所示。      

05

面向数据挖掘的数据仓库构建

         
           
实现从作战仿真系统大数据中挖掘出有用的数据是一项十分有意义的工作,也是一项复杂的系统工程。本文从宏观的层面上,从必要性、作用与意义、组织构成对作战仿真的数据挖掘问题进行了论述,并提出构建数据仓库满足作战仿真数据挖掘的需求,对于从现实世界中搜集、获取数据具有积极的参考价值。         
      
     
来源:安怀信正向设计研发港
非线性海洋理论爆炸仿真体系控制人工智能安怀信
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2022-10-31
最近编辑:1年前
获赞 65粉丝 44文章 357课程 6
点赞
收藏
未登录
还没有评论

课程
培训
服务
行家

VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈