基于属性数据模型的元数据采集方法、装置、计算机程序产品、以及计算机可读存储介质与流程
未命名
07-12
阅读:98
评论:0
1.本发明涉及信息编码及大数据技术领域,并且更具体地涉及一种基于属性数据模型的元数据采集方法、装置、计算机程序产品、以及计算机可读存储介质。
背景技术:
2.当前,数据已经成为社会生产要素之一,推进数据开放共享已经成为各行业、各领域的共识。随着信息化技术的广泛应用,数据的产生源头迅速增多,造成业务开展过程中数据种类繁杂、格式不一、定义不清等现象,难以高效利用和交互共享。
3.元数据(metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。
4.元数据发挥着数据识别和交换的“中继”作用,借助于对元数据的采集和管理,可实现对不同数据的标识、定义和映射转换,为建立不同来源数据之间的关联关系提供有效支撑,从而实现数据的集成汇聚、融合计算,发挥数据的深层价值。元数据同时为数据治理提供标准支撑,支撑数据质量管理。由此可见,元数据在数据治理和集成领域发挥着关键的作用。
5.在实际数据治理或数据融合集成实施过程中,元数据承载着核心业务、技术和管理信息,因此元数据信息的完整性、规范性和准确性很大程度上影响着企业数据治理的质量和数据交互的效率。现有技术中,元数据的采集工作一般会采用直接引接数据库的形式,因此目前元数据的治理工作通常仅在单一信息系统范围内进行,无法满足不同系统之间的数据集成交互。
6.特别地,在当前航空产品领域中,往往会涉及复杂业务模式下的跨部门、跨领域、跨层级的数据集成交互,完整、规范的元数据属性信息是航空产品领域中数据互认的基础。因此,当前在航空产品领域中亟需基于统一属性数据模型的元数据全量信息采集技术,从而一方面可以解决不同系统间元数据描述不统一的问题,规范全局共用元数据的表达,另一方面可以使得元数据的管理及应用基于统一的数据模型框架,避免信息不同步而造成的数据无法交互。
技术实现要素:
7.本发明各示例性实施例提供了一种基于属性数据模型的元数据采集方法、装置、计算机程序产品、以及计算机可读存储介质,以解决现有技术中的以上技术问题以及其他潜在技术问题中的至少一项技术问题。
8.本发明各示例性实施例第一方面提供了一种基于属性数据模型的元数据采集方法,其特征在于,包括:建立用于航空产品的元数据属性数据模型,所述元数据属性数据模
型将元数据的属性信息划分为标识属性、定义属性、表示属性、管理属性、以及关系属性;引接所述航空产品在全寿命周期内产生的数据资源,并按照所述元数据属性数据模型提取所述元数据的第一属性关联信息;所述第一属性关联信息包括所述元数据的标识属性、定义属性、表示属性、以及与申请相关联的管理属性;按照与所述元数据的属性信息相对应的约束条件,将提取的所述元数据的所述第一属性关联信息整编为标准格式的第一属性关联信息;利用整编后的标准格式的第一属性关联信息对所述元数据进行唯一性校验,并在唯一性校验通过后获得所述元数据的第二属性关联信息,所述第二属性关联信息包括所述元数据的与审核相关联的管理属性;以及按照元数据标识规则向所述元数据赋予唯一的元数据标识符,并根据所述元数据标识符建立所述元数据之间的关联关系,从而获得所述元数据的第三属性关联信息,所述第三属性关联信息包括所述元数据的关系属性。
9.根据本发明示例性实施例,所述标识属性用于标识和区分所述元数据,包括标识符、中文名称、同义名称、英文名称、字母标识、以及表达符号。
10.根据本发明示例性实施例,所述定义属性用于确定和解释所述元数据的含义,包括定义、参考来源名称、以及参考来源密级。
11.根据本发明示例性实施例,所述表示属性用于规定所述元数据所描述数据的表示形式,包括数据类型、长度、值域、以及计量单位。
12.根据本发明示例性实施例,所述管理属性用于所述元数据在全寿命周期过程中的管理,包括所属分类、描述对象、申请人姓名、申请人联系方式、申请单位名称、申请时间、审核人姓名、审核单位名称、审核时间、审核意见、数据状态、发布时间、更新时间、以及废止时间。
13.根据本发明示例性实施例,所述与申请相关联的管理属性包括申请人姓名、申请人联系方式、申请单位名称、以及申请时间;所述与审核相关联的管理属性包括所属分类、描述对象、审核人姓名、审核单位名称、审核时间、以及审核意见。
14.根据本发明示例性实施例,所述关系属性用于确定所述元数据之间的关系,包括基本元数据标识符、以及替代元数据标识符。
15.根据本发明示例性实施例,所述按照与所述元数据的属性信息相对应的约束条件,将提取的所述元数据的所述第一属性关联信息整编为标准格式的第一属性关联信息,包括:按照元数据命名规则将所述第一属性关联信息中标识属性的中文名称整编为标准格式的中文名称;其中,所述元数据命名规则为:所述中文名称为表达所述元数据含义的中文词组或短语,其由对象词、特性描述词、表示类词、限定词组成;其中对象词和表示类词为必选词汇,特性描述词和限定词为可选词汇。
16.根据本发明示例性实施例,所述利用整编后的标准格式的第一属性关联信息对所述元数据进行唯一性校验,包括:通过判断整编后的标准格式的所述第一属性关联信息中标识属性的中文名称是否相同、以及计算整编后的标准格式的所述第一属性关联信息中定义属性的相似度高低,来进行唯一性校验。
17.根据本发明示例性实施例,所述元数据标识符作为所述标识属性中的标识符;所述元数据标识规则为:所述元数据标识符由数据标识符和版本标识符两部分构成;其中所述数据标识符是根据所述元数据采集的先后顺序生成的无含义流水码;所述版本标识符是所述元数据的版本号。
18.根据本发明示例性实施例,所述元数据之间的关联关系包括继承关系和/或替代关系。
19.根据本发明示例性实施例,所述的方法还包括:在赋予唯一的元数据标识符之后,发布所述元数据的属性信息,并在所述元数据的使用过程中持续更新和维护所述元数据的与维护相关联的管理属性。
20.根据本发明示例性实施例,所述与维护相关联的管理属性包括数据状态、发布时间、更新时间、以及废止时间。
21.本发明各示例性实施例第二方面提供了一种基于属性数据模型的元数据采集装置,其特征在于,包括:处理器;存储器,耦合至所述处理器并且存储有指令,所述指令在由所述处理器执行时使所述处理器执行根据以上第一方面所述的基于属性数据模型的元数据采集方法。
22.本发明各示例性实施例第三方面提供了一种计算机程序产品,被有形地存储在非瞬态计算机可读介质上并且包括计算机可读程序指令,当所述计算机可读程序指令在设备上被执行时使得所述设备执行根据以上第一方面所述的基于属性数据模型的元数据采集方法。
23.本发明各示例性实施例第四方面提供了一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,所述计算机可读程序指令用于执行根据以上第一方面所述的基于属性数据模型的元数据采集方法。
附图说明
24.为了更清楚的说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
25.图1为本发明示例性实施例的基于属性数据模型的元数据采集方法的示意图。
26.图2为本发明示例性实施例的元数据属性数据模型的示意图。
27.图3为本发明示例性实施例的元数据命名规则的示意图。
28.图4为本发明示例性实施例的元数据标识规则的示意图。
29.图5为本发明优选实施例的基于属性数据模型的元数据采集方法的示意图。
具体实施方式
30.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然所描述的实施例仅是本发明的一部分实施例,不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
31.如图1-图4所示,本发明各示例性实施例提供了一种基于属性数据模型的元数据采集方法100,包括步骤102、步骤104、步骤106、步骤108、步骤110等步骤。
32.在步骤102,建立用于航空产品的元数据属性数据模型,所述元数据属性数据模型将元数据的属性信息划分为标识属性、定义属性、表示属性、管理属性、以及关系属性。
33.根据本公开的实施例,针对航空产品领域,可以建立元数据属性数据模型(如图2
所示),从而规范元数据的描述属性,并且本专利中还将设定的29项属性信息划分为标识类、定义类、表示类、管理类和关系类共计5类属性。
34.可以理解,对于航空产品领域而言,本专利设计的元数据属性数据模型涵盖了元数据的标识、定义、表示、管理和关联共五方面内容,并包含29项属性信息,这对于航空产品领域元数据的描述、管理和使用,信息更加全面,可提升元数据管理的整体性和规范化程度。
35.可以理解,本发明中的元数据属性数据模型和采集方法,对常规的标识类、定义类和表示类属性信息进行了扩展,并增设管理类和关联类属性信息,对于存在大量产品数据、供应链数据、业务管理数据的航空产品数据管理领域,更加适配多源数据集成、数据融合汇聚的使用场景,因此可解决以往元数据采集管理方法无法满足数据交互共享需求的问题。
36.根据本发明示例性实施例,所述标识属性用于标识和区分所述元数据,包括标识符、中文名称、同义名称、英文名称、字母标识、以及表达符号。
37.例如,标识属性是用于标识和区分元数据的属性信息,可以包括标识符、中文名称、同义名称、英文名称、字母标识、表达符号等属性;
38.根据本发明示例性实施例,所述定义属性用于确定和解释所述元数据的含义,包括定义、参考来源名称、以及参考来源密级。
39.例如,定义属性是用于确定和解释元数据的含义的属性信息,可以包括定义、参考来源名称、参考来源密级等属性;
40.根据本发明示例性实施例,所述表示属性用于规定所述元数据所描述数据的表示形式,包括数据类型、长度、值域、以及计量单位。
41.例如,表示属性是用于规定元数据所描述数据的表示形式的属性信息,可调包括数据类型、长度、值域、计量单位等属性;
42.根据本发明示例性实施例,所述管理属性用于所述元数据在全寿命周期过程中的管理,包括所属分类、描述对象、申请人姓名、申请人联系方式、申请单位名称、申请时间、审核人姓名、审核单位名称、审核时间、审核意见、数据状态、发布时间、更新时间、以及废止时间。
43.例如,管理属性是用于元数据采集、审核、发布、更新、废止等全寿命周期过程管理的属性信息,可以包括所属分类、描述对象、申请人姓名、申请人联系方式、申请单位名称、申请时间、审核人姓名、审核单位名称、审核时间、审核意见、数据状态、发布时间、更新时间、废止时间等属性。
44.根据本发明示例性实施例,所述与申请相关联的管理属性包括申请人姓名、申请人联系方式、申请单位名称、以及申请时间;所述与审核相关联的管理属性包括所属分类、描述对象、审核人姓名、审核单位名称、审核时间、以及审核意见。
45.例如,与申请相关联的管理属性、以及与审核相关联的管理属性,是在基于属性数据模型的元数据采集方法的不同阶段所形成或获取的属性信息。
46.根据本发明示例性实施例,所述关系属性用于确定所述元数据之间的关系,包括基本元数据标识符、以及替代元数据标识符。
47.例如,关系属性是用于确定元数据之间关系的属性信息,可以包括基本元数据标识符、替代元数据标识符。
48.在步骤104,引接所述航空产品在全寿命周期内产生的数据资源,并按照所述元数据属性数据模型提取所述元数据的第一属性关联信息;所述第一属性关联信息包括所述元数据的标识属性、定义属性、表示属性、以及与申请相关联的管理属性。
49.例如,引接航空产品设计、制造、试验、使用、保障等全寿命周期范围内产生的数据资源,依据航空产品领域元数据属性数据模型提取其中部分元数据信息,包括:中文名称、同义名称、英文名称、字母标识、表达符号等标识属性;定义、参考来源名称、参考来源密级等定义属性;数据类型、长度、值域、计量单位等表示属性;申请人姓名、申请人联系方式、申请单位名称、申请时间等管理属性(即与申请相关联的管理属性)。
50.例如,采集的元数据属性信息,其来源可以包括标准规范、文献资料或信息系统等多个渠道,即本公开中实施例可以面向多种信息来源渠道采集元数据,通过数据融合关联获得更加全面、准确的元数据信息,从而形成行业范围内可共享利用的元数据,作为数据交互集成的基础。
51.例如,定义类属性中的参考来源,可以包括标准规范、文献资料或信息系统等多个渠道,即本公开中实施例可以面向多种信息来源渠道采集元数据,通过数据融合获得更加全面、准确的元数据信息。例如,可以通过采集参考来源信息,提供对元数据定义、值域、长度等信息的参考依据的管理,以此为依据设置元数据的查询和使用权限。
52.在步骤106,按照与所述元数据的属性信息相对应的约束条件,将提取的所述元数据的所述第一属性关联信息整编为标准格式的第一属性关联信息。
53.例如,可以按照每一项描述属性的内容、格式定义,以及数据类型、是否全局唯一、是否必填等约束条件(即与所述元数据的属性信息相对应的约束条件),将采集得到的原始元数据信息整编为标准格式。
54.根据本发明示例性实施例,所述按照与所述元数据的属性信息相对应的约束条件,将提取的所述元数据的所述第一属性关联信息整编为标准格式的第一属性关联信息,包括:按照元数据命名规则将所述第一属性关联信息中标识属性的中文名称整编为标准格式的中文名称;其中,所述元数据命名规则为:所述中文名称为表达所述元数据含义的中文词组或短语,其由对象词、特性描述词、表示类词、限定词组成;其中对象词和表示类词为必选词汇,特性描述词和限定词为可选词汇。
55.作为示例,在整编元数据采集信息时,为保证元数据的中文名称全局唯一且无歧义,可以严格按照设定的元数据命名规则来确定元数据的中文名称。其中,元数据命名规则例如如下:元数据的名称为精炼表达元数据含义的中文词组或短语,其由对象词、特性描述词、表示类词、限定词(又分为对象限定词和类词限定词)四部分组成,其中对象词和表示类词为必选词汇,特性描述词和限定词为可选词汇。例如,基本元数据名称中可以不包含限定词,派生元数据名称一般有与之对应的基本元数据名称和特定的对象限定词或类词限定词组成。
56.例如,如图3所示,在规范名称为“航空产品类型常用名称”的元数据名称中,“产品”为对象词,“类型”为特性描述词,“名称”为表示类词,“航空”为对象限定词,“常用”为类词限定词。
57.在步骤108,利用整编后的标准格式的第一属性关联信息对所述元数据进行唯一性校验,并在唯一性校验通过后获得所述元数据的第二属性关联信息,所述第二属性关联
信息包括所述元数据的与审核相关联的管理属性。
58.根据本发明示例性实施例,所述利用整编后的标准格式的第一属性关联信息对所述元数据进行唯一性校验,包括:通过判断整编后的标准格式的所述第一属性关联信息中标识属性的中文名称是否相同、以及计算整编后的标准格式的所述第一属性关联信息中定义属性的相似度高低,来进行唯一性校验。
59.例如,可以根据整编后(规范后)的元数据的标识属性和定义属性,对多来源采集得到的元数据信息进行唯一性校验,包括对元数据的中文名称进行匹配查重,和通过在定义属性中抽取关键词的方式对元数据的定义进行相似度计算。
60.此时,唯一性校验的结果有以下4种情况(判断相似度高低的具体指标,可根据实际应用场景而确定):
61.a)存在与被校验元数据中文名称相同、且定义相似度高的元数据。则对两项元数据信息进行合并,合并时遵循尽量涵盖全部定义和表示的原则。
62.b)存在与被校验元数据中文名称相同、且定义相似度低的元数据。则依据元数据定义,调整元数据名称中的特性描述词或限定词,使其有所区分。
63.c)存在与被校验元数据中文名称不同、且定义相似度高的元数据。则对两项元数据信息进行合并,中文名称采用更符合定义范围的规范名称。
64.d)不存在与被校验元数据中文名称相同或定义相似度高的元数据,则通过唯一性校验。
65.其中,在唯一性校验时,a)、b)、c)三种情况发生时,可以调整后重新校验,直到达到d)结果,才认为通过唯一性校验。
66.作为示例,在唯一性校验时,原始数据合并去重时,可以重点筛选中文名称和定义中的重复数据。例如,对于元数据定义描述,可以采用分词算法切分文本,提取定义文本中的关键词,构建特征向量,计算定义描述的相似度,根据相似度所属区间提供不同的合并、调整策略。
67.作为示例,可以在唯一性校验通过后获得所述元数据的第二属性关联信息。例如,通过唯一性校验后,标志着元数据信息通过审核(信息规范且全局唯一),此时可以获得与审核相关联的管理属性,从而在管理属性中补充所属分类、描述对象、审核人姓名、审核单位名称、审核时间、审核意见等管理属性信息。
68.作为示例,元数据分类方法可以采用多维标签的形式进行元数据类别管理,多维分类涵盖了基础共用、航空装备需求数据、航空数字样机数据、航空数字装备数据、公司运营管控数据、业务流程数据等领域以及描述对象,更便于元数据的检索查询和关联使用。
69.例如,对于元数据分类,基于航空产品信息/数据标准体系,可以构建元数据分类体系框架,涵盖基础共用、航空装备需求数据、航空数字样机数据、航空数字装备数据、公司运营管控数据、业务流程数据等领域。可以根据元数据的标准定义、信息来源来确定元数据的所属分类,形成分类目录,为元数据信息的管理和使用提供标签信息,对于跨领域共用的元数据,可以赋予多个分类标签。
70.在步骤110,按照元数据标识规则向所述元数据赋予唯一的元数据标识符,并根据所述元数据标识符建立所述元数据之间的关联关系,从而获得所述元数据的第三属性关联信息,所述第三属性关联信息包括所述元数据的关系属性。
71.可以理解,元数据的描述属性信息主要由应用层决定,当元数据被应用于数据映射、数据交互以及数据治理等过程中时,其规范性至关重要,为消除元数据理解上的差异,如何准确、唯一地定义和标识元数据是元数据采集的重点。
72.根据本发明示例性实施例,所述元数据标识符作为所述标识属性中的标识符;所述元数据标识规则为:所述元数据标识符由数据标识符和版本标识符两部分构成;其中所述数据标识符是根据所述元数据采集的先后顺序生成的无含义流水码;所述版本标识符是所述元数据的版本号。
73.例如,可以为通过审核的元数据信息赋予标准元数据的识别代码,即标识属性中的标识符。为保证元数据标识符的唯一性、稳定性、可扩充性,可以严格按照设定的元数据标识规则来统一赋予元数据标识符。
74.例如,元数据标识规则可以为:元数据标识符共10位,由数据标识符和版本标识符组成(如图4所示),其中数据标识符是根据元数据采集的先后顺序生成的无含义流水码,采用八位阿拉伯数字流水码,代码范围为00000001~99999999;版本标识符是元数据版本号,当定义类和表示类属性信息变更时版本标识符发生变更,采用两位阿拉伯数字流水码,代码范围为01~99。例如,在统一标识符为“10011102101”的元数据标识符中,“100111021”为数据标识符,“01”为版本号,标识该元数据信息为第1版。
75.根据本发明示例性实施例,根据所述元数据标识符建立所述元数据之间的关联关系,可以获得所述元数据的第三属性关联信息。其中,所述元数据之间的关联关系包括继承关系和/或替代关系。
76.作为示例,采用的元数据关联模式可以以元数据标识符为手段,关系类型包括继承关系和替代关系。例如,元数据标识符创建完成后,可以根据标识符来建立元数据之间的关联关系,包括继承关系和替代关系,其中:
77.a)继承关系是基本元数据和由其派生出的元数据之间的继承关系,基本元数据通常是较为通用的元数据,派生元数据则根据基本元数据定义的基本内涵,在特定的应用场景下缩小描述取值范围。
78.从名称上,基本元数据名称中不应有限定词存在,派生元数据名称一般由与之对应的基本元数据名称和特定的对象限定词或类词限定词组成。作为示例,继承关系可以通过派生元数据的关系属性中的基本元数据标识符建立。
79.例如:“产品名称”为一个基本元数据,其取值范围包括全部航空产品的名称,“机载产品名称”为该基本元数据在描述机载产品时派生出的元数据,其取值范围仅包括机载产品的名称。
80.b)替代关系是已废除元数据和替代该元数据的新元数据之间的关系,当一个元数据不再满足使用需求时,可对其进行注销操作,通过数据状态标识其为已废止。
81.例如,替代关系可以通过已废止元数据的关系属性中的替代元数据标识符来建立。
82.根据本发明示例性实施例,所述的方法还包括:在赋予唯一的元数据标识符之后,发布所述元数据的属性信息,并在所述元数据的使用过程中持续更新和维护所述元数据的与维护相关联的管理属性。
83.根据本发明示例性实施例,所述与维护相关联的管理属性包括数据状态、发布时
间、更新时间、以及废止时间。
84.例如,在完成审核赋码后,可以发布元数据信息。并且,在元数据的使用过程中,可以持续更新维护数据状态、发布时间、更新时间、废止时间等管理属性信息。
85.根据以上实施例,本发明实施例提出了一种基于属性数据模型的元数据采集方法,包括:基于元数据在数据治理和集成过程中发挥的作用,将其属性信息划分为标识类、定义类、表示类、管理类和关系类;设计元数据属性数据模型,用于规范元数据的标识、定义、表示、管理和关联;设计元数据标识和命名方式,用于限定元数据的唯一标识信息,规范元数据的表达;设计元数据的关联模式,通过多种关系,使单条元数据之间产生关联,综合管理元数据的采集、发布、应用和更新。
86.本公开实施例中提供的基于属性数据模型的元数据采集方法,特别适用于航空产品设计、制造、试验、使用、保障等全寿命周期范围内的元数据采集管理。基于元数据在数据治理和集成过程中发挥的作用,本公开实施例对于航空产品特别设置有属性信息共29项,并将其属性信息划分为标识类、定义类、表示类、管理类和关系类,用于元数据的识别、描述和管理;设计元数据标识和命名方式,用于唯一确定元数据信息,规范元数据的表达,同时体现元数据所描述对象的粒度层级;设计元数据的关联体系,综合管理元数据的应用和更新。
87.由此,本公开实施例中的基于属性数据模型的元数据采集方法,能够通过构建元数据的属性数据模型,规范元数据的描述属性,并通过采集、处理、维护这些属性信息,得到体系化、标准化的元数据资源。工程实践表明,该方法能够有效获取与元数据标识、定义、表示、管理和关联相关的完整属性信息,并能够确保元数据标识、定义和表示的准确性,以及管理和关联的高效性,从而高效支撑元数据应用,解决了数据交互时元数据无法统一的问题。
88.相对于现有技术而言,本公开实施例中的元数据属性数据模型和采集方法,对常规的标识类、定义类和表示类属性信息进行扩展,并增设管理类和关联类属性信息,对于存在大量产品数据、供应链数据、业务管理数据的航空产品数据管理领域,更加适配多源数据集成、数据融合汇聚的使用场景,可解决以往元数据采集管理方法无法满足数据交互共享需求的问题。
89.本发明实施例中基于属性数据模型的元数据采集方法与现有技术相比的优点至少包括:现有元数据采集方法只考虑获取数据库层面的表结构信息,其属性信息不完整,难以支撑元数据治理、数据标准统一和数据质量校核等工作的开展。相较之下,本发明实施例所提出的采集方法,能够基于元数据属性数据模型,实现对影响元数据选用、元数据值、元数据信息管理的属性信息的全方位管理,为数据治理和质量管理提供了底层支撑,克服了元数据定义不明确导致的数据交互困难的不足。本公开实施例可有效提高元数据采集的完整性和规范性,尤其适用于多系统多领域共用的标准元数据的采集与治理。
90.因此,本发明实施例所提出的基于属性数据模型的元数据采集方法,结合信息系统数据治理和集成的开展,可从源头优化数据质量,统一数据表达与理解,从而弥补了现有数据标准执行困难,数据交互困难、效率低下的问题,具有高效、准确、可执行的特点。
91.图5为本发明优选实施例的基于属性数据模型的元数据采集方法的示意图,其包括如下步骤:
92.(1)建立航空产品领域元数据属性数据模型,规范元数据的描述属性,将设定的29项属性信息分为标识类、定义类、表示类、管理类和关系类等5类属性。
93.(2)引接数据资源,抽取元数据信息:引接航空产品设计、制造、试验、使用、保障等全寿命周期范围内产生的数据资源,依据航空产品领域元数据属性数据模型提取其中部分元数据信息,包括中文名称、同义名称、英文名称、字母标识、表达符号等标识属性;定义、参考来源名称、参考来源密级等定义属性;数据类型、长度、值域、计量单位等表示属性;申请人姓名、申请人联系方式、申请单位名称、申请时间等管理属性。
94.(3)按照元数据属性模型采集属性信息:按照每一项描述属性的内容、格式定义,以及数据类型、是否全局唯一、是否必填等约束,将采集得到的原始元数据信息整编为标准格式。例如,在整编元数据采集信息时,为保证元数据名称全局唯一且无歧义,严格按照设定的元数据命名规则确定元数据名称。
95.(4)唯一性校验:根据规范后的元数据标识和定义属性,对多来源采集得到的元数据信息进行唯一性校验,包括对元数据名称进行匹配查重,和通过抽取关键词的方式对元数据的定义进行相似度计算。在唯一性校验通过时转入步骤(5);在未通过时进行相似度计算,当相似度高时,合并处理;当相似度低时,调整属性信息,降低相似度;
96.(5)确定元数据分类:通过唯一性校验后,标志着元数据信息通过审核(信息规范且全局唯一),补充所属分类、描述对象、审核人姓名、审核单位名称、审核时间、审核意见等管理属性信息。
97.(6)赋予唯一标识:为通过审核的元数据信息赋予标准元数据的识别代码,即标识属性中的标识符。为保证元数据标识符的唯一性、稳定性、可扩充性,严格按照设定的元数据标识规则统一赋予元数据标识符。
98.(7)记录管理类属性信息:完成审核赋码后,发布元数据信息,在元数据的使用过程中,持续更新维护数据状态、发布时间、更新时间、废止时间等管理属性信息。
99.(8)建立关联关系(继承、替代等):元数据标识符创建完成后,根据标识符建立元数据之间的关联关系,包括继承关系和替代关系。
100.本发明各示例性实施例还提供了一种基于属性数据模型的元数据采集装置,其特征在于,包括:处理器;存储器,耦合至所述处理器并且存储有指令,所述指令在由所述处理器执行时使所述处理器执行根据以上实施例所述的基于属性数据模型的元数据采集方法。
101.本发明各示例性实施例还提供了一种计算机程序产品,被有形地存储在非瞬态计算机可读介质上并且包括计算机可读程序指令,当所述计算机可读程序指令在设备上被执行时使得所述设备执行根据以上实施例所述的基于属性数据模型的元数据采集方法。
102.本发明各示例性实施例还提供了一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,所述计算机可读程序指令用于执行根据以上实施例所述的基于属性数据模型的元数据采集方法。
103.本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”。其他术语的相关定义将在下文描述中给出。
104.本公开中所描述的方法和功能可以至少部分地由一个或多个硬件逻辑组件来执行。例如但不限于,可以使用的硬件逻辑组件的示意性类型包括现场可编程门阵列(fpga)、
专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑器件(cpld)等。
105.计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
106.这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
107.用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
108.这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
109.这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其它设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中
规定的功能/动作的各个方面的指令。
110.也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
111.附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
112.此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实现的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
113.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明还可以通过其他结构来实现,本发明的特征并不局限于上述较佳的实施例。任何熟悉该项技术的人员在本发明的技术领域内,可轻易想到的变化或修饰,都应涵盖在本发明的专利保护范围之内。
技术特征:
1.一种基于属性数据模型的元数据采集方法,其特征在于,包括:建立用于航空产品的元数据属性数据模型,所述元数据属性数据模型将元数据的属性信息划分为标识属性、定义属性、表示属性、管理属性、以及关系属性;引接所述航空产品在全寿命周期内产生的数据资源,并按照所述元数据属性数据模型提取所述元数据的第一属性关联信息;所述第一属性关联信息包括所述元数据的标识属性、定义属性、表示属性、以及与申请相关联的管理属性;按照与所述元数据的属性信息相对应的约束条件,将提取的所述元数据的所述第一属性关联信息整编为标准格式的第一属性关联信息;利用整编后的标准格式的第一属性关联信息对所述元数据进行唯一性校验,并在唯一性校验通过后获得所述元数据的第二属性关联信息,所述第二属性关联信息包括所述元数据的与审核相关联的管理属性;以及按照元数据标识规则向所述元数据赋予唯一的元数据标识符,并根据所述元数据标识符建立所述元数据之间的关联关系,从而获得所述元数据的第三属性关联信息,所述第三属性关联信息包括所述元数据的关系属性。2.根据权利要求1所述的方法,其特征在于,所述标识属性用于标识和区分所述元数据,包括标识符、中文名称、同义名称、英文名称、字母标识、以及表达符号。3.根据权利要求1所述的方法,其特征在于,所述定义属性用于确定和解释所述元数据的含义,包括定义、参考来源名称、以及参考来源密级。4.根据权利要求1所述的方法,其特征在于,所述表示属性用于规定所述元数据所描述数据的表示形式,包括数据类型、长度、值域、以及计量单位。5.根据权利要求1所述的方法,其特征在于,所述管理属性用于所述元数据在全寿命周期过程中的管理,包括所属分类、描述对象、申请人姓名、申请人联系方式、申请单位名称、申请时间、审核人姓名、审核单位名称、审核时间、审核意见、数据状态、发布时间、更新时间、以及废止时间。6.根据权利要求5所述的方法,其特征在于,所述与申请相关联的管理属性包括申请人姓名、申请人联系方式、申请单位名称、以及申请时间;所述与审核相关联的管理属性包括所属分类、描述对象、审核人姓名、审核单位名称、审核时间、以及审核意见。7.根据权利要求1所述的方法,其特征在于,所述关系属性用于确定所述元数据之间的关系,包括基本元数据标识符、以及替代元数据标识符。8.根据权利要求1-7任一项所述的方法,其特征在于,所述按照与所述元数据的属性信息相对应的约束条件,将提取的所述元数据的所述第一属性关联信息整编为标准格式的第一属性关联信息,包括:按照元数据命名规则将所述第一属性关联信息中标识属性的中文名称整编为标准格式的中文名称;其中,所述元数据命名规则为:所述中文名称为表达所述元数据含义的中文词组或短语,其由对象词、特性描述词、表示类词、限定词组成;其中对象词和表示类词为必选词汇,特性描述词和限定词为可选词汇。9.根据权利要求1-7任一项所述的方法,其特征在于,所述利用整编后的标准格式的第一属性关联信息对所述元数据进行唯一性校验,包括:
通过判断整编后的标准格式的所述第一属性关联信息中标识属性的中文名称是否相同、以及计算整编后的标准格式的所述第一属性关联信息中定义属性的相似度高低,来进行唯一性校验。10.根据权利要求1-7任一项所述的方法,其特征在于,所述元数据标识符作为所述标识属性中的标识符;所述元数据标识规则为:所述元数据标识符由数据标识符和版本标识符两部分构成;其中所述数据标识符是根据所述元数据采集的先后顺序生成的无含义流水码;所述版本标识符是所述元数据的版本号。11.根据权利要求1-7任一项所述的方法,其特征在于,所述元数据之间的关联关系包括继承关系和/或替代关系。12.根据权利要求1-7任一项所述的方法,其特征在于,还包括:在赋予唯一的元数据标识符之后,发布所述元数据的属性信息,并在所述元数据的使用过程中持续更新和维护所述元数据的与维护相关联的管理属性。13.根据权利要求12所述的方法,其特征在于,所述与维护相关联的管理属性包括数据状态、发布时间、更新时间、以及废止时间。14.一种基于属性数据模型的元数据采集装置,其特征在于,包括:处理器;存储器,耦合至所述处理器并且存储有指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-13中任一项所述的基于属性数据模型的元数据采集方法。15.一种计算机程序产品,被有形地存储在非瞬态计算机可读介质上并且包括计算机可读程序指令,当所述计算机可读程序指令在设备上被执行时使得所述设备执行根据权利要求1-13中任一项所述的基于属性数据模型的元数据采集方法。16.一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,所述计算机可读程序指令用于执行根据权利要求1-13中任一项所述的基于属性数据模型的元数据采集方法。
技术总结
本发明公开了基于属性数据模型的元数据采集方法、装置、计算机程序产品、以及计算机可读存储介质,该方法包括:建立用于航空产品的元数据属性数据模型;引接航空产品在全寿命周期内产生的数据资源,并按照元数据属性数据模型提取元数据的第一属性关联信息;按照与元数据的属性信息相对应的约束条件,将提取的元数据的第一属性关联信息整编为标准格式的第一属性关联信息;利用整编后的标准格式的第一属性关联信息对元数据进行唯一性校验,并在唯一性校验通过后获得元数据的第二属性关联信息;以及按照元数据标识规则向元数据赋予唯一的元数据标识符,并根据元数据标识符建立元数据之间的关联关系,从而获得元数据的第三属性关联信息。联信息。联信息。
技术研发人员:张驰 邢磊 张柯尧 付远祥 李琪 肖然然 刘倩 郭福旺
受保护的技术使用者:中国航空综合技术研究所
技术研发日:2023.01.18
技术公布日:2023/7/11
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
