用于工程系统的知识图的逻辑规则归纳的系统的制作方法
未命名
07-19
阅读:99
评论:0
1.本技术涉及应用于工程系统的机器学习。更具体地,本技术涉及工程设计领域中知识图分析的逻辑规则归纳。
背景技术:
2.从数据中学习一阶逻辑规则的问题已经成为机器学习中的长期挑战,并且在许多应用中起到重要作用。例如,对于如燃气轮机、电网或智能建筑的系统,大量的数据由传感器记录。对于这样的系统,可以构建知识图来表示系统的领域知识。在工程设计过程中,可以应用机器学习来加速在多个候选设计中搜索最优设计。在设计由许多相互连接的部分组成的情况下,每个部分具有从其中选择的几个可选方案,可用配置的排列可以是交错的。
3.逻辑规则是基于知识的推理的人类可解释的表示,与黑盒监督学习模型相比,其可以提供更好的洞察力来理解数据的属性。在许多情况下,这种可解释性导致迁移学习的鲁棒性。而且,逻辑规则对于许多下游任务(目标任务)非常有用,例如问题回答、从人类经验中提取知识,以及从开放域文本中提取知识。由于组合搜索空间,从知识图中提取规则是有挑战性的。执行所有可能规则的蛮力搜索在计算上是难以处理的。对于实际应用,候选逻辑规则公式的数量可以容易地达到数十亿甚至万亿。
4.现有方法使用具有各种约束的一阶逻辑公式的模板来减小搜索空间。传统的归纳逻辑编程方法不仅效率低,而且不能处理现实世界数据中的噪声。最近使用深度学习技术(例如,神经逻辑编程)的方法可以处理数据中的噪声,但是要求公式中的逻辑变量是链接的,并且每个谓词必须具有正好两个自变量。即使有了这些限制,现有的方法也只能提取具有多达两个或三个谓词的逻辑公式,这对于许多工业应用的建模要求来说是非常不足的。
技术实现要素:
5.系统通过用于搜索断开知识图的第一框架和用于搜索连接良好的知识图的第二框架来提供对工程系统的知识图的逻辑规则归纳。在第一框架中,当公式构建过程搜索较长公式时,生成一阶逻辑规则公式的排名最高的候选以减小知识图的搜索空间。第二框架应用具有反事实解算器引擎的图神经网络(gnn)来捕获知识图的局部拓扑模式,并基于图的原子动作来抽象一阶逻辑规则公式。归纳的一阶逻辑规则解释了工程系统的最优设计。
附图说明
6.参考以下附图描述本实施例的非限制性和非穷举性实施例,其中除非另有说明,否则在所有附图中相同的附图标记表示相同的元素。
7.图1示出了根据本发明的实施例的用于知识图的一阶逻辑公式归纳的系统的示例。
8.图2示出了根据本发明的实施例的来自断开知识图的框架一阶逻辑公式归纳的示例。
9.图3示出了根据本发明的实施例的聚合集束搜索顺序的示例。
10.图4示出了根据本发明的实施例的来自候选公式的公式扩展的示例。
11.图5示出了根据本发明的实施例的用于训练图神经网络的反事实公式的示例,该图神经网络被用于从连接良好的知识图中提取逻辑规则公式。
12.图6示出了根据本发明的实施例的关于连接良好的知识的原子动作用于生成逻辑规则归纳的反事实的示例。
13.图7示出了其中可以实现本发明的实施例的计算环境的示例。
具体实施方式
14.公开了用于显著提高搜索知识图的一阶逻辑公式的效率的方法和系统。对于断开知识图,使用具有动态公式生成和反转索引技术的聚合集束搜索方法。对于大规模连接良好知识图,并入图神经网络以避免难以处理的组合搜索空间。本发明的实施例所解决的技术问题包括需要针对从多个候选设计中提取最佳目标设计来定义一阶逻辑公式,其中可以管理搜索空间以减少处理时间和工作以提高效率。在一个方面中,导出的逻辑公式可以被配置为最佳设计的解释,其中成功的设计是通过单独的元素的性能和根据最佳标准执行的互连元素的关系来判断的。与依赖于公式模板来减少搜索空间的传统方法不同,所公开的框架可以从零(没有模板)学习公式,并且仍然快速地导出逻辑公式。虽然常规方法将公式约束为两个或三个谓词或两个至三个元素的链长度,但是所公开的框架不具有这种约束。
15.图1示出了根据本发明的实施例的用于知识图的一阶逻辑公式归纳的系统的示例。在实施例中,为具有可提供反馈的机器和传感器的工业系统170(例如自动化系统)执行设计工程项目。计算设备110包括处理器115和其上存储有各种计算机应用、模块或可执行程序的存储器111(例如,非暂时性计算机可读介质)。工程应用112可以包括用于建模工具、模拟引擎、计算机辅助设计(cad)工具和其他工程工具中的一个或多个的软件,用户可以通过图形用户界面(gui)116和用户界面模块114访问这些工具,用户界面模块114驱动gui 116的显示馈送并处理返回到处理器115的用户输入,所有这些工具都可用于执行系统设计,例如以2d或3d透视图的形式。诸如局域网(uan)、广域网(wan)或基于因特网的网络的网络130将计算设备110连接到知识图150的储存库。
16.在实施例中,由工程应用112生成的工程数据被监视并组织到知识图150中作为语义数据。知识图150是从工程应用112导出的设计数据的累积,并由处理导出数据的本体的知识图算法生成。在一些实施例中,从供应者获得知识图,例如与设计中的系统相关的类似系统、子系统或组件的供应商或制造商。本体支配系统的元素的类型以及存在元素之间的关系(例如,电动机控制、逻辑功能块、相关联的传感器信号)。本体还描述元素的属性和元素关系,并且可以将元素类型组织成分层结构,诸如超类型和子类型。知识图150将本体表示为分别对应于本体和元素关系的一组元素的节点和边。例如,包含在本体中的工程系统信息可以包括设计参数、传感器信号信息、操作范围参数(例如,电压、电流、温度、应力等)。当从工业系统170中的传感器获得测量数据时,可以将其添加到知识图150中的各个节点和边。因此,知识图结构可以包含关于系统的结构化和静态域知识。测量数据将包含关于系统的隐式和显式知识,这对于改进系统的操作性能或这种系统的未来设计是非常有价值的。显式知识可以包括例如趋势、相关模式、超出所需限度的数据值等。隐式知识可以包括以某
种特定方式驱动系统性能的规则、某些变量集合之间的约束和依赖性、变量之间的非线性关系等。
17.ai模块125被配置为使用包括过滤器121、集束搜索引擎122、动态公式生成器123、公式评估引擎124、反事实解算器引擎127和图神经网络模块128的多个模块对知识图150执行一阶逻辑公式归纳。ai模块125分析一个或多个知识图以引入表示最佳设计的一阶逻辑规则。在实施例中,一阶逻辑规则公式的归纳涉及导出公式,该公式是表示系统设计的组件关系的项目链。使用汽车设计作为示例,可以使用各种知识图来进行分析,每个图表示与汽车的不同设计的组件选择和组合的不同集合相关联。例如,五个已知的设计具有五个知识图用于进行分析,从而形成新的第六设计。要导出的一阶逻辑公式由可能涉及工程系统组件的术语链组成,例如从机械互连领域的知识图中提取的引擎、底盘、轴和车轮。另一公式链可表示电气领域,例如表示用于与引擎、底盘、轴和车轮相关联的各种传感器的互连计算机网络的元素。简化公式链示例是四个项目的链,其中a[涉及]b、b[涉及]c和d、c[涉及]b和d,其中“涉及”可采取取决于特定关系的任何关系语法的形式(例如,连接到、是
……
的组件、是
……
的传感器等)。根据实施例,对链长的约束可以是在没有其它约束的情况下在计算机的可用存储器内适配公式。
[0018]
简言之,过滤器121用于确定知识图,该知识图被断开以根据本发明的第一过程执行公式归纳。例如,过滤器121可以检测知识图中的不同集群并允许这样的知识图作为断开知识图通过。由集束搜索引擎122探索断开的知识图,该集束搜索引擎122以一个集束的增量(即知识图边)执行知识图的逐步探索。这里,术语“集束”和“边”可互换使用。集束搜索在具有排名最高的公式的节点处开始,并且在迭代过程的每个周期,将搜索扩展到所有连接的节点,因此执行单个集束增量搜索。动态公式生成器123为每个搜索集束定义一阶逻辑公式,例如p(t1,...,tn),其中n元谓词p具有至少两个自变量(即,n≥2),诸如项目t1和t2。为了对生成的公式进行求职,公式评估引擎124根据边类型映射公式,形成子图的集合,并找到集合交集,以确定哪些子图满足被评估的候选公式。这用于显著加速公式评估,因为避免了将每个候选公式作为基础。
[0019]
断开的知识图分析
[0020]
图2示出了根据本发明的实施例的用于从断开知识图进行一阶逻辑公式归纳的框架的示例。对于被过滤器121确定为分类上断开的知识图,框架200通过知识图数据提取的迭代过程来构建一组一阶逻辑规则公式,该知识图数据提取产生一组排名最高的候选逻辑规则公式。在一个方面,框架200的单次迭代包括集束搜索202、逻辑规则公式生成203和逻辑规则公式评估204。从一组知识图210开始,过滤器201检测第一个断开知识图,并且对于框架200的初始周期,集束搜索引擎122接收k个已知的短长度逻辑规则公式211作为输入。集束搜索202过程在对应于k个短长度逻辑规则公式的断开知识图中的集束处开始。集束搜索202如以下参考图3所描述进行。
[0021]
图3示出了根据本发明的实施例的聚合集束搜索序列的示例。在实施例中,集束搜索引擎122执行聚合集束搜索202,使得搜索域每次扩展一个跳(即,用于框架200的给定迭代的知识图的一个边)以搜索更长的逻辑规则公式。如图3所示,集束搜索序列开始于步骤301,其中初始k个逻辑规则公式211对应于知识图中的初始集束311、313。在随后的周期中,k个排名最高的逻辑规则公式212馈送集束搜索202。虽然本发明的实施例能够搜索和评估k
》》1000的候选公式,但是对于该简化示例,k=2。在实施例中,集束搜索202应用于识别距离初始集束311、313一个集束跳的搜索域。因此,搜索域包括连接到作为集束311、313的内部节点的关注节点312、314的所有集束。集束搜索202为跟踪扩展的一组搜索集束的每个路径定义子图。该跟踪的图表示在图3中在序列的步骤302中示出,其中通过扩展关注节点312、314的集束来形成子图。对于该第一集束搜索,集束322、323、324、325、326被识别为用于扩展与逻辑规则归纳中的集束311相关联的逻辑规则公式的候选,而集束327、328、329被识别为用于集束313的公式扩展的候选。使用在步骤302中定义的每个子图的知识图对象对框架200的当前周期执行公式生成203和评估204,下面将更详细地描述。当前周期的评估204的输出是前k个逻辑规则公式212,其然后触发下一个集束搜索303。在该示例中,集束324和327对应于上面的k个公式(对于k=2),因此在步骤303关注节点是节点334、335。从步骤302的所有候选集束中,在步骤303只有集束324和327保留用于第二周期的逻辑规则归纳。以与针对步骤302所描述类似的方式,集束搜索域将从步骤303中所示的子图扩展为来自节点334和335中的每一个的单个集束跳。以类似的方式对后续周期重复集束搜索202,直到扩展的子图耗尽k个排名靠前的公式,或者直到达到逻辑规则公式的期望长度为止。其它限制或约束也可限制周期数。如可以在图3中看到的,通过将迭代集束搜索限制到作为公式扩展的源的前k个候选,将被生成和评估的候选公式的数量显著减少。在实际规模上,即使在k》》1000的情况下,当知识图可具有多达数十亿或万亿的边时,计算节省也是显著的。
[0022]
图4示出了根据本发明的实施例的来自候选公式的受约束公式扩展的示例。在实施例中,集束搜索算法根据指定的评估度量跟踪前k个排序的公式,其中k是指定需要多少公式作为目标的常数。实践中,在数千的规模上设置k可以容易地由集束搜索算法202处理。结果,避免了用于较长公式大小的指数增加的搜索空间。作为用于说明目的的简化示例,对k=2执行图4中的公式展开。从两个公式树401、402开始,其中元素对应于来自图3所示集束的候选公式,存在由元素411和412表示的两个排名最高的公式。在框架200的下一周期中,从集束搜索中的连接集束中确定两个排名最高的公式,如树级452处的元素421和422所示。下一排名靠前的公式由在第三周期中确定的树级453处的元素431、432表示。以此方式,公式评估被防止随着框架200的每次迭代而指数地扩大。
[0023]
回到图2,接下来将对针对由集束搜索202定义的每个子图执行的动态逻辑规则公式生成203进行描述。虽然集束搜索202被配置为减少计算,但是为所有子图213生成候选公式在计算上代价高,因为必须检查每个候选公式是否满足其条件,即使对于不满足子图结构的任何谓词具有快捷中断。在实施例中,通过生成作为逻辑规则公式生成203的一部分的反转索引映射214和集合交集215来实现对逻辑规则公式生成和评估204的计算的进一步减少。公式生成器123生成反转索引,用于将与候选公式相关联的每种类型的边(集束)映射到它出现在其中的一组子图。在集合交集操作中,将逻辑and操作符应用于反转索引映射214的子图集合,以找到满足当前生成的候选公式的多个子图。这样,公式生成不用考虑消除重复的子图,避免了将每个候选公式作为基础,并且通过具有较少的候选公式来评估,公式评估阶段204显著加速。
[0024]
与没有反转索引的基线方法相比,生成的候选逻辑规则公式的数量显著减少。作为示例,对于分别具有2、3和4个谓词的长度为2、3和4的逻辑规则公式,所生成的候选规则的数量分别减少7x、22x和48x。对于较长的公式,基线方法在计算上禁止生成所有候选规
则,而改进的公式生成过程203可以容易地从由聚合集束搜索202导出的子图的子集来生成候选规则。
[0025]
逻辑规则公式生成203生成根据与子图连接相关联的逻辑规则语法制定的一阶逻辑规则公式。因为框架200使得公式基于集束搜索连接集束,所以每个子图都是固有连接的。该约束对应于在实际应用中框架200的焦点在于实体团而不是断开子图。
[0026]
根据替换逻辑规则公式变量的常数导出基础公式216。公式作为基础是动态的,因为不是所有候选公式都作为基础,而是一个子集作为反转索引和集合交集操作的结果而作为基础。作为导出基础公式的示例,考虑与具有15种可用引擎类型、11种底盘类型和25种变速驱动桥类型的车辆的工程系统设计相关的知识图210,特定知识图的子图通过以下实例作为基础:15的引擎12与11的底盘5连接,该底盘与25的变速驱动桥23连接。对于实际示例,多个知识图的许多(~100)子图的动态基础化可以是公式的特定概率的确定性。例如,如果引擎12很少连接到底盘2,则存在这种连接的可能性低的强确定性。
[0027]
逻辑规则公式评估204对基础公式216进行排序。为了对候选公式进行分级,选择标准,例如覆盖率、准确度、置信度得分或它们组合。保留排序最高的公式的特定数目k用于将来搜索更长的公式。
[0028]
作为反转索引映射214和集合交集215的另一优点,公式评估204比基线方法明显更有效。框架200相对于基线方法的测试结果产生显著的时间节省。对于具有2、3和4谓词的候选公式,与基线方法相比,框架200方法可以实现因数为22x、660x和85lx的更快的公式评估处理时间。对于较长的公式,基线方法太慢而不能评估,而框架100方法可以非常有效地完成候选公式生成。例如,可以在大约30分钟内评估具有12个谓词的公式。
[0029]
一旦通过公式评估204导出了最高k个排序的公式,就重复该过程,从另一集束搜索202开始,搜索链长为x+1的子图。框架200执行迭代过程,直到子图长度达到预定的最大极限或知识图的极限,或者直到在知识图中搜索的长度为x+1的新候选公式不满足公式标准。可以基于稳健性与计算时间和存储器之间的权衡将前k个公式的限制预定为约束。
[0030]
连接良好的知识图分析
[0031]
已经覆盖了如上所描述的用于从断开知识图中归纳逻辑规则公式的框架,接下来描述用于大规模连接良好知识图的逻辑规则公式归纳的方法。在实施例中,根据以下描述,过滤器121确定接收到的知识图150满足连通性标准,并将知识图上的逻辑规则归纳触发为连接良好的知识图。反事实解算器127与gnn 128一起工作以克服当基础化逻辑公式时快速扩展的问题。反事实是计算认知科学和统计的交集的一种方法,其试图预测某一事件的结果,假定该事件未被模型观察到。为了说明如何将反事实应用于连接良好的知识图,回想逻辑规则的解释的ai概念,通过该概念解释为什么分类如所叙述的。作为替换方法,反事实解算器引擎127找到查询知识图和干扰知识图两者所共有的一个或多个元素,使得如果该元素被改变,则查询知识图将被分类为更可能是干扰知识图(或查询图的“对应”版本或替换版本)。应用反事实分析的好处是它可以提供对知识图的哪些元素对于保持其分类完整是必要的或关键的理解。即,通过识别触发不同分类的知识图的最小原子变化,建立逻辑规则的有区别的验证。简而言之,什么情况产生知识图分类x而不是y。
[0032]
更正式地,给定知识图的子图或节点的某个分类,解释问题被公式化为使用gnn 128与反事实解算器引擎127的组合操作,对引起子图或节点的错误分类的知识图需要创建
的最小改变量。可以制定优化问题以试图识别导致节点的错误分类的对知识图的最小编辑数。这直接转化为反事实的公式化,因为图结构的识别类似于被分类的图结构,但足够不同以导致错误分类。所得到的图结构是所产生的反事实。
[0033]
给定gnn 128为其预测类c的查询知识图g,目标在于产生找到对图g进行最小变化的反事实解释,查看朝向gnn先前预测为类c'的干扰图g的变化。解决方案是执行从g到反事实g*的变换,使得g*看起来是对经训练的gnn模型g的类c'的实例。这里,gnn可以表示为gc(f(g))以表示图g的类c的对数概率。数学上,从g到g*的变换可以表示如下:
[0034][0035]
其中:1是所有都是1的向量;
[0036]
a是二进制门控向量;以及
[0037]
°
是矢量和矩阵之间的哈达玛积。
[0038]
图5示出了根据本发明的实施例的将反事实应用于gnn以从大规模连接良好知识图导出逻辑规则公式的示例。在实施例中,反事实解算器127通过最小化二进制门控向量a的范数来求解优化,其表示从图g’到查询图g以生成反事实图g*的最小编辑数。这可以表示如下:
[0039][0040][0041][0042]
其中:
[0043]
f(g)是查询图特征向量
[0044]
f(g*)是反事实图特征向量
[0045]
f(g')是干扰图特征向量
[0046]
p是重新排列f(g')的元素以与f(g)的元素一致的置换矩阵,
[0047]
pf(g')是重新排列的干扰特征向量
[0048]
p是所有置换矩阵的集合
[0049]
在实施例中,gnn被训练来学习置换矩阵p,这使得能够直接从知识图中确定最小编辑数。该方法使得处理算法更快,其使得能够以端到端方式训练系统。该方法的结果是生成gnn,该gnn可以解释所学习的参数以在大规模知识图上发现人类可读逻辑公式。由于gnn可以捕获图中的局部拓扑模式,因此可以将嵌入在学习模型中的知识抽象并推广到逻辑公式。
[0050]
图6示出了根据本发明的实施例的在连接良好的知识图上生成用于减少搜索空间逻辑规则归纳的反事实的原子动作的示例。在该示例中,为了说明的目的示出了非常简单的图,因为实际知识图可以包括数百万或数十亿个节点。如图所示,从查询图601开始,各种原子编辑包括公式加法编辑602、公式减法编辑603和术语编辑604,如图6所示。在每种情况下,对图601进行单个“原子”编辑以分析当被反事实解算器引擎127分析时图类是否已改变。
[0051]
图7示出了其中可以实现本发明的实施例的计算环境的示例。计算环境700包括计
算机系统710,其可包括诸如系统总线721的通信机制或用于在计算机系统710内传送信息的其它通信机制。计算机系统710还包括与系统总线721联接的用于处理信息的一个或多个处理器720。在实施例中,计算环境700对应于用于知识图的逻辑规则归纳的系统,其中计算机系统710涉及下面更详细描述的计算机。
[0052]
处理器720可以包括一个或多个中央处理单元(cpu)、图形处理单元(gpu)或本领域已知的任何其他处理器。更一般地,这里描述的处理器是用于执行存储在计算机可读介质上的机器可读指令的设备,用于执行任务,并且可以包括硬件和固件中的任何一个或其组合。处理器还可以包括存储可执行用于执行任务的机器可读指令的存储器。处理器通过操纵、分析、修改、转换或传输由可执行程序或信息设备使用的信息和/或通过将信息路由到输出设备来对信息起作用。处理器可以使用或包括例如计算机、控制器或微处理器的能力,并且使用可执行指令来调节以执行不由通用计算机执行的专用功能。处理器可以包括任何类型的适当处理单元,包括但不限于中央处理单元、微处理器、精简指令集计算机(risc)微处理器、复杂指令集计算机(cisc)微处理器、微控制器、专用集成电路(asic)、现场可编程门阵列(fpga)、片上系统(soc)、数字信号处理器(dsp)等。此外,处理器720可具有任何合适的微架构设计,其包括任何数目的组成组件,例如寄存器、多路复用器、算术逻辑单元、用于控制对高速缓冲存储器的读取/写入操作的高速缓冲存储器控制器、分支预测器等。处理器的微体系结构设计能够支持多种指令集中的任何指令集。处理器可以与能够在其间进行交互和/或通信的任何其它处理器联接(电联接和/或包括可执行组件)。用户界面处理器或产生器是已知的元素,包括用于产生显示图像或其部分的电子电路或软件或两者的组合。用户界面包括使用户能够与处理器或其它设备交互的一个或多个显示图像。
[0053]
系统总线721可以包括系统总线、存储器总线、地址总线或消息总线中的至少一个,并且可以允许在计算机系统710的各个组件之间交换信息(例如,数据(包括计算机可执行代码)、信令等)。系统总线721可以包括但不限于存储器总线或存储器控制器、外围总线、加速图形端口等。系统总线721可以与任何合适的总线体系结构相关联,包括但不限于工业标准体系结构(isa)、微通道体系结构(mca)、增强型isa(eisa)、视频电子标准协会(vesa)体系结构、加速图形端口(agp)体系结构、外围组件互连(pci)体系结构、pci-express体系结构、个人计算机存储卡国际协会(pcmcia)体系结构、通用串行总线(usb)体系结构等。
[0054]
继续参考图7,计算机系统710还可以包括联接到系统总线721的系统存储器730,用于存储将由处理器720执行的信息和指令。系统存储器730可以包括易失性和/或非易失性存储器形式的计算机可读存储介质,诸如只读存储器(rom)731和/或随机存取存储器(ram)732。ram 732可以包括其它动态存储设备(例如,动态ram、静态ram和同步dram)。rom 731可以包括其它静态存储设备(例如,可编程rom、可擦除prom和电可擦除prom)。此外,系统存储器730可用于在处理器720执行指令期间存储临时变量或其它中间信息。基本输入/输出系统733(bios)包含有助于诸如在启动期间在计算机系统710内的元素之间传递信息的基本例程,它可以存储在rom 731中。ram 732可包含可由处理器720立即访问和/或当前正由处理器720操作的数据和/或程序模块。系统存储器730还可以包括例如操作系统734、应用模块735和其它程序模块736。应用模块735可包括上述针对图1描述的模块,并且还可以包括用于开发应用程序的用户入口,允许输入参数并根据需要进行修改。
[0055]
操作系统734可以被加载到存储器730中,并且可以提供在计算机系统710上执行
的其他应用软件与计算机系统710的硬件资源之间的界面。更具体地,操作系统734可包括一组计算机可执行指令,用于管理计算机系统710的硬件资源并向其它应用程序提供公共服务(例如,管理各种应用程序之间的存储器分配)。在某些示例实施例中,操作系统734可以控制被描绘为存储在数据存储740中的一个或多个程序模块的执行。操作系统734可包括现在已知或将来可开发的任何操作系统,包括但不限于任何服务器操作系统、任何主机操作系统或任何其它专有或非专有操作系统。
[0056]
计算机系统710还可以包括联接到系统总线721的盘/介质控制器743,以控制用于存储信息和指令的一个或多个存储设备,诸如磁硬盘741和/或可移动介质驱动器742(例如,软盘驱动器、光盘驱动器、磁带驱动器、闪存驱动器和/或固态驱动器)。可以使用适当的设备接口(例如,小型计算机系统接口(scsi)、集成设备电子设备(ide)、通用串行总线(usb)或firewire)将存储设备740添加到计算机系统710。存储设备741、742可以在计算机系统710的外部。
[0057]
计算机系统710可以包括用户输入/输出界面760,用于与诸如键盘、触摸屏、输入板和/或点击设备之类的一个或多个输入设备761,以及诸如显示设备之类的输出设备762进行通信,以使得能够与计算机用户进行交互并向处理器720提供信息。
[0058]
计算机系统710可以响应于处理器720执行包含在诸如系统存储器730的存储器中的一个或多个指令的一个或多个序列而执行本发明实施例的处理步骤的一部分或全部。这样的指令可以从存储740的另一计算机可读介质(诸如磁硬盘741或可移动介质驱动器742)读入系统存储器730。硬磁盘741和/或可移动介质驱动器742可包含本发明的实施例所使用的一个或多个数据存储和数据文件。数据存储740可以包括但不限于数据库(例如,关系型、面向对象的等)、文件系统、平面文件,其中数据存储在计算机网络的多于一个节点上的分布式数据存储、对等网络数据存储等。数据存储内容和数据文件可以被加密以提高安全性。处理器720还可以用于多处理配置中,以执行包含在系统存储器730中的一个或多个指令序列。在替代实施例中,硬连线电路可以代替软件指令或与软件指令结合使用。因此,实施例不限于硬件电路和软件的任何特定组合。
[0059]
如上所叙述,计算机系统710可以包括至少一个计算机可读介质或存储器,用于保存根据本发明的实施例编程的指令,并且用于包含数据结构、表、记录或这里描述的其它数据。这里使用的术语“计算机可读介质”是指参与向处理器720提供指令以供执行的任何介质。计算机可读介质可以采用许多形式,包括但不限于非瞬态、非易失性介质、易失性介质和传输介质。非易失性介质的非限制性示例包括光盘、固态驱动器、磁盘和磁光盘,诸如磁硬盘741或可移动介质驱动器742。易失性介质的非限制性示例包括动态存储器,诸如系统存储器730。传输介质的非限制性示例包括同轴电缆、铜线和光纤,包括构成系统总线721的导线。传输介质也可以采用声波或光波的形式,例如在无线电波和红外数据通信期间产生的声波或光波。
[0060]
用于执行本发明的操作的计算机可读介质指令可以是汇编指令、指令集体系结构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据,或者以一种或多种编程语言的任何组合编写的源代码或目标代码,所述编程语言包括诸如smalltalk、c++等的面向对象的编程语言,以及诸如“c”编程语言或类似编程语言的常规过程编程语言。计算机可读程序指令可以完全在用户的计算机上执行,部分在用户的计算机上执行,作为独立
的软件包,部分在用户的计算机上执行,部分在远程计算机上执行,或者完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络连接到用户的计算机,包括局域网(lan)或广域网(wan),或者连接到外部计算机(例如,通过使用因特网服务提供商的因特网)。在一些实施例中,包括例如可编程逻辑电路,现场可编程门阵列(fpga)或可编程逻辑阵列(pla)的电子电路可以通过利用计算机可读程序指令的状态信息来使电子电路个性化来执行计算机可读程序指令,以便执行本发明的各方面。
[0061]
在此参考根据本发明的实施例的方法、装置(系统)和计算机程序产品的流程图图示和/或框图来描述本发明的各方面。应当理解,流程图图示和/或框图的每个框以及流程图图示和/或框图中的框的组合可以由计算机可读介质指令来实现。
[0062]
计算环境700还可包括使用到诸如远程计算设备773等一个或多个远程计算机的逻辑连接在联网环境中操作的计算机系统710。网络界面770可以实现例如经由网络771与其他远程设备773或系统和/或存储设备741、742的通信。远程计算设备773可以是个人计算机(膝上型计算机或台式计算机)、移动设备、服务器、路由器、网络pc、对等设备或公共网络节点,并且通常包括以上相对于计算机系统710描述的许多或所有元素。当在联网环境中使用时,计算机系统710可以包括调制解调器772,用于在诸如因特网的网络771上建立通信。调制解调器772可经由用户网络接口770或经由另一适当机制连接到系统总线721。
[0063]
网络771可以是本领域中通常已知的任何网络或系统,包括因特网、内联网、局域网(lan)、广域网(wan)、城域网(man)、直接连接或一系列连接、蜂窝电话网络,或能够促进计算机系统710与其它计算机(例如,远程计算设备773)之间的通信的任何其它网络或介质。网络771可以是有线的、无线的或其组合。有线连接可以使用以太网、通用串行总线(usb)、rj-6或本领域公知的任何其它有线连接来实现。无线连接可以使用wi-fi、wimax和蓝牙、红外、蜂窝网络、卫星或本领域公知的任何其它无线连接方法来实现。另外,若干网络可单独工作或彼此通信以促进网络771中的通信。
[0064]
应当理解,图7中描述的存储在系统存储器730中的程序模块、应用、计算机可执行指令、代码等仅仅是说明性的而不是穷尽性的,并且描述为由任何特定模块支持的处理可以可替换地分布在多个模块上或者由不同的模块执行。此外,可以提供各种程序模块、脚本、插件、应用编程接口(api),或在计算机系统710、远程设备773上本地托管的和/或在可经由一个或多个网络771访问的其它计算设备上托管的任何其它合适的计算机可执行代码,以支持由图7中描绘的程序模块、应用或计算机可执行代码提供的功能和/或附加或替代功能。此外,功能可以被不同地模块化,使得被描述为由图7所示的程序模块集合共同支持的处理可以由更少或更多数量的模块执行,或者被描述为由任何特定模块支持的功能可以至少部分地由另一模块支持。此外,支持这里描述的功能的程序模块可形成可根据诸如客户机-服务器模型、对等模型等任何合适的计算模型在任何数量的系统或设备上执行的一个或多个应用的一部分。另外,被描述为由图7中描绘的任何程序模块支持的任何功能可以至少部分地以硬件和/或固件在任意数量的设备上实现。
[0065]
还应当理解,在不脱离本发明的范围的情况下,计算机系统710可以包括所描述或描绘的之外的替代和/或附加硬件、软件或固件组件。更具体地,应当理解,被描绘为形成计算机系统710的一部分的软件、固件或硬件组件仅仅是说明性的,并且在各种实施例中可以不存在某些组件或者可以提供附加组件。虽然已将各种说明性程序模块描绘和描述为存储
在系统存储器730中的软件模块,但应了解,描述为由程序模块支持的功能性可由硬件、软件和/或固件的任何组合来启用。应进一步了解,在各种实施例中,上述模块中的每一者可表示所支持功能的逻辑分区。该逻辑分区是为了便于解释功能而描绘的,并且可以不代表用于实现该功能的软件、硬件和/或固件的结构。因此,应了解,在各种实施例中,描述为由特定模块提供的功能性可至少部分地由一个或多个其它模块提供。此外,在某些实施例中可不存在一个或多个所描绘的模块,而在其它实施例中,可存在未描绘的额外模块且其可支持所描述功能性和/或额外功能性的至少一部分。此外,虽然某些模块可被描绘和描述为另一模块的子模块,但在某些实施例中,此类模块可被提供为独立模块或其他模块的子模块。
[0066]
虽然已经描述了本发明的特定实施例,但是本领域的普通技术人员将认识到,在本发明的范围内存在许多其它修改和替换实施例。例如,关于特定设备或组件描述的任何功能和/或处理能力可以由任何其他设备或组件来执行。此外,虽然已经根据本发明的实施例描述了各种说明性实现和架构,但是本领域普通技术人员将理解,对本文描述的说明性实现和架构的许多其他修改也在本发明的范围内。另外,应了解,本文中描述为基于另一操作、元素、组件、数据等的任何操作、元素、组件、数据等可另外基于一个或多个其它操作、元素、组件、数据等。因此,短语“基于”或其变体应被解释为“至少部分地基于”。
[0067]
图中的流程图和框图示出了根据本发明的各种实施例的系统、方法和计算机程序产品的可能实现的体系结构、功能和操作。在这点上,流程图或框图中的每个框可以表示指令的模块、段或部分,其包括用于实现指定逻辑功能的一个或多个可执行指令。在一些可替换的实施方式中,方框中指出的功能可以不按附图中指出的顺序发生。例如,根据所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者这些框有时可以以相反的顺序执行。还将注意到,框图和/或流程图图示中的每个框以及框图和/或流程图图示中的框的组合可以由执行指定功能或动作或执行专用硬件和计算机指令的组合的基于专用硬件的系统来实现。
技术特征:
1.一种用于工程系统设计的知识图的一阶逻辑规则公式归纳的系统,包括:处理器;以及存储有由所述处理器执行的模块的存储器,所述模块包括:人工智能(ai)模块,被配置为接收用于工程系统的多个知识图,每个知识图表示用作候选的唯一工程系统设计,ai模块包括:过滤模块,用于基于识别出断开节点的由不同节点集群所带来的显著部分来确定所述多个知识图中的每一个是否断开,并且响应于确定知识图被断开,触发对断开的知识图的一阶逻辑规则归纳;集束搜索引擎,被配置为针对每个断开的知识图执行以关注节点连接的边为限的聚合搜索,并且为所述搜索的每个路径定义子图;公式生成器,被配置为生成多个候选逻辑规则公式,其中,对于每个候选逻辑规则公式:(i)通过使用反向索引将边类型映射到一组子图并找到子图的满足候选公式的交集来消除重复子图,以及(ii)所述公式受到公式链长度l的至少两个自变量的要求的约束;以及公式评估器,被配置为对基础候选公式进行公式评估,并且根据评估标准从候选公式中选择排名前k的公式;其中,逻辑公式归纳通过对每次迭代将候选公式扩展到链长度l+1来重复所述聚合搜索、候选公式生成和公式评估的迭代,重复直到达到链长度的定义限制为止。2.根据权利要求1所述的系统,其中,所述评估标准包括覆盖率、准确度、置信度得分或它们的组合。3.根据权利要求1所述的系统,其中,聚合集束搜索在每次迭代时将搜索域扩展一跳。4.根据权利要求1所述的系统,其中,所述公式通过将每个节点标记或枚举为所有不同连接可能性中的特定实例来具有动态的基础。5.根据权利要求1所述的系统,其中,所述过滤模块确定知识图满足连通性标准,并且作为连通知识图触发逻辑规则公式归纳,所述系统还包括:图神经网络,被训练为预测查询图的第一类并预测干扰图的第二类;以及反事实解算器引擎,被配置为求解对查询图朝向干扰图的最小编辑数,将预测的查询图第一类转换为预测的第二类。6.根据权利要求5所述的系统,其中,所述反事实解算器引擎被进一步配置成:根据置换矩阵重新排列所述干扰图的特征;应用门控向量与重新排列特征的矩阵的第一哈达玛积;以及应用所述门控向量的反转与查询图特征的矩阵的第二哈达玛积;其中,由所述第一哈达玛积和所述第二哈达玛积之和来形成反事实矩阵,并且由所述门控向量来表示最小编辑数。7.根据权利要求6所述的系统,其中,所述图神经网络被训练成学习所述置换矩阵。8.一种用于工程系统设计的知识图的一阶逻辑规则公式归纳的方法,包括:由人工智能(ai)模块接收用于工程系统的多个知识图,其中,每个知识图具有断开节点的由不同节点集群所带来的显著部分,每个知识图表示用作候选的唯一工程系统设计;确定所述多个知识图中的每一个是否被断开,并且响应于确定知识图被断开,触发断开知识图的一阶逻辑规则归纳,包括:
对于每个断开的知识图,执行以关注节点连接的边为限的聚合搜索;执行候选公式生成,每个候选公式表示由集束搜索引擎找到的相应边,每个公式受到公式链长度l的至少两个自变量的要求的约束;执行公式评估以确定每个候选公式是否有效,并根据定义的标准从候选公式中选择排名前k的公式;其中,逻辑公式归纳通过对每次迭代将候选公式扩展到链长度l+1来重复所述聚合搜索、候选公式生成和公式评估的迭代,重复直到达到链长度的定义限制为止。9.根据权利要求8所述的方法,其中,所述定义的标准包括覆盖率、准确度、置信度得分或它们的组合。10.根据权利要求8所述的方法,其中,聚合集束搜索在每次迭代时将搜索域扩展一跳。11.根据权利要求8所述的方法,其中,所述公式通过将每个节点标记为或枚举为所有不同连接可能性中的特定实例来具有动态的基础。12.根据权利要求8所述的方法,其中,过滤模块确定知识图满足连通性标准,并且作为连通知识图触发逻辑规则公式归纳,所述系统还包括:图神经网络,被训练为预测查询图的第一类并预测干扰图的第二类;反事实解算器引擎,被配置为求解对查询图朝向干扰图的最小编辑数,将预测的查询图第一类转换为预测的第二类。13.根据权利要求12所述的方法,其中,所述反事实解算器引擎还被配置成:根据置换矩阵重新排列所述干扰图的特征;应用门控向量与重新排列特征的矩阵的第一哈达玛积;以及应用所述门控向量的反转与查询图特征的矩阵的第二哈达玛积;其中,由所述第一哈达玛积和第二哈达玛积之和来形成反事实矩阵,并且由所述门控向量表示所述最小编辑数。14.根据权利要求13所述的方法,其中,所述图神经网络被训练成学习所述置换矩阵。
技术总结
用于工程系统设计的知识图的逻辑规则公式归纳的系统和方法,包括接收工程系统的多个知识图。对于断开的知识图,聚合集束搜索以关注节点连接的边为限,并且生成表示由集束搜索引擎找到的相应边的候选公式,每个公式都受到定义的公式链长度的至少两个自变量的要求约束。公式评估确定每个候选公式是否有效。根据定义的标准从候选公式中选择排名最高的公式。对于连接良好的图,训练图神经网络来预测查询图的第一类和干扰图的第二类。反事实解算器引擎求解对查询图朝向干扰图的最小编辑数,将预测的查询图第一类转换为预测的第二类。测的查询图第一类转换为预测的第二类。测的查询图第一类转换为预测的第二类。
技术研发人员:阿伦
受保护的技术使用者:西门子股份公司
技术研发日:2020.08.31
技术公布日:2023/7/17
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
