用于生物信息分析的数据处理系统及外部资源管理方法与流程
未命名
08-14
阅读:108
评论:0
1.本技术涉及数据处理技术领域:
:,具体涉及用于生物信息分析的数据处理系统及外部资源管理方法。
背景技术:
::2.随着用于处理计算任务的资源种类的扩展,用户能够使用各种类型的资源处理计算任务。例如,各种类型的资源包括cpu(centralprocessingunit,中央处理器)资源、gpu(graphicsprocessingunit,图形处理器)资源、fpga(fieldprogrammablegatearray,现场可编程门阵列)资源,且这些异构资源本身以kubernetes集群、sge集群等形式被集合管理。3.不同类型的资源的结构不同。调用不同结构的资源的方法不同。不同类型的资源的结构能够称为异构资源。处理计算任务的系统无法用单独的方法直接统一管理不同的异构资源,需要配置多种管理方法,导致系统整体结构的松散、控制力变弱,导致系统的运行效率降低。并且,系统调用异构资源的过程中会出现重复步骤,比如作业任务的属性设置、提交、删除和查询,也会影响到系统运行的效率。技术实现要素:4.有鉴于此,本技术提供用于生物信息分析的数据处理系统及外部资源管理方法,能够实现对异构资源的统一管理。5.基于此,本技术提供的技术方案如下:6.第一方面,本技术提供一种用于生物信息分析的数据处理系统,所述数据处理系统包括操作模块以及目标数量的控制模块,所述操作模块分别与目标数量的所述控制模块连接,每个所述控制模块与一个外部资源系统通过应用程序接口api代理连接,所述api代理用于实现与所述外部资源系统匹配的api转换;7.所述操作模块,用于获取任务指令,向目标控制模块发送所述任务指令,所述目标控制模块属于所述目标数量的控制模块;8.所述目标控制模块,用于调用与所述目标控制模块连接的目标外部资源系统执行所述任务指令。9.在一种可能的实现方式中,所述数据处理系统还包括第一参数配置模块,所述第一参数配置模块与所述操作模块连接;10.所述第一参数配置模块,用于配置资源管理参数,并向所述操作模块发送所述资源管理参数;11.所述操作模块,还用于根据所述资源管理参数,调整所述数据处理系统与所述外部资源系统的连接关系。12.在一种可能的实现方式中,所述数据处理系统还包括第二参数配置模块,所述第二参数配置模块与所述控制模块连接;13.所述第二参数配置模块,用于获取任务管理参数,并向所述控制模块发送所述任务管理参数;14.所述控制模块,还用于接收所述任务管理参数,根据所述任务管理参数,配置与所述控制模块连接的外部资源系统。15.在一种可能的实现方式中,所述数据处理系统还包括目标数量的数据交互模块,各个所述数据交互模块分别与所述操作模块和对应的一个所述控制模块连接;16.所述数据交互模块,用于传输所述操作模块和所述控制模块之间的交互数据。17.在一种可能的实现方式中,所述外部资源系统包括管理节点和多个资源节点,所述管理节点配置工作流引擎,用于管理多个所述资源节点,所述管理节点分别与所述多个资源节点通过采用任务执行服务tes接口规范的接口连接,所述控制模块与所述管理节点通过api应用程序接口代理连接,所述api代理采用wes接口规范。18.第二方面,本技术提供一种外部资源管理方法,所述方法应用于用于生物信息分析的数据处理系统,所述数据处理系统与至少一个外部资源系统通过api应用程序接口代理连接,所述方法包括:19.获取任务指令;20.通过目标api代理向目标外部资源系统发送所述任务指令,所述目标api代理连接所述数据处理系统与所述目标外部资源系统,所述目标api代理转换为与所述目标外部资源系统的资源结构匹配的api。21.在一种可能的实现方式中,所述方法还包括:22.获取任务管理参数,所述任务管理参数为配置外部资源系统处理所述任务指令的参数;23.基于所述任务管理参数配置所述外部资源系统。24.在一种可能的实现方式中,所述方法还包括:25.获取资源管理参数,所述资源管理参数用于管理所述外部资源系统;26.基于所述资源管理参数,调整所述数据处理系统与所述外部资源系统的连接关系。27.在一种可能的实现方式中,所述外部资源系统包括管理节点和多个资源节点,所述管理节点配置工作流引擎,用于管理多个所述资源节点,所述管理节点分别与所述多个资源节点通过采用任务执行服务tes接口规范的接口连接,所述控制模块与所述管理节点通过api应用程序接口代理连接,所述api代理采用wes接口规范,所述通过目标api代理向目标外部资源系统发送所述任务指令,包括:28.向所述目标外部资源系统的管理节点发送所述任务指令,以便所述管理节点运行的工作流引擎基于所述任务指令调用所述多个资源节点执行所述任务指令。29.第三方面,本技术提供一种外部资源管理装置,所述装置应用于用于生物信息分析的数据处理系统,所述数据处理系统与至少一个外部资源系统通过api应用程序接口代理连接,所述装置包括:30.获取单元,用于获取任务指令;31.发送单元,用于通过目标api代理向目标外部资源系统发送所述任务指令,所述目标api代理连接所述数据处理系统与所述目标外部资源系统,所述目标api代理转换为与所述目标外部资源系统的资源结构匹配的api。32.在一种可能的实现方式中,所述获取单元,还用于获取任务管理参数,所述任务管理参数为配置外部资源系统处理所述任务指令的参数;33.所述装置还包括:34.配置单元,用于基于所述任务管理参数配置所述外部资源系统。35.在一种可能的实现方式中,所述获取单元,还用于获取资源管理参数,所述资源管理参数用于管理所述外部资源系统;36.所述装置还包括:37.调整单元,用于基于所述资源管理参数,调整所述数据处理系统与所述外部资源系统的连接关系。38.在一种可能的实现方式中,所述外部资源系统包括管理节点和多个资源节点,所述管理节点配置工作流引擎,用于管理多个所述资源节点,所述管理节点分别与所述多个资源节点通过采用任务执行服务tes接口规范的接口连接,所述控制模块与所述管理节点通过api应用程序接口代理连接,所述api代理采用wes接口规范,所述发送单元,用于通过目标api代理向目标外部资源系统发送所述任务指令,包括:39.所述发送单元,用于向所述目标外部资源系统的管理节点发送所述任务指令,以便所述管理节点运行的工作流引擎基于所述任务指令调用所述多个资源节点执行所述任务指令。40.第四方面,本技术提供一种电子设备,包括:41.一个或多个处理器;42.存储装置,其上存储有一个或多个程序,43.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第二方面以及第二方面中任一实现方式所述的方法。44.第五方面,本技术提供一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现第二方面以及第二方面中任一实现方式所述的方法。45.第六方面,本技术提供一种计算机程序产品,所述计算机程序产品在设备上运行时,使得所述设备执行第二方面以及第二方面中任一实现方式所述的方法。46.由此可见,本技术具有如下有益效果:47.本技术提供的用于生物信息分析的数据处理系统。该数据处理系统包括操作模块以及目标数量的控制模块。操作模块分别与目标数量的所述控制模块连接,每个控制模块与一个外部资源系统通过api应用程序接口代理连接。api代理用于实现与所述外部资源系统匹配的api转换。如此能够解除数据处理系统,与资源结构之间的耦合,将匹配异构资源的部分从应用的层面剥离,实现对异构资源的统一管理。操作模块,用于获取任务指令,向目标控制模块发送所述任务指令。目标控制模块,用于调用与目标控制模块连接的目标外部资源系统执行任务指令。如此能够实现对不同结构的资源的外部资源系统进行管理,便于数据处理系统对本地以及云上的资源系统进行统一管理。数据处理系统能够获取任务指令,并通过目标api代理向目标外部资源系统发送任务指令,使得目标外部资源系统处理任务指令,实现对异构资源的利用。本技术实施例还提供外部资源管理方法、装置、设备及存储介质。附图说明48.图1为本技术实施例提供的一种数据处理系统与外部资源系统的结构示意图;49.图2为本技术实施例提供的一种数据处理系统的结构示意图;50.图3为本技术实施例提供的另一种数据处理系统的结构示意图;51.图4为本技术实施例提供的又一种数据处理系统的结构示意图;52.图5为本技术实施例提供的再一种数据处理系统的结构示意图;53.图6为本技术实施例提供的管理节点与资源节点连接的示意图;54.图7为本技术实施例提供的一种外部资源管理装置的结构示意图;55.图8为本技术实施例提供的一种电子设备的基本结构的示意图。具体实施方式56.为了便于理解和解释本技术实施例提供的技术方案,下面将先对本技术的
背景技术:
:进行说明。57.用户对生物信息数据进行分析的过程中,需要调用相关的资源对生物信息数据进行分析。目前,能够用于实现对生物信息数据的分析的资源涉及到多种异构资源。用户会使用与自身需求相匹配的资源实现对生物信息数据的分析。比如,建立本地的提供资源服务的sge集群。但是,在当用户需要使用其他异构资源实现对生物信息数据的分析时,对异构资源的使用和切换是相对频繁的,如果不进行统一调度,会使用户使用不畅,或者增加功能实现的负担。58.基于此,本技术实施例提供用于生物信息分析的数据处理系统及外部资源管理方法。该数据处理系统用于生物信息分析。该数据处理系统包括操作模块以及目标数量的控制模块。操作模块分别与目标数量的所述控制模块连接,每个控制模块与一个外部资源系统通过api应用程序接口代理连接。api代理用于实现与所述外部资源系统匹配的api转换。如此能够解除数据处理系统与资源结构之间的耦合,将匹配异构资源的部分从应用的层面剥离,实现对异构资源的统一管理。操作模块,用于获取任务指令,向目标控制模块发送所述任务指令。目标控制模块,用于调用与目标控制模块连接的目标外部资源系统执行任务指令。如此能够实现对不同结构的资源的外部资源系统进行管理,便于用户对本地以及云上的资源系统进行统一管理。数据处理系统能够获取任务指令,并通过目标api代理向目标外部资源系统发送任务指令,使得目标外部资源系统处理任务指令,实现对异构资源的利用。59.为了便于理解本技术实施例提供的技术方案,下面结合附图对本技术实施例提供的用于生物信息分析的数据处理系统及外部资源管理方法进行说明。60.参见图1所示,该图为本技术实施例提供的一种数据处理系统与外部资源系统的结构示意图。该数据处理系统101与至少一个外部资源系统102连接。并且,数据处理系统101与外部资源系统102通过api(applicationprogramminginterface,应用程序接口)agent(代理)连接。api代理实现针对不同结构的资源的api转换。外部资源系统102用于提供执行计算任务所需的各类异构资源。如此能够解除数据处理系统与资源结构之间的耦合,将匹配异构资源的部分从应用的层面剥离,实现对异构资源的统一管理。61.数据处理系统101获取任务指令,并通过目标api代理向目标外部资源系统102发送任务指令。目标外部资源系统102是确定的用于处理计算任务的外部资源系统。目标api代理连接数据处理系统101与所述目标外部资源系统102,能够转换为与目标外部资源系统102的资源结构匹配的api。目标外部资源系统102对获取的任务指令进行处理。62.在一种可能的实现方式中,数据处理系统101为bio-os(一种生物医学分析系统)。63.本领域技术人员可以理解,图1所示的框架示意图仅是本技术的实施方式可以在其中得以实现的一个示例。本技术实施方式的适用范围不受到该框架任何方面的限制。64.参见图2所示,该图为本技术实施例提供的一种数据处理系统的结构示意图。65.数据处理系统包括操作模块201以及目标数量的控制模块202。作为一种示例,参见图2所示,目标数量为3个。操作模块201分别与目标数量的控制模块202连接。每个控制模块与一个外部资源系统通过api应用程序接口代理连接。api代理用于实现与外部资源系统匹配的api转换。本技术实施例不限定目标数量的具体数值。目标数量大于等于与数据处理系统建立连接的外部资源系统的数量。外部资源系统是能够提供实现任务处理的资源的系统。外部资源包括cpu、gpu、fpga等用于执行计算任务的资源。外部资源以k8s集群、sge集群等形式被集合管理。66.操作模块201,用于获取任务指令,并向目标控制模块发送任务指令。本技术实施例不限定任务指令的具体内容。任务指令例如为执行计算任务的指令、查询任务结果的指令或者为删除任务的指令。作为一种示例,任务指令为执行计算任务的指令。任务指令还包括执行计算任务所需的执行脚本以及数据。任务指令能够是由使用数据处理系统的用户触发的,或者是由数据处理系统基于处理数据的需要自动生成的。操作模块201能够确定需要执行任务指令的目标控制模块。目标控制模块属于目标数量的控制模块202。目标控制模块的数量能够是一个或者多个。67.在一种可能的实现方式中,操作模块201能够基于与各个控制模块202连接的外部资源系统的运行参数确定执行任务指令的目标外部资源系统,进而向与目标外部资源系统连接的目标控制模块发送任务指令。在另一种可能的实现方式中,操作模块201基于各个控制模块202历史调用外部资源系统处理的任务,确定本次执行任务指令的目标控制模块。在又一种可能的实现方式中,由生成任务指令的用户确定执行任务指令的目标控制模块。68.目标控制模块,用于调用与目标控制模块连接的目标外部资源系统执行任务指令。目标控制模块与连接的目标外部资源系统进行数据交互,控制目标外部资源系统处理任务指令。69.需要说明的是,在一些可能的实现方式中,数据处理系统预先通过与外部资源系统连接的接口向外部资源系统提交安全证书,以便后续访问外部资源系统。安全证书能够预先存储在数据处理系统中。70.另外,预先配置使用各个外部资源系统的用户权限,在向目标外部资源系统发送任务指令时,验证触发任务指令的用户权限是否符合预设的用户权限。71.在一种可能的实现方式中,参见图3所示,该图为本技术实施例提供的另一种数据处理系统的结构示意图。数据处理系统还包括目标数量的数据交互模块203。各个数据交互模块203分别与操作模块201和对应的一个控制模块202连接。数据交互模块203用于传输操作模块201与对应的控制模块202之间的交互数据。72.在一种可能的实现方式中,参见图4所示,该图为本技术实施例提供的又一种数据处理系统的结构示意图。数据处理系统还包括第一参数配置模块204。第一参数配置模块204与操作模块201连接。73.本技术实施例不限定第一参数配置模块204的数量。作为一种示例,参见图4所示,第一参数配置模块204的数量能够是目标数量。一个第一参数配置模块204与一个控制模块202对应。74.第一参数配置模块204,用于配置资源管理参数,并向操作模块201发送资源管理参数。资源管理参数是对外部资源系统进行管理的参数。比如,资源管理参数包括需要解除连接的外部资源系统的标识。又比如,资源管理参数包括需要新建连接的外部资源系统的信息。资源管理参数能够是使用数据处理系统的用户配置的。在第一参数配置模块204的数量为目标数量的情况下,资源管理参数是用于管理第一参数配置模块204对应的控制模块202的。75.操作模块201,还用于基于所述资源管理参数,调整所述数据处理系统与所述外部资源系统的连接关系。具体的,例如,资源管理参数包括需要解除连接的外部资源系统的标识。操作模块201则解除与标识对应的外部资源系统的管理。具体的,停止与标识对应的外部资源系统连接的控制模块202的运行。又例如,资源管理参数包括新增加的连接的外部资源系统的信息。操作模块201则新建或者激活控制模块202,并且建立该控制模块202与信息指示的外部资源系统的连接,实现对外部资源系统的纳管。76.在又一种可能的实现方式中,参见图5所示,该图为本技术实施例提供的再一种数据处理系统的结构示意图。数据处理系统还包括第二参数配置模块205。第二参数配置模块205与控制模块202连接。77.第二参数配置模块205,用于配置任务管理参数,并向所述控制模块202发送所述任务管理参数。任务管理参数是用于实现任务指令执行的参数。任务管理参数例如包括输入任务数据、任务属性配置参数、存储地址或者存储上传参数。其中,任务属性配置参数包括外部资源系统的处理任务指令的节点数量,输出文件以及执行时间等。任务管理参数能够是使用数据处理系统的用户配置的。78.控制模块202,还用于接收任务管理参数,根据任务管理参数,配置与控制模块202连接的外部资源系统。79.在使用数据处理系统对生物信息数据进行分析的场景中,需要使用分析工具以及构建工作流的工具。工作流引擎能够基于任务指令,对外部资源系统进行任务调度。工作流引擎例如为cromwell、nextflow或者snakemake。80.在一种可能的实现方式中,外部资源系统包括管理节点和多个资源节点。管理节点配置有工作流引擎。工作流引擎用于对外部资源系统的资源节点进行管理。管理节点分别与多个资源节点通过采用任务执行服务tes接口规范的接口,也就是tes接口连接。tes接口与工作流引擎的后端对接。参见图6所示,该图为本技术实施例提供的管理节点与资源节点连接的示意图。在一种可能的实现方式中,接口为ve(virtualethernet,虚拟以太网)tes接口。tes定义一种将任务发送到计算节点的方法。控制模块202与管理节点通过api应用程序接口代理连接,api代理采用wes接口规范。tes(taskexecutionservice,任务执行服务)接口规范和wes(workexecutionsystem,工作流执行服务)接口规范是与ga4gh标准对齐,一方面保证了生物信息信息分析常用的工作流引擎能更方便平滑得被纳入数据处理系统,另一方面也保证处理生物信息数据能够符合ga4gh标准,保证生物信息数据的分析项目的进行。81.基于上述方法实施例提供的一种外部资源管理方法,本技术实施例还提供了一种外部资源管理装置。外部资源管理装置应用于用于生物信息分析的数据处理系统。数据处理系统与至少一个外部资源系统通过api应用程序接口代理连接。下面将结合附图对外部资源管理装置进行说明。82.参见图7所示,该图为本技术实施例提供的一种外部资源管理装置的结构示意图。如图7所示,该外部资源管理装置包括:83.获取单元701,用于获取任务指令;84.发送单元702,用于通过目标api代理向目标外部资源系统发送所述任务指令,所述目标api代理连接所述数据处理系统与所述目标外部资源系统,所述目标api代理转换为与所述目标外部资源系统的资源结构匹配的api。85.在一种可能的实现方式中,所述获取单元701,还用于获取任务管理参数,所述任务管理参数为配置外部资源系统处理所述任务指令的参数;86.所述装置还包括:87.配置单元,用于基于所述任务管理参数配置所述外部资源系统。88.在一种可能的实现方式中,所述获取单元701,还用于获取资源管理参数,所述资源管理参数用于管理所述外部资源系统;89.所述装置还包括:90.调整单元,用于基于所述资源管理参数,调整所述数据处理系统与所述外部资源系统的连接关系。91.在一种可能的实现方式中,所述外部资源系统包括管理节点和多个资源节点,所述管理节点配置工作流引擎,用于管理多个所述资源节点,所述管理节点分别与所述多个资源节点通过采用任务执行服务tes接口规范的接口连接,所述控制模块与所述管理节点通过api应用程序接口代理连接,所述api代理采用wes接口规范,所述发送单元702,用于通过目标api代理向目标外部资源系统发送所述任务指令,包括:92.所述发送单元702,用于向所述目标外部资源系统的管理节点发送所述任务指令,以便所述管理节点运行的工作流引擎基于所述任务指令调用所述多个资源节点执行所述任务指令。93.基于上述方法实施例提供的一种外部资源管理方法,本技术还提供一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例所述的外部资源管理方法。94.下面参考图8,其示出了适于用来实现本技术实施例的电子设备800的结构示意图。本技术实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(personaldigitalassistant,个人数字助理)、pad(portableandroiddevice,平板电脑)、pmp(portablemediaplayer,便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv(television,电视机)、台式计算机等等的固定终端。图8示出的电子设备仅仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。95.如图8所示,电子设备800可以包括处理装置(例如中央处理器、图形处理器等)801,其可以根据存储在只读存储器(rom)802中的程序或者从存储装置808加载到随机访问存储器(ram)803中的程序而执行各种适当的动作和处理。在ram803中,还存储有电子设备800操作所需的各种程序和数据。处理装置801、rom802以及ram803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。96.通常,以下装置可以连接至i/o接口805:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置808;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置807;包括例如磁带、硬盘等的存储装置808;以及通信装置809。通信装置809可以允许电子设备800与其他设备进行无线或有线通信以交换数据。虽然图8示出了具有各种装置的电子设备800,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。97.特别地,根据本技术的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置809从网络上被下载和安装,或者从存储装置808被安装,或者从rom802被安装。在该计算机程序被处理装置801执行时,执行本技术实施例的方法中限定的上述功能。98.本技术实施例提供的电子设备与上述实施例提供的外部资源管理方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。99.基于上述方法实施例提供的一种外部资源管理方法,本技术实施例提供了一种计算机存储介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如上述任一实施例所述的外部资源管理方法。100.需要说明的是,本技术上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。101.在一些实施方式中,客户端、服务器可以利用诸如http(hypertexttransferprotocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“lan”),广域网(“wan”),网际网(例如,互联网)以及端对端网络(例如,adhoc端对端网络),以及任何当前已知或未来研发的网络。102.上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。103.上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述外部资源管理方法。104.可以以一种或多种程序设计语言或其组合来编写用于执行本技术的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。105.附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。106.描述于本技术实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元/模块的名称在某种情况下并不构成对该单元本身的限定,例如,语音数据采集模块还可以被描述为“数据采集模块”。107.本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)等等。108.在本技术的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。109.需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。110.应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。111.还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。112.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页12当前第1页12
技术特征:
1.一种用于生物信息分析的数据处理系统,其特征在于,所述数据处理系统包括操作模块以及目标数量的控制模块,所述操作模块分别与目标数量的所述控制模块连接,每个所述控制模块与一个外部资源系统通过api应用程序接口代理连接,所述api代理用于实现与所述外部资源系统匹配的api转换;所述操作模块,用于获取任务指令,向目标控制模块发送所述任务指令,所述目标控制模块属于所述目标数量的控制模块;所述目标控制模块,用于调用与所述目标控制模块连接的目标外部资源系统执行所述任务指令。2.根据权利要求1所述的系统,其特征在于,所述数据处理系统还包括第一参数配置模块,所述第一参数配置模块与所述操作模块连接;所述第一参数配置模块,用于配置资源管理参数,并向所述操作模块发送所述资源管理参数;所述操作模块,还用于根据所述资源管理参数,调整所述数据处理系统与所述外部资源系统的连接关系。3.根据权利要求1所述的系统,其特征在于,所述数据处理系统还包括第二参数配置模块,所述第二参数配置模块与所述控制模块连接;所述第二参数配置模块,用于获取任务管理参数,并向所述控制模块发送所述任务管理参数;所述控制模块,还用于接收所述任务管理参数,根据所述任务管理参数,配置与所述控制模块连接的外部资源系统。4.根据权利要求1所述的系统,其特征在于,所述数据处理系统还包括目标数量的数据交互模块,各个所述数据交互模块分别与所述操作模块和对应的一个所述控制模块连接;所述数据交互模块,用于传输所述操作模块和所述控制模块之间的交互数据。5.根据权利要求1所述的系统,其特征在于,所述外部资源系统包括管理节点和多个资源节点,所述管理节点配置工作流引擎,用于管理多个所述资源节点,所述管理节点分别与所述多个资源节点通过采用任务执行服务tes接口规范的接口连接,所述控制模块与所述管理节点通过api应用程序接口代理连接,所述api代理采用wes接口规范。6.一种外部资源管理方法,其特征在于,所述方法应用于用于生物信息分析的数据处理系统,所述数据处理系统与至少一个外部资源系统通过api应用程序接口代理连接,所述方法包括:获取任务指令;通过目标api代理向目标外部资源系统发送所述任务指令,所述目标api代理连接所述数据处理系统与所述目标外部资源系统,所述目标api代理转换为与所述目标外部资源系统的资源结构匹配的api。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:获取任务管理参数,所述任务管理参数为配置外部资源系统处理所述任务指令的参数;基于所述任务管理参数配置所述外部资源系统。8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取资源管理参数,所述资源管理参数用于管理所述外部资源系统;基于所述资源管理参数,调整所述数据处理系统与所述外部资源系统的连接关系。9.根据权利要求6所述的方法,其特征在于,所述外部资源系统包括管理节点和多个资源节点,所述管理节点配置工作流引擎,用于管理多个所述资源节点,所述管理节点分别与所述多个资源节点通过采用任务执行服务tes接口规范的接口连接,所述控制模块与所述管理节点通过api应用程序接口代理连接,所述api代理采用wes接口规范,所述通过目标api代理向目标外部资源系统发送所述任务指令,包括:向所述目标外部资源系统的管理节点发送所述任务指令,以便所述管理节点运行的工作流引擎基于所述任务指令调用所述多个资源节点执行所述任务指令。10.一种外部资源管理装置,其特征在于,所述装置应用于用于生物信息分析的数据处理系统,所述数据处理系统与至少一个外部资源系统通过api应用程序接口代理连接,所述装置包括:获取单元,用于获取任务指令;发送单元,用于通过目标api代理向目标外部资源系统发送所述任务指令,所述目标api代理连接所述数据处理系统与所述目标外部资源系统,所述目标api代理转换为与所述目标外部资源系统的资源结构匹配的api。11.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求6-9中任一所述的方法。12.一种计算机可读介质,其特征在于,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求6-9中任一所述的方法。
技术总结
本申请公开了应用于数据处理技术领域的用于生物信息分析的数据处理系统及外部资源管理方法。该数据处理系统包括操作模块以及目标数量的控制模块。操作模块分别与目标数量的所述控制模块连接,每个控制模块与一个外部资源系统通过API应用程序接口代理连接。API代理用于实现与所述外部资源系统匹配的API转换。操作模块,用于获取任务指令,向目标控制模块发送所述任务指令。目标控制模块,用于调用与目标控制模块连接的目标外部资源系统执行任务指令。如此能够解除接口类型与资源结构之间的耦合,实现对不同结构的资源的外部资源系统进行管理,实现对异构资源的利用。实现对异构资源的利用。实现对异构资源的利用。
技术研发人员:卢欣 于鸿磊 刘继龙 李召义 李昭强 陈林 肖庆宇 孙博文 程瑾瑜 郎志坚 陈秭如 肖华源 周剑文 张鑫 李亦学 谭待
受保护的技术使用者:广州国家实验室
技术研发日:2023.05.19
技术公布日:2023/8/13
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
