一种在线签约的意愿认证的方法与流程
未命名
08-15
阅读:102
评论:0
1.本发明涉及数据处理技术领域,具体涉及一种在线签约的意愿认证的方法。
背景技术:
2.在线签约是一种用户通过线上远程的签约或授权的方法,但在线签约过程中存在许多安全隐患,例如身份伪造、网络攻击和技术漏洞等。常见场景为将恶意链接混在签约的验证链接中,用户极有可能被钓鱼网站窃取个人信息和权限,导致用户信息泄露和财产损失;对未知链接进行分析进而判断用户是否有意愿在该未知链接进行签约的过程即为意愿认证,当分析为恶意链接时则认为用户没有意愿进行签约。
3.对于在线签约安全隐患中最常见场景的为dns域名系统劫持,又称域名劫持,指攻击者利用攻击手段篡改了域名的解析结果,使得该域名的ip变成了另一个ip,导致对相应网址的访问被劫持到另一个虚假网址,从而实现非法窃取用户信息的目的。出现域名劫持时难以保障签约过程的安全性,由于域名和ip之间的绑定关系并非一对一,且服务器经常存在访问压力较大启用备用服务器分流的情况,因此无法直接根据ip清单检测恶意链接,影响用户的在线签约的意愿分析的准确性,容易造成信息泄漏和财产损失,用户在线签约的安全性差。
技术实现要素:
4.为了解决上述无法直接根据ip清单检测恶意链接,影响用户的在线签约的意愿分析的准确性,用户在线签约的安全性差,本发明的目的在于提供一种在线签约的意愿认证的方法,所采用的技术方案具体如下:获取在线签约的域名的默认服务器的日访问量、备用服务器的运维信息;获取默认服务器与备用服务器之间的距离;根据是否启用备用服务器的日访问量的差异特征获得所述默认服务器的访问压力临界值;根据备用服务器的所述运维信息获得备用服务器的运维水平指数;根据默认服务器与备用服务器的距离特征和是否启用备用服务器的日访问量的差异特征,获得域名的历史距离相关系数;根据是否启用备用服务器的日访问量的差异特征和备用服务器的运维水平指数的差异特征,获得域名的历史运维相关系数;根据所述历史距离相关系数和所述历史运维相关系数获得距离权重和运维权重;根据所述访问压力临界值和默认服务器的日访问量的差异特征,获得默认服务器的当前访问压力系数;根据所述域名当前连接的其他服务器与默认服务器之间的距离特征、所述距离权重、默认服务器与备用服务器之间的距离特征,获得所述其他服务器的距离验证系数;根据所述运维权重、其他服务器与备用服务器的所述运维水平指数的差异特征,获得所述其他服务器的运维验证系数;根据所述当前访问压力系数、所述距离验证系数和所述运维验证系数,获得所述其他服务器的恶意链接概率,根据所述恶意链接概率进行签约意愿认证。
5.进一步地,所述根据是否启用备用服务器的日访问量的差异特征获得所述默认服务器的访问压力临界值的步骤包括:计算未启用备用服务器时的所述默认服务器的日访问量的平均值,获得默认日均访问量;计算所述域名启用相同备用服务器数量的所有历史日期中,所述默认服务器的日访问量的平均值,获得备用日均访问量;计算所述备用日均访问量与所述默认日均访问量的差值的平方,获得日均访问差异表征值;计算启用不同数量的备用服务器时,对应的所述日均访问差异表征值的平均值的算术平方根,获得所述访问压力临界值。
6.进一步地,所述根据备用服务器的所述运维信息获得备用服务器的运维水平指数的步骤包括:所述运维信息包括硬件参数、网络环境、性能参数和操作系统;提取所述运维信息的代表特征,将所述代表特征输入到训练好的分类神经网络,由分类神经网络对所述运维信息的所述代表特征进行分类识别,并输出从劣到优为零到一的所述运维水平指数。
7.进一步地,所述获得域名的历史距离相关系数的步骤包括:对于所述域名任意一次启用备用服务器时的默认服务器,计算所述默认服务器的日访问量与所述默认日均访问量的差值,获得默认访问量差异;计算所述默认服务器与对应启用的备用服务器的实际位置的平均欧氏距离的倒数,获得备用距离表征值,计算默认服务器与所有备用服务的实际位置的平均欧氏距离的倒数,获得常规距离表征值,计算所述备用距离表征值与所述常规距离表征值的差值,获得备用距离差异表征值;计算所述默认日均访问量的标准差与所述备用距离差异表征值的标准差的乘积,获得第一标准差表征值,计算所述默认访问量差异与所述备用距离差异表征值的协方差与所述第一标准差表征值的比值的绝对值,获得所述历史距离相关系数。
8.进一步地,所述获得域名的历史运维相关系数的步骤包括:计算所有备用服务器的所述运维水平指数的平均值,获得运维水平平均值;对于所述域名任意一次启用的备用服务器,计算启用的所述备用服务器的运维水平指数的平均值,获得备用运维水平平均值;计算所述备用运维水平平均值与所述运维水平平均值的差值,获得备用运维水平差异表征值;计算所述默认日均访问量的标准差与所述备用运维水平差异表征值的标准差的乘积,获得第二标准差表征值;计算所述默认访问量差异与所述备用运维水平差异表征值的协方差与所述第二标准差表征值的比值的绝对值,获得所述历史运维相关系数。
9.进一步地,所述根据所述历史距离相关系数和所述历史运维相关系数获得距离权重和运维权重的步骤包括:计算所述历史距离相关系数与所述历史运维相关系数的和值,获得相关系数表征值,计算所述历史距离相关系数与所述相关系数表征值的比值,获得所述距离权重;计算所述历史运维相关系数与所述相关系数表征值的比值,获得所述运维权重。
10.进一步地,所述获得默认服务器的当前访问压力系数的步骤包括:计算所述默认服务器当前的日访问量与所述默认日均访问量的差值绝对值,获得当前访问量差异值;计算所述当前访问量差异值与所述访问压力临界值的比值,获得所述当前访问压力系数。
11.进一步地,所述获得所述其他服务器的距离验证系数的步骤包括:计算所述其他服务器与所述默认服务器的欧氏距离的倒数,获得其他距离表征值,计算所述其他距离表征值和所述常规距离表征值的比值,获得其他距离差异表征值;计算所述其他距离差异表征值与所述距离权重的乘积,获得所述其他服务器的所述距离验证系数。
12.进一步地,所述获得所述其他服务器的运维验证系数的步骤包括:计算所述其他服务器的所述运维水平指数与所述运维水平平均值的比值,获得其他运维差异表征值,计算所述其他运维差异表征值与所述运维权重的乘积,获得所述其他服务器的所述运维验证系数。
13.进一步地,所述获得所述其他服务器的恶意链接概率,根据所述恶意链接概率进行签约意愿认证的步骤包括:计算所述距离验证系数与对应的所述运维验证系数的和值,获得其他服务器验证系数;计算所述其他服务器验证系数与所述当前访问压力系数的乘积,计算常数1和所述其他服务器验证系数与所述当前访问压力系数的乘积的差值绝对值,获得所述恶意链接概率;当所述恶意链接概率不超过预设概率阈值时,判断不存在签约风险,不进行用户签约的意愿认证;当所述恶意链接概率超过预设概率阈值时,判定存在签约风险,对用户签约的意愿进行认证提醒。
14.本发明具有如下有益效果:在本发明实施例中,计算访问压力临界值能够表征域名对应的默认服务器在正常负载和负载过高时的日访问量的差异特征,通过访问压力临界值可提高最终分析恶意链接概率的准确性。计算运维水平指数能够表征服务器站点的综合建站水平,从而反映该服务器站点的质量,进而提高最终计算恶劣链接概率的准确性。通过历史距离相关系数和历史运维相关系数获得距离权重和运维权重,能够反映在该域名的历史时期中启用默认服务器时是以距离择优或是运维水平择优,表征了启用备用服务器的选取权重,有助于提高最终分析计算恶劣链接概率的准确性。获取当前访问压力系数能够反映当前默认服务器的负载情况是否接近历史时期中启用备用服务器的负载水平;进而判断出现恶意链接的概率;获取距离验证系数和运维验证系数能够反映其他服务器与历史时期所选取的备用服务器的特征相似性。最终通过当前访问压力系数、距离验证系数和运维验证系数获取恶意链接概率,提高了分析域名劫持的准确性,进而提高用户在线签约的安全性,保证了用户的签约意愿。
附图说明
15.为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
16.图1为本发明一个实施例所提供的一种在线签约的意愿认证的方法流程图。
具体实施方式
17.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种在线签约的意愿认证的方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
18.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
19.下面结合附图具体的说明本发明所提供的一种在线签约的意愿认证的方法的具体方案。
20.请参阅图1,其示出了本发明一个实施例提供的一种在线签约的意愿认证的方法流程图,该方法包括以下步骤:步骤s1,获取在线签约的域名的默认服务器的日访问量、备用服务器的运维信息;获取默认服务器与备用服务器之间的距离;根据是否启用备用服务器的日访问量的差异特征获得默认服务器的访问压力临界值;根据备用服务器的运维信息获得备用服务器的运维水平指数。
21.在本发明实施例中,实施场景为对在线签约的链接进行检测分析。对于在线签约的域名,其中dns域名系统的作用是把域名网络地址对应到真实的计算机能够识别的网络ip地址,以便计算机能够进一步通信和传递内容等。dns劫持是通过篡改某个域名的解析结果,使得指向该域名的ip变成了另一个ip,导致对相应网址的访问被劫持到另一个不可达或者虚假的网址。因为dns类似于公共的ip地址解析电话本,并且一个域名可以绑定多个ip,一个ip也可以绑定多个域名,因此需要发送方认可的域名清单和ip清单,对于公共dns而言,其与ip之间的映射关系并非固定,故不能仅以ip清单作为检测恶意链接的标准。ip地址用于标识互联网或本地网络上的设备,实际服务器地址指的是服务器所在的物理位置或网络位置。服务器可以位于数据中心、云服务提供商、企业内部等不同地方,其实际地址与ip地址之间的映射关系由dns服务器负责维护,当服务器迁移时,也需要更新ip地址。因此可以对dns所有解析结果的实际地址和ip地址进行分析,同时结合服务器的运维信息,判断域名是否受到域名劫持。
22.首先,需要获取在线签约的域名的默认服务器的日访问量,获取域名的备用服务器的运维信息;需要说明的是,该方法为第三方监控,为了维护用户的信息与财产安全,需要向发送方索要部分信息查看权限,若遭到拒绝则不允许向用户发送任何链接,发送方需要向第三方提供域名dns清单、ip清单、ip对应服务器的历史运行日志、当前日志和运维信息。默认服务器指提供在线签约的网页服务的常用服务器,备用服务器指的是当默认服务器故障或超负载的临时启用的服务器;对于日访问量的获取可由服务器的日志数据中进行提取,日访问量可以表征服务器每天的负载特征。对于运维信息的获取,本发明实施例获取的为服务器的硬件参数、网络环境、性能参数和操作系统,运维信息能够表征该服务器所处站点的综合建设水平,通过运维信息可以表征服务器对应站点是否为安全正规站点。进一步地,还需获取默认服务器与备用服务器之间的距离,后续可以根据距离特征分析备用服务器的启用优先级,距离即为服务器之间的实际距离。
23.因为发生域名劫持后会变更连接的服务器,正常情况下域名使用的为默认服务器,而在默认服务器的日访问量过高时,会切换到备用服务器,若在默认服务器负载正常会切换服务器可能是受到域名劫持的情况,因此可先分析默认服务器的负载特征;故根据是否启用备用服务器的日访问量差异特征获得默认服务器的访问压力临界值;需要说明的是,分析之前需要剔除由于故障、更新等问题导致更换服务器的日志数据;具体包括:计算未启用备用服务器时的所述默认服务器的日访问量的平均值,获得默认日均访问量;计算域名启用相同备用服务器数量的所有历史日期中,默认服务器的日访问量的平均值,获得备用日均访问量;计算备用日均访问量与默认日均访问量的差值的平方,获得日均访问差异表征值;计算启用不同数量类型的备用服务器时,对应的日均访问差异表征值的平均值的算术平方根,获得访问压力临界值;访问压力临界值的具体获取公式包括:式中,为默认服务器的访问压力临界值,表示同一天中启用不同数量类型个备用服务器的数量,表示启用种数量类型个备用服务器时默认服务器的日志总数量,表示第个日志中的日访问量,表示备用日均访问量。表示未启用备用服务器时的总日志数量,表示第个日志中的日访问量,表示默认日均访问量。表示日均访问差异表征值。
24.对于访问压力临界值的获取,通过分析该域名对应的默认服务器在启用和未启用备用服务器时,默认服务器的日访问量的差异情况,该公式为启用不同数量备用服务器时日访问量差异的均方差,表示了该域名在是否启用备用服务器时默认服务器的日访问量的差异特征;访问压力临界值表征了默认服务器在访问压力较大时相比正常运行状态时多出的临界访问值,在正常情况下,默认服务器的负载较低,而当启用备用服务器时,此时默认服务器的负载较高,故可通过访问压力临界值分析默认服务器的负载承压情况,后续可通过访问压力临界值分析切换服务器时的原因是否为默认服务器负载较高,接近日访问量上限,进而判断出现域名劫持的概率。
25.进一步地,获取了默认服务器的访问压力临界值之后,为了提高识别域名劫持的准确率,还需要分析服务器的运维情况,因为服务器站点的运维水平能够反映该站点的综合建设水平,对于虚假网站的站点其综合运维水平往往较差,故根据备用服务器的运维信息通过神经网络获得备用服务器的运维水平指数,具体包括:运维信息包括硬件参数、网络环境、性能参数和操作系统;可通过人工评价、网络投票或主成分分析法提取运维信息的代表特征,对运维信息的重要特征通过人工方式标记运维优劣的评分标签,通过分类神经网络对运维信息的重要特征进行训练;训练完成的分类神经网络能够将输入的运维信息的重要特征进行分类识别,输出从劣到优为零到一的运维水平指数。需要说明的是,主成分分析法和分类神经网络属于现有技术,具体计算步骤不再赘述。分类神经网络的结构为
encoder-fc,损失函数为交叉熵函数,为了提高分类神经网络的准确性,可额外获取大量不同的服务器站点的运维信息作为训练集和验证集,在训练过程中,通过梯度下降法进行训练,直到损失函数收敛,完成分类神经网络训练。后续可利用训练完成的分类神经网络对发送方的服务器站点运维情况进行分类,得到服务器的运维水平指数,当站点的综合建设水平越高,输出的运维水平指数越接近1。当输出的运维水平指数越接近0时,意味遇到虚假网址的服务器站点的概率越大,进而后续可结合运维水平指数分析出现域名劫持的概率。
26.至此,获取了在线签约域名对应的默认服务器在是否启用备用服务器的访问压力临界值,以及不同服务器站点的运维水平指数,最终可基于访问压力临界值和运维水平指数分析出现域名劫持的概率。
27.步骤s2,根据默认服务器与备用服务器的距离特征和是否启用备用服务器的日访问量的差异特征,获得域名的历史距离相关系数;根据是否启用备用服务器的日访问量的差异特征和备用服务器的运维水平指数的差异特征,获得域名的历史运维相关系数;根据历史距离相关系数和历史运维相关系数获得距离权重和运维权重。
28.因为备用服务器存在多台,启用备用服务器的优先级是基于默认服务器的访问压力、服务器之间的距离和备用服务器的运维情况而定;默认服务器访问压力大,同样需要运维状态较好的站点分担,避免庞大的访问流量导致服务器瘫痪,但若服务器距离较远,则中间经过的节点较多,导致网络延迟时间较长。因此为了后续分析域名劫持的概率,则需要分析启用备用服务器的优先级逻辑,故根据默认服务器与备用服务器的距离特征和是否启用备用服务器的日访问量的差异特征,获得域名的历史距离相关系数,具体包括:对于域名任意一次启用备用服务器时的默认服务器,计算默认服务器的日访问量与默认日均访问量的差值,获得默认访问量差异;计算默认服务器与对应启用的备用服务器实际位置的平均欧氏距离的倒数,获得备用距离表征值,计算默认服务器与所有备用服务实际位置的平均欧氏距离的倒数,获得常规距离表征值,计算备用距离表征值与常规距离表征值的差值,获得备用距离差异表征值;计算默认日均访问量的标准差与备用距离差异表征值的标准差的乘积,获得第一标准差表征值,计算默认访问量差异与备用距离差异表征值的协方差与第一标准差表征值的比值的绝对值,获得历史距离相关系数;获取历史距离相关系数的具体公式包括:式中,表示历史距离相关系数,表示启用备用服务器的第个日志中默认服务器的日访问量,表示默认日均访问量;表示第个日志中对应的默认服务器和启用备用服务器的平均欧氏距离,表示默认服务器与所有备用服务的平均欧氏距离;表示备用距离表征值;表示常规距离表征值;表示备用距离差异表征值;
表示默认访问量差异,表示默认访问量差异与备用距离差异表征值的协方差,表示默认日均访问量的标准差,表示备用距离差异表征值的标准差,表示第一标准差表征值。
29.对于历史距离相关系数的获取,该值的计算过程为皮尔逊相关系数的计算过程,需要说明的是,皮尔逊相关系数为现有技术,用于度量两个变量之间的相关性,在本发明实施例中两个变量分别为启用备用服务器时默认服务器的日访问量和默认日均访问量的差值、启用的备用服务器和默认服务器的距离差异特征。两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商,其值范围介于-1和1,当越接近0时,意味着两个变量的变化越不相关。其中计算平均欧氏距离的倒数是根据距离择优的逻辑,当出现访问量压力较大时,应选取距离较近的备用服务器,故利用平均欧氏距离的倒数矫正访问压力和距离择优之间的逻辑关系。因此该历史距离相关系数表征了该签约域名在历史时期中启用备用服务器是否与服务器之间的距离存在相关性,当历史距离相关系数越接近1,则意味着启用备用服务器时与距离择优越相关,即选取距离较近的备用服务器优先启用。
30.进一步地,分析了选取所启用的备用服务器的距离相关性后,又因备用服务器的选取可能与其运维水平存在相关性,故根据是否启用备用服务器的日访问量的差异特征和备用服务器的运维水平指数差异特征,获得域名的历史运维相关系数,具体包括:计算所有备用服务器的运维水平指数的平均值,获得运维水平平均值;对于域名任意一次启用的备用服务器,计算启用的备用服务器的运维水平指数的平均值,获得备用运维水平平均值;计算备用运维水平平均值与运维水平平均值的差值,获得备用运维水平差异表征值;计算默认日均访问量的标准差与备用运维水平差异表征值的标准差的乘积,获得第二标准差表征值;计算默认访问量差异与备用运维水平差异表征值的协方差与第二标准差表征值的比值的绝对值,获得历史运维相关系数。需要说明的是,因历史运维相关系数与历史距离相关系数都是借用皮尔逊相关系数的思想进行计算,且计算公式相似,故计算公式不再赘述。对于历史运维相关系数的获取,当该数值越接近1,则意味着该签约域名在历史时期中选取备用服务器时与运维水平择优越相关,即选取运维水平指数较高的备用服务器优先启用。
31.获取了域名对应的历史距离相关系数和历史运维相关系数后,则需要分析二者的权重占比,即在选取启用的备用服务器时是根据距离优先或是运维水平优先;故根据历史距离相关系数和历史运维相关系数获得距离权重和运维权重,具体包括:计算历史距离相关系数与历史运维相关系数的和值,获得相关系数表征值,计算历史距离相关系数与相关系数表征值的比值,获得距离权重;计算历史运维相关系数与相关系数表征值的比值,获得运维权重。当距离权重大于运维权重时,则意味着选取启用的备用服务器时更倾向于距离较近的;当运维权重大于距离权重时,则意味着选取启用的备用服务器时更倾向于运维水平较高的。后续则可以结合距离权重以及运维权重分析新连接的其他服务器是否出现域名劫持的情况。
32.步骤s3,根据访问压力临界值和默认服务器的日访问量的差异特征,获得默认服务器的当前访问压力系数;根据域名当前连接的其他服务器与默认服务器之间的距离特征、距离权重、默认服务器与备用服务器之间的距离特征,获得其他服务器的距离验证系数;根据运维权重、其他服务器与备用服务器的运维水平指数的差异特征,获得其他服务器
的运维验证系数;根据当前访问压力系数、距离验证系数和运维验证系数,获得其他服务器的恶意链接概率,根据恶意链接概率进行签约意愿认证。
33.当发送方发送的签约域名链接对应的ip不在该域名的历史清单中,则意味着切换了未出现过的服务器,此时则需要分析出现域名劫持的概率。首先,需要分析当前默认服务器的负载情况,故根据访问压力临界值和默认服务器的日访问量的差异特征,获得默认服务器的当前访问压力系数,具体包括:计算默认服务器当前的日访问量与默认日均访问量的差值绝对值,获得当前访问量差异值;计算当前访问量差异值与访问压力临界值的比值,获得当前访问压力系数。若当前访问量差异值与访问压力临界值的比值越接近1,则意味着当前默认服务器的负载已经接近了历史时期中该域名启用备用服务器时的日访问量,即确实存在访问量压力大的情况,需要启用其他服务器。若当前访问量差异值与访问压力临界值的比值越小于1,则意味着当前默认服务器的负载并未接近启用备用服务器的水平,进而出现域名的劫持的概率较大。
34.获得当前访问压力系数后,为了提高分析出现域名劫持的概率准确性,还需要分析当前连接的其他服务器的运维水平,以及与默认服务器的距离特征;故根据域名当前连接的其他服务器与默认服务器之间的距离特征、距离权重、默认服务器与备用服务器之间的距离特征,获得其他服务器的距离验证系数;根据运维权重、其他服务器与备用服务器的运维水平指数的差异特征,获得其他服务器的运维验证系数,具体包括:计算其他服务器与默认服务器的欧氏距离的倒数,获得其他距离表征值,计算其他距离表征值和常规距离表征值的比值,获得其他距离差异表征值;计算其他距离差异表征值与距离权重的乘积,获得其他服务器的距离验证系数。计算其他服务器的运维水平指数与运维水平平均值的比值,获得其他运维差异表征值,计算其他运维差异表征值与运维权重的乘积,获得其他服务器的运维验证系数。
35.对于其他服务器的距离验证系数和运维验证系数的获取,当其他距离差异表征值越接近1时,意味着其他服务器与备用服务器的位置越接近,可能在同一服务器集群中;当其他距离差异表征值越不接近1时,意味着其他服务器与备用服务器的位置越不接近,此时出现域名劫持的概率较大。当其他运维差异表征值越接近1时,意味着该其他服务器与备用服务器的运维水平接近,即该其他服务器站点的综合建设水平较好;当其他运维差异表征值越不接近1时,则意味着该其他服务器站点的综合建设水平不如备用服务器。其中分别计算与对应的距离权重和运维权重的乘积的目的是作为权重系数,若该域名历史时期选取启用的备用服务器是以距离优先,则在计算距离验证系数时给予的权重更大,同理若以运维水平优先时,则在计算运维验证系数时给予的权重更大;通过不同的权重能够提高分析域名劫持出现概率的准确性。
36.至此,获得当前访问压力系数、距离验证系数和运维验证系数后,故可根据当前访问压力系数、距离验证系数和运维验证系数,获得其他服务器的恶意链接概率,根据恶意链接概率进行签约意愿认证,具体包括:计算距离验证系数与对应的运维验证系数的和值,获得其他服务器验证系数;计算其他服务器验证系数与当前访问压力系数的乘积,计算常数1和其他服务器验证系数与当前访问压力系数的乘积的差值绝对值,获得恶意链接概率;当恶意链接概率不超过预设概率阈值时,判断不存在签约风险,不进行用户签约的意愿认证;当恶意链接概率超过预设概率阈值时,判定存在签约风险,对用户签约的意愿进行认证提
醒;恶意链接概率的获取公式具体包括:式中,表示恶意链接概率,表示默认服务器当前的日访问量,表示当前访问量差异值;表示距离权重,表示运维权重,表示其他服务器与默认服务器的欧氏距离;表示其他服务器的运维水平指数,表示运维水平平均值,表示其他服务器的距离验证系数;表示其他服务器的运维验证系数。表示其他服务器验证系数。
37.对于恶意链接概率的获取,根据步骤s3中对公式中各个参数的分析,若当前访问量差异值越接近1、距离验证系数越接近1、以及运维验证系数越接近1,此时其他服务器和备用服务器越相似,且默认服务器的负载越接近启用备用服务器的水平,故恶意链接概率越接近零;若当前访问量差异值越不接近1、距离验证系数越不接近1、以及运维验证系数越不接近1,此时其他服务器和备用服务器越不相似,且默认服务器的负载越不接近启用备用服务器的水平,故恶意链接概率的值越大。故可预设概率阈值,当恶意链接概率不超过预设概率阈值时,则认为切换的其他服务器与历史的备用服务器相似,此时用户在线签约正常,用户签约的意愿不受干扰;当恶意链接概率超过预设概率阈值时,则认为切换的其他服务器未经过认证,受到域名劫持的概率较大,用户在该网址签约的意愿较低,此时需要及时弹窗提醒用户或强制关闭网址,保护用户的信息与财产安全。至此,本发明实施例通过分析当前默认服务器的日访问量与历史正常日访问量的差异特征,以及其他服务器的运维水平、其与默认服务器的距离特征,提高了分析域名劫持概率的准确性,进而提高了用户签约的安全性。
38.综上所述,本发明实施例提供了一种在线签约的意愿认证的方法;获取在线签约域名对应的默认服务器的日访问量、备用服务器的运维信息,服务器之间的距离。根据是否启用备用服务器时的日访问量差异获得访问压力临界值,分析默认服务器的负载水平。根据运维水平指数分析服务器站点的综合建设水平;根据历史距离相关系数分析启用备用服务器与距离的相关性;根据历史运维相关系数分析启用备用服务器与运维水平的相关性。最终本发明通过分析当前访问压力系数、距离验证系数和运维验证系数获取恶意链接的概率,提高判断域名劫持的准确性,进而提高用户在线签约的安全性,保证了用户的签约意愿。
39.需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
40.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
技术特征:
1.一种在线签约的意愿认证的方法,其特征在于,所述方法包括以下步骤:获取在线签约的域名的默认服务器的日访问量、备用服务器的运维信息;获取默认服务器与备用服务器之间的距离;根据是否启用备用服务器的日访问量的差异特征获得所述默认服务器的访问压力临界值;根据备用服务器的所述运维信息获得备用服务器的运维水平指数;根据默认服务器与备用服务器的距离特征和是否启用备用服务器的日访问量的差异特征,获得域名的历史距离相关系数;根据是否启用备用服务器的日访问量的差异特征和备用服务器的运维水平指数的差异特征,获得域名的历史运维相关系数;根据所述历史距离相关系数和所述历史运维相关系数获得距离权重和运维权重;根据所述访问压力临界值和默认服务器的日访问量的差异特征,获得默认服务器的当前访问压力系数;根据所述域名当前连接的其他服务器与默认服务器之间的距离特征、所述距离权重、默认服务器与备用服务器之间的距离特征,获得所述其他服务器的距离验证系数;根据所述运维权重、其他服务器与备用服务器的所述运维水平指数的差异特征,获得所述其他服务器的运维验证系数;根据所述当前访问压力系数、所述距离验证系数和所述运维验证系数,获得所述其他服务器的恶意链接概率,根据所述恶意链接概率进行签约意愿认证。2.根据权利要求1所述的一种在线签约的意愿认证的方法,其特征在于,所述根据是否启用备用服务器的日访问量的差异特征获得所述默认服务器的访问压力临界值的步骤包括:计算未启用备用服务器时的所述默认服务器的日访问量的平均值,获得默认日均访问量;计算所述域名启用相同备用服务器数量的所有历史日期中,所述默认服务器的日访问量的平均值,获得备用日均访问量;计算所述备用日均访问量与所述默认日均访问量的差值的平方,获得日均访问差异表征值;计算启用不同数量类型的备用服务器时,对应的所述日均访问差异表征值的平均值的算术平方根,获得所述访问压力临界值。3.根据权利要求1所述的一种在线签约的意愿认证的方法,其特征在于,所述根据备用服务器的所述运维信息获得备用服务器的运维水平指数的步骤包括:所述运维信息包括硬件参数、网络环境、性能参数和操作系统;提取所述运维信息的代表特征,将所述代表特征输入到训练好的分类神经网络,由分类神经网络对所述运维信息的所述代表特征进行分类识别,并输出从劣到优为零到一的所述运维水平指数。4.根据权利要求2所述的一种在线签约的意愿认证的方法,其特征在于,所述获得域名的历史距离相关系数的步骤包括:对于所述域名任意一次启用备用服务器时的默认服务器,计算所述默认服务器的日访问量与所述默认日均访问量的差值,获得默认访问量差异;计算所述默认服务器与对应启用的备用服务器的实际位置的平均欧氏距离的倒数,获得备用距离表征值,计算默认服务器与所有备用服务的实际位置的平均欧氏距离的倒数,获得常规距离表征值,计算所述备用距离表征值与所述常规距离表征值的差值,获得备用距离差异表征值;计算所述默认日均访问量的标准差与所述备用距离差异表征值的标准差的乘积,获得第一标准差表征值,计算所述默认访问量差异与所述备用距离差异表征值的协方差与所述
第一标准差表征值的比值的绝对值,获得所述历史距离相关系数。5.根据权利要求4所述的一种在线签约的意愿认证的方法,其特征在于,所述获得域名的历史运维相关系数的步骤包括:计算所有备用服务器的所述运维水平指数的平均值,获得运维水平平均值;对于所述域名任意一次启用的备用服务器,计算启用的所述备用服务器的运维水平指数的平均值,获得备用运维水平平均值;计算所述备用运维水平平均值与所述运维水平平均值的差值,获得备用运维水平差异表征值;计算所述默认日均访问量的标准差与所述备用运维水平差异表征值的标准差的乘积,获得第二标准差表征值;计算所述默认访问量差异与所述备用运维水平差异表征值的协方差与所述第二标准差表征值的比值的绝对值,获得所述历史运维相关系数。6.根据权利要求1所述的一种在线签约的意愿认证的方法,其特征在于,所述根据所述历史距离相关系数和所述历史运维相关系数获得距离权重和运维权重的步骤包括:计算所述历史距离相关系数与所述历史运维相关系数的和值,获得相关系数表征值,计算所述历史距离相关系数与所述相关系数表征值的比值,获得所述距离权重;计算所述历史运维相关系数与所述相关系数表征值的比值,获得所述运维权重。7.根据权利要求2所述的一种在线签约的意愿认证的方法,其特征在于,所述获得默认服务器的当前访问压力系数的步骤包括:计算所述默认服务器当前的日访问量与所述默认日均访问量的差值绝对值,获得当前访问量差异值;计算所述当前访问量差异值与所述访问压力临界值的比值,获得所述当前访问压力系数。8.根据权利要求4所述的一种在线签约的意愿认证的方法,其特征在于,所述获得所述其他服务器的距离验证系数的步骤包括:计算所述其他服务器与所述默认服务器的欧氏距离的倒数,获得其他距离表征值,计算所述其他距离表征值和所述常规距离表征值的比值,获得其他距离差异表征值;计算所述其他距离差异表征值与所述距离权重的乘积,获得所述其他服务器的所述距离验证系数。9.根据权利要求5所述的一种在线签约的意愿认证的方法,其特征在于,所述获得所述其他服务器的运维验证系数的步骤包括:计算所述其他服务器的所述运维水平指数与所述运维水平平均值的比值,获得其他运维差异表征值,计算所述其他运维差异表征值与所述运维权重的乘积,获得所述其他服务器的所述运维验证系数。10.根据权利要求1所述的一种在线签约的意愿认证的方法,其特征在于,所述获得所述其他服务器的恶意链接概率,根据所述恶意链接概率进行签约意愿认证的步骤包括:计算所述距离验证系数与对应的所述运维验证系数的和值,获得其他服务器验证系数;计算所述其他服务器验证系数与所述当前访问压力系数的乘积,计算常数1和所述其他服务器验证系数与所述当前访问压力系数的乘积的差值绝对值,获得所述恶意链接概率;当所述恶意链接概率不超过预设概率阈值时,判断不存在签约风险,不进行用户签约的意愿认证;当所述恶意链接概率超过预设概率阈值时,判定存在签约风险,对用户签约的意愿进行认证提醒。
技术总结
本发明涉及数据处理技术领域,具体涉及一种在线签约的意愿认证的方法;获取在线签约域名对应的默认服务器的日访问量、备用服务器的运维信息,服务器之间的距离。根据是否启用备用服务器时的日访问量差异获得访问压力临界值,分析默认服务器的负载水平。根据运维水平指数分析服务器站点的综合建设水平;根据历史距离相关系数分析启用备用服务器与距离的相关性;根据历史运维相关系数分析启用备用服务器与运维水平的相关性。最终本发明通过分析当前访问压力系数、距离验证系数和运维验证系数获取恶意链接的概率,提高判断域名劫持的准确性,进而提高用户在线签约的安全性,保证了用户的签约意愿。户的签约意愿。户的签约意愿。
技术研发人员:赵云 陆猛 张伟 谢文迅 孙肖辉
受保护的技术使用者:北京点聚信息技术有限公司
技术研发日:2023.07.13
技术公布日:2023/8/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
