基于多维组合位置行为轨迹链的行为分析方法及装置与流程
未命名
10-18
阅读:129
评论:0
1.本发明涉及数据分析技术领域,具体涉及一种基于多维组合位置行为轨迹链的行为分析方法及装置。
背景技术:
2.目前,现有的定位方法主要包括app(应用程序)定位法、ta(定时提前量)结合aoa(来波方向)定位法、三角定位法及基于指纹库的定位法等。其中,app定位方法主要通过解析s1-u口信令,将用户上报的经纬度提取出来,获取用户位置信息。ta结合aoa定位法主要根据mr(测量报告)中ta值估算基站和ue之间的距离,再根据aoa的角度信息就可以获得终端的位置信息。三角定位法主要通过结合mr场强信息及网元工参信息,利用主服务小区和两个或更多个最强的邻区形成的三角形或多边形,计算中心点,并进行场强加权偏移,获得定位结果。
3.现有技术中的方案,存在定位精度不高、定位误差大,对用户的行为进行分析结果不准确的技术问题。
技术实现要素:
4.本发明提供一种基于多维组合位置行为轨迹链的行为分析方法及装置,用以解决对用户的行为进行分析结果不准确的技术问题。
5.第一方面,本发明提供一种基于多维组合位置行为轨迹链的行为分析方法,包括:
6.采用精准定位和模式匹配结合的定位方式对用户进行全网测量报告mr定位;
7.基于mr定位结果分别对用户进行室内外识别、楼宇分层识别及运动态识别;
8.采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测;
9.构建基于用户位置的空间大数据库,并基于所述空间大数据库进行用户行为的预测及分析。
10.在一个实施例中,所述采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测,包括:
11.提取用户静态位置特征、用户运动轨迹特征、网络环境特征、用户所处场景特征和用户所处地理环境特征;
12.基于所述用户静态位置特征、所述用户运动轨迹特征、所述网络环境特征、所述用户所处场景特征和所述用户所处地理环境特征、所述用户静态位置特征对应的预设权重、所述用户运动轨迹特征对应的预设权重、所述网络环境特征对应的预设权重、所述用户所处场景特征对应的预设权重和所述用户所处地理环境特征对应的预设权重构建位置定位模型并进行训练及对用户位置进行预测。
13.在一个实施例中,预测范围越小的网络环境特征对应的预设权重越大。
14.在一个实施例中,位置相关性越高的用户静态位置特征对应的预设权重越大。
15.在一个实施例中,所述用户静态位置特征、所述用户运动轨迹特征、所述网络环境
特征、所述用户所处场景特征和所述用户所处地理环境特征对应的权重占比依次降低。
16.在一个实施例中,所述用户静态位置特征、所述用户运动轨迹特征、所述网络环境特征、所述用户所处场景特征和所述用户所处地理环境特征对应的权重占比依次为40%、35%、12.5%、10%和2.5%。
17.第二方面,本发明提供一种基于多维组合位置行为轨迹链的行为分析装置,包括:
18.定位模块,用于采用精准定位和模式匹配结合的定位方式对用户进行全网测量报告mr定位;
19.识别模块,用于基于mr定位结果分别对用户进行室内外识别、楼宇分层识别及运动态识别;
20.预测模块,用于采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测;
21.分析模块,用于构建基于用户位置的空间大数据库,并基于所述空间大数据库进行用户行为的预测及分析。
22.第三方面,本发明提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述计算机程序时实现第一方面所述的基于多维组合位置行为轨迹链的行为分析方法。
23.第四方面,本发明提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行第一方面所述的基于多维组合位置行为轨迹链的行为分析方法。
24.第五方面,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的基于多维组合位置行为轨迹链的行为分析方法。
25.本发明提供的基于多维组合位置行为轨迹链的行为分析方法及装置,通过多维组合定位及集成学习的方式构建基于用户位置行为的三位一体的位置定位模型,并构建基于用户位置的空间大数据库对用户行为进行预测分析,保证了对用户行为真实性及合理性的判别。
附图说明
26.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.图1是本发明提供的基于多维组合位置行为轨迹链的行为分析方法的流程示意图;
28.图2是本发明提供的室内外mr区分算法的流程示意图;
29.图3是本发明提供的基于多维组合位置行为轨迹链的行为分析装置的结构示意图;
30.图4是本发明提供的电子设备的结构示意图。
具体实施方式
31.目前,现有的定位方法主要包括app(应用程序)定位法、ta(定时提前量)结合aoa(来波方向)定位法、三角定位法及基于指纹库的定位法等。其中,app定位方法主要通过解析s1-u口信令,将用户上报的经纬度提取出来,获取用户位置信息。ta结合aoa定位法主要根据mr(测量报告)中ta值估算基站和终端/用户设备(user equipment,ue)之间的距离,再根据aoa的角度信息就可以获得终端的位置信息。三角定位法主要通过结合mr场强信息及网元工参信息,利用主服务小区和两个或更多个最强的邻区形成的三角形或多边形,计算中心点,并进行场强加权偏移,获得定位结果。
32.app定位法精度校准需在室外才能精准定位且由于绝大多数app的经纬度被加密无法直接解析得出,可用的样本点数量有限。
33.ta结合aoa定位法定位精度受环境的影响明显,在开阔地区定位较准,但在高大建筑物较多区域,定位精度会较差。
34.三角定位法中现网mr数据邻区信息不全的现象占较大比例,因此三点定位方法可实施性较差,精度不高,定位误差大,且受站间距影响明显。
35.综上,上述几类方法要么精度不高,要么存在某些场景无法定位的情况(比如高铁上运动态的识别),且上述定位方法均较为单一,未与其它技术良好结合。
36.本技术主要用于解决传统定位方法精度不高、定位误差大、定位方法单一、无法与其他技术良好结合来对用户的行为进行分析,以及对用户的行为分析结果不准确的技术问题,因此,本技术通过多维组合定位及集成学习的方式构建基于用户位置行为的三位一体的位置定位模型,并构建基于用户位置的空间大数据库对用户行为进行预测分析,从而实现对用户行为真实性及合理性的判别。
37.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
38.图1是本发明提供的基于多维组合位置行为轨迹链的行为分析方法的流程示意图,如图1所示,本发明提供一种基于多维组合位置行为轨迹链的行为分析方法,包括:
39.步骤101、采用精准定位和模式匹配结合的定位方式对用户进行全网测量报告mr定位。
40.其中,采用精准定位和模式匹配结合的定位方式,对于可识别的用户进行精确定位,对于未识别的用户,通过模式匹配定位进行knn算法匹配,部分用户精确匹配,部分用户最优匹配,最终实现全网mr定位。
41.本实施例中精确定位的方法包括:基于传播模型的基站三角定位、基于ta结合aoa的位置定位、传播模型的指纹库定位、基于ott数据的位置定位、基于wifi网络的三角定位、关联家庭宽带信息进行位置定位、基于路测数据的拟合定位。
42.1、基于传播模型的基站三角定位
43.实现原理:无线电信号强度随着传播距离的增加而衰减,无线电传播距离与信号强度存在强相关性。在大量实践的基础上可以得出,接收信号强度符合log-normal(对数-常态)分布模型,可以通过信号在传播过程中的衰减计算传播距离。
44.计算方法:待测点接收来自三个不同方向的小区信号,然后依照无线信号的传输损耗模型将其转换成待测目标到基站的距离,然后以三个小区为圆心,以其各自到待测点的距离为半径做圆,所得三个圆的交点即为用户位置。
45.2、基于ta结合aoa的位置定位
46.实现原理:在tdd_lte mr记录中,每个mr点上报tadv值与aoa值,通过tadv值与aoa可确定当前mr的位置。
47.计算方法:步骤一、通过tadv字段可以得到当前mr上报点到基站的距离信息。
48.计算方法是:1个ts的时间提前量距离=300000000/(15000*2048))/2=4.89米;当d=0时:s=0~4.89*(d+0.5)中随机值;当d》0时:s=4.89*(d-0.5)~4.89*(d+0.5)中随机值。其中,s:代表天线到mr点的距离,单位为米,d:为直接取tadv上报值。l=sqrt(power(s,2)-power(h,2)),其中,l:代表mr点到小区的距离,单位为米,h为小区天线挂高,sqrt()为平方根函数。
49.步骤二、确定mr点经纬度,因为s取了随机值,此处将球形距离直接忽略为平面距离。
50.x(2)=x(1)+lsinaoa
51.y(2)=y(1)+lcosaoa
52.其中,x(2)为用户上报mr点的经度,y(2)为用户上报mr点的纬度,x(1)为小区经度,y(1)为小区纬度,aoa为天线到达角。
53.3、传播模型的指纹库定位
54.实现原理:基于高精度地图,利用3d射线传播模型计算待规划区域三维空间内每个栅格内的信号强度,最终将这些包含各小区场强的栅格信息数字化,形成特征向量值,这些特征向量值的样本数据集就构成了指纹库,利用指纹库算法精确定位mr数据。
55.计算方法:某mr点测量到的主服务小区a的电平强度为a,邻区b、c的电平强度分别为b、c,构成mr小区场强向量(a,b,c),而某一指纹位置构成的特征向量为(aa,bb,cc,)(其中,aa表示此位置处a小区的电平强度为a,则两向量的欧式距离d满足最短则为匹配,即d=(a-aa)2+(b-bb)2+(c-cc)2]
1/2
)。
56.4、基于ott数据的位置定位
57.实现原理:目前许多app应用会获取用户的位置信息,用户在位置定位过程中,会使用http协议与服务器端进行信息交互,通过核心网信令抓包截获用户的准确位置。
58.5、基于wifi网络的三角定位
59.实现原理:当设备处在wifi网络中时,可以将收集到的这些能够标识ap(接入点)的数据发送到位置服务器,服务器检索出每一个ap的地理位置,并结合每个信号的强弱程度,计算出设备的地理位置并返回到用户设备,利用三点定位技术,实现用户的定位。
60.计算方法:待测点接收来自三个不同方向的ap信号,然后依照无线信号的传输损耗模型将其转换成待测目标到ap的距离,然后以三个ap为圆心,以其各自到待测点的距离为半径做圆,所得三个圆的交点即为用户位置。
61.6、关联家庭宽带信息进行位置定位
62.实现原理:利用家庭宽带信息定位本楼宇的家庭宽带用户,更精确地定位用户楼层,有利于无线网络问题的精确定位。
63.7、基于路测数据的拟合定位
64.实现原理:基于收集的路测、扫频数据,分析各小区的场强信息变化趋势,结合测试线路的走向,形成特征曲线,对待定位的mr采样点通过这些特征曲线进行拟合,从而完成mr采样数据的定位。
65.计算方法:从mr采样点数据中提取其关联的主服务小区的电平强度和采集到周边邻区的电平强度,作为该mr采样点的识别特征,然后在模型库中查找该小区的特征曲线,通过拟合进而定位该采样点的具体位置。
66.步骤102、基于mr定位结果分别对用户进行室内外识别、楼宇分层识别及运动态识别。
67.1、室内外用户识别
68.对用户室外属性识别的方法基于初步定位后的临界区域mr数据,通过用户的小区驻留情况,位置变化,移动速率,主服务小区变化率,rsrp水平变化情况,业务属性等多个纬度进行综合判定实现室内外用户区分。图2是本发明提供的室内外mr区分算法的流程示意图,如图2所示,对上报的mro(原始测量报告)以mme ue s1ap id(接入点识别码)为单位进行统计,对同一mme ue s1ap id的mr数据具体算法如下:
69.a、根据主服务小区的切换特征(根据用户前后若干时刻所在小区变化情况),区分室内外用户。
70.b、根据总小区数据特征(根据室内外接收到的邻区数量的差别)区分室内外用户。
71.c、根据室内外电平强度特征(根据室内外接收到的服务小区及邻区的电平强度的差别)区分室内外小区。
72.根据室内外覆盖环境特点分析及其mr数据特征对比分析,从“室内外主服务小区切换具有明显移动性特征”、“mr包含的小区数”、“各导频信号的强度与差值”等多个方面进行室内外用户的识别。
73.2、楼宇分层识别
74.对楼宇的用户,在完成用户特征分类的基础上,按照定位技术所需的数据以及适用场景,适配对应的定位技术,完成全量数据的定位,进行楼宇分层用户识别。
75.根据定位利用3d高精度地图的建筑,实现楼宇分层指标呈现,分层的算法有:
76.a、利用rru(射频拉远单元)的性能及信令的数据及每层的测试数据实现楼宇分层呈现。
77.b、室内楼宇集合规划图纸及仿真数据实现分层识别。
78.定位的算法有:蓝牙室内定位,wifi定位,zigbee室内定位,超宽带定位等。
79.具体算法如下:
80.蓝牙室内技术是利用在室内安装的若干个蓝牙局域网接入点,把网络维持成基于多用户的基础网络连接模式,并保证蓝牙局域网接入点始终是这个微微网(piconet)的主设备,然后通过测量信号强度对新加入的盲节点进行三角定位。蓝牙室内定位技术最大的优点是设备体积小、短距离、低功耗,容易集成在手机等移动设备中。只要设备的蓝牙功能开启,就能够对其进行定位。蓝牙传输不受视距的影响,但对于复杂的空间环境,蓝牙系统的稳定性稍差,受噪声信号干扰大且在于蓝牙器件和设备的价格比较昂贵,蓝牙室内定位主要应用于对人的小范围定位,例如单层大厅或商店。
81.wifi定位技术有两种,一种是通过移动设备和三个无线网络接入点的无线信号强度,通过差分算法,来比较精准地对人和车辆的进行三角定位。另一种是事先记录巨量的确定位置点的信号强度,通过用新加入的设备的信号强度对比拥有巨量数据的数据库,来确定位置(“指纹”定位)。wifi定位可以在广泛的应用领域内实现复杂的大范围定位、监测和追踪任务,总精度比较高,但是用于室内定位的精度只能达到2米左右,无法做到精准定位。由于wifi路由器和移动终端的普及,使得定位系统可以与其他客户共享网络,硬件成本很低,而且wifi的定位系统可以降低了射频(rf)干扰可能性。wifi定位适用于对人或者车的定位导航,可以于医疗机构、主题公园、工厂、商场等各种需要定位导航的场合。定位适用于对人或者车的定位导航,可以于医疗机构、主题公园、工厂、商场等各种需要定位导航的场合。
82.zigbee室内定位技术:zigbee室内定位技术通过若干个待定位的盲节点和一个已知位置的参考节点与网关之间进行组网,每个微小的盲节点之间相互协调通信以实现全部定位。zigbee是一种新兴的短距离、低速率无线网络技术,这些传感器只需要很少的能量,以接力的方式通过无线电波将数据从一个节点传到另一个节点,作为一个低功耗和低成本的通信系统,zigbee的工作效率非常高。但zigbee的信号传输受多径效应和移动的影响都很大,而且定位精度取决于信道物理品质、信号源密度、环境和算法的准确性,造成定位软件的成本较高,提高空间还很大。zigbee室内定位已经被很多大型的工厂和车间作为人员在岗管理系统所采用。
83.超宽带定位技术是一种全新的、与传统通信定位技术有极大差异的新技术。它利用事先布置好的已知位置的锚节点和桥节点,与新加入的盲节点进行通讯,并利用三角定位或者“指纹”定位方式来确定位置。超宽带通信不需要使用传统通信体制中的载波,而是通过发送和接收具有纳秒或纳秒级以下的极窄脉冲来传输数据,因此具有ghz量级的带宽。由于超宽带定位技术具有穿透力强、抗多径效果好、安全性高、系统复杂度低、能提供精确定位精度等优点,前景相当广阔。但由于新加入的盲节点也需要主动通信使得功耗较高,而且事先也需要布局,使得成本还无法降低。超宽带室内定位可用于各个领域的室内精确定位和导航,包括人和大型物品,例如汽车地库停车导航、矿井人员定位、贵重物品仓储等。
84.3、运动态识别
85.首先,通过将信令数据与mr等等数据进行关联,将用户信息、占用网络信息以及终端所处无线环境等整合在一起,综合时间维度与空间维度进行分析,识别用户的动静态、行为轨迹、所处场景等特征。
86.其次,应用k-means等算法进行非监督式学习,对采样点关联信令、工参等多源数据后,进行聚类分析,挖掘采样点数据潜在的关联关系,识别出当前未知的用户的行为特征,以自学习的形式不断丰富用户行为特征标签库。
87.最后,根据高速移动的特性,计算同一个用户前后两个采样点的距离及时间差后可以得出用户的移动速度,结合高速(高铁)等沿线小区数据,判断该用户是否为高速(高铁)等的用户。
88.实现运动态识别的算法有:阻隔特征判断法,运动态识别,邻区特征识别,kmeans聚类层级分析算法,最小二乘法,k-近邻分析等,具体如下:
89.阻隔特征判断法:把采集到的mr参数和工程参数代入扩展hata模型公式,计算用
户的理论路损值,与实际小区发射功率减去ue接收发射功率的差来比较,从而判断用户与基站之间信号传播是否有阻隔。通过对用户多个mr的综合计算,以用户被阻隔的mr点比例来初步判断用户的室内外属性。
90.运动识别:通过用户占用各基站的采样点数及占比情况,占用基站的经纬度计算距离,确定用户的大致活动范围,初步判断用户的稳定度。统计用户占用基站类型情况,统计用户占用宏站中时长最长的站点为该用户的主占用基站;
91.通过基站经纬度,基于地球上任意两点距离计算公式计算用户占用各个基站到主占用基站的距离max(d)《500m。
92.邻区特征:通过基站上报邻区情况,mr测量邻区中有室分小区比例大于一定比例的用户为室内用户。室内用户邻区数量较少,且邻区信号较弱。
93.kmeans聚类层级分析算法:通过在相同位置的mro采样(同一位置不同高度的mro信息是存在差异性的),对采样数据进行聚类分析得到不同高度上的mro数据。
94.实现方法:
95.(1)、处理后大小为n的mro数据集,令i表示迭代次数,i的初始值等于1,随机选k个初始聚类中心zj(i),j=1,2,3,...,k,zj(i)表示第i次迭代中的第j个聚类中心。
96.(2)、计算每个数据对象与聚类中心的距离d(xi,zj(i)),i=1,2,
…
,n,j=1,2,3
…
k,xi表示第i个样本点,如果满足:d(xi,zk(i))=min{d(xi,zj(i)),i=1,2,3
…
,n},则xi属于ck,zk(i)表示第i次迭代中的第k个聚类中心,ck表示以zk(i)为聚类中的第k个簇。
97.(3)、计算k个新的聚类中心zj(i+1),j=1,2,3,...,k,zj(i+1)表示第i+1次迭代中的第j个聚类中心:即取聚类中心所有元各自纬度的算术平均数。
98.(4)、判断若zj(i+1)!=zj(i),j=1,2,3,
…
,k,则i=i+1,返回(2)否则算法结束。
99.最小二乘法:是基于图论、网络流理论和解析几何等知识的快速栅格化射线追踪方法,把每个计算区域转化成大规模连通图,在图中利用最短路径算法结合解析几何的知识计算路径射线信息。
100.最小二乘法物理模型建立指纹库算法:
101.计算公式:
[0102][0103][0104]
其中,l表示路径射线长度,a表示信号强度,b表示网格的大小,d表示增加流量,c表示容量,n表示路径数量,c
path
表示路径大小,f(α,β)表示流量。
[0105]
引入损失函数:err=1/2(l-ax)2,在min(err)时,x=(a
t
a)-1at
l。
[0106]
找出与栅格i所在建筑物相邻的所有室外栅格,利用室外模型计算每个室外栅格k的衰减l
ik
:
[0107]
l
ik
=min{lk+η0+η1(d
ik-2.5)}
[0108]
其中,lk表示第k个栅格的路径射线长度,η0表示电平强度,η1表示信号增益,d
ik
表示第i个栅格到第k个栅格之间的差。
[0109]
k-近邻分析:运用knn匹配前k个最相似的栅格。对于这k个栅格的经纬度,赋予不同的权重加权得到测试点最终的经纬度。权重是由栅格中样本点对应各个小区的电平分布得到的。
[0110]
假设:每个样本点取对应n个小区,mr中也有取n个小区。每个样本点测试到小区的电平服从高斯分布:
[0111][0112]
其中,μ为小区电平分布的数学期望,δ为小区电平分布的标准差。
[0113]
由于每个栅格对应n个小区,则mr与栅格(cj)的匹配概率为:
[0114][0115]
其中,cj为第j个最相似栅格的标记,n为cj对应的小区个数。
[0116]
则每个栅格的经纬度权重:
[0117][0118]
其中,k为栅格个数;对k个栅格的匹配概率作归一化作为栅格经纬度的权重,∑
i=1k
weighti=1。
[0119]
权重加权后得到mr的经纬度:
[0120][0121][0122]
其中,lonti为经度,lati为维度,ci为第i个最相似栅格的标记,i=1,2,
…
,k。
[0123]
步骤103、采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测。
[0124]
具体地,所述采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测,包括:
[0125]
提取用户静态位置特征、用户运动轨迹特征、网络环境特征、用户所处场景特征和用户所处地理环境特征;
[0126]
基于所述用户静态位置特征、所述用户运动轨迹特征、所述网络环境特征、所述用户所处场景特征和所述用户所处地理环境特征、所述用户静态位置特征对应的预设权重、所述用户运动轨迹特征对应的预设权重、所述网络环境特征对应的预设权重、所述用户所处场景特征对应的预设权重和所述用户所处地理环境特征对应的预设权重构建位置定位模型并进行训练及对用户位置进行预测。
[0127]
其中,模型构建及训练包括以下步骤:在融合处理多维度数据基础上,构建涵盖“特征识别+位置定位+模型训练”三位一体的位置定位模型,并应用集成学习技术进行模型训练持续提升定位模型的精度,实现mr数据的全面准确定位。
[0128]
具体地,在定位时,一方面选择精度最高的方式如ott定位进行定位,另一方面利用集成学习的方法基于用户静态特征、用户轨迹特征、所处场景特征、地理环境特征以及基
础的位置信令数据进行定位预测。通过计算高精度定位点与预测定位点的空间距离来评估预测效果,经过大量训练来达到效果最佳,从而达到在高精度定位方式,不适用的情况下,也可以通过经过训练的定位模型来预测较为精准的位置信息。
[0129]
具体地,利用集成学习技术进行用户位置预测包括以下步骤:
[0130]
1、特征提取:
[0131]
用户静态特征:位置编码、小区编码、所处基站维度、基站经度、基站地址、小区名称、小区类型(1:宏蜂窝,2:微蜂窝,3:功分或耦合基站信源,4:rru)、天线挂高、电子倾角、机械倾角、天线方向角、覆盖类型(1:室外,2:室内)天线纬度、天线经度、基站类型(1:2g、2:3g、3:4g)。
[0132]
用户运动轨迹特征:选取历史5分钟内所经位置点或历史5个位置点(取位置点较多的方式)作为历史位置点集,其中各点的位置、历史位置点集的总轨迹路途、历史位置点集中在各位置点的瞬时速度、历史位置点集中在各位置点的运动方向、历史位置点集中经过各点的时间、历史位置点集轨迹总位移距离、历史位置点集轨迹总位移速度、历史位置点集轨迹总位移方向。
[0133]
网络环境特征:2g网络、3g网络、4g网络、5g网络、wifi信号。
[0134]
用户所处场景特征:基站区域类型(城市、县城、农村)、基站所在区域名称、基站地市、基站区县、基站附近的交通地标(市内道路、国道、高速、地铁、飞机场、港口)、附近楼宇。
[0135]
用户所处地理环境特征:气候(晴朗、雨天、雾天、雪天)、土地(草原、森林、荒漠、湿地、硬化地面)、河流、湖泊、山脉。
[0136]
2、各特征的权重设计采用以下几个原则:
[0137]
1)、预测范围越小的特征权重越大,例如5g网络特征权重》4g网络权重》3g网络权重》2g网络权重。
[0138]
2)、位置相关性越高权重越大,例如小区位置权重》小区类型权重》小区名称权重。
[0139]
3)、按经验判断,用户静态位置特征、用户运动轨迹特征、用户网络环境特征、用户场景特征、用户地理环境特征的权重占比为4:3.5:1.25:1:0.25。
[0140]
3、模型训练与验证测试:基于预处理后的特征数据构建随机森林模型并进行训练及验证测试。
[0141]
例如,使用深度为20的300棵crt树组建的随机森林模型;
[0142]
预测结果在50m范围内的匹配程度80%,100m的匹配达到90%。
[0143]
步骤104、构建基于用户位置的空间大数据库,并基于所述空间大数据库进行用户行为的预测及分析。
[0144]
空间大数据包含以下几部分:
[0145]
地理数据:指直接或者间接关联着相对于地球某个地点的数据,包含自然地理数据及社会经济数据;内容:土地覆盖类型数据,地貌数据,土壤数据,水文数据,植被数据,居民地数据,河流数据,行政境界及社会经济的方面数据等,特点:数据体量大,较为规则化,变化较慢。
[0146]
轨迹数据:指通过gnss等测量手段以及网络签到等方法获得的用户活动数据,可以被用来反映用户的位置和用户的社会偏好;内容:个人轨迹数据,群体轨迹数据,车辆轨迹数据等,特点:数据体量大,信息碎片化,准确率较低,半结构化。
[0147]
空间媒体数据:包含位置的数字化的文字、图形、图像、视频影像等媒体数据,主要来源于移动社交网络微博等新型互联网应用。
[0148]
空间大数据主要作用如下:
[0149]
城市运行服务:城市规划、疾病控制、智能交通、节能减排、环境保护、应急响应;
[0150]
个人生活服务:社会交流、个性化信息推送、驾驶安全、智能驾驶;
[0151]
企业经济服务:企业调度、门店选址、广告推送、位置营销;
[0152]
空间大数据分析包含数据处理:
[0153]
数据处理主要是利用hadoop等大数据工具实现数据的存储、处理、提取、过滤;利用arcgis等呈现工具实现空间分析、信息展现、条件定义、数据生产。
[0154]
空间大数据有多种用途
–
从分析以往无法获取的位置数据中来获得更准确的洞察力,到分析运动中的数据来把握以前错过的机遇。空间大数据平台使您的组织能够解决以往根本无法解决的复杂问题。
[0155]
具体的,空间大数据分析的业务思路为:数据-信息-知识-智能-方案。
[0156]
关键技术:
[0157]
传感器网络——位置感知识别技术,包括卫星、wifi、蓝牙等定位技术,获取人或物的空间位置海量数据;
[0158]
全息位置地图——网格化多维度位置信息数,包括人、物、事件等等,真正意义上实现多维度数据的在空间上的关联;
[0159]
空间大数据仓库——非结构化数据、半结构化数据、结构化数据并行存储与管理,建立异构型数据库,适应空间大数据的复杂性、多样性及混沌性;
[0160]
数据安全——多层次应用安全及设计,安全的每一层被设计用于特定目的,并且可以用于提供授权规则;
[0161]
空间大数据挖掘——利用神经网络等挖掘算法,保证空间大数据分析与计算的高度并行性、自适应与自组织特性,有很好的预测能力和控制能力,支持大数据的盲分析,从中获得不同的知识学习,或为经营决策、或为企业管理或为扩张发展,或为提升用户体验;
[0162]
空间大数据可视化——全视角感知数据,还原事实真相,掌控事物空间分布相关性、预测未来趋势;
[0163]
空间大数据分析呈现:基础数据报表、客流动线描像、顾客流失分析、商铺联盟建议等。
[0164]
本技术通过多维组合定位及集成学习的方式构建基于用户位置行为的三位一体的位置定位模型,并构建基于用户位置的空间大数据库对用户行为进行预测分析,从而实现对用户行为真实性及合理性(例如位置验真,有无骗保等)的判别,此外,本技术通过运用大数据构建模型的方法对银行、保险公司等进行风险控制和风险提示。
[0165]
下面对本发明提供的基于多维组合位置行为轨迹链的行为分析装置进行描述,下文描述的基于多维组合位置行为轨迹链的行为分析装置与上文描述的基于多维组合位置行为轨迹链的行为分析方法可相互对应参照。
[0166]
图3是本发明提供的基于多维组合位置行为轨迹链的行为分析装置的结构示意图,如图3所示,本发明提供一种基于多维组合位置行为轨迹链的行为分析装置,包括定位模块301、识别模块302、预测模块303和分析模块304,其中:
[0167]
定位模块301用于采用精准定位和模式匹配结合的定位方式对用户进行全网测量报告mr定位;识别模块302用于基于mr定位结果分别对用户进行室内外识别、楼宇分层识别及运动态识别;预测模块303用于采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测;分析模块304用于构建基于用户位置的空间大数据库,并基于所述空间大数据库进行用户行为的预测及分析。
[0168]
在一个实施例中,所述采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测,包括:
[0169]
提取用户静态位置特征、用户运动轨迹特征、网络环境特征、用户所处场景特征和用户所处地理环境特征;
[0170]
基于所述用户静态位置特征、所述用户运动轨迹特征、所述网络环境特征、所述用户所处场景特征和所述用户所处地理环境特征、所述用户静态位置特征对应的预设权重、所述用户运动轨迹特征对应的预设权重、所述网络环境特征对应的预设权重、所述用户所处场景特征对应的预设权重和所述用户所处地理环境特征对应的预设权重构建位置定位模型并进行训练及对用户位置进行预测。
[0171]
在一个实施例中,预测范围越小的网络环境特征对应的预设权重越大。
[0172]
在一个实施例中,位置相关性越高的用户静态位置特征对应的预设权重越大。
[0173]
在一个实施例中,所述用户静态位置特征、所述用户运动轨迹特征、所述网络环境特征、所述用户所处场景特征和所述用户所处地理环境特征对应的权重占比依次降低。
[0174]
在一个实施例中,所述用户静态位置特征、所述用户运动轨迹特征、所述网络环境特征、所述用户所处场景特征和所述用户所处地理环境特征对应的权重占比依次为40%、35%、12.5%、10%和2.5%。
[0175]
在此需要说明的是,本发明实施例提供的基于多维组合位置行为轨迹链的行为分析装置,能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
[0176]
图4是本发明提供的电子设备的结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(communication interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的计算机程序,以执行基于多维组合位置行为轨迹链的行为分析方法的步骤,例如包括:
[0177]
采用精准定位和模式匹配结合的定位方式对用户进行全网测量报告mr定位;基于mr定位结果分别对用户进行室内外识别、楼宇分层识别及运动态识别;采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测;构建基于用户位置的空间大数据库,并基于所述空间大数据库进行用户行为的预测及分析。
[0178]
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,
read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0179]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的基于多维组合位置行为轨迹链的行为分析方法的步骤,例如包括:
[0180]
采用精准定位和模式匹配结合的定位方式对用户进行全网测量报告mr定位;基于mr定位结果分别对用户进行室内外识别、楼宇分层识别及运动态识别;采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测;构建基于用户位置的空间大数据库,并基于所述空间大数据库进行用户行为的预测及分析。
[0181]
另一方面,本技术实施例还提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行上述各实施例提供的方法的步骤,例如包括:
[0182]
采用精准定位和模式匹配结合的定位方式对用户进行全网测量报告mr定位;基于mr定位结果分别对用户进行室内外识别、楼宇分层识别及运动态识别;采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测;构建基于用户位置的空间大数据库,并基于所述空间大数据库进行用户行为的预测及分析。
[0183]
所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(mo)等)、光学存储器(例如cd、dvd、bd、hvd等)、以及半导体存储器(例如rom、eprom、eeprom、非易失性存储器(nand flash)、固态硬盘(ssd))等。
[0184]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0185]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0186]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种基于多维组合位置行为轨迹链的行为分析方法,其特征在于,包括:采用精准定位和模式匹配结合的定位方式对用户进行全网测量报告mr定位;基于mr定位结果分别对用户进行室内外识别、楼宇分层识别及运动态识别;采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测;构建基于用户位置的空间大数据库,并基于所述空间大数据库进行用户行为的预测及分析。2.根据权利要求1所述的基于多维组合位置行为轨迹链的行为分析方法,其特征在于,所述采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测,包括:提取用户静态位置特征、用户运动轨迹特征、网络环境特征、用户所处场景特征和用户所处地理环境特征;基于所述用户静态位置特征、所述用户运动轨迹特征、所述网络环境特征、所述用户所处场景特征和所述用户所处地理环境特征、所述用户静态位置特征对应的预设权重、所述用户运动轨迹特征对应的预设权重、所述网络环境特征对应的预设权重、所述用户所处场景特征对应的预设权重和所述用户所处地理环境特征对应的预设权重构建位置定位模型并进行训练及对用户位置进行预测。3.根据权利要求2所述的基于多维组合位置行为轨迹链的行为分析方法,其特征在于,预测范围越小的网络环境特征对应的预设权重越大。4.根据权利要求2所述的基于多维组合位置行为轨迹链的行为分析方法,其特征在于,位置相关性越高的用户静态位置特征对应的预设权重越大。5.根据权利要求2所述的基于多维组合位置行为轨迹链的行为分析方法,其特征在于,所述用户静态位置特征、所述用户运动轨迹特征、所述网络环境特征、所述用户所处场景特征和所述用户所处地理环境特征对应的权重占比依次降低。6.根据权利要求5所述的基于多维组合位置行为轨迹链的行为分析方法,其特征在于,所述用户静态位置特征、所述用户运动轨迹特征、所述网络环境特征、所述用户所处场景特征和所述用户所处地理环境特征对应的权重占比依次为40%、35%、12.5%、10%和2.5%。7.一种基于多维组合位置行为轨迹链的行为分析装置,其特征在于,包括:定位模块,用于采用精准定位和模式匹配结合的定位方式对用户进行全网测量报告mr定位;识别模块,用于基于mr定位结果分别对用户进行室内外识别、楼宇分层识别及运动态识别;预测模块,用于采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测;分析模块,用于构建基于用户位置的空间大数据库,并基于所述空间大数据库进行用户行为的预测及分析。8.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述的基于多维组合位置行为轨迹链的行为分析方法。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的基于多维组合位置行为轨迹链的行为分析方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的基于多维组合位置行为轨迹链的行为分析方法。
技术总结
本发明提供一种基于多维组合位置行为轨迹链的行为分析方法及装置,所述方法包括:采用精准定位和模式匹配结合的定位方式对用户进行全网测量报告MR定位;基于MR定位结果分别对用户进行室内外识别、楼宇分层识别及运动态识别;采用集成学习技术对位置定位模型进行训练,并对用户位置进行预测;构建基于用户位置的空间大数据库,并基于所述空间大数据库进行用户行为的预测及分析。本发明提供的基于多维组合位置行为轨迹链的行为分析方法及装置,通过多维组合定位及集成学习的方式构建基于用户位置行为的三位一体的位置定位模型,并构建基于用户位置的空间大数据库对用户行为进行预测分析,保证了对用户行为真实性及合理性的判别。判别。判别。
技术研发人员:李尧 郭志伟 王楠 陈建宏 陈立峰 徐海勇 陶涛 杨猛 尚晶 陈卓
受保护的技术使用者:中国移动通信集团有限公司
技术研发日:2022.03.25
技术公布日:2023/10/11
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
