一种基于手机信令数据的用户室内外状态判别方法

未命名 09-11 阅读:157 评论:0


1.本发明涉及一种室内外状态判别方法,尤其涉及一种基于手机信令数据的用户室内外状态判别方法。


背景技术:

2.随着城市化进程的加速,越来越多的人们生活在城市中,人们更加依赖于城市公共服务,也对合理的城市规划的需求越来越高。了解人群的室内外状态,以及一天当中人群位于室内外的时间分布,是城市公共服务和城市规划的基础,具有重要意义。
3.目前,常见的一些判别用户室内外状态的方法大都是从移动端的角度去实现的,其基于移动终端的传感器收集数据,然后进行判断。专利文献cn110472644a根据从移动终端收集的gps特征信息进行用户室内外状态的判别;专利文献cn107655564a根据从移动终端的光检测器、地磁检测器、基站信号检测器所收集的光强、磁场强度、蜂窝信号强度数据来进行用户室内外状态的判别;专利文献cn114091542a则是根据从移动终端收集的wifi信号强度与gps模块在可见卫星数,来进行用户室内外状态的判别。
4.然而,上述方法均存在有所使用的数据成本高的问题,而且,无法大范围采集,使得大尺度、全面的判别城市中用户的室内外状态存在困难。


技术实现要素:

5.为了解决上述技术所存在的不足之处,本发明提供了一种基于手机信令数据的用户室内外状态判别方法,降低了所使用数据的获取成本,且能够解决目前无法大尺度的、全面的分析城市中用户室内外状态的问题。
6.为了解决以上技术问题,本发明采用的技术方案是:一种基于手机信令数据的用户室内外状态判别方法,主要包括以下处理步骤:
7.s1、手机信令数据预处理;
8.s2、潜在室内轨迹点识别;
9.s3、潜在室内轨迹点的主连接基站类型识别与信令切换特征提取;
10.s4、宏蜂窝基站服务范围内的建筑物覆盖率与高度提取;
11.s5、判别用户位于潜在室内轨迹点时室内外状态的随机森林模型训练与参数调优;
12.s6、用户的室内外状态判别,并进行时间分布的表征。
13.进一步地,s1中,手机信令数据预处理的具体方法为:剔除所获取的手机信令数据中的错误记录,错误记录包括但不限于数据中的缺失与重复记录。
14.进一步地,s2中,潜在室内轨迹点识别过程为:基于轨迹点之间速度、距离与轨迹点的到访次数识别噪声点,将噪声点与邻近的非噪声点聚合,保留其原本连接的基站经纬度、基站小区编号以及基站类型;在噪声点聚合后,基于各轨迹点的位置提取轨迹序列,根据轨迹序列所包含的轨迹点数量识别潜在室内轨迹点。
15.进一步地,s3中,主连接基站类型识别方法为:根据步骤s2提取出的潜在室内轨迹点序列连接宏微蜂窝的情况,判别序列中潜在室内轨迹点的主连接基站小区类型,将其分为宏蜂窝轨迹点、微蜂窝轨迹点;
16.若潜在室内轨迹点所在的轨迹序列中有一个以上的点原本连接的基站为微蜂窝基站,则该轨迹点的主连接基站类型为微蜂窝,该轨迹点为微蜂窝轨迹点;否则该序列的主连接基站小区类型为宏蜂窝,该轨迹点为宏蜂窝轨迹点。
17.进一步地,s3中,提取的各轨迹点的信令切换特征,包括宏蜂窝基站间切换频率、宏蜂窝基站小区间切换频率、微蜂窝基站间切换频率、微蜂窝基站小区间切换频率、微蜂窝基站占比。
18.进一步地,各个信令切换特征的提取具体方法为:
19.(1)宏蜂窝基站小区间切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的宏蜂窝基站小区之间的切换频率:
[0020][0021]
其中,switch_marcocelli表示第i个潜在室内轨迹点的宏蜂窝基站小区间切换频率,trji表示第i个潜在轨迹点所在的轨迹序列i,n(trji)表示该轨迹序列包含的轨迹点数量,s
marcocell
(trji)表示该轨迹序列中相邻轨迹点连接的宏蜂窝基站小区的变化次数;
[0022]
(2)宏蜂窝基站切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的宏蜂窝基站位置之间的切换频率:
[0023][0024]
其中,switch_marcoi表示第i个潜在室内轨迹点的宏蜂窝基站间切换频率,trji表示第i个潜在轨迹点所在的轨迹序列i,n(trji)表示该轨迹序列包含的轨迹点数量,s
marco
(trji)表示该轨迹序列中相邻轨迹点连接的宏蜂窝基站位置的变化次数;
[0025]
(3)微蜂窝基站小区间切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的微蜂窝基站小区之间的切换频率:
[0026][0027]
其中,switch_smallcelli表示第i个潜在室内轨迹点的微蜂窝基站小区间切换频率,trji表示第i个潜在轨迹点所在的轨迹序列i,n(trji)表示该轨迹序列包含的轨迹点数量,s
smallcell
(trji)表示该轨迹序列中相邻轨迹点连接的微蜂窝基站小区的变化次数;
[0028]
(4)微蜂窝基站间切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的微蜂窝基站之间的切换频率:
[0029][0030]
其中,switch_smalli表示第i个潜在室内轨迹点的微蜂窝基站间切换频率,trji表示第i个潜在轨迹点所在的轨迹序列i,n(trji)表示该轨迹序列包含的轨迹点数量,s
small
(trji)表示该轨迹序列中相邻轨迹点连接的微蜂窝基站位置的变化次数;
[0031]
(5)微蜂窝基站占比:计算潜在室内轨迹点所在的轨迹序列中,连接基站类型为微蜂窝基站轨迹点的数量与所有轨迹点数量之间的比值:
[0032][0033]
其中,switch_smalli表示第i个潜在室内轨迹点的微蜂窝基站占比,trji表示第i个潜在轨迹点所在的轨迹序列i,n(trji)表示该轨迹序列所包含的轨迹点数量,n(trji)
smallcell
表示该轨迹序列中连接微蜂窝基站的轨迹点的数量。
[0034]
进一步地,s4中,宏蜂窝基站服务范围内的建筑物覆盖率与高度提取方法具体有:
[0035]
基于宏蜂窝基站生成泰森多边形,将每一宏蜂窝基站所处的泰森多边形范围作为其服务范围;
[0036]
计算每一宏蜂窝基站服务范围内的建筑物覆盖率与建筑物平均高度;
[0037]
计算结果通过基站小区编号与步骤s3中的宏蜂窝轨迹点进行匹配,作为宏蜂窝轨迹点的基站建筑物特征;微蜂窝轨迹点的基站建筑物特征则不计算。
[0038]
进一步地,s5中,随机森林模型训练与参数调优的具体方法为:利用已有的室内外标签的手机信令数据,通过步骤s1-s2识别的潜在室内轨迹点,通过步骤s3-s4提取潜在室内轨迹点的多种特征,输入到随机森林模型,进行模型的训练,并使用k折验证的方法对模型精度进行评估,进而优化模型参数。
[0039]
进一步地,s6中,用户的室内外状态判别方法为:取任意用户任意时间段的手机信令数据;通过步骤s1-s2识别用户的潜在室内轨迹点,若轨迹点不是潜在室内轨迹点,则该点为室外轨迹点;若轨迹点是潜在室内轨迹点,再通过步骤s3-s4提取主服务基站小区类型、信令切换特征、基站建筑物特征,输入到步骤s5训练好的随机森林模型中,判别其为室外轨迹点或室内轨迹点。
[0040]
本发明公开了一种基于手机信令数据的用户室内外状态判别方法,能够根据一段时间内用户的手机信令数据判断出用户在该时间段内的室内外状态,以及相应状态的持续时间;本发明突破了传统方法适用范围小、数据收集困难的局限,可以大尺度的、全面的判别用户的室内外状态,并分析用户室内外状态的时间分布,有助于合理的建设城市公共服务与开展城市规划。
附图说明
[0041]
图1为本发明的总体流程示意图。
[0042]
图2为潜在室内轨迹点识别示意图。
[0043]
图3为用户的室内外状态判别具体流程示意图。
具体实施方式
[0044]
下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0045]
如图1所示,本发明所公开的基于手机信令数据的用户室内外状态判别方法主要包括以下处理步骤:
[0046]
s1、手机信令数据预处理;
[0047]
s2、潜在室内轨迹点识别;
[0048]
s3、潜在室内轨迹点的主连接基站类型识别与信令切换特征提取;
[0049]
s4、宏蜂窝基站服务范围内的建筑物覆盖率与高度提取;
[0050]
s5、判别用户位于潜在室内轨迹点时室内外状态的随机森林模型训练与参数调优;
[0051]
s6、用户的室内外状态判别,并进行时间分布的表征。
[0052]
对于本发明所公开的基于手机信令数据的用户室内外状态判别方法,能够根据一段时间内用户的手机信令数据判断出用户在该时间段内的室内外状态,以及相应状态的持续时间。
[0053]
下面结合图3所示的用户的室内外状态判别具体流程示意图,对本发明所公开的用户室内外状态判别方法的具体处理过程做详细说明:
[0054]
首先,对使用到的专业术语进行解释,基站与基站小区:在移动通信网络中,基站是一个无线电设备,用于提供无线通信服务;它可以发射和接收无线电波,与用户终端(例如手机)进行通信,从而实现无线语音、数据和视频等通信服务。基站小区是指基站覆盖范围内的一个较小的区域,也称作“蜂窝”。每个基站可以划分成多个小区,每个小区都有一个唯一的标识符,称作小区id。
[0055]
s1、手机信令数据预处理:对获取到的用户的手机信令数据进行预处理,剔除数据中的缺失与重复记录;
[0056]
该步骤的目的是剔除手机信令数据中的错误记录,以提升判别用户室内外状态的准确性。
[0057]
首先,获取用户一天的手机信令数据,其可以表示为:
[0058]
t={(l1,ci1,ci1_type,t1),(l2,ci2,ci2_type,t2),
……
(ln,cin,cin_type,tn)}
[0059]
其中,(ln,cin,tn)表示一个轨迹点,当且仅当用户手机与基站发生交互时,才会产生一个轨迹点;ln表示交互发生时,用户手机连接的基站的经纬度;cin表示用户手机连接的基站小区编号,cin_type表示连接的基站小区类型,tn表示交互发生的时间。
[0060]
然后将手机信令数据中同一时间的重复、字段不全等错误记录进行剔除。
[0061]
s2、潜在室内轨迹点识别:基于轨迹点之间速度、距离与轨迹点的到访次数识别噪声点,将噪声点与邻近的非噪声点聚合,保留其原本连接的基站经纬度、基站小区编号以及基站类型。在噪声点聚合后,基于各轨迹点的位置提取轨迹序列,根据轨迹序列所包含的轨迹点数量识别潜在室内轨迹点。
[0062]
该步骤的目的是基于用户的移动行为,初步对用户的室内外状态进行判别。当用户高速移动时,其手机与附近的基站只会产生一次交互,故只会产生一个轨迹点;当用户移动速度较慢或处于静止时,其手机与附近的基站会产生多次交互,故会产生多个轨迹点。但只有当用户位于室外时,其才能进行高速移动,因此可以通过手机信令数据中用户某位置的轨迹点数量,初步判断用户的室内外状态。
[0063]
为了获取手机信令数据中用户于某位置时的轨迹点,则需要提取手机信令数据中的轨迹序列,而在提取轨迹序列之前,还需要对手机信令数据中的噪声点进行聚合,以提高提取轨迹序列的准确度。本发明中手机信令数据的噪声点聚合是基于轨迹点之间速度、距离与轨迹点的到访次数三个方面依次进行处理的:
的到访频率大于点m3,故m2为噪声序列seq.2_3新的中心点,该序列中的各个点新的基站经纬度为中心点m2的基站经纬度,同时保留各轨迹点的原始基站经纬度、基站小区编号以及基站类型。最后,基于轨迹点的到访次数对噪声点进行聚合:在所有轨迹点中,到访次数最高的点为m4,其到访次数为9次。与m4有关的噪声序列为seq.4和seq.5,其局部放大如图2(e)所示。在这两个噪声序列中,除m4以外的到访次数最高的点为m'4。因此,将m4的基站经纬度赋予m'4,作为其新的基站经纬度。此时,该用户的手机信令数据中不存在噪声点,噪声点聚合完成。然后开始提取轨迹序列,提取结果如图2(f)所示,t.1~t.7为提取出的轨迹序列。轨迹序列t.1、t.4、t.5、t.6、t.7所包含的轨迹点数量均不少于一个,则这些序列中的点均为潜在室内轨迹点;t.2与t.3中的轨迹点则为室外轨迹点。
[0073]
s3、潜在室内轨迹点的主连接基站类型识别与信令切换特征提取:根据步骤s2提取出的潜在室内轨迹点序列连接宏微蜂窝的情况,判别序列中潜在室内轨迹点的主连接基站小区类型,将其分为宏蜂窝轨迹点与微蜂窝轨迹点。再提取各轨迹点的信令切换特征,包括宏蜂窝基站间切换频率、宏蜂窝基站小区间切换频率、微蜂窝基站间切换频率、微蜂窝基站小区间切换频率、微蜂窝基站占比等。
[0074]
该步骤的目的是为了提取潜在室内轨迹点的信令切换特征,为利用随机森林模型判别用户的室内外状态做准备。
[0075]
根据基站的功能,基站可以被分为宏蜂窝基站与微蜂窝基站两类。宏蜂窝基站通常被用于提供广域覆盖的无线通信服务,承担了城市内绝大部分的虚线通信的要求,通常建立在道路附近或者建筑物楼顶;微蜂窝基站是一种小型的无线通信基站,通常被用于提供局部覆盖的无线通信服务,以弥补宏蜂窝基站在某些场景下对用户服务能力不足的问题,其通常被建立在室内或者人口密集的区域中。因此,获取用户连接的基站类型,将有利于对用户室内外状态的判别。
[0076]
对于步骤s2识别出的潜在室内轨迹点,根据该轨迹点所在的轨迹序列中所有轨迹点原本连接的宏蜂窝基站与微蜂窝基站的情况,来判断该轨迹点的主连接基站类型。若潜在室内轨迹点所在的轨迹序列中有一个以上的点原本连接的基站为微蜂窝基站,则该轨迹点的主连接基站类型为微蜂窝,该轨迹点为微蜂窝轨迹点;否则该序列的主连接基站小区类型为宏蜂窝,该轨迹点为宏蜂窝轨迹点。
[0077]
当用户位于室内时,由于建筑物的遮挡,用户的手机通常会长时间、稳定的连接至一个基站或基站小区,而不发生基站或基站小区的切换;而当用户位于室外时,由于环境开阔,没有建筑物的遮挡,用户的手机通常会在多个基站或基站小区之间发生切换。因此,用户位于室内时其信令在基站或基站小区间的切换状态与用户位于室外时其信令在基站或基站小区的切换状态会不一样,进一步提取用户的信令切换特征,也将有利于进行用户室内外状态的判别。
[0078]
进一步提取其中的信令切换特征,包括以下五个方面:
[0079]
(1)宏蜂窝基站小区间切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的宏蜂窝基站小区之间的切换频率:
[0080][0081]
其中,switch_marcocelli表示第i个潜在室内轨迹点的宏蜂窝基站小区间切换频
率,trji表示第i个潜在轨迹点所在的轨迹序列i,n(trji)表示该轨迹序列包含的轨迹点数量,s
marcocell
(trji)表示该轨迹序列中相邻轨迹点连接的宏蜂窝基站小区的变化次数;
[0082]
(2)宏蜂窝基站切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的宏蜂窝基站位置之间的切换频率:
[0083][0084]
其中,switch_marcoi表示第i个潜在室内轨迹点的宏蜂窝基站间切换频率,trji表示第i个潜在轨迹点所在的轨迹序列i,n(trji)表示该轨迹序列包含的轨迹点数量,s
marco
(trji)表示该轨迹序列中相邻轨迹点连接的宏蜂窝基站位置的变化次数;
[0085]
(3)微蜂窝基站小区间切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的微蜂窝基站小区之间的切换频率:
[0086][0087]
其中,switch_smallcelli表示第i个潜在室内轨迹点的微蜂窝基站小区间切换频率,trji表示第i个潜在轨迹点所在的轨迹序列i,n(trji)表示该轨迹序列包含的轨迹点数量,s
smallcell
(trii)表示该轨迹序列中相邻轨迹点连接的微蜂窝基站小区的变化次数;
[0088]
(4)微蜂窝基站间切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的微蜂窝基站之间的切换频率:
[0089][0090]
其中,switch_smalli表示第i个潜在室内轨迹点的微蜂窝基站间切换频率,trji表示第i个潜在轨迹点所在的轨迹序列i,n(trji)表示该轨迹序列包含的轨迹点数量,s
small
(trji)表示该轨迹序列中相邻轨迹点连接的微蜂窝基站位置的变化次数;
[0091]
(5)微蜂窝基站占比:计算潜在室内轨迹点所在的轨迹序列中,连接基站类型为微蜂窝基站轨迹点的数量与所有轨迹点数量之间的比值:
[0092][0093]
其中,switch_smalli表示第i个潜在室内轨迹点的微蜂窝基站占比,trji表示第i个潜在轨迹点所在的轨迹序列i,n(trji)表示该轨迹序列所包含的轨迹点数量,n(trji)
smallcell
表示该轨迹序列中连接微蜂窝基站的轨迹点的数量。
[0094]
若该轨迹点为宏蜂窝轨迹点,则只计算它的宏蜂窝基站小区间切换频率与宏蜂窝基站间切换频率,将该轨迹点的微蜂窝基站小区间切换频率与微蜂窝基站间切换频率的值设为2,微蜂窝基站占比设为0;若该轨迹点为微蜂窝轨迹点,则只计算它的微蜂窝基站小区间切换频率、微蜂窝基站间切换频率以及微蜂窝基站占比,将该轨迹点的宏蜂窝基站小区间切换频率与宏蜂窝基站间切换频率的值设为2。
[0095]
s4、宏蜂窝基站服务范围内的建筑物覆盖率与高度提取:基于宏蜂窝基站生成泰森多边形,将每一宏蜂窝基站所处的泰森多边形范围作为其服务范围。计算每一宏蜂窝基
站服务范围内的建筑物覆盖率与建筑物平均高度。计算结果通过基站小区编号与步骤s3中的宏蜂窝轨迹点进行匹配,作为宏蜂窝轨迹点的基站建筑物特征;微蜂窝轨迹点的基站建筑物特征则不计算。
[0096]
该步骤的目的是为了提取宏蜂窝轨迹点的基站建筑物特征,为下一步利用随机森林模型判别用户的室内外状态做准备。
[0097]
无线电波传播模型认为建筑物的密度和高度都会影响无线传播,当用户位于建筑物密度和高度不同的区域,即使用户的室内外状态一致,其手机连接基站的状态不同,所以信令切换特征也会不同。因此,提取基站周边的建筑物特征,有利于更好的使用信令切换特征对用户室内外状态进行判别。由于微蜂窝基站通常建立在建筑物内部,故其周围的建筑物特征通常表现一致,在建设有微蜂窝基站的不同建筑物内部或者周边时,同一室内外状态的用户手机连接基站的状态不会发生太大的变化。因此,只需提取宏蜂窝基站周边的建筑物特征,以帮助我们对用户的室内外状态进行判别。
[0098]
一般来说,城市中基站的服务范围会使用根据基站位置生成的泰森多边形来确定,每一个基站所处的泰森多边形范围为该基站的服务范围。实际上,微蜂窝基站的服务范围通常只包括其所在的建筑物内部,且微蜂窝基站附近的宏蜂窝基站也能服务到位于该建筑内部的部分用户。所以在生成泰森多边形时,如果将微蜂窝基站与宏蜂窝基站一起考虑,会使得宏蜂窝基站的服务范围存在偏差。因此,只基于宏蜂窝基站的位置生成泰森多边形,将每一个宏蜂窝基站所处的泰森多边形范围作为其服务范围,并重新计算其服务范围内的建筑物特征,包括:(1)建筑物高度:计算每一个宏蜂窝基站服务范围内的建筑物平均高度;(2)建筑物覆盖率:根据每一个宏蜂窝基站服务范围内的建筑物面积,计算宏蜂窝基站的建筑物覆盖率:
[0099][0100]
其中,btsi表示第i个宏蜂窝基站,bci表示第i个宏蜂窝基站服务范围内的建筑物覆盖率,area(btsi)表示该宏蜂窝基站服务范围的面积,area(btsi_building)表示该基站服务范围内的建筑物面积。
[0101]
所有宏蜂窝基站的建筑物覆盖率与高度计算完成后,根据宏蜂窝基站的位置与步骤s3识别出的宏蜂窝轨迹点的基站经纬度,将计算结果与宏蜂窝轨迹点进行匹配。作为其基站建筑物特征。而微蜂窝轨迹点中的建筑物覆盖率与高度的值均设为-1。
[0102]
s5、判别用户位于潜在室内轨迹点时室内外状态的随机森林模型训练与参数调优:利用已有的室内外标签的手机信令数据,通过步骤s1-s2识别的潜在室内轨迹点,通过步骤s3-s4提取潜在室内轨迹点的多种特征,然后输入到随机森林模型,进行模型的训练,并使用k折验证的方法对模型精度进行评估,进而优化模型参数。
[0103]
该步骤的目的是通过带有用户位于室内外标签的手机信令数据,训练随机森林模型,从而实现基于潜在室内轨迹点的多种特征,进行用户的室内外状态判别。
[0104]
对于带有用户位于室内外标签的手机信令数据,通过步骤s1-s2识别出潜在室内轨迹点,通过步骤s3-s4计算潜在室内轨迹点的信令切换特征与基站建筑物特征,构建一个包含n个训练样本的训练数据集:
[0105]
t={(xi,yi)|i=1,2,

,n}
[0106]
其中xi=(x
i1
,x
i2
,

x
in
)为第i个潜在室内轨迹点的输入特征,其中包括该轨迹点的信令切换特征与基站建筑物特征,yi表示用户位于该轨迹点时的室内外状态:(1)室内;(2)室外。将训练数据集输入到随机森林模型中进行训练,随机森林的公式为:
[0107][0108]
其中,rf(x)为最终判别结果,fi(x)为第i棵决策树的判别结果,ntree和mtry为模型参数,分别表示随机森林中决策树的个数和每个决策树随机选择特征的个数。该模型可以随着训练数据集的积累,不断迭代学习和更新,从而提高判别精度。
[0109]
s6、用户的室内外状态判别与时间分布计算:
[0110]
基于上一步训练得到的随机森林模型,便可以对用户位于潜在室内轨迹点时的室内外状态进行判别;
[0111]
获取任意用户任意时间段的手机信令数据,如图3所示,通过给定任一用户的手机信令数据,首先,通过步骤s1进行预处理,然后,通过步骤s2识别该用户手机信令数据中的潜在室内轨迹点,若轨迹点不是潜在室内轨迹点,则该点为室外轨迹点;
[0112]
若轨迹点是潜在室内轨迹点,再通过步骤s3-s4提取出潜在室内轨迹点的主服务基站小区类型、信令切换特征、基站建筑物特征;最后,将特征输入到步骤s5训练好的随机森林模型中,进一步判别其为室外轨迹点或室内轨迹点。
[0113]
最终,对于所有判别结果,根据各轨迹点的时间属性计算用户在一天中位于室内与室外的时间分布。
[0114]
由此可知,对于本发明所公开的基于手机信令数据的用户室内外状态判别方法,利用噪声点来进行用户室内外状态的判断,具体体现在:(1)步骤s2中对噪声点的处理不是传统剔除方式,而是进行聚合;并且聚合噪声点时保留了各轨迹点的原本信息,为后续能够提取潜在室内轨迹点的信令切换特征打下基础;(2)步骤s3中,提取潜在室内轨迹点的信令切换特征,实现利用噪声点来帮助判断用户的室内外状态。本发明在提取潜在室内轨迹点的各种特征前,基于宏蜂窝和微蜂窝对潜在室内轨迹点进行了分类,提高了最终判别结果的准确度。本发明的步骤s4创新性的利用基站服务范围内建筑物特征以辅助判断用户的室内外状态,且在提取基站服务范围时只是基于宏蜂窝基站生成泰森多边形,使提取的宏蜂窝基站服务范围更接近于其真实值。
[0115]
与现有技术相比,其具有以下技术优势:
[0116]
(1)基于低成本且易获取的手机信令数据进行用户室内外状态判别,解决了传统方法获取数据困难的问题;
[0117]
(2)手机信令数据能够记录城市中极大部分人每天的轨迹点,利用手机信令数据进行用户的室内外状态判别,提供了大尺度的、全面的研究用户室内外状态的方法,解决了传统方法只能针对少部分人群进行分析的问题;
[0118]
(3)本发明的模型具有较高的灵活性,可以随着数据样本的积累不断进行训练学习、参数调优,从而不断提高判别精度。
[0119]
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。

技术特征:
1.一种基于手机信令数据的用户室内外状态判别方法,其特征在于:主要包括以下处理步骤:s1、手机信令数据预处理;s2、潜在室内轨迹点识别;s3、潜在室内轨迹点的主连接基站类型识别与信令切换特征提取;s4、宏蜂窝基站服务范围内的建筑物覆盖率与高度提取;s5、判别用户位于潜在室内轨迹点时室内外状态的随机森林模型训练与参数调优;s6、用户的室内外状态判别,并进行时间分布的表征。2.根据权利要求1所述的基于手机信令数据的用户室内外状态判别方法,其特征在于:s1中,手机信令数据预处理的具体方法为:剔除所获取的手机信令数据中的错误记录,错误记录包括但不限于数据中的缺失与重复记录。3.根据权利要求1所述的基于手机信令数据的用户室内外状态判别方法,其特征在于:s2中,潜在室内轨迹点识别过程为:基于轨迹点之间速度、距离与轨迹点的到访次数识别噪声点,将噪声点与邻近的非噪声点聚合,保留其原本连接的基站经纬度、基站小区编号以及基站类型;在噪声点聚合后,基于各轨迹点的位置提取轨迹序列,根据轨迹序列所包含的轨迹点数量识别潜在室内轨迹点。4.根据权利要求1所述的基于手机信令数据的用户室内外状态判别方法,其特征在于:s3中,主连接基站类型识别方法为:根据步骤s2提取出的潜在室内轨迹点序列连接宏微蜂窝的情况,判别序列中潜在室内轨迹点的主连接基站小区类型,将其分为宏蜂窝轨迹点、微蜂窝轨迹点;若潜在室内轨迹点所在的轨迹序列中有一个以上的点原本连接的基站为微蜂窝基站,则该轨迹点的主连接基站类型为微蜂窝,该轨迹点为微蜂窝轨迹点;否则该序列的主连接基站小区类型为宏蜂窝,该轨迹点为宏蜂窝轨迹点。5.根据权利要求4所述的基于手机信令数据的用户室内外状态判别方法,其特征在于:s3中,提取的各轨迹点的信令切换特征,包括宏蜂窝基站间切换频率、宏蜂窝基站小区间切换频率、微蜂窝基站间切换频率、微蜂窝基站小区间切换频率、微蜂窝基站占比。6.根据权利要求5所述的基于手机信令数据的用户室内外状态判别方法,其特征在于:各个信令切换特征的提取具体方法为:(1)宏蜂窝基站小区间切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的宏蜂窝基站小区之间的切换频率:其中,switch_marcocell
i
表示第i个潜在室内轨迹点的宏蜂窝基站小区间切换频率,trj
i
表示第i个潜在轨迹点所在的轨迹序列i,n(trj
i
)表示该轨迹序列包含的轨迹点数量,s
marcocell
(trj
i
)表示该轨迹序列中相邻轨迹点连接的宏蜂窝基站小区的变化次数;(2)宏蜂窝基站切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的宏蜂窝基站位置之间的切换频率:
其中,switch_marco
i
表示第i个潜在室内轨迹点的宏蜂窝基站间切换频率,trj
i
表示第i个潜在轨迹点所在的轨迹序列i,n(trj
i
)表示该轨迹序列包含的轨迹点数量,s
marco
(trj
i
)表示该轨迹序列中相邻轨迹点连接的宏蜂窝基站位置的变化次数;(3)微蜂窝基站小区间切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的微蜂窝基站小区之间的切换频率:其中,switch_smallcell
i
表示第i个潜在室内轨迹点的微蜂窝基站小区间切换频率,trj
i
表示第i个潜在轨迹点所在的轨迹序列i,n(trj
i
)表示该轨迹序列包含的轨迹点数量,s
smallcell
(trj
i
)表示该轨迹序列中相邻轨迹点连接的微蜂窝基站小区的变化次数;(4)微蜂窝基站间切换频率:计算潜在室内轨迹点所在的轨迹序列中,各轨迹点连接的微蜂窝基站之间的切换频率:其中,switch_small
i
表示第i个潜在室内轨迹点的微蜂窝基站间切换频率,trj
i
表示第i个潜在轨迹点所在的轨迹序列i,n(trj
i
)表示该轨迹序列包含的轨迹点数量,s
mall
(trj
i
)表示该轨迹序列中相邻轨迹点连接的微蜂窝基站位置的变化次数;(5)微蜂窝基站占比:计算潜在室内轨迹点所在的轨迹序列中,连接基站类型为微蜂窝基站轨迹点的数量与所有轨迹点数量之间的比值:其中,switch_small
i
表示第i个潜在室内轨迹点的微蜂窝基站占比,trj
i
表示第i个潜在轨迹点所在的轨迹序列i,n(trj
i
)表示该轨迹序列所包含的轨迹点数量,n(trj
i
)
smallcell
表示该轨迹序列中连接微蜂窝基站的轨迹点的数量。7.根据权利要求1所述的基于手机信令数据的用户室内外状态判别方法,其特征在于:s4中,宏蜂窝基站服务范围内的建筑物覆盖率与高度提取方法具体有:基于宏蜂窝基站生成泰森多边形,将每一宏蜂窝基站所处的泰森多边形范围作为其服务范围;计算每一宏蜂窝基站服务范围内的建筑物覆盖率与建筑物平均高度;计算结果通过基站小区编号与步骤s3中的宏蜂窝轨迹点进行匹配,作为宏蜂窝轨迹点的基站建筑物特征;微蜂窝轨迹点的基站建筑物特征则不计算。8.根据权利要求1所述的基于手机信令数据的用户室内外状态判别方法,其特征在于:s5中,随机森林模型训练与参数调优的具体方法为:利用已有的室内外标签的手机信令数据,通过步骤s1-s2识别的潜在室内轨迹点,通过步骤s3-s4提取潜在室内轨迹点的多种特征,输入到随机森林模型,进行模型的训练,并使用k折验证的方法对模型精度进行评估,进
而优化模型参数。9.根据权利要求1所述的基于手机信令数据的用户室内外状态判别方法,其特征在于:s6中,用户的室内外状态判别方法为:取任意用户任意时间段的手机信令数据;通过步骤s1-s2识别用户的潜在室内轨迹点,若轨迹点不是潜在室内轨迹点,则该点为室外轨迹点;若轨迹点是潜在室内轨迹点,再通过步骤s3-s4提取主服务基站小区类型、信令切换特征、基站建筑物特征,输入到步骤s5训练好的随机森林模型中,判别其为室外轨迹点或室内轨迹点。

技术总结
本发明公开了一种基于手机信令数据的用户室内外状态判别方法,包括以下步骤:手机信令数据预处理;潜在室内轨迹点识别;潜在室内轨迹点的主连接基站类型识别与信令切换特征提取;宏蜂窝基站服务范围内的建筑物覆盖率与高度提取;判别用户位于潜在室内轨迹点时室内外状态的随机森林模型训练与参数调优;用户的室内外状态判别,并进行时间分布的表征。本发明根据用户的手机信令数据判断出用户在一段时间内的室内外状态,以及相应状态的持续时间,突破了传统方法适用范围小、数据收集困难的局限,可以大尺度的、全面的判别用户的室内外状态,并分析用户室内外状态的时间分布,有助于合理的建设城市公共服务与开展城市规划。助于合理的建设城市公共服务与开展城市规划。助于合理的建设城市公共服务与开展城市规划。


技术研发人员:裴韬 蒋林峰 宋辞
受保护的技术使用者:中国科学院地理科学与资源研究所
技术研发日:2023.07.13
技术公布日:2023/9/9
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐