基于时序与时隙的用户行为模式挖掘方法及系统

未命名 08-12 阅读:119 评论:0


1.本发明涉及用户行为分析技术领域,特别是涉及基于时序与时隙的用户行为模式挖掘方法及系统。


背景技术:

2.随着科技的飞速发展,人们对生活质量也有着更高的要求,追求健康化、智能化的生活方式。越来越多的用户使用智能手环、智能家居等设备监测日常起居的行为日志,从日常起居日志找到日常行为频繁模式,发现用户的生活习惯和生活规律,评估生活健康状态。因此从日常起居日志挖掘用户的日常行为频繁模式是尤为重要的。通常日常起居日志包括用户每天的行为及行为发生所对应的时间,而传统的挖掘算法仅考虑了用户行为上的关联性,挖掘出的频繁模式难以对用户的行为习惯和生活规律实现精确表征。基于时序与时隙的行为表征形式构建策略在进行数据分析和挖掘的时候不仅仅关注行为上的相关性,还考虑了行为先后顺序与其间的时间间隔这两个重要因素,最终挖掘出的频繁模式可以表征出用户生活习惯的时序性及其间的时间间隔,实现最大程度的挖掘用户日常起居日志中有价值有意义的信息,更好的表征用户行为习惯及生活规律。
3.频繁模式挖掘是进行用户行为分析的核心问题。频繁模式就是在样本数据集中频繁出现的模式,“模式”是一个较为抽象的概念词语,例如,在某段时间内的日常起居日志中,记录了每天内对应时间的行为日志,每一条记录信息包括了行为发生的时间以及对应的行为。如果经过了对这些数据的分析和挖掘,发现吃晚餐和看电视这两个行为总是相继在一天内的记录中出现,而且频率达到规定阈值。那么吃晚餐和看电视这两个行为同时出现在同一天的记录中就叫做一种频繁模式,这样的数据挖掘算法就叫做频繁模式挖掘。常用的频繁模式挖掘算法有apriori、prefixspan等。
4.apriori算法是数据挖掘中的经典算法,其核心是通过重复遍历数据库找出候选项集并通过支持度筛选出频繁项集,以迭代的方式挖掘频繁模式。apriori算法虽然可以从大量的日常起居日志中挖掘出用户行为间的相关性,但无法发现行为间的时序性及其间的时间间隔信息。
5.prefixspan算法的全称是prefix-projected pattern growth,即前缀投影的模式挖掘。其算法核心采用分治的思想,不断产生序列数据库的多个更小的投影数据库,然后在各个投影数据库上进行序列模式挖掘。prefixspan算法在用户日常行为日志中不仅可以挖掘出用户行为的相关性还可以进一步挖掘这些行为的时序性信息,但依然忽略了日常起居日志中较为重要的时间因素。
6.现有的频繁模式挖掘算法例如apriori、prefixspan等算法仅考虑了行为关联度或时序上的挖掘,均未从行为因素和时间因素两方面综合考虑行为间的时序性及其时间间隔信息。用户的生活习惯、生活规律源于日常起居日志,而日常起居日志通常由行为及其对应时间两个元素组成,单从行为相关性或时序性角度很难发现包含丰富信息且有意义的生活规律。因此如何从行为因素和时间因素两方面综合考虑行为间的时序性及其时间间隔信
息,从用户日常起居日志挖掘出有意义的频繁行为模式,并表征用户生活习惯和生活规律是有待解决的问题。


技术实现要素:

7.有鉴于此,本发明提出基于时序与时隙的用户行为模式挖掘方法,解决了传统频繁模式挖掘技术在用户行为模式挖掘上仅能挖掘出包含行为信息的频繁模式,而忽略了时间信息的问题,以实现从大量日常起居日志挖掘频繁出现的包含时间信息和行为信息的模式,并以此表征用户的生活习惯及生活规律。
8.为此,本发明提供了以下技术方案:
9.本发明提供了一种基于时序与时隙的用户行为模式挖掘方法,所述方法包括:
10.基于用户行为序列构建包含时间间隔的后缀数据库,在建立所述后缀数据库时引入时间因素,将前缀与下一项集之间的一段时间间隔加入到与前缀相对应的每条后缀当中;
11.基于所述后缀数据库,在确定时间间隔内允许频繁模式中的行为有顺序上的模糊,综合考虑行为间的时序性及其时间间隔信息,挖掘用户行为频繁模式;
12.以基于时序与时隙的频繁模式表征用户的生活习惯和生活规律。
13.进一步地,综合考虑行为间的时序性及其时间间隔信息,挖掘用户行为频繁模式,包括:
14.s1、扫描用户日常起居日志数据库获取候选项集,根据所设置的支持度从候选项集中筛选频繁项集作为频繁k-序列集,k表示序列集中序列长度;
15.s2、以频繁1-序列集中每条频繁1-序列为前缀,通过包含时间间隔的后缀数据库建立每个频繁1-序列各自对应的包含时间间隔的后缀数据库;
16.s3、扫描上述构造好的包含时间间隔的后缀数据库,根据所设置的支持度筛选频繁项集作为当前频繁序列的后缀,与其对应前缀进行连接操作,形成频繁k+1-序列集;
17.s4、以新的频繁k+1-序列集中的每条频繁k+1-序列为前缀,通过包含时间间隔的后缀数据库建立每个频繁k+1-序列各自对应的包含时间间隔的后缀数据库;
18.重复上述s3和s4,不断递归进行挖掘,直到获得日常起居日志数据库中所有的频繁序列模式为止。
19.进一步地,构建包含时间间隔的后缀数据库,包括:
20.从日常起居日志获取所述用户行为序列对应的开始时间序列,表示如下所示:
21.s
t
={t1,t2,...tn};
22.其中,ti表示sa中第i个用户行为对应的开始时间,n表示sa中共有n个用户行为;sa={a1,a2,...an},ai∈{a,z};sa表示用户行为序列,每个小写字母代表一种用户行为,相同的用户行为用相同的字母表示,n表示sa中共包含n个用户行为;
23.根据用户行为序列sa和对应的时间序列s
t
构造三元组序列,分别存储用户行为、对应时间、相邻行为的时间间隔,表示如下所示:
24.si={(a2,t2,i2),(a3,t3,i3)...(an,tn,in)};
25.其中,ii=t
i-t
i-1
,n表示si中共有n-1个三元组元素;
26.根据三元组序列获取以第i个元组为前缀的后缀序列,表示如下所示:
27.s
′i={(a
i+1
,t
i+1
,i
i+1
),(a
i+2
,t
i+2
,i
i+2
),...(an,tn,in)};
28.其中,n表示s
′i中共有n-i个元素;
29.根据后缀序列获取以元组(ai,ti,ii)为前缀的时间间隔后缀数据库,表示如下:
30.database={d1,d2,...dm};
31.其中,dk表示以元组(ai,ti,ii)为前缀的第k条后缀序列s
′i,m表示以元组(ai,ti,ii)为前缀的时间间隔后缀数据库共包含m条后缀序列。
32.进一步地,以基于时序与时隙的频繁模式表征用户的生活习惯和生活规律,包括:
33.基于时序与时隙的频繁模式序列集中的每条行为与时间交替的序列表示用户的一种行为频繁模式,表示如下:
34.s={a1,i1,a2,i2,

,a
n-1
,i
n-1
,an};
35.其中,ai取为a-z中的某个字母,表示用户某一行为;ii取值为非负整数,表示ai和a
i+1
这两个用户行为之间的间隔时间;以这样一条基于时序和时隙的频繁模式序列,表征用户的一种生活习惯和生活规律。
36.本发明还提供了一种基于时序与时隙的用户行为模式挖掘系统,所述系统包括:
37.用户行为序列单元,将每天日常起居日志中的用户行为信息按先后顺序排成序列,获得用户行为序列;
38.后缀数据库建立单元,基于所述用户行为序列单元获得的用户行为序列构建包含时间间隔的后缀数据库,在建立所述后缀数据库时引入时间因素,将前缀与下一项集之间的一段时间间隔加入到与前缀相对应的每条后缀当中;
39.频繁模式挖掘单元,基于所述后缀数据库建立单元建立的后缀数据库,在确定时间间隔内允许频繁模式中的行为有顺序上的模糊,综合考虑行为间的时序性及其时间间隔信息,挖掘用户行为频繁模式;
40.用户行为模式表征单元,以所述频繁模式挖掘单元得到的基于时序与时隙的频繁模式表征用户的生活习惯和生活规律。
41.本发明的优点和积极效果:本发明在建立后缀数据库时引入时间因素,将前缀与下一项集之间的一段时间间隔加入到与前缀相对应的每条后缀当中,构建包含时间间隔的拓展后缀数据库,同时将这一段时间定义为时隙。本发明在挖掘频繁模式时构建了包含时间间隔的后缀数据库,以基于时序与时隙信息的频繁模式表征用户的生活习惯和生活规律,并且允许频繁模式中的行为在确定时间间隔内有顺序上的模糊,符日常起居日志的实际情况。基于时序与时隙的用户表征形式构建策略从行为因素和时间因素两方面综合考虑行为间的时序性及其时间间隔信息,从用户日常起居日志挖掘出有意义的频繁行为模式,并表征用户生活习惯和生活规律。
附图说明
42.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
43.图1为本发明实施例中基于时序与时隙的用户行为模式挖掘方法的流程图;
44.图2为本发明实施例中基于日常起居日志的用户行为模式挖掘方法的流程图;
45.图3为本发明实施例中时间间隔后缀数据库的构建方法的流程图。
具体实施方式
46.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
47.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
48.本发明提出基于时序与时隙的用户行为模式挖掘方法,在建立后缀数据库时引入时间因素,将前缀与下一项集之间的一段时间间隔加入到与前缀相对应的每条后缀当中,构建包含时间间隔的后缀数据库;在确定时间间隔内允许频繁模式中的行为有顺序上的模糊,综合考虑行为间的时序性及其时间间隔信息,挖掘用户行为频繁模式;以基于时序与时隙的频繁模式表征用户的生活习惯和生活规律。
49.如图1所示,本发明提出一种基于时序与时隙的行为表征形式及其构建策略包括构造用户行为数据库、获得频繁项集并生成新的频繁序列、构造时间间隔后缀数据库三个主要阶段。
50.下面以具体实例对基于日常起居日志的用户行为模式挖掘方法进行详细说明。
51.数据集说明如下:
52.日常起居日志数据集共包含21天的用户起居日志;
53.时间上,每天从0:00开始到24:00结束;
54.行为上,共包括十种日常行为标签,分别是:leaving,toileting,showering,sleeping,breakfast,lunch,dinner,snack,spare_time/tv,grooming。
55.任务:通过构造时间间隔后缀数据库,挖掘包含时序与时隙的用户行为频繁模式,表征用户生活习惯和生活规律。
56.本发明在建立投影数据库时引入时间因素,构建包含时间间隔的后缀数据库,综合考虑行为因素和时间因素来挖掘频繁模式,发现包含时序与时隙的用户行为频繁模式,表征用户生活习惯和生活规律,整个方法流程如图2所示,图2中min_sup为设置的支持度阈值,取值为不大于1的非负数,表示用户行为模式的发生频率超过min_sup时即为频繁行为模式;t为设置的时间间隔数值,表示在t时长内允许存在用户行为顺序上的模糊;itemset表示新生成的频繁项集。在本实施例中min_sup设置为0.4,t设置为1。
57.综合考虑行为间的时序性及其时间间隔信息的用户行为频繁模式挖掘方法如下:
58.s1、扫描用户日常起居日志数据库获取候选项集,根据所设置的支持度从候选项集中筛选频繁项集作为频繁k-序列集,k表示序列集中序列长度,具体地说就是序列中包含的用户行为数,此时k值为1;
59.s2、以频繁1-序列集中每条频繁1-序列为前缀,通过包含时间间隔的后缀数据库建立每个频繁1-序列各自对应的包含时间间隔的后缀数据库;
60.s3、扫描上述构造好的包含时间间隔的后缀数据库,根据所设置的支持度筛选频繁项集作为当前频繁序列的后缀,与其对应前缀进行连接操作,形成频繁(k+1)序列集;
61.s4、以新的频繁(k+1)-序列集中的每条频繁(k+1)-序列为前缀,通过包含时间间隔的后缀数据库建立每个频繁(k+1)-序列各自对应的包含时间间隔的后缀数据库;
62.重复上述s3和s4,不断递归进行挖掘,直到获得日常起居日志数据库中所有的频繁序列模式为止。
63.上述基于日常起居日志的时间因素和行为因素挖掘的部分用户生活习惯如表1所示,表1中,小写字母a-j分别表示以下十种行为活动:leaving,toileting,showering,sleeping,breakfast,lunch,dinner,snack,spare_time/tv,grooming;ik表示时间间隔在k到k+1小时之间。
64.表1
[0065][0066]
表1的结果展示了基于日常起居日志的时间因素和行为因素挖掘的部分用户行为模式。例如,序号5序列表示用户21天里有10天存在如下生活习惯:睡觉后8-9个小时起床吃早饭,间隔5-6个小时吃午饭,再次间隔5-6个小时吃晚饭。从序号5序列可知该用户通常睡眠时间为8-9个小时,并且三餐较为规律,有着比较健康的生活状态。例如,序号1序列表示用户21天里有17天存在如下生活习惯:休闲娱乐0-1小时后做一些美容护肤,间隔0-1小时去睡觉。从序号1序列可知该用户经常在睡觉前有一些休闲娱乐以及美容护肤的活动,这样的结果使智能家居系统更加了解用户的生活习惯,从而提供更智能化的服务。
[0067]
本发明建立后缀数据库时引入时间因素,如图3所示,时间间隔后缀数据库的构建方法如下:
[0068]
将每天日常起居日志中的用户行为信息按先后顺序排成序列,获得用户行为序列,表示如下所示:
[0069]
sa={a1,a2,...an},ai∈{a,z};
[0070]
其中,每个小写字母代表一种用户行为,相同的用户行为用相同的字母表示,n表示sa中共包含n个用户行为;
[0071]
从日常起居日志获取所述用户行为序列对应的开始时间序列,表示如下所示:
[0072]st
={t1,t2,...tn};
[0073]
其中,ti表示sa中第i个用户行为对应的开始时间,n表示sa中共有n个用户行为;
[0074]
根据用户行为序列sa和对应的时间序列s
t
构造三元组序列,分别存储用户行为、对应时间、相邻行为的时间间隔,表示如下所示:
[0075]
si={(a2,t2,i2),(a3,t3,i3)...(an,tn,in)};
[0076]
其中,ii=t
i-t
i-1
,n表示si中共有n-1个三元组元素。
[0077]
根据三元组序列获取以第i个元组为前缀的后缀序列,表示如下所示:
[0078]s′i={(a
i+1
,t
i+1
,i
i+1
),(a
i+2
,t
i+2
,i
i+2
),...(an,tn,in)};
[0079]
其中,n表示s
′i中共有n-i个元素;
[0080]
根据后缀序列获取以元组(ai,ti,ii)为前缀的时间间隔后缀数据库,表示如下:
[0081]
database={d1,d2,...dm};
[0082]
其中,dk表示以元组(ai,ti,ii)为前缀的第k条后缀序列s
′i,m表示以元组(ai,ti,ii)为前缀的时间间隔后缀数据库共包含m条后缀序列。
[0083]
基于时序与时隙的频繁模式表征用户的生活习惯和生活规律方法如下:
[0084]
经上述用户行为频繁模式挖掘后可以获得行为与时间间隔交替构成的频繁模式序列集,其中的每条行为与时间交替的序列就表示了用户的一种行为频繁模式,具体表示如下:
[0085]
s={a1,i1,a2,i2,

,a
n-1
,i
n-1
,an};
[0086]
其中,ai取为a-z中的某个字母,表示用户某一行为;ii取值为非负整数,表示ai和a
i+1
这两个用户行为之间的间隔时间;以这样一条基于时序和时隙的频繁模式序列,表征用户的一种生活习惯和生活规律。
[0087]
上述实施例中,利用公开数据集进行了基于日常起居日志的用户行为模式挖掘,综合考虑行为间的时序性及其时间间隔信息,将行为之间的时间间隔作为特征元素加入到每条后缀中,构建包含时间间隔的后缀数据库,挖掘基于时序和时隙的频繁模式,表征用户生活习惯和生活规律,比传统的频繁模式挖掘算法更丰富更有实际意义。
[0088]
对应于上述实施例中的基于时序与时隙的用户行为模式挖掘方法,本发明还提供了一种基于时序与时隙的用户行为模式挖掘系统,该系统包括:
[0089]
用户行为序列单元,将每天日常起居日志中的用户行为信息按先后顺序排成序列,获得用户行为序列;
[0090]
后缀数据库建立单元,基于所述用户行为序列单元获得的用户行为序列构建包含时间间隔的后缀数据库,在建立所述后缀数据库时引入时间因素,将前缀与下一项集之间的一段时间间隔加入到与前缀相对应的每条后缀当中;
[0091]
频繁模式挖掘单元,基于所述后缀数据库建立单元建立的后缀数据库,在确定时间间隔内允许频繁模式中的行为有顺序上的模糊,综合考虑行为间的时序性及其时间间隔信息,挖掘用户行为频繁模式;
[0092]
用户行为模式表征单元,以所述频繁模式挖掘单元得到的基于时序与时隙的频繁模式表征用户的生活习惯和生活规律。
[0093]
对于本发明实施例的一种基于时序与时隙的用户行为模式挖掘系统而言,由于其与上面实施例中的一种基于时序与时隙的用户行为模式挖掘方法相对应,所以描述的比较简单,相关相似之处请参见上面实施例中一种基于时序与时隙的用户行为模式挖掘方法部分的说明即可,此处不再详述。
[0094]
在本发明所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0095]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0096]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0097]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0098]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

技术特征:
1.一种基于时序与时隙的用户行为模式挖掘方法,其特征在于,所述方法包括:基于用户行为序列构建包含时间间隔的后缀数据库,在建立所述后缀数据库时引入时间因素,将前缀与下一项集之间的一段时间间隔加入到与前缀相对应的每条后缀当中;基于所述后缀数据库,在确定时间间隔内允许频繁模式中的行为有顺序上的模糊,综合考虑行为间的时序性及其时间间隔信息,挖掘用户行为频繁模式;以基于时序与时隙的频繁模式表征用户的生活习惯和生活规律。2.根据权利要求1所述的一种基于时序与时隙的用户行为模式挖掘方法,其特征在于,综合考虑行为间的时序性及其时间间隔信息,挖掘用户行为频繁模式,包括:s1、扫描用户日常起居日志数据库获取候选项集,根据所设置的支持度从候选项集中筛选频繁项集作为频繁k-序列集,k表示序列集中序列长度;s2、以频繁1-序列集中每条频繁1-序列为前缀,通过包含时间间隔的后缀数据库建立每个频繁1-序列各自对应的包含时间间隔的后缀数据库;s3、扫描上述构造好的包含时间间隔的后缀数据库,根据所设置的支持度筛选频繁项集作为当前频繁序列的后缀,与其对应前缀进行连接操作,形成频繁k+1-序列集;s4、以新的频繁k+1-序列集中的每条频繁k+1-序列为前缀,通过包含时间间隔的后缀数据库建立每个频繁k+1-序列各自对应的包含时间间隔的后缀数据库;重复上述s3和s4,不断递归进行挖掘,直到获得日常起居日志数据库中所有的频繁序列模式为止。3.根据权利要求1所述的一种基于时序与时隙的用户行为模式挖掘方法,其特征在于,构建包含时间间隔的后缀数据库,包括:从日常起居日志获取所述用户行为序列对应的开始时间序列,表示如下所示:s
t
={t1,t2,...t
n
};其中,t
i
表示s
a
中第i个用户行为对应的开始时间,n表示s
a
中共有n个用户行为;s
a
={a1,a2,...a
n
},a
i
∈{a,z};s
a
表示用户行为序列,每个小写字母代表一种用户行为,相同的用户行为用相同的字母表示,n表示s
a
中共包含
n
个用户行为;根据用户行为序列s
a
和对应的时间序列s
t
构造三元组序列,分别存储用户行为、对应时间、相邻行为的时间间隔,表示如下所示:s
i
={(a2,t2,i2),(a3,t3,i3)

(a
n
,t
n
,i
n
)};其中,i
i
=t
i-t
i-1
,n表示s
i
中共有n-1个三元组元素;根据三元组序列获取以第i个元组为前缀的后缀序列,表示如下所示:s

i
={(a
i+1
,t
i+1
,i
i+1
),(a
i+2
,t
i+2
,i
i+2
),

(a
n
,t
n
,i
n
)};其中,n表示s

i
中共有n-i个元素;根据后缀序列获取以元组(a
i
,t
i
,i
i
)为前缀的时间间隔后缀数据库,表示如下:database={d1,d2,...d
m
};其中,d
k
表示以元组(a
i
,t
i
,i
i
)为前缀的第k条后缀序列s

i
,m表示以元组(a
i
,t
i
,i
i
)为前缀的时间间隔后缀数据库共包含m条后缀序列。4.根据权利要求3所述的一种基于时序与时隙的用户行为模式挖掘方法,其特征在于,以基于时序与时隙的频繁模式表征用户的生活习惯和生活规律,包括:基于时序与时隙的频繁模式序列集中的每条行为与时间交替的序列表示用户的一种
行为频繁模式,表示如下:s={a1,i1,a2,i2,

,a
n-1
,i
n-1
,a
n
};其中,a
i
取为a-z中的某个字母,表示用户某一行为;i
i
取值为非负整数,表示a
i
和a
i+1
这两个用户行为之间的间隔时间;以这样一条基于时序和时隙的频繁模式序列,表征用户的一种生活习惯和生活规律。5.一种基于时序与时隙的用户行为模式挖掘系统,其特征在于,所述系统包括:用户行为序列单元,将每天日常起居日志中的用户行为信息按先后顺序排成序列,获得用户行为序列;后缀数据库建立单元,基于所述用户行为序列单元获得的用户行为序列构建包含时间间隔的后缀数据库,在建立所述后缀数据库时引入时间因素,将前缀与下一项集之间的一段时间间隔加入到与前缀相对应的每条后缀当中;频繁模式挖掘单元,基于所述后缀数据库建立单元建立的后缀数据库,在确定时间间隔内允许频繁模式中的行为有顺序上的模糊,综合考虑行为间的时序性及其时间间隔信息,挖掘用户行为频繁模式;用户行为模式表征单元,以所述频繁模式挖掘单元得到的基于时序与时隙的频繁模式表征用户的生活习惯和生活规律。

技术总结
本发明提供了基于时序与时隙的用户行为模式挖掘方法及系统,涉及用户行为模式挖掘技术领域,该方法包括:将每天日常起居日志中的用户行为信息按先后顺序排成序列,获得用户行为序列;基于所述用户行为序列构建包含时间间隔的后缀数据库,在建立所述后缀数据库时引入时间因素,将前缀与下一项集之间的一段时间间隔加入到与前缀相对应的每条后缀当中;在确定时间间隔内允许频繁模式中的行为有顺序上的模糊,综合考虑行为间的时序性及其时间间隔信息,挖掘用户行为频繁模式;以基于时序与时隙的频繁模式表征用户的生活习惯和生活规律。的频繁模式表征用户的生活习惯和生活规律。的频繁模式表征用户的生活习惯和生活规律。


技术研发人员:王洁 谭雨晴 高庆华
受保护的技术使用者:大连海事大学
技术研发日:2023.05.19
技术公布日:2023/8/9
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐