中国科学技术大学学报 ›› 2018, Vol. 48 ›› Issue (1): 57-64.DOI: 10.3969/j.issn.0253-2778.2018.01.008

• 论著 • 上一篇    下一篇

一种用户频繁移动模式并行挖掘算法

朱一波,鲍培明,吉根林   

  1. 南京师范大学计算机科学与技术学院,江苏南京 210046
  • 收稿日期:2017-05-20 修回日期:2017-06-23 出版日期:2018-01-01 发布日期:2018-01-01
  • 通讯作者: 鲍培明
  • 作者简介:朱一波,男,1994年生,硕士生.研究方向:数据挖掘及其应用. E-mail: zyb0619@163.com
  • 基金资助:
    国家自然科学基金(41471371)资助.

A parallel algorithm for mining user frequent moving patterns

ZHU Yibo, BAO Peiming, JI Genling   

  1. College of Computer Science and Technology, Nanjing Normal University, Nanjing 210046, China)
  • Received:2017-05-20 Revised:2017-06-23 Online:2018-01-01 Published:2018-01-01

摘要: 针对用户的日常移动轨迹进行挖掘,可以有效地发现隐藏在用户生活中频繁出现的移动规律,即用户频繁移动模式,提出了一种基于PrefixSpan算法的用户频繁移动模式并行挖掘算法PASFORM.该算法利用了新的剪枝策略,缩小了搜索空间;引入了时间约束,挖掘出的频繁移动模式带有时间属性;使用前缀树存储频繁移动模式,缩小了存储空间;采用了并行化方法,适用于海量时空数据的挖掘.实验结果表明,该方法能够快速有效地挖掘出用户频繁移动模式.

关键词: 频繁移动模式挖掘, 序列模式挖掘, 前缀树, 并行化

Abstract: Through daily moving trajectories, one can effectively find the frequent moving rules, i.e., user frequent moving patterns. Based on PrefixSpan algorithm, a parallel algorithm named PASFORM is presented for mining user frequent moving patterns. PASFORM uses a new pruning strategy to reduce the search space and several time constraints to make mining results time-tagged. It also employs the parallel method to mine mass data and a prefix tree to save the store space. Experimental results show that PASFORM is effective and efficient.

Key words: frequent moving pattern mining, sequential pattern mining, prefix tree, parallelization

中图分类号: