随着移动设备的发展,最新一代的移动设备允许用户连接到地理社交网络服务中,让用户分享他们在访问特定地点时的亲身体验。用户分享的位置隐私数据常常被用于分析、统计和挖掘。这些有价值的隐私数据受到互联网等领域研究者的关注,特别是在位置推荐领域。然而,当前面临的挑战是如何保护用户的位置数据的同时保证位置推荐的准确度。直接向不可信推荐系统发布用户历史访问位置会导致严重的位置隐私泄露问题。
用户签到的历史位置可以揭示个人出行或生活方式等敏感细节。目前,位置推荐算法有协同过滤技术[1]、序列技术[2]等。协同过滤技术也可与其他信息相结合[3],例如用户与社交朋友地理坐标之间的联系。由于社交朋友更容易分享共同的兴趣,因此社交链接信息被广泛用于测量用户之间的相似性,结合协同过滤技术可以提高位置推荐的精度。目前研究工作从用户的签到位置序列中提取序列模式,利用全局或个人马尔可夫模型分别挖掘用户运动的全局行为和个体模式信息,并根据过去的位置序列预测用户可能感兴趣的位置。而
				
现有的几种技术部分解决了位置隐私泄露问题。第一种位置隐私保护方法是
				
针对位置推荐中隐私保护的问题,本文提出基于自适应权重的
				
近年来,研究者对位置推荐算法进行了大量研究。基于协同过滤的思想,Noulas等[11]通过提取用户信息中地理位置的类型、时间戳、用户移动方向等特征结合监督学习模型向用户推荐下一时刻可能感兴趣的地点。文献[12]通过考虑地理和时间属性对用户访问下一地点的影响,提出一种混合的矩阵分解方法,以实现受欢迎地点的推荐。Lu等[13]揭示了用户对地点访问的决策依赖于多个因素,因此设计了一个综合考虑各种因素的推荐结果的地点推荐框架。这些方法主要分析用户与地理位置之间的关系,缺乏对语义信息以及用户本身偏好的考虑。
在为用户提供推荐服务的同时,可能会出现用户隐私泄露的情况。因此,位置推荐系统需要保护用户个人隐私的同时,向用户提供个性化推荐服务。文献[14-15]利用
					
在差分隐私位置推荐算法研究中,Liu等[16]将差分隐私结合协同过滤推荐技术,实验表明在没有严重损失推荐准确率的情况下可以向用户提供个性化推荐,但算法未能考虑到潜在因子模型。Li等[17]针对用户兴趣点的推荐,将原始位置序列数据转为二部图,然后提取二部图中的关联矩阵,通过向矩阵元素中添加噪声以满足
					
差分隐私位置推荐研究的难点在于位置域维度高,数据稀疏,精准、个性化推荐难度大,虽然保护了用户隐私,但是导致最后向用户推荐位置的效果不佳。本文基于马尔可夫模型,提出基于差分隐私的自适应权重
					
转移概率:假设数据集
						
| ${T_P}_{ij}({l_i} \to {l_j}) = \frac{{{T_C}({l_i} \to {l_j})}}{{\displaystyle \sum\nolimits_{j = 1}^{|L|} {{T_C}({l_i} \to {l_j})} }}$ | (1) | 
自适应权重
						
| ${P_r}({l_j}|{S_u}) = \sum\nolimits_{i = 1}^n {{w_i}{T_P}_{ij}({l_i} \to {l_j})} \propto \sum\nolimits_{i = 1}^n {{w_i}{T_C}_{ij}({l_i} \to {l_j})} $ | (2) | 
差分隐私是一种概率隐私模型,假设在只相差1条记录的2个数据集中,使用差分隐私保护的方法分析这2个数据集的结果不会有明显的差别,即从2个数据集中获得相同结果的概率相似。因此,即使攻击者拥有背景知识,也无法判断某条记录是否在数据集里,即不能以任何方式侵犯个人隐私。
| $P[M({D_1}) \in S] \leqslant {{\rm{e}}^{\varepsilon}}P[M({D_2}) \in S]$ | (3) | 
概率
						
差分隐私保护需要对转移计数添加噪声来实现,常用的一种实现噪声添加技术是拉普拉斯机制,而噪声大小与全局敏感度有关。
全局敏感度:对于函数
						
| $\Delta f = {\max _{{D_1},{D_2}}}||f({D_1}) - f({D_2})|{|_1}$ | (4) | 
其中,
拉普拉斯机制:对于数据集
						
| $M(D) = f(D) + {L_a}\left(\frac{{\Delta f}}{\varepsilon }\right)$ | (5) | 
本文提出的差分隐私保护位置推荐算法框架DPLORE分为差分隐私保护模块和位置推荐模块。对原始用户位置签到数据计算其转移计数,然后向统计数据提供差分隐私保护。将已受保护的噪声转移计数作为位置推荐系统输入,利用自适应权重
				
计算满足差分隐私的转移计数矩阵算法过程为:
算法1 计算差分隐私转移计数矩阵
输入:数据集用户的数量
					
输入:隐私预算
					
输出:噪声转移计数矩阵
1: TC[|L|][|L|]=0
2: for 
					
3:  for 
					
4:    
					
5:    
					
6: TC[li,j][li,j+1]+=1
7: end for
8: end for
9: U|L|×r′
10: 
					
11: 
					
12: V T′r×|L|=V Tr×|L|+La(1/ε3)
13: 
					
14: return 
					
算法2将算法1输出的噪声转移计数矩阵用于自适应权重的
					
算法2 自适应权重的
					
输入:用户
					
输出:推荐位置得分前
					
1: 
					
2: 
					
3: for 
					
4:   
					
5:  if 
					
6:   for 
					
7:    
					
8:    
					
9:    
					
10:    
					
11:    
					
12: end for
13: end if
14:  
					
15: end for
16: 返回
					
算法1首先初始化一个
					
算法2根据噪声转移计数矩阵,计算转移概率TP,结合用户
					
本文提出的算法使用Python实现,本节中所有实验的硬件环境为Intel(R) Core(TM)i7 2.70 GHz,内存为8 GB。采用2个不同规模的公开数据集,分别是Foursquare、Brightkite来验证算法的有效性。首先对原始数据进行预处理,过滤地点在数据集中出现少于5次的数据,过滤数据集中用户签到位置数量少于10次的用户,以及用户在同一时间连续在同一位置进行签到的异常数据,最后保留的数据集的基本统计信息如表1所示。
|   | 表 1 数据集的基本统计信息 Table 1 Basic statistics of dataset | 
一般来说,位置推荐算法通过计算每个候选位置对目标用户的得分,并将得分最高的前
					
准确率的定义为,给出目标用户的得分前
					
| $ p = \frac{{|{S_r} \cap {S_t}|}}{k} $ | (6) | 
召回率的定义为,给出目标用户的得分前
					
| $ r = \frac{{|{S_r} \cap {S_t}|}}{{|{S_t}|}} $ | (7) | 
在实验中,每个数据集将依据用户签入时间顺序划分为训练集和测试集,一半具有较早时间戳的签入数据作为训练集,另一半签入数据作为测试集。在向用户推荐的位置数
					
图1是本文提出的算法DPLORE与3种不同算法在两个不同的数据集,不同的位置推荐数
					
|   | 图 1 不同 | 
图2是2个数据集在不同的隐私预算下,本文提出的算法DPLORE与3种不同算法的准确率和召回率的对比实验结果。实验中位置推荐数
					
|   | 图 2 不同隐私预算 | 
图3描述了衰减率参数
					
|   | 图 3 衰减率 | 
本文提出基于差分隐私的位置推荐算法DPLORE,目的是为了提高位置推荐的准确率和召回率的同时保护用户的位置隐私。本文的算法通过改进噪声的添加方式,在同等隐私预算下,向分解后的转移计数矩阵添加的噪声量更少,在推荐算法模块中,使用改进的自适应权重的
				
| [1] | 
																												YAO L N, SHENG Q Z, WANG X Z, et al. Collaborative location recommendation by integrating multi-dimennsional contextual information[J].
												ACM Transactions on Internet Technology, 2018, 18(3): 1-24.
																									 | 
| [2] | 
									 
										CHO E, MYERS S. Friendship and mobility: user movement in location-based social networks [C]//Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Diego: ACM, 2011: 1082-1090. 
										
																 | 
| [3] | 
									 
										GAO H J, TANG J L LIU H. GSCorr: Modeling geo-social correlations for new check-ins on location-based social networks [C]//Proceedings of the 21st ACM International Conference on Information and Knowledge Management. Maui: ACM, 2012: 1582-1586. 
										
																 | 
| [4] | 
									 
										ZHANG J D, CHOW C Y, LI Y H. LORE: exploiting sequential influence for location recommendations [C]//Proceedings of the 22nd ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems. Dallas: ACM, 2014: 103-112. 
										
																 | 
| [5] | 
																												WANG J B, CAI Z P, LI Y S, et al. Protecting query privacy with differentially private k-anonymity in location-based services
					[J].
												Personal and Ubiquitous Computing, 2018, 22(3): 453-469.
												DOI: 10.1007/s00779-018-1124-7.													 | 
| [6] | 
																												GHASEMZADEH M, FUNG B C, CHEN R, et al. Anonymizing trajectory data for passenger flow analysis[J].
												Transportation Research Part C Emerging Technologies, 2014, 39(1): 63-79.
																									 | 
| [7] | 
									 
										DWORK C. Differential privacy [C]//Proceedings of the 33rd International Conference on Automata, Languages and Programming-Volume Part II. Berlin: ICALP, 2006: 1-12. 
										
																 | 
| [8] | 
									 
										KELLARIS G, PAPADOPOULOS S. Practical differential privacy via grouping and smoothing [C]//Garda, The 39th International Conference on Very Large Data Bases: ACM, 2013: 301-312. 
										
																 | 
| [9] | 
									 
										DAY W Y, LI N H. Differentially private publishing of high-dimensional data using sensitivity control [C]//Proceedings of the 10th ACM Symposium on Information Computer and Communications Security. Singapore: ACM, 2015: 451-462. 
										
																 | 
| [10] | 
																							鲜征征, 李启良, 黄晓宇. 基于差分隐私和SVD++的协同过滤算法[J].
												控制与决策, 2019, 34(01): 43-54.
																		 XIAN Z Z, LI Q L, HUANG X Y. Collaborative filtering via SVD++ with differential privacy[J]. Control and Decision, 2019, 34(01): 43-54. | 
| [11] | 
									 
										NOULAS A, SCELLATO S. Mining user mobility features for next place prediction in location-based services [C]//2012 IEEE 12th International Conference on Data Mining. Brussels: IEEE, 2012: 1038-1043. 
										
																 | 
| [12] | 
																												ZHANG J D, CHOW C Y. IGeoRec: a personalized and efficient geographical location recommendation framework[J].
												IEEE Transactions on Service Computing: IEEE, 2015, 8(5): 701-714.
												DOI: 10.1109/TSC.2014.2328341.													 | 
| [13] | 
																												LU Z Y, WANG H. Personalized location recommendation by aggregating multiple recommenders in diversity[J].
												Geoinformatica, 2017, 21(3): 459-484.
												DOI: 10.1007/s10707-017-0298-x.													 | 
| [14] | 
																												CHAKRABORTY B, VERMA S, SINGH K P, et al. Differentially private location privacy preservation in wireless sensor networks[J].
												Wireless Personal Communications: An International Journal, 2019, 104(1): 387-406.
												DOI: 10.1007/s11277-018-6026-5.													 | 
| [15] | 
																												ZHANG Y, MAO Y L, ZHONG S, et al. Joint differentially private gale-shapley mechanisms for location privacy protection in mobile traffic offloading systems[J].
												IEEE Journal on Selected Areas in Communications, 2016, 34(10): 2738-2749.
												DOI: 10.1109/JSAC.2016.2605798.													 | 
| [16] | 
									 
										LIU Z Q, WANG Y X. Fast differentially private matrix factorization [C]//Proceedings of the 9th ACM Conference on Recommender Systems. Vienna: ACM, 2015: 171-178. 
										
																 | 
| [17] | 
									 
										LI C, PALANISAMY B, JOSHI J. Differentially private trajectory analysis for points-of-interest recommendation  [C]//2017 6th IEEE International Congress on BigData. Honolulu: IEEE, 2017: 1-8. 
										
																 | 
| [18] | 
																												WEI J H, LIN Y P, YAO X, et al. Differential privacy-based trajectory community recommendation in social network[J].
												Journal of Parallel and Distributed Computing, 2019, 133(1): 136-148.
																									 | 
 2021,  Vol. 38
 2021,  Vol. 38