长江航道信息智能推送服务方法研究 | ![]() |
2. 长江科学院空间信息技术应用研究所,湖北 武汉,430010
2. Spatial Information Technology Application Department, Changjiang River Scientific Research Institute, Wuhan 430010, China
航运是长江流域经济兴旺发展的重要基础,有力支撑了沿江社会经济发展。建立智能航道信息服务体系对提升长江航道运行能力、辅助企业航运决策、保障船舶航行安全、提高航行效率具有重要意义。
智能化信息服务在国外的应用已经十分广泛,有国家的智能航运信息服务网络系统在水上交通监管与智能化信息服务方面发挥了重要作用[1]。国内学者在航运信息智能化服务中的研究表明,相比国外尤其是欧美等国家的内河智能信息服务建设,长江航道信息智能服务体系相关研究还处于起步阶段[2-5],信息推送形式为被动式搜索,难以做到智能精准推送。随着物联网、大数据、云计算及人工智能等技术的高速发展以及长江航道信息化基础建设的不断推进,长江航道信息智能化服务建设步伐不断加快。长江航道图应用程序(application,APP)自2015年正式对外推广应用至今,已超过8万用户,累计服务200余家航运企业、科研机构、港航管理部门,为航道信息智能推送奠定了数据基础。
本文结合现有长江干线数字航道工程及长江电子航道图建设成果,利用人工智能相关技术,挖掘用户行为以制定服务策略,结合深度学习来提取航道信息关键数据,并基于地理围栏进行叠加分析以获取推送对象,实现长江航道信息推送的精细化、智能化。
1 信息智能推送方法 1.1 基于用户行为的智能推送模型用户行为数据是指用户在使用长江电子航道图APP过程中的操作记录,包括位置、时间、功能模块、访问模式、用户等信息,这些记录描述了不同用户在不同位置对不同功能模块的访问需求。
智能推送服务从用户行为出发,基于不同用户的不同行为进行个性化定制,基于不同位置进行分析计算,从大量航道信息数据中挖掘和提取对用户有用的信息,使信息推送更加精准、智能,从而提升用户体验。
本文提出一种基于用户行为的航道信息智能推送模型,如图 1所示。
![]() |
图 1 智能推送流程图 Fig.1 Flow Chart of Intelligent Push |
通过对用户的偏好和行为进行分析,预测用户的使用需求。对非结构化的航道通告信息进行特征提取,通过地理围栏对航道要素信息进行空间位置分析以缩小信息服务范围,并基于用户行为分析结果为不同的用户制定不同的信息推送策略,从而实现航道信息推送的精细化、智能化。
1.2 基于数据挖掘的用户行为分析行为是用户对目标或对象进行相关操作的基本单元,相同的操作可以以不同方式或者由不同的人来执行[6, 7]。用户行为分析是指对应用中海量的用户行为数据进一步分析和挖掘,从而获取用户的行为特征和规律[8]。常见的用户行为分析方法有用户特征分析、关联分析、分类与预测、异常分析、TopN分析。其中,TopN分析是用户行为分析中较为常用的方法[9-14]。通过对某类业务进行TopN分析,可以获取当前最受关注的业务类型及其访问规律,TopN业务较大程度代表着该类业务的访问特性,基于TopN业务分析采取相应的服务策略将是最为有效的方式。
本文主要针对长江航道图APP目标用户的业务行为进行TopN分析,目的是找到目标用户的行为模式和兴趣偏好。基于长江航道图APP的功能特性,本文拟从行为模式、兴趣偏好两个维度进行研究。行为模式是分析不同用户的业务访问情况;兴趣偏好是分析用户对不同业务类型的访问情况;通过上述两个维度对用户的行为数据进行分析,并用数据透视方法实现多维数据可视化,以此作为信息推送的服务策略,为航道信息的智能推送提供关键决策依据。
1.3 基于Word2vec的关键词提取关键词提取是指从文本数据中抽取有价值信息的过程。Word2vec是谷歌发布的开源深度学习工具,文献[15]的研究表明,基于Word2vec的关键词提取算法准确率较高。
Word2vec通过一个浅而双层的神经网络模型,将词转化为向量表示,映射到高维向量空间中,从而寻求词更深层次的特征,预测词与词之间的相似性,进而进行聚类分析和词性分析等。Word2vec包括
连续词袋(continuous bag-of-words,CBOW)模型和Skip-gram模型,训练结构见图 2。
![]() |
图 2 Word2vec训练结构 Fig.2 Structure of Word2vec Training |
CBOW模型根据某个中心词前后N个连续的词来计算该中心词出现的概率,即根据上下文预测当前词语概率;Skip-gram模型与CBOW模型相反,通过当前中心词预测上下文概率。对于较大数据量的文本训练,CBOW模型在训练速度上优于Skip-gram模型[16-18]。结合航道通告信息数据量大、时效性强、非结构化的特点,本文采用CBOW模型提取位置关键词,将它们转化为结构化的数据,为下一步位置分析及航道信息的智能推送提供数据支撑。
1.4 基于地理围栏的位置分析地理围栏是位置服务的一种新应用,其基本原理是利用预先设定的虚拟地理边界来判断位置源与之对应的空间关系,进而提供相应的服务。这种低成本、高效率的方式使位置服务更加精准,同时节省功耗,是智能硬件时代消息推送的主流技术模式[19]。
本文以“位置点+缓冲区”的形式来构建地理围栏,并与航道要素信息进行叠加分析,获取该地理围栏范围内所有水道、水位站、相关通告、障碍物及重要区域等航道要素信息。分析模型如图 3所示。
![]() |
图 3 位置分析流程 Fig.3 Flow Chart of Position Analysis |
2 实验结果及分析 2.1 行为分析
本文以用户在2020-05-01 00:00:00—2020-5-05 00:00:00时间段对长江航道图APP的使用记录为数据源,选取10个用户(以用户1~10表示)进行实验分析,将与信息推送相关的气象详情、航道尺度详情、航道公告详情及水位站详情作为参量指标,从不同用户的业务访问情况、用户对不同业务类型的访问情况两个维度进行分析,分析结果见图 4。
![]() |
图 4 用户1~10的业务访问情况 Fig.4 Business Access of Users 1−10 |
图 4展示了选取的10位用户对长江航道图APP相关业务的访问情况,可以看出不同用户的行为模式及兴趣偏好。绝大多数用户倾向于访问航道尺度,用户4则对航道公告更感兴趣。对于水位站详情、气象详情,用户访问频次均不高。水位站详情访问频次在20次/周左右,其中,用户9对于水位站详情更为关注,达到26次/周。气象详情访问频次均低于10次/周,每天访问次数在1~2波动。总体上,用户的关注度由高到低依次为航道尺度详情、航道公告详情、水位站详情、气象详情。
2.2 特征提取长江航道图APP作为重要的航道公共服务产品,基于空间位置来提供航道信息服务。结合长江航道图APP的功能特性,本文利用Word2vec的CBOW模型对50 476条航道通告标题数据进行训练学习,建立模型以提取其中与空间位置相关的地名信息,并对提取模型进行验证分析。
本文以当前最新发布的“长江九江航道处关于新洲水道航标增设的航道通告“”长江岳阳航道处关于洞庭湖口支流航道航标调整的航道通告“”长江上海航道处关于浏河水道航标失常的航道通告“”长江芜湖航道处关于白茆水道航标异动的航道通告”为测试数据对提取模型进行验证,测试结果见图 5。
![]() |
图 5 地名词语提取模型测试 Fig.5 Tests on the Extraction Model of Place Names |
以转移概率为参量指标,将所有词按照转移概率大小降序排列,越靠前的词就越重要,成为关键词的概率越大。通过图 5可以看出,失常、异动等事件的词语转移概率多处于关键的第一位,九江、新洲、洞庭湖、浏河、白茆等与空间位置相关的地名词语转移概率多处于关键的第二位。考虑到下一步需要进行位置分析,当前实验结果虽实现了关键词的提取,但与位置相关的地名词语未处于绝对关键地位,后续仍有优化空间。
2.3 智能推送基于用户行为分析结果及长江航道图APP,对处于浏览状态下的用户推送并播报最新的关注信息(航道尺度信息、航道通告信息、水位站信息、气象信息等)。对处于航行状态下的用户,基于地理围栏计算,并以关注度为序,推送最近的航道尺度信息、航道通告信息、水位站信息及气象信息。对于航道重要区域及碍航物等信息,当船舶定位信号接近或者位于该要素时,在浏览及航行状态均进行相关预警告警信息推送及播报。
本文以用户1、4、9为例展示智能推送结果,用户1接收到的信息推送为“当前航道养护水深为4.5 m;长江芜湖航道处关于白茆水道航标异动的航道通告”,推送顺序为航道尺度详情、航道公告详情。用户4接收到的信息推送为“长江芜湖航道处关于白茆水道航标异动的航道通告,当前航道养护水深为4.5 m”,推送顺序为航道公告详情、航道尺度详情。用户9接收到的信息推送为“当前航道养护水深为4.5 m,长江芜湖航道处关于白茆水道航标异动的航道通告,白茆下游40公里水位为3.02 m”,推送顺序为航道尺度详情、航道公告详情、水位站详情。
3 结束语本文提出一种基于用户行为的航道信息智能推送模型,首先,利用TopN分析法对用户行为进行分析;然后,借助Word2vec深度学习工具提取航道通告消息的地名关键词;最后,基于用户行为分析结果制定航道信息智能推送服务的策略,并结合长江航道图APP进行实验验证,初步实现了基于用户使用习惯的信息个性化、智能化服务方式。
本研究仍然存在一些不足之处,用户行为数据样本仅为2020-05-01 00:00:00—2020-05-05 00:00:00时间段的使用记录,存在一定局限性,后续随着用户数据的丰富,可进一步挖掘、细分用户行为,不断逼近、拟合用户的真实需求,并以此来制定合理的信息推送服务策略,使信息推送更为精准、智能。
[1] |
Spalding J W, SheaK M, Lewandowski M J. Intelligent Waterway System and the Waterway Information Network[C]. Proceedings of the 2002 National Technical Meeting of The Institute of Navigation, San Diego, CA, USA, 2002
|
[2] |
严忠贞, 严新平, 马枫, 等. 绿色长江航运智能化信息服务系统及其关键技术研究[J]. 交通信息与安全, 2010, 28(6): 76-81. DOI:10.3963/j.ISSN1674-4861.2010.06.021 |
[3] |
刘怀汉, 曾晖, 周俊安, 等. 内河航道助航系统智能化技术研究现状与展望[J]. 水利水运工程学报, 2015(6): 82-87. |
[4] |
郭涛. 长江智能航道关键技术分析[J]. 水运工程, 2016(1): 99-105. DOI:10.3969/j.issn.1002-4972.2016.01.021 |
[5] |
王起超. 基于水上位置大数据的智能服务应用模式研究[D]. 大连: 大连海事大学, 2016
|
[6] |
Zhao S, Ramos J, Tao J R, et al. Discovering Different Kinds of Smartphone Users Through Their Application Usage Behaviors[C]. Proceedings of the 2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing, Heidelberg, Germany, 2016
|
[7] |
Fang C J, Wang Y Q, Mu D J, et al. Next-App Prediction by Fusing Semantic Information with Sequential Behavior[J]. IEEE Access, 2018, 6: 73 489-73 498. DOI:10.1109/ACCESS.2018.2883377 |
[8] |
王保群. 基于用户行为习惯的APP使用预测及应用[D]. 重庆: 重庆邮电大学, 2019
|
[9] |
贾俊, 张斌, 李志远, 等. 基于用户行为分析的个性化推荐算法[J]. 智能科学与技术学报, 2019, 1(4): 421-426. |
[10] |
张辉. 基于用户行为数据分析的个性化推荐算法研究[D]. 南京: 南京信息工程大学, 2017
|
[11] |
Ge M Z, Persia F. A Survey of Multimedia Recom mender Systems: Challenges and Opportunities[J]. International Journal of Semantic Computing, 2017, 11(3): 411-428. DOI:10.1142/S1793351X17500039 |
[12] |
Scholz M, Dorner V, Schryen G, et al. A Configuration-Based Recommender System for Supporting E-Commerce Decisions[J]. European Journal of Operational Research, 2017, 259(1): 205-215. DOI:10.1016/j.ejor.2016.09.057 |
[13] |
Walek B, Fojtik V. A Hybrid Recommender System for Recommending Relevant Movies Using an Expert System[J]. Expert Systems with Applications, 2020, 158: 113452. DOI:10.1016/j.eswa.2020.113452 |
[14] |
符明晟. 基于深度学习的智能推荐技术研究[D]. 成都: 电子科技大学, 2019
|
[15] |
李跃鹏, 金翠, 及俊川. 基于Word2vec的关键词提取算法[J]. 科研信息化技术与应用, 2015, 6(4): 54-59. |
[16] |
Jatnika D, Bijaksana M A, Suryani A A. Word2vec Model Analysis for Semantic Similarities in English Words[J]. Procedia Computer Science, 2019, 157: 160-167. |
[17] |
Comber S, Arribas Bel D. Machine Learning Innovations in Address Matching: A Practical Comparison of Word2vec and CRFs[J]. Transactions in GIS, 2019, 23(2): 334-348. |
[18] |
王飞, 谭新. 一种基于Word2vec的训练效果优化策略研究[J]. 计算机应用与软件, 2018, 35(1): 97-102. |
[19] |
鞠明山. 地理围栏技术发展现状及网络信息安全问题探究[J]. 江西通信科技, 2018(3): 39-41. |