基于POI和查询似然的微博用户地理位置推演

VSole2021-12-08 19:19:30

简介

该文为发表于ICICS 2021的Microblog User Location Inference Based on POI and Query Likelihood Model。目前,微博用户的位置信息对于灾害监测、舆情追踪等应用具有重要意义。但是仅根据用户未公开位置信息,而仅通过其发布的文本信息来推断用户位置是相当困难的。在这项工作中,作者提出了一种基于POI和查询似然模型的微博用户位置推断算法,命名为PaQL。该方法首先基于电子地图构建各区域的POI(Point of Interest)模型。然后,从用户博客文本的分词结果中,提取出位置定向性较强的POI作为用户特征。最后基于查询似然模型计算用户与候选区域之间的相关性,将相关性最高的候选区域作为用户的推断位置。

方法

整体框架图如下所示,PaQL主要分为5大步骤。

作者首先构建候选区域的POI库。基于电子地图API获取候选区域19类POI信息,构建POI-region地图。其中19类POI包括地图中的餐饮、旅馆、美容、运动、文教、交通、金融、政府等组织的名称、地址和类型信息。例如,漫语融合餐厅就是河南郑州的一个餐饮类POI。在此基础上,分别建立POI到其区域的映射和候选区域到其POI的映射。以城市级作为候选区域为例,其映射情况如下表示。之后作者将每个用户发布的文本按时间顺序收尾相连,再经过一些常规的预处理操作后,得到用户发布文本的词汇表。再根据得到的POI与地理区域的映射,找到用户发布文本与POI中相关的内容,并使用词袋进行建模,构成POI向量。最后,PaQL训练分类器模型以计算查询似然模型的概率(包括POI的逆区域频率和POI在每个候选区域中被提及的条件概率)。查询似然模型是一种用于信息检索的语言模型。该算法为集合中的每个文档构建一个语言模型。然后根据给定查询的特定文档的概率对每个文档进行排名,从而挖掘在给定查询的情况下文档间的相关性。在本论文中,作者以用户的POI向量为查询,计算向量与候选地理区域POI文档的相关性,将相关性最高的区域作为推断位置。

实验

实验阶段,作者分别针对省级数据和城市级数据进行验证。数据量如下表所示。其实验效果如下表所示,各项指标均由于已有的地理位置推演算法:GP-FLIW,GP-LIWTF和WC-EFS。

安全学术圈招募队友-ing, 有兴趣加入学术圈的请联系secdr#qq.com

poi
本作品采用《CC 协议》,转载必须注明作者和本文链接
网络安全研究员Sam Curry及其团队在 points.com 网站上发现了“多个安全漏洞”。这些漏洞允许攻击者访问客户帐户详细信息,包括姓名,账单地址,编辑的信用卡详细信息,电子邮件,电话号码和交易记录。
研究人员报告了基于 shellcode 的下载程序 GuLoader 的新版本,它是上个月第四大最猖獗的恶意软件。发生了重大变化。上月,Qbot 和 Anubis 也都在相应排行榜上位居榜首。尽管 Microsoft 通过阻止 Office 文件中的宏运行来减缓恶意软件的传播,但 Qbot 运营组织已迅速调整其散播方式。
根据Check Point的数据,去年记录的网络攻击数量比2021年观察到的总数量高出近五分之二 (38%)。
2022 年 10 月,全球领先的网络安全解决方案提供商 Check Point 软件技术有限公司连续第三年蝉联《福布斯》全球最佳雇主榜单。
2022已悄然步入下半年,对互联网安全领域而言,2022年必然能成为“载入史册”的一年。近日,Check Point Research (CPR) 报告称,2022 年第二季度全球网络攻击创历史新高,与 2021 年第二季度相比增加了 32%。全球每个机构平均每周所遇攻击次数最高达到 1200 次。
近年来,移动智能设备大行其道,尤其是新冠疫情以来,智能移动设备已经成为混合办公模式中不可或缺的主要生产力工具之一。
Check Point 安全报告显示:在过去一年中,全球银行平均每周受到700次攻击,同比增长53%。从网络钓鱼诈骗和DDoS攻击到大型的跨境复杂攻击,针对银行的网络威胁在持续增加。
Check Point Research 指出,Emotet 再次成为最猖獗的恶意软件,而 Trickbot 则从第二位跌至第六位。Apache Log4j 不再是最常被利用的漏洞,但教育/研究行业仍然是首要攻击目标。
受调查的公司仍在统合安全性与 DevOps 之间面临专业人才匮乏的问题。仅有 16% 的受访者已全面实施 DevSecOps,37% 的受访者刚刚开始在企业内实施部分 DevSecOps 要素管理多个云服务商所带来的复杂性远超最初想象,配置不当被视为头号安全相关事件。
供应链一直是网络犯罪分子的主要目标之一。由于新冠疫情悄然改变了现代企业的运营方式,在许多企业可能尚未做好充分准备的情况下,就直接采用了混合办公模式,并将诸多应用移至云端。因此,安全团队往往不堪重负,无法满足突发安全需求。Check Point 的《2022 年安全报告》显示,2021 年供应链攻击同比骤增 650%。
VSole
网络安全专家