所有文章 > 正文

研究人员通过AI分析推文来观测城市物流

作者: Jansfer

时间: 2019-06-24 18:40

在Mines Paristech团队领导的一项新的城市物流研究 “Unsupervised Machine Learning to Analyse City Logistics”(自主运转学习机器分析城市物流)中,通过机器学习算法来分析推特,以跟踪有关城市物流的对话趋势,特别是围绕低排放区和城市配送中心等问题。

图片来源:Courtesy Shutterstock

论文链接

Twitter真正的安防数据自有其用途,尤其在人工智能和机器学习领域。Chik-fil-A(美国快餐连锁店) 最近开始利用此数据在餐厅寻找食源性疾病的迹象,而欧洲委员会科学和知识联合服务研究中心的科学家今年早些时候详细介绍了一个测量Twitter实时用户流量的报告原型。

合著者写道,物流的作用是在成本和客户服务方面使消费者有效地获得商品和服务。城市物流政策制定非常复杂,因为它需要诊断和分析,因此要观测、监视。合著者指出,实际的障碍往往会阻碍大规模的城市物流调查。而这篇论文通过研究AI,分析推特如何有助于物流的观察和分析。

在他们的工作过程中,团队利用了两种关键的机器学习技术——降维和聚类。前者通过获取一组主变量来减少所考虑的变量数量,而后者通过此种方式对对象进行分组:同一组中的元素对比其他组中的元素具有更多的共同点。

研究人员的机器学习模型在Twitter上搜索“城市物流”、“最后一英里物流”、“城市物流”和“城市货运”等短语,并收集过滤后的Twitter,以删除不需要的内容(如链接、符号和链接词)和重复条目。随后,对文本中的单词进行词形化,或者将其组合在一起,这样单词就可以作为一个单独的项目进行分析,并组合成特征图。

该团队接下来使用开源自然语言工具包(NLTK)对提取的文本进行分析,这是一套用于英语符号和统计自然语言处理库和程序。他们使用基于某种规则的情绪强度分析仪(Valence Aware Dictionary)和情绪推理器(Vader)计算每个样本的极性得分(负与正),并计算传统统计数据。

在2007年至2018年发布的包含关键城市物流条款的111265条推特的数据集中,研究者发现“city logistics”(出现在66%的推特中)一词比“urban logistics” (9%的推文)和“urban logistics”(6%的推文)更受欢迎,最常见的是唯一出现的城市物流用语与就业相关。除其他见解外,研究小组还报告说,根据研究结果,堪萨斯城是美国商业的一个重要中转站,是城市物流相关的活动量排名前五位中最活跃的地区,物流相关内容的比例从2016年的43%上升到2018年的68%。

研究人员写道:“为了评估挖掘社交媒体能为观察城市物流带来什么,识别代表性不足的问题或盲点至关重要。”令人满意的是,人们可以发现范围广泛的问题(例如道路安全、燃油消耗、可持续性、城市结构等)和解决方案(例如培训、ICT、城市整合中心、清洁车辆、货运自行车等)。相反,一些在学术界广为宣传的概念几乎没有出现在语料库中(例如21条关于物理互联网的推文,8条关于非工作时间交付的推文,3条关于同步模式的推文。)

该团队指出,他们的方法没有考虑到客户活动级别、范围或偏见。这些都留到了以后的工作。尽管如此,由于推特平台规模庞大,研究者依然认为它对于城市物流的利益相关者来说是一个“令人敬畏的机会”。

参考:venturebeat

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多