【摘要】
近年来,大数据技术给许多领域带来了革命,包括零售、医疗和运输行业。然而,迄今为止,用于维持治安的大数据技术受到限制,特别是在英国。尽管警方每天收集大量的数字数据,但情况依然如此。
目前缺乏对大数据分析在英国警务中的潜在用途的研究。本文旨在为这一证据基础作出贡献。以访谈25名在职警官和工作人员以及来自技术部门和学术界的专家的形式进行的初步研究使人们对警察目前使用数据的局限性和警察扩大这些能力的优先事项有了新的认识。
这项研究查明了警察目前使用数据的一些基本限制。特别是,本文发现,数据库和软件应用程序的分散性严重妨碍了警察部队的效率,因为警察数据是在多个相互不兼容的单独系统中管理的。
此外,在大多数情况下,对数字数据的分析几乎完全是人工的,尽管软件可用于使这一过程的大部分自动化。此外,警察部队无法使用先进的分析工具来拖网和分析图像和视频等非结构化数据,因此无法充分利用联合王国的广泛监控能力。
在大数据技术应用于英国警务的众多方法中,有四个被确定为关键优先事项。
首先,预测性犯罪绘图可用于确定犯罪最有可能发生的领域,使有限的资源成为最有效的目标。
第二,预测分析还可以用于识别与特定个体相关的风险。这包括查明更有可能再次犯罪的人,以及有可能失踪或成为犯罪受害者的人。
第三,先进的分析可以使警方充分利用通过视频监控收集的数据,如闭路电视图像和自动车牌识别数据。
第四,大数据技术可以应用于开源数据,例如从社交媒体收集的数据,以便更好地了解具体的犯罪问题,最终为制定预防性警务战略提供信息。
目前,在实施这些技术方面存在一些实际和组织上的障碍。最重要的是,在英国整个警务工作中,缺乏技术协调发展,对大型数据造成严重问题,而大型数据依赖于有效的全国数据共享和协作。近年来,财政削减也严重阻碍了技术发展,因为大多数警察信息技术预算用于支持现有的遗留系统,几乎没有资金可用于投资新技术。最后,在警察使用数据方面存在着严重的法律和道德限制,尽管这不是本报告的主要重点。
这些障碍绝不是不可逾越的,预计在今后几年,警察使用技术的进步将使大数据警务工具的成功开发成为可能。必须根据具体确定的要求和优先事项通报这方面的情况,本报告确定了值得进一步调查的几个特别感兴趣的领域。尽管2010年以来实施了此类预算削减,但投资新技术至关重要,因为初期投资的成本将远远超过长期节省的效率。
建议
1、警察部队、警察和犯罪专员
•大数据技术方面的任何重大发展都应当与具有代表性的警察和工作人员进行直接协商。
这对开发人员和最终用户都有几个积极的结果。从发展的角度来看,技术投资将直接针对具体要求,而不是基于临时和投机性研究。从警察的角度来看,前线以及管理层都将改进警官入伍。
•英国警察部队应优先探索预测测绘软件的潜力。
预测热点制图已经一再表明,比智能引导技术在预测未来犯罪地点方面明显更有效。然而,很少有部队将这一做法纳入目前的巡逻战略。警方收集了大量的历史性犯罪数据,可用于预测犯罪可能发生在哪里,从而使有限的资源能够直接针对最需要的地方。
•任何严肃或长期调查的数字方面应由一名数字媒体调查员管理,后者负责成为具体行动的技术领导者。
几乎所有的警察调查都有重要的数字部分,但调查往往没有连贯的数字战略,警官报告从事不同类型数据工作的小组之间缺乏协调。大多数警察部队尚未充分利用的数字媒体调查员能够填补这一空白,成为数字调查潜在的极有价值的资源。
预测个人相关风险的分析工具应使用国家数据集,而不是地方数据集。
预测分析使警察部队能够利用过去的犯罪历史来查明更有可能再次犯罪的个人,并利用伙伴机构的数据查明特别脆弱和需要保护的个人。这种分析目前使用当地警察数据集进行,但必须使用国家数据集,才能充分了解这些风险。
2、内政部、警务学院和警察信通技术公司
•应制定国家大数据采购战略,协调联合王国所有警察部队的技术投资。
联合王国的警务结构高度地方化,导致不同警察部队之间的技术发展水平大不相同。部队孤立地追求技术变革,在国家一级几乎没有协调。内政部应为采购大数据警务技术发布明确的国家指导,以确保今后在这方面的投资不会浪费。
•应编制通用术语标准化词汇表,以便将信息输入警察数据库。
当从警察数据库中检索信息时,调查人员需要执行关键字搜索,这涉及猜测特定感兴趣主题的每个潜在同义词。这使得特别难以核对和交叉参考从不同来源收集的信息。一个标准化的词典将解决这一问题,同时还能够开发可用的文本挖掘软件。
•应建立共享MASH(多机构保护枢纽)数据库,以便在警察和伙伴机构之间更好地共享数据。地方当局、社会服务部门和警察在查明需要保护的弱势个人时应密切合作。共享MASH数据库将有助于做到这一点,同时也使警察能够迅速获得对正在进行的调查至关重要的信息。目前,数据共享不足意味着警方对脆弱性的了解有点单向度。
•应在国家一级制定明确的决策框架,以确保在警务中道德地利用大数据技术。
目前没有明确的决策框架来规范英国公共部门组织对大数据技术的道德使用。必须作为紧急事项处理这一问题,以确保警察等组织能够有效利用这些新能力,而不必担心侵犯公民的隐私权。
3、软件开发人员
•在提供新的分析软件时,应同时举办一次干事培训班和/或由软件开发商提供的教学视频。分析工具仅与操作工具的个人一样有效,如果官员不能有效使用新技术,投资就会浪费。由于现代软件解决方案是高度直观的,并且通常可以轻松地采用,因此可以以官员方便时可以参考的简短演示或教学视频的形式提供这方面的培训,从而演示新技术是如何工作的,以及它为什么是有效的。
•所有数据应用程序都应该包括永久启用的事件日志特性,记录对数据集所做的任何更改。当呈现新的数据集时,分析师应该能够查看相应的事件日志,记录数据被修改的方式和时间,以及由谁修改。这将确保连续性并防止从一个用户到另一个用户的重复。
•预测性警务软件的开发者应进一步研究使用基于网络的模型来生成基于街道段的犯罪预测。
最近的研究表明,生成街道段预测的校准的基于网络的模型比传统的基于网格的预测具有更高的预测精度。街区预测比任意网格更有助于警务目的,这些初步调查结果表明,需要进一步研究,以完善此类模型,并将其纳入现有的预测性警务软件。
4、进一步研究
•需要进一步研究,以探讨风险地形模型(RTM)在识别最有可能经历犯罪的领域方面的潜在用途。
目前的预测性制图方法仅依靠过去的犯罪事件来预测未来的犯罪,并且对使某些地点更容易受到犯罪的潜在地理和环境因素漠不关心。风险地形建模(Risk Terrain Modelling, RTM)考虑了这些潜在的环境因素,为空间风险提供综合分析,一些研究表明,风险地形建模(Risk Terrain Modelling, RTM)比回顾性热点映射具有更好的预测能力。
•需要进一步研究如何利用伤害矩阵来评估不同类型犯罪造成的伤害。
目前,在大多数部队中,警察资源的优先次序主要取决于特定地区的犯罪总量,而不是不同类型犯罪造成的伤害。MoRiLE Matrix等工具表明,可以通过考虑对个人、社区和经济造成的危害等因素,使用数据更深入地了解危害。需要进一步研究,以便更详细地探索这些潜力,并制定更复杂的分析方法,评估不同类型犯罪造成的损害。
需要进一步研究警察对物联网收集的大数据的潜在用途。
在未来几年中,从城市环境中的传感器发送的数据量很可能会显著增加。虽然这些数据可用于提高交通网络、医院和学校等城市服务的绩效和效率,但也可以改变城市环境的治安方式。
导言
迄今为止,尽管英国军队每天收集大量的数字数据,但探索大数据用于警务的研究却非常有限。本文的目的是找出具体的方法,使大数据分析能够使英国警察部队更好地利用他们收集的数据,使警察能够更有效地采取行动。近年来,大数据技术的兴起,给零售、医疗、金融等领域带来了革命性的变化。如果使用得当,大数据分析就有可能改变警务的许多方面。随着尖端技术的成本越来越低,有效利用大数据将成为警察和其他执法机构的首要任务。
本文直接从警务专业知识和经验出发,概述了英格兰和威尔士的警务技术现状,然后探讨了大数据如何支持业务、战略和指挥警务。确定了潜在的挑战,并提出了切实可行的解决办法。请注意,虽然本文的研究结果几乎可以肯定地扩展到了英国的所有警察部队,但研究只调查了英格兰和威尔士的43支领土警察部队。
研究理由
“我们拥有从不同来源收集到的大量信息。我们所缺乏的是有效分析它的技术能力。这是作为本文研究的一部分接受采访的侦探巡视员的话,这种情绪在随后的所有谈话中反复出现。虽然警官在需要什么技术发展、数据分析的重要性以及今后加强数据能力的优先事项方面意见不一,但对于这一基本事实存在着明确的共识:警察缺乏有效分析其收集的数据的技术能力。
在英国,很少有组织能够像警方那样收集数据,而且很少有组织拥有从其他来源获取数据的广泛权力。然而,警方只利用了这些数据的很小一部分。目前,警察数据的分析是一项艰巨的任务,因为部队无法获得复杂的数据挖掘工具和基础设施。如果警察能够有效地将这种技术应用于他们收集的数据,他们将大大提高他们的行动效率和打击犯罪的能力。
今后任何技术发展都必须以明确确定的具体要求和优先事项为根据。本文件的目的是提供这种证据。
方法
本论文的研究分三个阶段进行。
首先是对现有学术文献、政府政策文件、执法战略和私营部门关于警察使用数据的报告的审查。这包括最近和当前为进一步发展数据能力而采取的举措。
在第二阶段,对25名在职警官和4支部队的工作人员以及来自技术部门和学术界的5名专家进行了半结构化面谈。访谈于2017年4月和5月在伦敦进行,多数是亲自进行的,其中3次通过电话进行。所有这些都是秘密进行的,使答卷人能够公开谈论敏感或有争议的问题。在本文中,面谈是在伦敦进行的,但这并不一定意味着该官员属于伦敦警察部队。
第三阶段的研究涉及在伦敦举行的为期半天的讲习班,来自五个警察部队以及内政部、警务学院和学术界的代表聚集一堂。这提供了一个机会,可以对前两个研究阶段的调查结果进行三角分析和验证,并就今后的技术发展以及警方使用数据的道德和法律考虑进行了知情的讨论。
本文共分四章。
第一章概述了大数据在犯罪分析中的主要用途、主要局限性和实际应用。
第二章探讨了英国警务技术的现状,重点探讨了访谈中提出的问题。
第三章根据研究中确定的要求,讨论了大数据技术应用于警务的几种具体方式。
第四章强调了实现这些变化需要克服的主要组织障碍,以及警察使用数据的道德和法律挑战。
【目录】
一、什么是大数据?
定义和用途
局限性
大数据与犯罪分析
二、当今英国的警察技术
数据库管理
协作,兼容性和连续性
预测分析
移动警务
通讯数据
开源数据
三、大数据与警务技术的未来
预测性热点制图
超越预测制图
个人的预测风险评估
视觉监控
开源分析
四、挑战与解决方案
隔离当地警察
文化、采购和培训
分析行动
网络犯罪和大数据犯罪
数据的法律和道德使用
结论
文章正文原版及其机器翻译请到本文末尾扫码前往知识星球下载。
文章来源:英国皇家联合军种学院国防和安全研究所
作者:亚历山大·巴布塔 Alexander Babuta
Alexander Babuta是英国皇家联合军种学院国防和安全研究所专门从事警务和有组织犯罪的研究分析员,他的研究重点是数字时代的警务、跨国有组织犯罪和跨界贩运。他持有伦敦大学犯罪学硕士学位,他的论文研究了失踪儿童事件的性质、特点和警方的反应。他还拥有伦敦大学语言学士学位。在加入英国皇家联合军种学院国防和安全研究所之前,AlexanderBabuta曾为议会议员工作。
本文机器翻译由百分点智能翻译提供
官网地址:http://translate.percent.cn/
公司官网:https://www.percent.cn/
商务和技术咨询欢迎联系400-6240-800 或 fanyi@percent.cn