
一套人工智能系统刚刚宣称,它能以86.3%的准确率预测美国城市的抢劫案发生地点和时间。
这个数字听起来令人印象深刻。但在预测性警务这个领域,技术能力从来都不是唯一需要回答的问题。
这项研究由国际学术期刊《国际创新计算与应用杂志》发表,研究团队构建了一套将多种机器学习技术融合在一起的混合模型,并在包括洛杉矶和西雅图在内的多个美国城市的历史犯罪数据上进行了测试。
模型的核心构件有三层。第一层是图卷积网络,专门用来识别不同地理位置之间的关联,比如某条街区的犯罪率如何影响相邻区域的风险。第二层是Transformer架构,这种最初为自然语言处理设计的技术被引入进来,用于捕捉犯罪活动随时间演变的规律,比如某类案件在特定季节或特定时段的集中程度。第三层是生成对抗网络,通过让两个AI子系统相互博弈来提升整体性能,同时配合变分自编码器来生成更具代表性的训练数据,减少模型在学习过程中可能出现的输出偏差和梯度消失问题。
三层叠加的结果,是一套能够同时处理"在哪里""什么时候"以及"周边社会环境如何"这三类信息的预测系统。
在抢劫案预测上,该模型达到了86.3%的准确率,而此前同类系统中表现最好的也只有83.2%。研究团队认为,这套系统在其他犯罪类型的预测上同样表现出色,并指出准确的犯罪预测可以帮助执法部门更有效地分配警力资源,提前识别高风险区域。
但研究者同时承认了一个明显的局限:在历史犯罪数据稀少的地区,模型的准确率会显著下降,在几乎没有历史记录的区域几乎无法正常运作。他们计划通过迁移学习来解决这个问题,也就是将在数据丰富地区习得的模式迁移应用到数据匮乏的环境中。
86.3%这个数字放在任何机器学习评估场景里都不算低,但预测性警务不是一个普通的机器学习应用场景。
这个领域有一段并不轻松的历史。美国各城市过去二十年里陆续推出了各种预测性警务项目,其中最著名的包括芝加哥的"战略对象名单"和洛杉矶的PredPol系统,两者最终都因为存在系统性偏见和效果存疑而被叫停或缩减。
批评者指出的核心问题一直都是同一个:这类系统的训练数据来自历史犯罪记录,而这些记录本身就是过去警务资源分配的产物。如果历史上某个社区被投入了更多警力,它就会产生更多的逮捕和犯罪记录,模型从这些数据中学习,就会倾向于预测同一个社区未来依然是高风险区域,从而驱使执法部门继续向那里投入更多警力,形成自我强化的循环。
美国全国有色人种协进会在其关于AI预测性警务的政策简报中明确指出,当算法从包含系统性不公正的历史数据中学习时,它不是在预测犯罪本身,而是在预测警察过去关注过哪里。这不是同一件事。
布伦南司法中心也在2024年发布的报告中警告,目前美国各地对执法机构使用AI工具几乎缺乏统一的监管框架,透明度和问责机制的缺失,使得这类技术在实践中的偏见难以被识别和纠正。
这项最新研究没有对数据偏见问题进行正面讨论,这在技术论文中并不罕见,但在预测性警务这个具体领域,这个缺席的讨论会被反复追问。
一个准确率86.3%的模型,如果训练数据本身存在结构性偏见,那它的预测结果对谁更准,对谁更不准,是一个比总体准确率更关键的问题。这个问题,这篇论文还没有回答。
天牛宝配资提示:文章来自网络,不代表本站观点。