睿帆科技:以数据赋能,推动公安部门数字化转型

2019年11月14日,由中国指挥与控制学会主办,CCIC安全应急共享知识专业委员中国人民公安大学大数据战略研究中心承办的2019年度中国指挥与控制学会安全应急共享知识专业委员会年会在南京举办,本次会议共有包括北京、广州、天津、南京、西安、长春、大连等24座城市企业及公安部门代表出席本次活动。

会议上南京市公安局党委委员、副局长、CCIC安全应急共享知识专业委员会副主任蒋平中国人民公安大学警务信息工程与网络安全学院党委书记、中国人民公安大学大数据战略研究中心副主任张峰中国指挥与控制学会副秘书长、一体化指挥调度技术国家工程实验室主任、CCIC安全应急共享知识专业委员会副主任刘玉昌等多位领导出席并发布了致辞,睿帆科技作为学会大数据及人工智能技术支持单位,由副总经理于东代表出席本次年会。


本次年会旨在通过大数据及人工智能引领公安部门的改革,让大数据创造大价值,借大数据之力打造公安“最强大脑”。大会上公布了以大数据、人工智能、云计算为核心的智力共享平台,旨在将各地的警务系统打通,完成跨区域警务协作资源共享

睿帆科技作为智力共享平台大数据及人工智能的产品及技术支持方,在会上详细地为24市的公安部门代表介绍了由睿帆科技自主研发的公安大数据解决方案


当前公安系统的业务非常多样,公安大数据体系建设需要全盘考虑大数据存储技术、管理技术、挖掘技术等多个方面,以海量的公安数据资源库为基础建立大数据采集平台、大数据存储平台、大数据分析平台,并不断挖掘公安情报,实现信息化的快速发展,形成业务与信息化互相促进的格局。

(一) 建立大数据采集平台

大数据采集平台大小取决于所获取的数据的广度与深度。公安数据具体可以分为以下几类:一是公安基础工作数据信息。主要包括:人员信息、案件信息、物品信息、线索信息、场所信息等。二是公安内网共享的数据信息。主要包括公安部及各省市公安内网中的在逃人员信息、盗抢汽车信息、违法犯罪人员信息、通缉令、预警信息、研判指令等。三是外部社会信息。主要包括互联网刊载的违法犯罪信息、商业网站的一些异常信息、保险理赔信息、个人资信信息、中介机构信息、检察机关案件信息、审判机关案件信息、信用卡组织信息、公证机构信息等。

(二) 建立大数据存储平台

建立大数据存储平台,可以解决海量数据的统一存放问题,但是这些来自不同来源的公安数据仍然是散乱的、不规则的原始数据。需要对原始数据进行清洗、整合,建立规范、统一、完整的基础数据视图,然后在此基础上,针对业务部门提出的具体业务需求,进一步的进行数据的加工和处理,形成面向主题的数据集市,供业务部门使用。

(三) 建立大数据分析平台

建立大数据分析平台是公安信息化应用的重要环节。公安机关对大数据的分析解读是一个去伪存真、去粗取精的过程。分析解读的方法和内容主要是:一是对大数据信息真实性分析。违法犯罪活动大多处于隐蔽状态,所反映信息往往缺乏明朗性,有的甚至具有伪装性,对初期收集到的信息必须甄别其真伪;二是对大数据信息的比对查询分析。这是公安工作特别是侦查工作中运用较为广泛的分析解读手段,通过同类信息比对查询,扩展信息量,串并同类信息;三是量化比较分析。对某个区域、时段、案件、涉案人员、财物、场所以及线索等的数量与前期、上年同期、周边同期进行比较分析等等,例如包括信息查询、人员甄别、串并、碰撞比对,重大案件特点分析预警,各类数据的统计分析、规律提炼及情报收集,可疑人员身份锁定及人员控制,生物信息档案管理和证件鉴别研究等功能。


睿帆科技基于公安系统需求的深刻理解,以大数据科学平台Baymax为数据采集、存储、分析的基础,以大禹中文智慧文本平台历史档案识别标注的处理引擎,以分布式分析型数据库雪球DB交互式查询的核心,构建了一整套围绕警务易搜、自助比对、综合查询、信息布控、专题研判、预警分析等多种业务场景的公安大数据解决方案。

(一) 大数据科学平台Baymax,为警务人员提供高效一体化大数据采集存储分析平台

大数据科学平台Baymax是一款围绕多源异构的海量数据入、存、管、出四个核心场景,集数据集成、数据治理、数据分析、数据监控及系统配置等功能为一体的大数据平台,能有效支撑公安所有业务过程中各个环节的数据需求,帮助警务人员对海量数据进行采集、存储、治理、分析和挖掘,发现案件中的关键信息。

其支持1000个节点以上的分布式处理数据处理规模可达PB级别以上,记录文档数据可支持万亿规模以上,支持对结构化数据、非结构化数据,半结构化数据进行统一的存储管理及一体化查询,帮助警务人员快速从身份证、交易日志、卡口视频、案件照片录音等多种数据类型中,快速发现有效信息。

(二)大禹中文智慧文本平台,历史案卷信息读取的小帮手

大禹中文智慧文本平台是一款围绕中文文本的模型自动识别、文本结构化、文本数据应用、关键信息提取四个核心场景,集自动标注、人工标注、模型训练以及API部署等功能为一体的文本平台,能快速准确处理大量复杂文本,满足不同场景下的文本处理需求,帮助警务人员对大量历史文本案卷进行预处理、存储、识别、提取关键信息和挖掘,发现其中包含的价值。

(三)分布式分析型数据库雪球DB,高效信息交互的核心

分布式分析型数据库雪球DB是一款用于联机分析处理(OLAP)MPP列式数据库管理系统(DBMS)。提供PB级别大数据集的在线多维查询分布式存储,特别适用于海量结构化数据存储、高并发点查询、高吞吐即席查询(Ad-hoc)、多维分析和实时查询场景。

在刑侦大数据场景中,由于数据量大、查询人员多,所以对于数据库性能的要求极为苛刻。分布式分析型数据库雪球DB在万亿规模数据,进行高并发即席查询实现秒级响应,这极大的提升了刑侦破案的效率,降低了破案周期。

“过去公安部门在做串并案分析时,通常采用的是人工比对的方式。2个民警,一天只能比对10本历史案卷。通过睿帆科技自主研发的公安大数据解决方案,仅需1000条文本即可完成文本模型的训练,再通过文本模型10分钟即可完成1000本的历史案卷自动识别标注,这对于公安系统来说是超过万倍的提升。”睿帆科技副总经理于东表示。


受邀出席本次年会是公安部门对睿帆科技大数据人工智能产品及技术的认可,也标志着睿帆科技进一步深入公安安防行业的开始。未来,睿帆科技将继续加大产品技术的研发,以更为全面、优异的产品及解决方案与公安部门共筑智能安防新时代。