专注图关系数据挖掘,「极验」发布图数据建模平台“叠图”

7月11日,「极验」举行Graph Learning 创新大会暨极验 2019 图数据建模平台发布会,并发布新产品——图数据建模平台。

36氪曾多次报道极验。极验成立于 2012 年,是一家验证安全技术服务提供商。36氪曾报道,极验的核心产品为是一款嵌入 PC 端或移动端登陆页的验证滑块,用来取代传统的输入型验证码。背后的技术支持包括用户的生物特征,比如鼠标移动轨迹等行为轨迹的分析,结合动态更新的数据库和全网联防技术,在 SaaS 后台,极验也为网站提供实时的数据分析和预警功能。

本次发布的新产品图数据建模平台,是极验在图数据建模领域探索数年后,研发的一套符合建模需求的底层数据引擎,支持企业级图数据深度学习建模,企业能够一站式完成建模操作。

图数据是什么?在企业纷纷线上化,做数字化转型的时期,会产生大量数据。对于不少AI公司通过深度学习来训练神经网络而言,大量的数据是必要的,但对于更多的具有特定关系的关系数据,现在的挖掘则很少,比如对于社交网络中的关系,则适合用图数据来表达,因为图数据可以囊括里面的节点(社交账号、帖子),以及用户间的关系(关注、转发)等。

另外,应用图数据来做深度学习,能够做到端对端的自动学习,以往的深度学习很多还是靠手工规则来提取,像这类人工环节就可以省去,提高企业从系统底层搭建数据平台的效率。

在技术架构方面,叠图技术框架的核心包括中间三层,分别存储层、操作层和建模层。

存储层与操作层合称为图存储引擎,主要完成对图数据分布式存储以及图数据操作的抽象接口。在这一层的设计上,极验围绕图分区、图数据的结构设计与存储,以及整个数据系统的索引设计与优化来做了大量开发工作,以支撑上层数据操作的高效性,比如随机游走、子图采样等。

专注图关系数据挖掘,「极验」发布图数据建模平台“叠图”

而在落地场景场面,极验图建模平台可以适用于风控和营销两大类业务场景。

以车险反欺诈为例,一起车辆事故的数据有很多,车辆损伤数据就包括褶皱、凹陷、开裂、擦伤等等;另外还有车辆属性信息,来自不同的厂商,不同的年份,版本也不相同。这些数据之间存在着复杂关系,比如当车辆的发动机损坏的时候,往往也会伴随着其他的零配件损坏。通过建立车险理赔的图,利用图神经网络,可以很好的发现一些风险模式,比如线上风险、二手车风险、人伤碰瓷、理赔人员问题等等。

叠图集成了大规模图数据分布式建模能力,以 Web 端提供服务,企业可以直接上手使用,不需要专家也可以进行建模,降低了建模门槛。其次,极验将整个建模流程固化到平台上,后期模型的维护成本也大大降低。

在性能方面,极验图数据建模平台完成百万节点构图需要的时间不到20秒。而对于 1 亿节点,5 亿边规模的数据,极验在 10 个 worker 上的构图时间只需要 150 秒。在读取性能上,极验可将子图采样的时间控制在 100 毫秒以下,显卡不会出现计算延时。

对于未来的发展方向,极验表示,除了风控和营销外,医学药物挖掘、图像识别、智慧城市等研究方向,也有图技术的发展空间;另外,近年来颇为流行的技术中台、数据中台等概念,叠图也可以从数据的关联度出发,将各类数据进行整合建模,提升中台的建设效率。

Like
喜欢 哈哈 哇哦 悲伤 愤怒

评论 0