第一百五十二章 名侦探乔闵
这种从大量信息中挖掘出知识的过程,称作数据挖掘或者知识发现,这在地球上来说,是随着计算机技术与信息技术的成熟而出现的新兴学科,与传统的数学有种千丝万缕的关联,却又超出传统数学的基本框架,算是现代应用数学的范畴。
之前曾经出现的蚁群算法,也是属于现代应用数学的范畴,除此之外,有限元分析、神经网络、小波分析与傅里叶变换、深度学习等学科,都是属于现代应用数学。
对乔闵而言,他并不喜欢现代应用数学,虽然,他不得不承认,与传统的经典数学方法相比,现代应用数学方法有着无可比拟的强大优势。以乔闵自身的角度而言,他认为,现代应用数学方法普遍缺乏数学的美感。然而,解决实际的工程问题,离不开这些现代应用数学方法,这确实是传统数学领域内学者的无奈。
虽然不喜欢现代应用数学方法,但乔闵却还是对几种典型的算法与理论还是有一定程度了解的。毕竟,喜欢与否是一回事,强大与否是另外一回事。虽然丑了点,但是好使,也是好方法。
这次的事情,解决起来,说不难也不难,说不简单也不简单。为啥这么说?从原理上来说,就是一个基于大数据的数据挖掘与知识发现问题,难点在于,知识的模式未知,该如何使用这些大数据呢?
黑衣组织兴起于五十年前,仿佛一夜之间崛起的,在刺杀了妖族超过三位重要人物后,一时之间,名声大振。而后五十年间,有超过四十位妖族重要人物被刺杀,其中包括青丘玉璃的父母在内。
在查阅了妖族的卷宗后,乔闵发现黑衣组织是一个组织非常严密,人员众多的一个大型组织。
微微思索了一下,既然如此,乔闵决定采用数据可视化技术来寻找黑衣组织的蛛丝马迹。而乔闵所依据的主要内容,就是每位妖族修士通过关卡门禁时遗留的记录了。
先以青丘玉璃遇刺事件作为突破口吧。
青丘玉璃是在妖族白云关附近被行刺的,白云关附近还有三个关卡,乔闵于是查询了这四个关卡一天之内所有修士的进出数据,总共十万条记录,还好,数量并不是非常大。
这十万条记录,就是线索。乔闵查询了这五万条记录对应的修士在事件发生前后三天的所有活动链,最终得到三万三千条数据链。{十万条记录是以人次为单位的,而数据链,则是以人为单位的。}
这三万三千条数据链,记录了修士三万三千名修士在青丘玉璃遇刺前后三天时间内的所有移动轨迹。
对于知识发现领域,有一个很重要的概念,相同目标的人,行为模式会具有极大的相似性。还有一个理念,就是数据绝不会说谎。
不过,这种数据链形式,行为模式的相似性被隐藏了,因此,需要对原始数据进行一定的信息处理。这个过程称作数据降维。
对于数据降维,乔闵了解主成分分析、局部线性嵌入等。不过,最适合当前情况的,当属分布邻域嵌入算法了。算法的过程略,反正明白,这种数据降维算法非常强大,可以数据点之间的高维欧几里得距离转换为表示相似性的条件概率,最终表现为,将一条数据链映射为二维平面上的一个点上。
然后,四个时辰后,乔闵通过数据降维算法,三万三千条数据变成了平面内的三万三千个点。乔闵拿着手上的这章耗费了巨大心里的图纸,仔细观察起来。
这些点,在平面上当然不是乱无章法的分布的,否则,降维就没有任何意义了。通过分布邻域嵌入算法,三万三千个点,在平面上呈现一团一团的分布。所有人的行为模式,被一目了然的呈现了,这就是数据可视化的强大之处。
只见图纸上,有八个较大的数据簇,囊括了三万一千个数据点,对每个大数据簇内对应的成员身份进行分析,乔闵发现八个数据簇分别是附近的八个不同的妖族种族,这些数据是正常的数据,黑衣组织的成员信息不会落在这些数据簇中。
剩余不足两千个点,其中有八百个离散点,这表示的是无组织瞎晃悠的妖族无聊人士,剩余的一千两百个数据,分为五个一百到三百人规模不等的数据簇。
对照着纸质卷宗,第一个三百五十人的数据簇,应该是妖族部落的妖族女修联盟,联盟中心就在白云关不远之处,是一个很无聊的组织,反正和本案无关,就不介绍了。第二个两百七十人的数据簇对应的组织更加无聊,以另一个世界的说法而言,是玉兔族某玉兔美眉的粉丝同好会,经过与卷宗对照,这个粉丝同好会是个真的同好会,组织里的修士普遍都是一群菜鸡,弱的惊人。第三个两百五十人的数据簇,对应的是妖族的一个专门来交流战技术法的组织,这个小组织的基地就在与白云关相邻的双塔关,这个才是修真世界画风的组织。第四个两百人左右数据簇,是一个小商人联盟,这个是在妖族十五个种族之间贩卖各种日常用品的一个小组织。而第五个一百三十人的数据簇,最为可疑,并没有在卷宗中有任何与之对应的信息。
乔闵于是将这一百三十人的名字全部抄录下来,交给青丘玄华,让青丘玄华去查证一下这些人的基本状况。
为了防止偶然性的数据,乔闵把两年前玉兔族天之骄子月宫长青遇刺事件以相同的方式分析了一下,在得到的图纸上,相同的位置,也有这样一个数据簇。而其他任意选择一个时间段进行投影分析,在对应的位置,并没有这样的数据簇。
分析了几组之后,乔闵心下确定,这个数据簇里对应的修士,就是黑衣组织的成员。
在乔闵分析之时,青丘玄华已经回来了,对乔闵说道:“我已经问清这一百三十位妖族修士的状况了,他们有一个普遍的特点,就是天赋不佳,在族内受到各种欺压,但在最近几年,境界修为却都有长足的进步,甚至不少成了部落的未来之星了。”
查证到这里,青丘玄华已经确定了,这些人不出意外,应该都是黑衣组织的成员了。她心中的好奇心已经提升到了极限了,乔闵观看的数据,不仅是她,妖族内的很多大佬也都已经观看过无数遍的,妄图从中寻找蛛丝马迹,连先知也以天衍之术来推演,结果结论是有人以某种方式蒙昧了天机,了无所获。
而乔闵,他是如何能做到的?在仅仅四个时辰的时间,就取得如此巨大的突破,离找到黑衣组织只有一线之差了,简直不可思议啊!
虽然之前她就告诉自己,乔闵应该能够找出黑衣组织的真实身份来,但当乔闵真正做到时,青丘玄华仍然无法掩盖内心的巨大震撼。乔闵,非凡人也!她甚至萌生了一个想法,青丘玉璃在乔闵身边,会不会比在妖族部落里有更好的发展呢?
之前曾经出现的蚁群算法,也是属于现代应用数学的范畴,除此之外,有限元分析、神经网络、小波分析与傅里叶变换、深度学习等学科,都是属于现代应用数学。
对乔闵而言,他并不喜欢现代应用数学,虽然,他不得不承认,与传统的经典数学方法相比,现代应用数学方法有着无可比拟的强大优势。以乔闵自身的角度而言,他认为,现代应用数学方法普遍缺乏数学的美感。然而,解决实际的工程问题,离不开这些现代应用数学方法,这确实是传统数学领域内学者的无奈。
虽然不喜欢现代应用数学方法,但乔闵却还是对几种典型的算法与理论还是有一定程度了解的。毕竟,喜欢与否是一回事,强大与否是另外一回事。虽然丑了点,但是好使,也是好方法。
这次的事情,解决起来,说不难也不难,说不简单也不简单。为啥这么说?从原理上来说,就是一个基于大数据的数据挖掘与知识发现问题,难点在于,知识的模式未知,该如何使用这些大数据呢?
黑衣组织兴起于五十年前,仿佛一夜之间崛起的,在刺杀了妖族超过三位重要人物后,一时之间,名声大振。而后五十年间,有超过四十位妖族重要人物被刺杀,其中包括青丘玉璃的父母在内。
在查阅了妖族的卷宗后,乔闵发现黑衣组织是一个组织非常严密,人员众多的一个大型组织。
微微思索了一下,既然如此,乔闵决定采用数据可视化技术来寻找黑衣组织的蛛丝马迹。而乔闵所依据的主要内容,就是每位妖族修士通过关卡门禁时遗留的记录了。
先以青丘玉璃遇刺事件作为突破口吧。
青丘玉璃是在妖族白云关附近被行刺的,白云关附近还有三个关卡,乔闵于是查询了这四个关卡一天之内所有修士的进出数据,总共十万条记录,还好,数量并不是非常大。
这十万条记录,就是线索。乔闵查询了这五万条记录对应的修士在事件发生前后三天的所有活动链,最终得到三万三千条数据链。{十万条记录是以人次为单位的,而数据链,则是以人为单位的。}
这三万三千条数据链,记录了修士三万三千名修士在青丘玉璃遇刺前后三天时间内的所有移动轨迹。
对于知识发现领域,有一个很重要的概念,相同目标的人,行为模式会具有极大的相似性。还有一个理念,就是数据绝不会说谎。
不过,这种数据链形式,行为模式的相似性被隐藏了,因此,需要对原始数据进行一定的信息处理。这个过程称作数据降维。
对于数据降维,乔闵了解主成分分析、局部线性嵌入等。不过,最适合当前情况的,当属分布邻域嵌入算法了。算法的过程略,反正明白,这种数据降维算法非常强大,可以数据点之间的高维欧几里得距离转换为表示相似性的条件概率,最终表现为,将一条数据链映射为二维平面上的一个点上。
然后,四个时辰后,乔闵通过数据降维算法,三万三千条数据变成了平面内的三万三千个点。乔闵拿着手上的这章耗费了巨大心里的图纸,仔细观察起来。
这些点,在平面上当然不是乱无章法的分布的,否则,降维就没有任何意义了。通过分布邻域嵌入算法,三万三千个点,在平面上呈现一团一团的分布。所有人的行为模式,被一目了然的呈现了,这就是数据可视化的强大之处。
只见图纸上,有八个较大的数据簇,囊括了三万一千个数据点,对每个大数据簇内对应的成员身份进行分析,乔闵发现八个数据簇分别是附近的八个不同的妖族种族,这些数据是正常的数据,黑衣组织的成员信息不会落在这些数据簇中。
剩余不足两千个点,其中有八百个离散点,这表示的是无组织瞎晃悠的妖族无聊人士,剩余的一千两百个数据,分为五个一百到三百人规模不等的数据簇。
对照着纸质卷宗,第一个三百五十人的数据簇,应该是妖族部落的妖族女修联盟,联盟中心就在白云关不远之处,是一个很无聊的组织,反正和本案无关,就不介绍了。第二个两百七十人的数据簇对应的组织更加无聊,以另一个世界的说法而言,是玉兔族某玉兔美眉的粉丝同好会,经过与卷宗对照,这个粉丝同好会是个真的同好会,组织里的修士普遍都是一群菜鸡,弱的惊人。第三个两百五十人的数据簇,对应的是妖族的一个专门来交流战技术法的组织,这个小组织的基地就在与白云关相邻的双塔关,这个才是修真世界画风的组织。第四个两百人左右数据簇,是一个小商人联盟,这个是在妖族十五个种族之间贩卖各种日常用品的一个小组织。而第五个一百三十人的数据簇,最为可疑,并没有在卷宗中有任何与之对应的信息。
乔闵于是将这一百三十人的名字全部抄录下来,交给青丘玄华,让青丘玄华去查证一下这些人的基本状况。
为了防止偶然性的数据,乔闵把两年前玉兔族天之骄子月宫长青遇刺事件以相同的方式分析了一下,在得到的图纸上,相同的位置,也有这样一个数据簇。而其他任意选择一个时间段进行投影分析,在对应的位置,并没有这样的数据簇。
分析了几组之后,乔闵心下确定,这个数据簇里对应的修士,就是黑衣组织的成员。
在乔闵分析之时,青丘玄华已经回来了,对乔闵说道:“我已经问清这一百三十位妖族修士的状况了,他们有一个普遍的特点,就是天赋不佳,在族内受到各种欺压,但在最近几年,境界修为却都有长足的进步,甚至不少成了部落的未来之星了。”
查证到这里,青丘玄华已经确定了,这些人不出意外,应该都是黑衣组织的成员了。她心中的好奇心已经提升到了极限了,乔闵观看的数据,不仅是她,妖族内的很多大佬也都已经观看过无数遍的,妄图从中寻找蛛丝马迹,连先知也以天衍之术来推演,结果结论是有人以某种方式蒙昧了天机,了无所获。
而乔闵,他是如何能做到的?在仅仅四个时辰的时间,就取得如此巨大的突破,离找到黑衣组织只有一线之差了,简直不可思议啊!
虽然之前她就告诉自己,乔闵应该能够找出黑衣组织的真实身份来,但当乔闵真正做到时,青丘玄华仍然无法掩盖内心的巨大震撼。乔闵,非凡人也!她甚至萌生了一个想法,青丘玉璃在乔闵身边,会不会比在妖族部落里有更好的发展呢?