安然公司高管组织结构发现 联系客服

发布时间 : 星期一 文章安然公司高管组织结构发现更新完毕开始阅读5c3a96a8fe4733687f21aa08

安然公司高管组织结构发现

摘 要

本文针对安然公司高层管理组织结构问题,通过对人物关系网络的行或列求和,并进行排序,得到关键人物和除已知嫌疑人外的其他嫌疑人,综合利用熵权法和数据标准化处理得到综合评价指标,结合聚类分析的方法,挖掘出人物关系网络中的群集行为。

针对问题一:要利用方法1和方法2中的人物关系网络找出关键人物,对方法1中的150′150人物关系网络矩阵的每一行求和,建立相应的数学模型,用matlab软件求解,得到每一个人的通信总次数,并进行排序,取前5名,所求的关键人物如下:Lavorato-j,Dasovich-j,Bass-e,Hayslett-t,Jnoes-t。

以方法1中的人名为基准,在方法2中的2307′2307人物关系网络矩阵中找到其对应行和列位置,利用matlab软件,提取出2307′2307矩阵的107′107子矩阵,作为方法2的人物关系网络,利用同方法1同样的方法,得到每个人的在邮件内容里出现的总频率及其排序,取前5名,所求的关键人物如下:Mike Swerzbin,Fletcher J Sturm,Jay Reitmeyer,Steven P South,Robert Badeer。

针对问题二:基于方法1和方法2所构建的关系网络,分析两种方法对组织结构关系刻画的利弊,分析结果如下:方法1以通信次数为分析对象,人物关系直接明了,但是信息量较小;方法2以邮件内容为分析对象,兼顾考虑了通信次数和人与人之间的间接通信,信息量大,但在数据预处理时,从2307个人中提取107个人,可能会遗漏也可能成为关键人物的那一部分人,总体来说,两种方法各有利弊。

综合利用两种方法挖掘人物关系网络中的群集行为,首先利用熵权法,对通信和邮件两项指标赋权重,结果见表3。由于通信和邮件两项指标的量纲不同,对二者进行标准化,结果见附录表7和表8。最后对赋权值和标准化后的通信与邮件两项指标进行求和,得到综合评指标,基于综合评价指标的人物关系网络矩阵见表4。利用该矩阵,利用聚类分析的方法,建立数学模型,用matlab软件求解,得到人物关系网络中的群集行为,结果如下:harris-s一个人为一类,king-j一个人为一类,lewis-a一个人为一类,williams-j一个人为一类,其余的103个人聚为一类,详细结果见表5。

针对问题三:要由已知道的三位犯罪嫌疑人找出可能存在的其他犯罪嫌疑人,只需找到与这三个犯罪嫌疑人联系最频繁的人即可。在方法2中的2307′2307人物关系网络矩阵中找到已知的3位犯罪嫌疑人的对应位置,提取3′2307子矩阵,对矩阵的每一列求和,建立相应的数学模型,利用matlab软件得到每个人与这三个犯罪嫌疑人联系频繁程度之和,作为对嫌疑程度的综合度量,进行排序,取前5名,则最有可能的其他犯罪嫌疑人如下:Morten E Pettersen,Kenneth,Andy,Page,Jones。(职位)

关键词:组织结构问题;熵权法;标准化;综合评价指标;层次聚类分析

一 问题重述

安然公司(Enron)是一家位于美国得克萨斯州休斯敦市的能源类公司,曾是世界上最大的电力、天然气以及电讯公司之一,公司连续六年被《财富》杂志评选为“美国最具创新精神公司”,然而真正使安然公司在全世界声名大噪的,却是这个拥有上千亿资产的公司2002年在几周内破产,持续多年精心策划、乃至制度化系统化的财务造假丑闻,以及安然事件中的高层管理者欺诈犯罪事件。

安然倒闭之后,许多研究者致力于分析与处理安然邮件数据集(包含有150位安然公司高层管理者自2000年至2002年的所有邮件),试图通过分析这个数据集挖掘出安然公司高层管理者之间的组织结构关系(通常也叫做社区结构),并进一步找出其中可能存在犯罪嫌疑人。他们采用了两种建立人物关系的方法初步得到了两个与之对应的人物关系网络(用矩阵来描述,每个元素描述关系的紧密程度,取值范围从0至1, 0代表关系最不紧密,1代表关系最紧密):

方法1,基于通信行为的人物关系网络构建:人物关系的建立是基于通信行为的,这是指如果两个人之间的通信次数越高那么二者之间的关系就越紧密;所得人物关系网络为150乘150矩阵,这里的150是Enron高管的人数,详细数据见第一组数据(数据中有两个文件,name.txt为150个人的名字,adjacent.txt表示他们之间的有效通信次数);

方法2:基于邮件内容的人物关系网络构建:人物关系的建立是基于邮件内容的,这是指假设两个人在N篇邮件内同时出现过,如果N越大,那么二者的关系就越紧密。所得人物关系网络为2307乘2307矩阵,这里的2307个人物是邮件内出现的高频人物,详细数据见第二组数据(数据中Namelist2.txt表示人物名字,RalationNet2.mat是matlab文件,表示这2307个人物之间的紧密程度。值得提醒的是由于基于内容分析,有些人物名字上可能有不一致,比如可能是名字全称,也可能只用名或姓,这也需要你们自行分析)。

问题:

1、分别针对方法1和方法2中的人物关系网络,找出其中的关键人物。 2、试分析上述两种方法所构建的人物关系网络对组织结构关系刻画的利弊,结合第一问得到的关键人物,选择其中的一种方法(或是综合两种方法),挖掘人物关系网络中的群集行为。

3、若已经知道,Enron公司的三位高管是犯罪嫌疑人(Kenneth Lay:Chairman;Jeffery Skilling:CEO;Andrew Fastow CFO),能否通过以上的组织结构找出可能存在的其他犯罪嫌疑人,高管职位参见附录。

二 问题分析

针对问题一,要求分别根据方法1和方法2中的人物关系网络,找出其中的关键人物。对于方法1,人物关系网络是基于通信行为建立的,两人之间的通信次数越高则这两者之间的关系就越紧密,一个人与其他人的总通信次数越多则表明这个人物越关键。从方法1中的150′150人物关系网络矩阵,找出每一个人与他人总的通信次数在前五位的人作为关键人物。即对150′150人物关系网络矩阵的每一行进行求和,建立相应的数学模型,利用matlab软件求解,得到每一个人的通信总次数,并进行排序,取前5名,即为针对方法1所求出的关键人

物。对于方法二,由于所给数据太过庞大,且数据中人物名字不一致,有可能是全名,也有可能是名或姓。这会在建模时照成一定的困难,在这里对名字进行一定的处理,使数据量减少,便于计算。处理方法如下:以方法1 中150个人物的名字为基础,在方法2的2307个名字中,把150个名字对应的位置找出,利用matlab软件,提取出2307′2307矩阵的107′107子矩阵,作为方法2的人物关系网络,用同方法1同样的方法,找出针对方法2的关键人物。

针对问题二,要分析两种方法所构建的人物关系网络对组织结构关系刻画的利弊,可以基于方法1和方法2所构建的关系网络,从信息的广度,提供信息的真实可靠性等方面来进行分析。

由于方法1和方法2所构建的人物关系网络对组织结构关系的刻画各有利弊,且在确定关键人物的过程中,通信和邮件这两项评价指标的重要性并不相同,为了挖掘人物关系网络中的群集行为,需综合利用两种方法,即得到综合的评价指标,具体过程如下:对方法1中的通信指标和方法2中的邮件指标分别赋权值,且对这两个指标进行标准化处理,最后将二者相加,求得综合的评价指标。考虑到熵权法可以根据各指标的变异程度,利用信息熵计算出各指标的熵权,再通过熵权对各指标的权重进行修正,得出较为客观的指标权重,故采用熵权法,求解出通信和邮件两项指标的权重。通过以上分析,建立相应的数学模型,利用matlab软件求解,得到基于综合评价指标的人物关系矩阵,结合聚类

分析的方法,建立相应的数学模型,利用matlab软件求解,即可分析出人物关系网络中的群集行为。

针对问题三,要求根据已知的三位犯罪嫌疑人,通过组织结构关系,找出可能存在的其他犯罪嫌疑人。在犯罪嫌疑人已知的情况下,只要找到跟这三个犯罪嫌疑人联系最频繁的人,即可找到最有可能其他犯罪嫌疑人。先根据已知的3为犯罪嫌疑人的名字在方法2的人物关系网络中找出其相对应的位置,提取出3′2307人物关系网络矩阵,而这三行中的元素表示的就是其他人与已知的3个犯罪嫌疑人之间的联系频繁程度。对矩阵的每一列求和,建立相应的数学模型,利用matlab软件求解,得到每个人与这三个犯罪嫌疑人联系频繁程度之和,进行排序,取前5名,即可获得5位除已知嫌疑人之外的最有可能的犯罪嫌疑人。

三 模型假设

1.所给数据具有一定的依据。

2.对于方法二中的重复信息,假设只考虑全名和名,不考虑只有姓的情况。 3.每个人的嫌疑程度可以通过与已知的三个的嫌疑人的联系频繁程度来衡量。

四 符号说明

si:表示第i个人与其他人通话次数总和。

zi:表示第i各人与其他人得在邮件中出现频率总和。

mij:表示第i个人和第j个人之间的通话次数。 nij:表示第i个人和第j个人之间的邮件中出现频率。

五 模型建立与求解

5.1 问题一模型建立与求解

5.1.1基于方法1分析关键人物模型的建立与求解

模型的建立

对方法1构建的基于通信行为的人物关系网络,即150′150矩阵进行每行求和,得到每个人的通信总次数,建立相应的数学模型:

si=?150mijj=1模型的求解

利用matlab软件求解,对所得结果从大到小进行排序后,找出通话次数在前五名的五个人,即为针对方法1的关键人物,所得结果见下表:

方法1中关键人物表 附表1

排名 1 2 3 4 5

姓名编号 63 20 6 46 55

姓名 Lavorato-j Dasovich-j Bass-e Hayslett-t Jnoes-t

通话次数 2413 2180 1793 1604 1554

结果分析

据上表可知,由方法1的人物关系网络找出的关键人物是Lavorato-j,Dasovich-j,Bass-e,Hayslett-t,Jnoes-t,这些人与其他人的通话次数最多,是最有可能的关键人物。

5.1.2基于方法2关键人物分析模型的建立与求解

模型的建立

对方法2中所给出的2307个名称进行处理,处理方式如下:以方法1 中150个人物的名字为基础,在方法2的2307个名字中,把150个名字对应的位置找出。由已找到的107个人,提取2307′2307人关系网络矩阵的107′107子矩阵,作为方法2的人物关系网络,对这个新的人物关系网络矩阵进行每行求和,得到每个人的在邮件内容里出现的总频率,建立相应的数学模型:

zi=?107nij

j=1模型的求解

利用matlab软件求解,且对所得结果从大到小进行排序后,找出在在邮件内容里出现的总频率前五名的五个人,即为针对方法2的关键人物,所得结果见下表: