小白学熵权法原理及案例教程
作者:吴裕雄
链接:
来源:博客园
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
写在前面:
熵权法也属于一种综合评价方法,没有主观性,可与前面几篇文章提到的方法联合使用。
目录
一、熵权法概述
1.1 信息论基础
信息量:信息量是度量弄清楚一个未知事物需要查询的信息的多少,单位是比特。随机变量取某个值时,其概率倒数的对数就是信息量。通俗的说就是,事物所含信息量与其发生的概率负相关。一件事物出现的概率决定了它的不确定性大小,也就决定了所含信息量的大小。出现的概率越大,不确定性越小,所含信息量也就越小。

信息熵:信息熵也就是信息量的期望。可以把信息熵理解成不确定性的大小,不确定性越大,信息熵也就越大。

X表示的是一个信源。
信息量是对信源发出的某一个信号所含信息的度量,信息熵是对一个信源所含信息的度量,也就是信息量的期望。
1.2 熵权法介绍
熵最先由香农引入信息论,目前已经在工程技术、社会经济等领域得到了非常广泛的应用。
熵权法的基本思路是根据指标变异性的大小来确定客观权重。
一般来说,若某个指标的信息熵越小,表明指标值得变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。相反,某个指标的信息熵越大,表明指标值得变异程度越小,提供的信息量也越少,在综合评价中所起到的作用也越小,其权重也就越小。
个人理解:注意上面这段话,说的是提供的信息量,也就是已知的信息。提供的信息量越大,包含的信息也就越小。按照前面信息量的阐述,一个指标变异性越大则发生的概率越大,不确定也就越小,信息量也就越小,解决这个未知事物所需要的信息量也就越小,也就是说它本身提供了较多的信息量。
二、熵权法赋权步骤
2.1 数据标准化
首先将各个指标进行去量纲化处理。
假设给定了m个指标:

,其中

。假设对各指标数据标准化后的值为
![]()
,那么

或

2.2 求各指标在各方案下的比值
也就是第j项指标在第i个方案中占该指标的比重,其实也就是为了计算该指标的变异大小。

2.3 求各指标的信息熵。
根据信息论中信息熵的定义,一组数据的信息熵为:

其中Ej≥0。若pij=0,定义Ej=0。
2.4 确定各指标的权重
根据信息熵的计算公式,计算出各个指标的信息熵为E1,E2,…,Em。
2.4.1 通过信息熵计算各指标的权重:

这里k指的是指标个数,即k=m。
2.4.2 也可以通过计算信息冗余度来计算权重:

然后计算指标权值:

2.5 最后计算每个方案的综合评分
感谢评论区的提醒,下方公式中有误,wj*pij改为wj*xij。

三、熵权法应用实例
3.1 背景介绍
某医院为了提高自身的护理水平,对拥有的11个科室进行了考核,考核标准包括9项整体护理,并对护理水平较好的科室进行奖励。下表是对各个科室指标考核后的评分结果。

但是由于各项护理的难易程度不同,因此需要对9项护理进行赋权,以便能够更加合理的对各个科室的护理水平进行评价。
3.2 数据预处理
根据原始评分表,对数据进行标准化后可以得到下列数据标准化表
所用公式:

11个科室9项整体护理评价指标得分表标准化表:

3.3 计算第j个指标在第i个方案中所占比重


3.4 求各指标的信息熵


3.5 计算各指标的权重
根据指标权重的计算公式:

这里k指的是指标个数,即k=m。
可以得到各个指标的权重如下所示:

3.6 对各个科室进行评分
根据计算出的指标权重,以及对11个科室9项护理水平的评分。依据公式:

各个科室最终得分如下表所示
![]()
四、熵权法的优缺点及使用注意
4.1 熵权法的优点
熵值法是根据各项指标指标值的变异程度来确定指标权数的,这是一种客观赋权法,避免了人为因素带来的偏差。
相对那些主观赋值法,精度较高客观性更强,能够更好的解释所得到的结果。
4.2 熵权法的缺点
·忽略了指标本身重要程度,有时确定的指标权数会与预期的结果相差甚远,同时熵值法不能减少评价指标的维数,也就是熵权法符合数学规律具有严格的数学意义,但往往会忽视决策者主观的意图;
·如果指标值的变动很小或者很突然地变大变小,熵权法用起来有局限
4.3 熵权法的使用
·一般指标个数最好小于对象个数,比较好;
·可用于任何评价问题中的确定指标权重;
·可用于剔除指标体系中对评价结果贡献不大的指标;
·可以用于任何需要确定权重的过程,也可以结合一些方法共同使用。
参考文献:
[1]赵金先,武丹丹,张英,王苗苗.基于熵权法的绿色建筑项目管理绩效可拓评价[J].工程管理学报,2018,32(02):125-130.
[1]孔尚萍,张海瑞,廖选平,洪东跑.基于AHP与熵权法的空中目标威胁评估方法[J].战术导弹技术,2018(01):79-84.