小白学熵权法原理及案例教程

作者:吴裕雄

链接:

吴裕雄 python 熵权法确定特征权重

来源:博客园

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

写在前面:

熵权法也属于一种综合评价方法,没有主观性,可与前面几篇文章提到的方法联合使用。

目录

一、熵权法概述

1.1 信息论基础

信息量:信息量是度量弄清楚一个未知事物需要查询的信息的多少,单位是比特。随机变量取某个值时,其概率倒数的对数就是信息量。通俗的说就是,事物所含信息量与其发生的概率负相关。一件事物出现的概率决定了它的不确定性大小,也就决定了所含信息量的大小。出现的概率越大,不确定性越小,所含信息量也就越小。

信息熵:信息熵也就是信息量的期望。可以把信息熵理解成不确定性的大小,不确定性越大,信息熵也就越大。

X表示的是一个信源。

信息量是对信源发出的某一个信号所含信息的度量,信息熵是对一个信源所含信息的度量,也就是信息量的期望。

1.2 熵权法介绍

熵最先由香农引入信息论,目前已经在工程技术、社会经济等领域得到了非常广泛的应用。

熵权法的基本思路是根据指标变异性的大小来确定客观权重。

一般来说,若某个指标的信息熵越小,表明指标值得变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。相反,某个指标的信息熵越大,表明指标值得变异程度越小,提供的信息量也越少,在综合评价中所起到的作用也越小,其权重也就越小。

个人理解:注意上面这段话,说的是提供的信息量,也就是已知的信息。提供的信息量越大,包含的信息也就越小。按照前面信息量的阐述,一个指标变异性越大则发生的概率越大,不确定也就越小,信息量也就越小,解决这个未知事物所需要的信息量也就越小,也就是说它本身提供了较多的信息量。

二、熵权法赋权步骤

2.1 数据标准化

首先将各个指标进行去量纲化处理。

假设给定了m个指标:

,其中

。假设对各指标数据标准化后的值为

,那么

2.2 求各指标在各方案下的比值

也就是第j项指标在第i个方案中占该指标的比重,其实也就是为了计算该指标的变异大小。

2.3 求各指标的信息熵。

根据信息论中信息熵的定义,一组数据的信息熵为:

其中Ej≥0。若pij=0,定义Ej=0。
2.4 确定各指标的权重

根据信息熵的计算公式,计算出各个指标的信息熵为E1,E2,…,Em。

2.4.1 通过信息熵计算各指标的权重:

这里k指的是指标个数,即k=m。

2.4.2 也可以通过计算信息冗余度来计算权重:

然后计算指标权值:

2.5 最后计算每个方案的综合评分

感谢评论区的提醒,下方公式中有误,wj*pij改为wj*xij。

三、熵权法应用实例

3.1 背景介绍

某医院为了提高自身的护理水平,对拥有的11个科室进行了考核,考核标准包括9项整体护理,并对护理水平较好的科室进行奖励。下表是对各个科室指标考核后的评分结果。

但是由于各项护理的难易程度不同,因此需要对9项护理进行赋权,以便能够更加合理的对各个科室的护理水平进行评价。

3.2 数据预处理

根据原始评分表,对数据进行标准化后可以得到下列数据标准化表

所用公式:

11个科室9项整体护理评价指标得分表标准化表:

3.3 计算第j个指标在第i个方案中所占比重

3.4 求各指标的信息熵

3.5 计算各指标的权重

根据指标权重的计算公式:

这里k指的是指标个数,即k=m。

可以得到各个指标的权重如下所示:

3.6 对各个科室进行评分

根据计算出的指标权重,以及对11个科室9项护理水平的评分。依据公式:

各个科室最终得分如下表所示

四、熵权法的优缺点及使用注意

4.1 熵权法的优点

熵值法是根据各项指标指标值的变异程度来确定指标权数的,这是一种客观赋权法,避免了人为因素带来的偏差。

相对那些主观赋值法,精度较高客观性更强,能够更好的解释所得到的结果。

4.2 熵权法的缺点

·忽略了指标本身重要程度,有时确定的指标权数会与预期的结果相差甚远,同时熵值法不能减少评价指标的维数,也就是熵权法符合数学规律具有严格的数学意义,但往往会忽视决策者主观的意图;

·如果指标值的变动很小或者很突然地变大变小,熵权法用起来有局限

4.3 熵权法的使用

·一般指标个数最好小于对象个数,比较好;

·可用于任何评价问题中的确定指标权重;

·可用于剔除指标体系中对评价结果贡献不大的指标;

·可以用于任何需要确定权重的过程,也可以结合一些方法共同使用。

参考文献:

[1]赵金先,武丹丹,张英,王苗苗.基于熵权法的绿色建筑项目管理绩效可拓评价[J].工程管理学报,2018,32(02):125-130.

[1]孔尚萍,张海瑞,廖选平,洪东跑.基于AHP与熵权法的空中目标威胁评估方法[J].战术导弹技术,2018(01):79-84.