数据综合评价方法盘点:从原理到实践(十二)十一种方法的对比总结

十一种方法的对比总结

方法名称 原理 数据要求 权重确定 计算复杂度 结果客观性 适用场景
主成分分析法 通过线性变换将多个相关变量转化为少数几个互不相关的主成分,按方差大小排序,保留大部分信息实现降维 需要一定数量样本数据,数据最好服从正态分布 由算法基于数据内在结构和方差贡献自动确定 较高,涉及矩阵运算,如求特征值和特征向量 较高,基于数据本身结构确定权重和分析结果 数据维度高,需简化数据结构、提取主要信息,如市场调研数据降维分析
因子分析法 研究变量相关性,将多个相关变量归结为少数公共因子,假设原始变量由公共因子和特殊因子构成,通过分析确定因子载荷和得分 需要一定数量样本数据,对数据分布有一定要求,近似正态分布更好 由算法基于数据相关性分析确定,如通过对相关系数矩阵分解 高,涉及复杂矩阵运算和迭代计算,如求解因子载荷矩阵 较高,基于数据相关性确定,但旋转方法等存在一定主观性 适用于多变量数据,挖掘潜在结构和公共因子,如消费者行为多因素分析
模糊综合评价法 借助模糊数学理论,将边界模糊因素量化,构建模糊关系矩阵,结合权重进行模糊合成运算,确定评价对象在不同评价等级上的隶属程度 对数据分布无严格要求,需明确评价指标和评语集,以及构建模糊关系矩阵的数据 可通过主观赋权法(如层次分析法)或客观赋权法(如熵权法)确定,主观性较强 适中,主要是矩阵运算和模糊合成运算 一般,权重确定主观性影响结果,模糊关系矩阵构建也有主观性 评价对象具有模糊性、难以精确量化的情况,如产品满意度、环境舒适度评价
灰色关联分析法 以各因素样本数据为依据,用灰色关联度描述因素间关系,根据序列曲线相似程度判断联系紧密程度 样本数据量要求低,适用于数据有限、信息不完全情况,对数据分布无特殊要求 无需单独确定权重,通过计算关联度反映因素相对重要性 较低,主要计算差值、最值等简单运算 较高,基于数据间关联关系计算,受主观因素影响小 样本数据少、信息不确定,分析因素关联程度,如新兴产业影响因素分析
CRITIC 权重法 通过指标的对比强度(标准差)和冲突性(与其他指标的相关性)确定权重,综合考虑指标变异性和相关性 依赖各指标实际数据,对数据分布要求不高 根据指标标准差和与其他指标相关系数计算确定,是客观赋权法 较高,需计算标准差、相关系数等复杂统计量 高,基于数据客观特征计算权重 多指标综合评价中,需考虑指标变异性和相关性确定权重
独立性权系数法 计算指标与其他指标复相关系数,以 1 减去复相关系数得到独立性权系数,体现指标独立性确定权重 依赖各指标实际数据,对数据分布要求不高 通过计算复相关系数,以 1 减复相关系数确定权重,是客观赋权法 高,涉及多元线性回归分析计算复相关系数 高,基于数据间相关性客观计算 需突出指标独立性的多指标评价场景,如学生综合素质评价中突出某些独特能力指标
变异系数法 根据指标变异程度(标准差与均值的比值)确定权重,变异程度越大,权重越高 依赖各指标实际数据,对数据分布要求不高 根据指标的变异系数大小确定权重,是客观赋权法 适中,主要计算标准差和均值 高,完全基于数据变异程度客观确定 多指标综合评价,依据指标变异程度确定权重,突出数据差异对评价影响
秩和比综合评价法 对每个指标数据编秩,计算每个评价对象秩和,再计算秩和比进行综合评价 对数据分布和数量无严格限制,数据应能进行排序和编秩 不需要专门确定权重,通过编秩和计算秩和比综合评价 较低,主要是数据排序和简单运算 较高,基于数据排序和计算,主观因素影响小 对多个评价对象进行综合排序和评价,如班级、企业综合评价
数据包络分析方法 用于多投入多产出效率评价,通过构建线性规划模型,判断决策单元是否有效,衡量投入产出相对效率 需要多个决策单元多投入多产出数据,数据量一般不少于投入产出指标之和两倍 不需要预先设定权重,通过线性规划模型确定决策单元相对效率 高,构建和求解线性规划模型 高,基于实际投入产出数据客观评价 多投入多产出系统效率评价,如企业生产、学校教学效率评价
层次分析法 将复杂问题分解为多个层次,建立层次结构模型,构造判断矩阵,计算权重向量并进行一致性检验确定各因素相对重要性 对数据要求主要是能通过专家判断或经验构建合理判断矩阵 通过专家对各因素两两比较构造判断矩阵确定,主观性较强 较高,需计算判断矩阵特征向量等 一般,权重确定依赖专家主观判断,一致性检验可能有困难 复杂多目标决策问题,将问题层次化辅助决策,如项目选择、战略规划
熵权法 根据指标数据变异程度确定权重,信息熵越小,指标变异程度越大,权重越高 依赖各指标实际数据,对数据分布要求不高 根据指标信息熵计算确定权重,是客观赋权法 适中,主要计算信息熵相关运算 高,基于数据变异客观确定权重 多指标综合评价,希望依据数据客观信息确定权重