数据综合评价方法盘点:从原理到实践(十)秩和比综合评价法

秩和比综合评价法

原理

秩和比综合评价法是一种集古典参数统计与近代非参数统计各自优点于一体的统计分析方法。它是将原始数据编秩后,计算出秩和比(RSR),然后根据 RSR 值对评价对象进行排序和分档,从而实现对多个评价对象的综合评价。该方法利用了数据的秩次信息,能够在一定程度上反映数据的综合水平,对离群值不敏感,具有较强的稳健性。

实现路径

  1. 数据准备:收集并整理需要进行评价的原始数据,确保数据的准确性和完整性。
  2. 编秩:对每个评价指标分别进行编秩。将同一指标下的数据从小到大排序,然后依次赋予秩次。若有相同的数据,通常取它们应占秩次的平均值作为其秩次。
  3. 计算秩和比(RSR):对于每个评价对象,将其在各个指标上的秩次相加,得到秩和。然后用秩和除以该评价对象的指标数与评价对象总数的乘积,即得到秩和比。公式为:RSR=j=1mRijn×mRSR = \frac{\sum_{j = 1}^{m}R_{ij}}{n \times m},其中RijR_{ij}是第ii个评价对象在第jj个指标上的秩次,nn是评价对象的总数,mm是指标的个数。
  4. 确定 RSR 的分布:将所有评价对象的 RSR 值从小到大排序,计算累计频率。根据累计频率确定 RSR 的分布类型,通常可通过绘制频率分布直方图或进行拟合优度检验来判断。
  5. 分档排序:根据 RSR 值及其分布,将评价对象进行分档。可以根据实际需求确定分档的数量和界限,例如将评价对象分为优、良、中、差等不同等级。然后按照 RSR 值的大小对评价对象进行排序,从而对各评价对象的优劣进行综合评价。

Python 实现代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
import numpy as np
import pandas as pd


def rank_sum_ratio(data):
# 编秩
ranked_data = data.rank()
# 计算秩和
rank_sum = ranked_data.sum(axis = 1)
# 计算秩和比
n, m = data.shape
RSR = rank_sum / (n * m)
return RSR


# 示例数据
data = pd.DataFrame({
'指标 1': [10, 20, 30],
'指标 2': [15, 25, 35],
'指标 3': [20, 30, 40]
})

rsr_values = rank_sum_ratio(data)
print("秩和比:", rsr_values)

优劣势

  • 优势
    • 计算简单:方法原理直观,计算过程相对简便,不需要复杂的数学运算和模型假设。
    • 稳健性好:利用秩次信息进行评价,对数据中的离群值不敏感,能够在一定程度上避免极端值对评价结果的影响,使评价结果更加稳健可靠。
    • 综合评价能力强:能够综合考虑多个评价指标的信息,将不同指标的信息整合到一个综合指标(RSR)中,从而对评价对象进行全面的评价。
  • 劣势
    • 信息损失:在编秩过程中,只利用了数据的相对大小关系,而没有充分利用原始数据的具体数值信息,可能会导致部分信息的损失。
    • 分档主观性:在确定 RSR 的分档界限时,往往需要根据经验或主观判断来确定,存在一定的主观性,不同的分档方法可能会导致评价结果有所差异。

具体案例

为了全面、客观地了解各班级的教学质量,发现教学过程中的优势与不足,以便有针对性地进行教学改进和资源分配,某学校决定对多个班级的教学质量进行综合评价。经过研究讨论,确定了学生成绩、课堂表现、作业完成情况这三个关键评价指标。学生成绩反映了学生对知识的掌握程度,课堂表现体现了学生在课堂上的参与度和学习态度,作业完成情况则能展示学生对知识的巩固和应用能力。学校采用秩和比综合评价法对各班级在这些指标上的数据进行分析,以得出科学合理的评价结果。

  1. 数据收集 学校对 10 个班级进行教学质量数据收集。
    1. 学生成绩:收集各班级学生在本学期期末考试中各主要科目的平均成绩。例如,班级 1 的语文、数学、英语等科目的平均成绩总和为 240 分,班级 2 为 235 分等。
    1. 课堂表现:由任课教师根据学生在课堂上的出勤情况、参与讨论的积极性、回答问题的质量等方面进行综合评分,满分 100 分。如班级 3 的课堂表现平均得分为 85 分,班级 4 为 80 分等。
    1. 作业完成情况:通过检查学生作业的完成率、正确率、书写规范等方面进行量化评分,满分 100 分。例如,班级 5 的作业完成情况平均得分为 90 分,班级 6 为 88 分等。

整理后得到如下数据表格:

班级编号 学生成绩(分) 课堂表现(分) 作业完成情况(分)
班级 1 240 82 88
班级 2 235 80 85
班级 3 245 85 90
班级 4 230 80 83
班级 5 238 83 90
班级 6 232 78 86
班级 7 242 84 89
班级 8 236 81 87
班级 9 234 79 84
班级 10 237 82 88
  1. 运用秩和比综合评价法进行分析
    1. 数据编秩
    • 学生成绩编秩:将 10 个班级的学生成绩按照从高到低的顺序进行排序,成绩最高的班级编为 1 秩,次高的编为 2 秩,以此类推,成绩相同的班级取平均秩。例如,班级 3 的学生成绩最高,编为 1 秩;班级 1 和班级 7 的学生成绩相近,并列第 3 名,则它们的秩为(3+4)÷2=3.5(3 + 4)÷2 = 3.5秩。
    • 课堂表现编秩:同样将各班级的课堂表现得分从高到低排序,进行编秩。如班级 3 的课堂表现得分 85 分最高,编为 1 秩;班级 1 和班级 10 的课堂表现得分均为 82 分,并列第 4 名,则它们的秩为(4+5)÷2=4.5(4 + 5)÷2 = 4.5秩。
    • 作业完成情况编秩:把各班级的作业完成情况得分从高到低排序后编秩。例如,班级 3 和班级 5 的作业完成情况得分均为 90 分,并列第 1 名,则它们的秩为(1+2)÷2=1.5(1 + 2)÷2 = 1.5秩。

编秩后的数据如下表:

班级编号 学生成绩秩 课堂表现秩 作业完成情况秩
班级 1 3.5 4.5 4.5
班级 2 6 6.5 6
班级 3 1 1 1.5
班级 4 8 6.5 8
班级 5 5 3 1.5
班级 6 9 9 5
班级 7 3.5 2 3
班级 8 7 5 7
班级 9 10 10 9
班级 10 2 4.5 4.5
    1. 计算秩和: 每个班级的秩和等于该班级在各个指标上的秩相加。例如,班级 1 的秩和为 3.5+4.5+4.5=12.53.5 + 4.5 + 4.5 = 12.5;班级 2 的秩和为 6+6.5+6=18.56 + 6.5 + 6 = 18.5 等。
    1. 计算秩和比(RSR): 秩和比的计算公式为 RSR=Rn×mRSR = \frac{R}{n \times m},其中 RR 是每个班级的秩和,nn 是班级数量,mm 是评价指标的数量。在本案例中,n=10n = 10m=3m = 3
    以班级 1 为例,其 RSR1=12.510×30.42RSR_1 = \frac{12.5}{10×3} \approx 0.42;班级 2 的 RSR2=18.510×30.62RSR_2 = \frac{18.5}{10×3} \approx 0.62 等。

计算得到各班级的 RSR 值如下表:

班级编号 RSR 值
班级 1 0.42
班级 2 0.62
班级 3 0.12
班级 4 0.75
班级 5 0.32
班级 6 0.77
班级 7 0.25
班级 8 0.60
班级 9 0.97
班级 10 0.38
  1. 结果分析与应用 从计算结果可以看出,班级 9 的 RSR 值最高,达到 0.97,说明班级 9 在综合教学质量方面表现非常突出;而班级 7 的 RSR 值较低,仅为 0.25,表明班级 7 在教学质量上还有很大的提升空间。