测试效度指的是什么含义?

测试效度亦称测试的有效,指一套测试对应该测试的内容所测的程度。也就是说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。

例如:“Is photography an art orscience?Discuss.”这种题目以摄影的知识为前提和主要内容,用来考语言能力,就不具有效。又如用听写来测量学生的听觉能力,其效度也是不理想的,因为书面记录有声语言不仅涉及学生的听觉能力,而且还与他们的书写速度、拼写能力、语法知识、记忆能力和对全文的理解能力等有关。

测试效度的分类具体指的是什么?

(1)表面效度(face validity)

指测试应达到的卷面标准,即一套测试题从表面看来是否是合适的。例如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度。表面效度是测试出受试者正常的一种保证因素。

(2)内容效度(content validity)

指一套测试题是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表和覆盖面的程度。例如,如果某一套发音技能测试题仅仅考查发音所必须具备的某些技能,如只考单一音素的发音,而不考查重读、语调或音素在词语中的发音,那么,该测试的内容效度就很低。

(3)编制效度(construct validity)

指一套测试题的诸项目对编制该测试所依据的理论的各个基本方面的反映程度。例如,以结构主义语言理论为基础,认为系统的语言惯是通过句型而获得的,那么,强调词汇和语法环境的测试题目就失去了编制效度。

(4)经验效度(empiricalvalidity)

经验效度是一种衡量测试有效的量度,通过把一次测试与一个或多个标准尺度相对照而得出。经验效度可分为两种:一是共时效度(concurrent validity),即将一次测试的结果同另一次时间的有效测试的结果相比较,或同教师的鉴定相比较而得出的系数;二是预测效度(predictive validity),即将一次测试的结果同后来的语言能力相比较,或是同教师后来对学生的鉴定相比较而得出的系数。

推荐内容