用户注册 |  用户登陆 |  设为首页
  当前位置:首 页 >> 命题评价 >> 正文
教育评价改革再认识
时间:2015-05-09  来源:admin  
长期以来,由于缺乏准确反映义务教育质量状况的客观数据,单纯以成绩和升学率为标准来评价学校教育教学质量的现象一直存在。近日,国务院教育督导委员会办公室印发《国家义务教育质量监测方案》,决定在全国开展义务教育质量监测工作。本报4月16日10版对这一有着“中国的PISA”之称的教育质量监测进行了深度解读(详见《教育质量监测:考试评价制度改革的突破口》),就为什么要开展监测、会否增加学生负担、与中高考的区别等热点回应社会关注。今天本版特推出两位学者对教育评价改革的再认识,围绕认知理解和把握中国教育评价改革的核心逻辑、应用逻辑、技术逻辑,进一步探讨促进学生全面发展、提升义务教育质量的途径和手段。
  从关于教育评价改革的各种国家政策、规划、制度、意见中明确本次改革的目标与任务,是认知理解和把握中国教育评价改革的基础和核心逻辑
  正在进行的教育评价改革,作为教育领域中具有划时代意义的重大事件,肩负着从根本上改变我国当前的教育评价与国家对素质教育以及人才培养要求不相配套的历史使命,改革的成功不仅关系到中国亿万学子的身心健康和全面发展,也关系到教育兴国、人才兴国的战略能否深入推进。
  在教育评价改革进程中,2002年、2010年、2013年和2014年,我国政府相继发布了一系列文件,对教育评价改革提出了越来越清晰、也越来越紧迫的要求和任务。
  2002年,教育部发布《关于积极推进中小学教育评价与考试制度的通知》,提出了中小学评价与考试制度改革的原则。2010年,被称为“中国当代教育改革元年”,《国家中长期教育改革和发展规划纲要(2010-2020年)》正式发布,中国教育未来十年的总体战略、指导思想和战略目标就此确立。文件中专门论述要改革教育质量评价和人才评价制度。
  2013年,被称为“中国教育史上具有里程碑意义的一年”。教育部先后发布了《关于推进中小学教育质量综合评价改革的意见》及其附件《综合评价指标框架(试行)》和《中共中央关于全面深化改革若干重大问题的决定》。前者给出了中小学教育质量综合评价改革的总体要求、综合评价体系要求、完善推进评价改革的保障机制要求、认真组织实施要求;《决定》则明确给出了教育评价、考试改革的时间表和路线图,被称为“我国教育考试招生制度系统性综合性最强的一次改革”。
  2014年,被称为中国“全面深化教育改革元年”,标志性事件是教育部指定的全国30个中小学教育质量综合评价改革实验区以及中国教育学会管理的实验区先后启动,由此拉开了中国教育史上规模最大、历时最长的教育评价改革实验。当年9月,万众企盼的《关于深化考试招生制度改革的实施意见》由国务院发布,正式提出了以“学生学业水平考试成绩和统一考试成绩为两种依据,以综合素质评价结果为参考的高考招生方案”,并建立了上海和浙江两个试点。
  上述一系列的政策、规划、制度以及意见类文件,基本完成了我国教育评价改革的顶层设计和实现路线,这种设计体现了全球教育评价发展的总体趋势,即教育评价进入了多元化、个性化、全面综合发展评价的时代。将教育评价改革指向建立一种“体现素质教育要求、以学生发展为核心、科学多元的中小学教育质量评价制度,并希望借此制度的建立,能够实现‘切实扭转单纯以学生学业考试成绩和学校升学率评价中小学教育质量的倾向,促进学生全面发展、健康成长,促进学生社会责任感、创新精神和实践能力的培养’”的改革目标。因此,借鉴国际先进经验,建立一套符合中国国情、能够解决我国实际问题的中小学教育质量评价体系,把教育质量评价作为诊断教育问题、完善教育政策、改进教育教学的重要举措是完成这一目标的途径和手段,也成为确保改革成功而必须要完成的任务。
  有效可靠地研究和把握教育发达国家及中国教育评价发展的历史和现实,是认知理解和把握中国教育评价改革的应用逻辑
  迄今为止,全球教育评价发展共经过6个发展时期和5个理论阶段,分别是考试时期(学校出现-19世纪末,也称作萌芽时期)、测验时期(测量理论阶段)(20世纪初-30年代)、描述时期(目标中心理论阶段)(20世纪30-50年代)、判断时期(标准研制理论阶段)(20世纪50-70年代)、结果认同时期(建构理论阶段)(20世纪70年代以来)和综合评价时期(多元智能理论阶段)(20世纪80-90年代及之后的大发展)。与第六个时期基本同步的是全球新一轮的教育深度改革,标志着以成长为基础、以“幸福+成功”为目标的多元化、个性化、全面综合发展的教育时代到来。
  我国的教育评价发展至今,经历了考试时期(周代至清末)、引入美国教育评价时期(民国时期至1949年前)、引入苏联教育评价时期(20世纪50-70年代)、“双基测验+课外活动”时期(20世纪80年代至2010年)、2013年至今的教育评价改革启动。
  我国尽管从20世纪90年代末就开始了新一轮课程改革,并于2002年对教育评价提出了新的要求,但在实际发展过程中,教育评价基本上还停留在测验时期。历史上这一时期的特点是,用教育测量的结果作为教育评价的结果,即用分数取代评价。教育测量解决了科学收集教学信息的问题,在一定程度上克服了传统考试的主观性、随机性和随意性,但其最大的问题在于它企图用数字来表示受教育者全部特征,而学生的态度、兴趣、创造力、鉴赏力等的评价十分复杂,很难全部量化,因此,以测量结果作为评价结果,难免过于机械化、片面化,缺乏对受教育者完整和全面的认识。从测验时期发展到综合评价时期,西方国家历经了4个历史时期、近70年的时间。我国本轮的教育评价改革力图用10年左右的时间达到西方国家70多年积累所达到的水平,改革难度之大、任务之艰巨,我们要有清晰的认识。从测量阶段跨入综合评价阶段,意味着要解决以下几方面的问题:
  构建教育质量综合评价的模型以解决教育质量综合评价到底应该评什么以及各部分之间的结构关系问题;
  构建教育质量综合评价的理论体系以解决教育质量综合评价的理论依据的问题;
  健全和完善教育质量综合评价的评价标准及内容以解决教育质量综合评价的评价标准及内容结构的问题;
  健全和完善教育质量综合评价的测量标准以解决教育质量综合评价的测量标准的问题;
  开发测量和评价工具以解决教育质量综合评价技术及方法的问题;
  建立评价结果解释及应用系统以解决教育质量综合评价结果如何解读以及如何应用的问题;
  建立教育质量综合评价的标准化实施流程以解决教育质量综合评价长效运行的问题;
  研究和理解教育发达国家的教育评价历史与发展,是认知理解和把握中国教育评价改革与发展的理念和技术逻辑
  如前所述,以美国为代表的教育发达国家的教育评价历史与发展共经历了6个时期、5个理论阶段,从测试时期到综合评价时期历时近一个世纪,期间积累了丰富的理论和实践经验。经历过了以单纯的标准化考试(实质就是智力测验、认知测验)为评价标准的“应试”评价模式所带来的各种弊端后,自20世纪60年代起,以评估学生的综合素质为主的“表现性评价”(performance assessment)、“真实性评价”(authentic assessment)或“情境性评价”在美国开始兴起,并成为标准化考试的重要补充。今时今日,美国在评价学生和学校上已经形成了“GPA(学业成就)+综合素质评价+标准化考试(学习竞争能力考试,或应用、研究潜力测试)”的综合评价模式,而其对综合评价的目标结构的界定则是:综合评价目标=学习(成就、能力、素养)评价目标+成长(程度、个性、素养)评价目标+应用、研究潜力(或学习竞争能力)测试目标。
  一个国家对教育质量综合评价的基础框架(图式)架构的设计,是以该国教育理念、意图、目标与标准为基础和基准的。1999年《中共中央国务院关于深化教育改革全面推进素质教育的决定》,2001年的《基础教育课程改革纲要(试行)》和2002年《教育部关于积极推进中小学评价与考试制度改革的通知》以及2013年的《意见》和《指标(试行)》,陆续给出了关于教育目标的基础的、系统的划分和结构要求——在国家教育宗旨和总目标之下,基本划分为:学科教育(三维)目标、基础性发展目标、人才培养教育目标,提出了“学业评价、综合素质评价、标准化考试”基本结构和要求。基于这些目标,从2001年到2012年,教育部陆续出台了学科课程标准、综合实践活动等综合素质课程标准、人才培养规划。十八届三中全会后教育部发布相关文件及提出的中高考改革制度,提出了:综合评价=学业评价+综合素质评价+统一考试(学习能力考试,或应用、研究潜力测试)的结构和模式。
  综合我国国内相关政策及文件的要求,以及国外教育先进国家的实践做法,我国教育评价改革实验的基础框架应采用:以“学业(素质能力)评价+综合素质评价+统一考试(或标准化考试)”为基础,辅助以教育质量监测(或全国教育进步评估)的结构和模式。
  教育质量综合评价结构和模式的确立仅仅是解决基础问题之一,依据2013年的《意见》和《框架(试行)》的要求,本次中小学教育质量综合评价应建设的评价指标、标准体系等,除教育质量监测之外,主要涉及到学业评价、综合素质评价以及标准化考试三个领域。这三个领域都有其要解决的理论、技术与方法难题。
  1.中小学生学业评价的理论、方法和技术需要突破。
  我国2001年的《基础教育课程改革纲要(试行)》和2002年《教育部关于积极推进中小学评价与考试制度改革的通知》及相关文件,给出了“三维”的学科教育目标和学科课程标准,学科教育目标不再是过去的“双基”目标,而是“三维”目标。依据三维学科教育目标与学科课程标准的要求,学业评价应解决学生、学校在学科教育上的“三维目标”测量与评价问题,而不再仍局限于“基础知识、基本技能”的两目标测量评价。
  就学业评价而言,评价理论、标准、技术和方法的设计需要思考在以下几个方面实现突破:
  理论突破:要有机整合国际知名教育理论以及教育学、心理学等学科的最新研究,建立多元、多维的评价技术模型,使学业诊断和甄别有据可依。
  技术突破:要在试题赋分、计分和统计分析上,依据认知与思维等发生过程,设计新的多元、多维的分数结构,为学业诊断和甄别提供丰富的信息,也为不同测试之间的等值转换提供重要的参考。
  应用突破:在成绩报告方面,应学习和借鉴国际大型标准化测试的报告系统,不仅能提供数据多元、多维、多重比较结果,而且能提供面向不同群体的数据报告,从而能为教育咨询提供可靠、可信、有效的科学工具,也能为教研、教学、教管等提供可靠有效的科学平台和工具,并为教师专业发展提供科学的操作平台。
  2.中小学生综合素质评价的理论、方法和技术需要突破。
  中小学生综合素质评价是本次改革实验的重点内容之一。在这个方面美国有相当丰富的经验值得我们借鉴。如以档案袋评价法为代表的表现性评价,今时今日,已经成为美国教育评价和人才选拔中一种不可或缺的评价方法。
  通过对比分析我国当前学生综合素质评价领域中存在的问题以及美国在此方面已经取得的成就和经验,本次教育质量综合评价改革中,就学生综合素质评价而言,要考虑解决以下几方面难题:如何界定中小学生综合素质及其评价的概念;构建中小学生综合素质评价的理论体系及模型;健全和完善中小学生综合素质的评价标准;健全和完善中小学生综合素质评价的测量标准;健全和完善中小学生综合素质评价的指标体系;开发中小学生综合素质评价的评价工具;制定中小学生综合素质评价的工具操作标准;改进中小学生综合素质评价的结果呈现方式;建立中小学生综合素质评价的结果解释及应用系统;设计中小学生综合素质评价实验推广模式;设计中小学生综合素质评价公信力保障系统。
  3.标准化考试的理论、方法和技术需要突破。
  标准化考试,作为人才评估与选拔的核心手段之一,在这次改革中也有需要解决和突破的难题。
  首先要解决的难题是如何界定学科人才、学业人才,以及如何界定学术型人才和应用型人才概念的问题。
  其次,要解决学业人才评估与选拔的理论和评价模型构建的难题。
  第三,解决学业人才评估与选拔指标体系构建的难题。
  (作者:张勇 姚春艳  作者单位:中华教育改进社)