加拿大关于科学课程评价的研究与启示

    (摘要)  随着我国新世纪义务教育科学课程实验工作在省级实验区的全面铺开,关于科学课程评价策略的研究愈益成为我国课程领域关注的焦点。为了推进我国新世纪义务教育科学课程评价实践的改革进程,本文探讨分析了加拿大科学课程界近年来在科学课程评价上的一些研究成果及其对我国新世纪义务教育科学课程评价工作的有益启示。

    (关键词)  法蒂玛法则  评价行为  评价范式  评价工具

    (作者简介)  周勇,华东师范大学课程与教学研究所博士研究生  (上海  200062)

    目前,我国新世纪义务教育科学课程实验工作已在省级实验区全面铺开。为了保证新科学课程的实施成效,无论是科学课程设计者,学校教育管理人员,还是一线科学教师皆需要通过适当的评价策略获取关于科学教学过程与效果的反馈信息,并据此调整课程决策或调控教学过程,充分发挥课程评价之于改进教学实践、促进学生发展和提高科学素养的价值功能。因此,探讨科学课程评价的有效策略愈益成为我国课程研究领域关注的焦点。但是,通过访谈不少地方的科学教师,笔者非常忧虑地发现,我国根深蒂固的传统应试教育文化依然非常厚重,有许多学生不是在积极地、有意义地学习科学课程,而仍是在学习如何通过科学课程考试,因而在科学教育实践中依然存在着大量机械学习的“法蒂玛现象”。为了推进我国新世纪义务教育科学课程评价实践的改革进程,本文考察和分析了近年来加拿大关于科学课程评价的若干研究成果,并且探讨了这些成果对我国新世纪义务教育科学课程评价工作的益启示。

    一、加拿大关于“法蒂玛”机械学习现象根源的研究

    1995年,加拿大学者蓝森(Larson)通过与一些学习化学的中学生交谈,敏锐地发现了传统科学教育中肤浅的学习现象背后所蕴涵的学习方式,并称之为“法蒂玛法则”(Fatimas rules)。艾特怀特(Atwater)1996年的研究表明,“法蒂玛法则”包括各种应付或者消极应付的学习机制。例如,在学习中不去仔细阅读教材内容而是仅仅记忆课本上那些醒目的标题或词句就可以方便地应付考试;在课堂上或者保持沉默,或者巧妙地附和、讨好教师,或者推卸责任、逃避学习等等。

    娄瑞安和戴瑞(Loughran&Berry)1997年通过深入调查揭示了导致法蒂玛法则的原因,并认为这些原因与公立学校的应试文化传统有关。既然公立学校系统评价学生发展的:主要标准是考试成绩,那么,学生就可能认为,深入理解课程内容并不如取得学校认可的考试成绩那样重要,而且没有它照样可以取得为学校所认可的好成绩。当然,这并不意味着他们都是学习不认真的学生,而是他们学会了付出多大努力便可以取得好成绩,而不必花费额外的时间或精力。

    如果说传统科学教育中:存在的“法蒂玛”现象与加拿大注重考试成绩的应试教育文化密切相关的话,那么加拿大的许多科学教师实际上也是这种现象的“始作俑者”。加拿大学者托宾和麦可罗比(TobinMcrobbie)1997年撰文指出,有些科学教师的教学目的和学生的学习目标是非常一致的,那就是都强调对事实和解题程序的记忆以便获得为测验和考试成功所需要的“正解”或者说“标准答案”。更为严重的是,一些教师和学生却认为在学习中运用这些“法蒂玛学习法则”时,好象就是在进行有意义的学习。但是,对关键术语和程序的机械记忆充其量只能在应付考试时临时派上用场,而一旦考试

结束,它们便成了没有意义和价值的东西,怎么能在

学生的记忆中长期保存呢?难怪许多加拿大科学教

师不无悲哀地叹息,“不管我怎样挖空心思去教,学

生们似乎只去学习他们考试过关所需要的内容,一

旦考试结束,他们便忘得一干二净”。

  加拿大学者考斯塔(Costa)1997年对上述几

位学者的研究工作进行了总结。他使加拿大科学教

育界认识到,传统科学教育(包括学校应试教育文化

和科学教师的科学教育理念)对考试成绩过分关注

而非强调积极的有意义学习导致了许多的恶果。在

这种浓重的应试氛围之中,许多学生并不是在学习

科学,而在学习如何通过科学课程考试,科学课程本

身对他们来说是无关紧要的,他们通过商讨或默契

逐渐达成了在课堂上如何行动的协议。当然,这些

行动并不是参与科学教学过程的积极行为,而是应

付科学教学的策略行为。在学习科学的时候,他们

根本没有必要积极参与,他们只需要为得到体面的

分数而采取“富有策略的”行动。显然,考斯塔所说

的这些关于科学学习的应付“协议”或“策略”便是蓝

(larson)所谓的“法蒂玛法则”的具体内涵。

加拿大关于科学课程实施过程中“法蒂玛”机械学习现象根源的深刻揭示对我国新世纪义务教育科学课程评价工作具有极大的启示意义。传统标准化测验以及以通过这样的考试为目的的学校课程文化氛围和科学教学方式,是导致科学学习中“法蒂玛”机械学习现象的根源。通过掌握这些游戏规则学习科学,学生并未真正积极地投入科学学习过程之中。但是,在对科学内容不求甚解的情况下照样可以获得为学校和教师所认可的(甚至是所追求的)分数。更加令人担忧的是,在科学教育实践中那些追求分数的学校和教师甚至以这种游戏规则作为他们进行理科教学的内容,并认为这就是有意义的科学学习内容与方式。“实际上目前中国的大规模的应试教育便隐含着大量的这种‘游戏’规则的技巧训练。许多地区几乎有一个整年,学生和教师们在做这样一种游戏。他们试图将具有创意的题目转换为技能性的题目。教师们训练我们的孩子如何掌握这些技巧去获得高分。”依靠“法蒂玛法则”进行科学学习,能够培养批判性思维能力、创造力、科学精神、科学态度和科学价值观吗?能够培养出真正具有科学素养的合格公民吗?然而,学科成绩领先、在学生整体中居少数的尖子生中,有不少学生正是通过灵活运用这种游戏规则,“过关斩将”而拿到了挤身于社会精英行列的通行证,这不正是困扰人们的高分低能人才现象的根源吗?他们能够成为真正适应和推动现代科技发展的合格人才吗?成为社会精英的毕竟还是少数人,大多数学生则是经历了“法蒂玛法则”训练之后而直接进入现实社会的各行各业之中,他们能够真正把所“掌握”的科学知识技能合理地运用于日常工作生活的行为决策之中吗?他们具有为当今科技和社会可持续发展所必需的价值观和社会责任感吗?

    在我国新世纪义务教育科学课程进入大规模实验阶段的今天,我们首先要清醒地意识到应试教育和应试学习方式的巨大惯性所带来的严峻挑战。在我们这样一个考试文化传统源远流长的国家,应试文化深深地植根于我国的社会文化传统之中并渗透在各级各类教育系统之中,应试氛围远比加拿大厚重得多。“这种‘考试的黑洞效应’不仅使我们各学科课程改革的新理念难以实施,甚至将这些新理念异化为一种考试形式反映到教学实践中……其结果是,理科教育中缺少对科学技术性质、科学方法以及科学精神的真正理解,只有对应付考试的解题能力和解题技巧的关注和强调。”另一方面,我们必须要正视这样的现实,一线科学教师毕竟是实施科学课程和实现科学教育深层次改革的主体,可以说,这个群体的科学教学及评价理念能否发生实质性变革,决定着我国新世纪义务教育科学课程改革的成败。在基础教育阶段,科学教育的根本目的是为了提高中华民族的整体科学素养,为达此目的,必须要切实加强、支持和推进以一线科学教师为主体的校本行动研究,在我国《基础教育课程改革纲要》所倡导的课程评价理念指导之下,深入探讨解决科学教育评价实践中的深层次问题,以彻底改变长期困扰我国科学课程实践的应试教育取向及其教学评价策略。例如,采取怎样的科学教学评价策略,才能促进有意义的科学学习方式,并消除科学学习中大量存在的“法蒂玛”现象?怎样才能真正实现我国科学教育评价实践的实质性变革呢?

    二、加拿大关于评价行为和评价范式的研究

    为了克服科学学习中大量存在的“法蒂玛”机械学习现象,重塑长期困扰加拿大科学教育实施过程的传统应试主义学校课程文化,有效实现科学教学过程与评价过程的融合,充分发挥科学教学评价之于改进科学教学实践及促进学生科学素养发展的功能,加拿大科学教育评价领域深刻揭示了评价过程中“观察行为”与“解释行为”的区别,以及支配评价行为方式并且极大地影响着评价效果的三种教学评价范式——经验分析的、解释学的和批判理论的评价范式,并且基于新的教育评价理念开发和完善了可以有效评价学生科学素养的评价工具。

    加拿大科学课程界认为,评价过程与教学过程和学生的学习成果总是紧密地交织在一起,优质的评价总是贯穿于优质的教学过程之中。为了对科学课程自身的价值和课程实施成效做出准确的思考和判断,区分下述两种与评价有关的行为是非常重要的:

      观察学生表现或收集学习信息资料的行为

      对观察结果或各种信息资料做出解释或价值判断的行为

    显然,观察行为与解释行为是不同的。但是,有些人常常根据惯例对这两种不同的行为不加区分,而是用同样的术语来描述它们,这样做往往会把收集资料的方法与对这些资料做出解释或价值判断的方法等同起来,例如,把划定考试成绩等同于对学习结果的评价。最近,加拿大科学课程界已经开始把这两种行为区分开来,并且把收集学习信息资料的行为称为“评定”(assessment),而把对这些资料做出价值判断的行为称为“评价”(evaluation)

    在此基础上,加拿大学者瑞安(Ryan)1988年对不同评价行为所依据的评价范式进行了深人研究,深刻揭示了内在地支配着评价方式策略的三种评价范式:

      经验分析范式——这是一种蕴含着西方逻辑实证主义和技术理性主义传统的评定或评价范式。标准化考试是该范式关注的主题。

      解释学范式——这是一种从学习者的角度理解学生的语言、概念和行为表现的评定或评价范式。形成性评价是该范式所关注的主题,它包括多种可资选择的评定方法,诸如有关学生成长的档案资料、概念地图等等。

     批判理论范式——这种范式旨在消除人与人之间不平等的压迫关系(例如,教育评价中存在的强制性认同关系),因此,师生平等和学生的自主权利是该范式所关注的主题。例如,经过师生合作审慎做出的定级评定,学生的自我评价等都属于这种范式。

    加拿大关于评价行为及其理论范式的深刻剖析,对我国新世纪义务教育科学课程评价的启示意义在于:首先,我们要清醒地认识到区分收集评价信息与解释评价信息两种不同评价行为的必要性和重要性。在自然情境或人为控制情景之下,通过观察、调查、访谈、检查、测试、汇总、整理、统计等策略方法,对包括过程与结果的学习信息资料的收集与处理行为,以及对反映学习过程与结果的信息资料的价值判断与分析解释行为——属于一个完整教育评价过程的两个不同构成侧面。前者是评价的前提和手段,后者才是评价的目的和归宿,如果把它们简单地等同起来,就容易产生把手段作为目的加以追求的本末倒置的偏向。同时,无论是量化的信息资料,还是难以量化的质性信息资料,它们的价值功能在于从不同的侧面去反映学生学习及科学素养的发展状况。因此,为了获取充分的、全面反映学习进程与结果及科学素养发展状况的反馈信息,就不能仅仅局限于量化信息,而应该把量化信息与质性信息统整地结合起来,在此基础上才能做出准确全面的分析、解释和价值判断。亦即,我们不仅要重视量化评价,而且要重视质性评价。

    其次,我们要意识到每种评价范式都有各自关注的主题和评价策略:

      经验分析评价范式关注教学和学习的外显行为结果,并且特别。重视量化标准(quantitativestandardization)

      解释学评价范式试图从学习者的角度理解学生的语言、概念和行为表现,它不仅关注学习的结果,而且关注学习的过程,因而包含了多种评定或评价的技巧和策略。目前,基于解释学评价范式的真实性评价(authentic~ment)的理论与方法正在受到世界各国的重视并且在科学教学评价中得到了广泛的应用。真实性评价以学习者的学习和真实表现为中心,强调学生的积极主动参与,强调评价与课程教学的统一,全面评价个人及小组学习的过程、产品及进步,特别重视评价表评价或等级评价、学生的自我评价以及档案袋评价的评价方式及评价策略。在学生综合性、复杂性、主题性、探究性和体验性的学习经验领域,批判性思维能力和问题解决能力等高级思维和实践技能领域,以及学习过程、进步状况、小组合作学习活动等领域,远远突破了狭隘的经验分析范式。

      批判理论评价范式特别关注评定赖以发生的社会或文化背景,并认为这些背景极大地影响着学习过程和学习结果;它不仅关注学习结果和学习过程,而且关注学习情境。

    因此,鉴于学习成果及其影响因素的丰富多样性、评价目的的差异性,为了做出准确的思考和判断,在任何特定的时刻,都不应忽视我们所持有的、据以思考和价值判断的评价范式,而且必须能够超越而不是局限于某种特定的范式——评价必须要根据不同的评价目的或目标、评价的对象或内容领域而统整合理地采取相应的评价范式及评价策略。

    第三,加拿大关于科学教育评价及其理论范式的深刻剖析,同时为我们提供了一种反思传统科学教育评价理念与评价策略的思维路向。我们看到,传统科学教育对科学素养的评定与评价主要是基于经验分析范式的标准化测验。经验分析评价范式把科学素养目标定位于学科领域的知识技能,并且假设知识技能可以描述为一个个细小的信息单元或知识点,然后给它们赋予一定权重;瞄准这些细目或知识点设计具有结构效度的、由若干测试项目构成的标准化试卷,并且假设这些测试项目都能够引起设计者所期望的行为反应样式。通过符合信度要求的标准化程序实施测试,就可以获得一系列代表学生知识技能经验的行为样组,根据项目所规定的标准正解及其所对应的知识点的权重,就可以对这些行为样组赋予一定的分数。最后,考试分数是根据统计分布常模(如平均分数与标准差)或考试专家组的判断加以标准化的,这种标准化分数具有统计学意义或曰统计学价值,即反映一名学生在分数团体中的相对位置或等第。这种基于逻辑实证主义和工具理性的评价范式,实质上是以单一的学科知识技能标准和控制性、区分性(区分出胜利者和失败者)、客观性、公平性及其统计学价值去满足考试竞争和社。会之于人才选拔需要的,而评价之于课程开发、教学实践和学生发展的教育功能本质却被消解了。该范式不仅把两个不同的评价概念——收集学习信息资料的行为(assessment)与解释判断学习信息资料价值的行为(evaluation)混同起来,而且存在着这样的危险——它使有着教育价值功能的教育评价沦为编制测试项目和实施标准化测试的纯粹技术操作,把赋予分数和排列等第混同于对学业成就的评价,在追求评价的定量化、标准化、客观、公平、效度和信度的同时,忽视或排斥了真正的价值判断。令人担忧的是,学习者的积极主动参与和真实表现、真实而丰富多样的(综合性的、复杂性的、主题性的、探究性的、体验性的)学习经验及现代合格公民科学素养的本质侧面,诸如科学态度、科学精神、价值观和责任感、对科学一技术一社会互动关系的理解、批判思维能力、问题解决能力以及理智地参与社会决策的能力等等,几乎被标准化测验完全剔除了出去。结果,不仅使科学教育评价丧失了真正的价值功能,而且也把科学素养的内容领域严重地窄化了!更为严重的是,由于评价的范式策略对科学教育实践所产生的强烈导向作用,基于经验分析范式的标准化测验所倡导的标准反应、“泛正解主义”及其对科学素养诸种本质侧面、学习者积极主动参与和真实个性化表现的排斥,无疑成为学校科学教育中应试教育倾向和“法蒂玛”机械学习现象的催化剂。我国著名课程论专家钟启泉教授曾深刻地指出,克服教学实践中无处不在的“泛正解主义”倾向是尊重儿童自我的必要前提。而且我们看到,与经验分析评价范式相反,解释学和批判理论评价范式却假设知识是学生积极能动地加以建构的,在不同的情境之下知识具有不同的意义——这正是建构主义学习理论的核心。经验分析范式所关注的问题是,“哪些知识是重要的并且是值得学生学习的?”而批判理论评价范式则进一步追问。“谁的知识是重要的并且在评价中居于优先地位?”“依据谁的目标来定义评价标准并且如何确定这些目标?

    三、加拿大关于科学素养评价工具的研究

    为了克服拘泥于经验分析范式的传统标准化测验所导致的大量“法蒂玛”机械学习现象及其在学生科学素养评价上的局限和弊端,推进加拿大科学教育评价实践的改革进程,以埃肯海德(Aikenhead)、瑞安(Ryan)、弗莱明(Fleming)等人为代表的科学课程专家,一直致力于开发和完善一种可以有效评价学生科学素养的评价工具——VOSTS(Views onScienceTechnologySociety),即“科学一技术一社会观点评价表”。该评价工具由114VOSTS测试项目构成,其中每个项目的设计经历了如下几个基本过程:

    1.为每个测试项目确定一个关于STS关系认识或看法的论题。这些论题采自如下几个STS关系范畴:

    (1)科学的本质——科学认识论。包括科学探究方法(如科学观察、科学模型、分类与表征等等),科学探究过程,科学知识(基本假设、理论、定律等),科学中的逻辑推理,科学技术知识中的准确性与不确定性。

    (2)科学与技术的互动关系。涉及科学与技术的概念,研究与开发的概念,科学与技术的相互依存关系。

    (3)科学技术的外部社会学——科学技术与社会的互动关系。包括:

      社会对科学技术的影响。如政府、企业、军

事、伦理道德、教育、特殊团体和公众对科学的影响。

      科学技术对社会的影响。涉及科学家与技术专家的社会责任,科学技术对社会决策、经济发展、军事力量的影响及其对社会思维方式的影响,科学技术导致的社会问题及其对解决社会实际问题的贡献。

      学校科学课程对社会的影响。包括不同文化间的桥梁作用,对社会决策的影响,对科学发展的影响等等。

    (4)科学技术的内部社会学。包括:

      科学家的人格特征。包括科学家的个人动机、生活和工作的标准与价值观、意识形态、科研能力及其对科学过程及结果的影响,女性科学家的地位。

      科学知识的社会性建构。涉及科学集体主义,科学决策,科学家之间的学术交流与学术竞争,社会与科学知识的相互作用,个人对科学的影响,国家对科学技术的影响,个人和公众的科学等等。

      技术的社会性建构。涉及技术的自发性及技术决策等。

    2.收集、归纳经验性资料——学生对每个论题的各种代表性观点和论据而非设计者的观点,把基于学生经验的代表性观点改写开发为选项。每个论题与这些基于学生经验和观点的选项一起构成的多项选择题,就成为一个VOSTS测试项目。

    3.收集学生反馈信息,对选项进行修订。这些反馈信息既包括书面回答,也包括口语报告,它们不仅用于修订选项内容,而且用于考察设计者与学生在选项上的思考方式是否一致,同时修改选项的表达方式,以充分反映学生的实际观点与思维方式,提高项目的测试效度。

    4.组织大样本测试,根据测试结果进一步整理完善选项。经过这种反复的修改调整过程,便得到了基于学生经验、充分反映学生STS观点的VOSTS评价工具。通过使用这种评价工具进行测试,可以得到充分反映学生个人关于科学一技术一社会实际观点的经验资料。

    加拿大关于VoSTS评价工具的开发与研究使我们看到,VOSTS评价的设计与运作主要基于解释学范式并且融合了:经验分析范式的优势,超越了对结构效度的纯粹技术关注,并力求反映学生的实际经验和观点。VOSTS测试属于真实性评价方式,得到的是学生关于STS问题的真实想法,并非像传统的标准化测验那样企图让学生在项目设计者控制和规定的选项中选择“标准答案”,因而在评价学生的科学素养上拥有更高的效度。埃肯海德教授同时指出,“VOSTS的设计和运作方法,为建立一个特别适用于STS科学课程评价的试题库指明了方向”。一旦VOSTS试题库建立起来,一线科学教师就可以根据特定的评价内容和目标和效度要求,方便地从中选择测试项目,形成适应特定课堂教学情景的评价工具,以获取学生关于STS观点的真实反馈信息,从而为他们带来像从标准化题库中方便地获取试题那样的便利之效。而且,VOSTS论题同时可作为课堂上学生进行科学探究活动的课题,这样,科学教学过程与评价过程就可以真正实现有机的融合,评价之于科学教学的积极导向功能及其促进科学学习的教育功能在这种融合的氛围中可以得到更好的发挥和实现。这难道不正是我们可以选择的——既正视评价的导向功能,又可,以避免应试教育倾向和“法蒂玛”机械学习现象的评价策略吗!

                             作者:周勇,华东师范大学课程与教学研究所博士研究生