您的位置:网站首页 > 学历类考试 > 正文

新技术给考试与测评带来的变革2013-12-26学历类考试

类别:学历类考试 日期:2013-12-26 12:06:13 人气: 来源:

  主持人:尊敬的各位领导、各位来宾,大家下午好,由ATA举办的新技术给考试与测评带来的变革暨第八届国际考试理论与测评技术研讨会现在正式开始,很高兴能与大家渡过这样一个充实而又有意义的下午,请允许我代表会议主办方向各位领导各位来宾的到来表示热烈的欢迎。

  ATA举办的国际考试理论与测评技术研讨会今年已经步入第八个年头,八年以来我们在大会沟通与交流的平台上共同分享了国际最新考试理论与测评技术的发展趋势,研讨并借鉴了国内外典型的成功案例,与众多考试与测评行业的领导同仁以及新老朋友一起为推动我国考试理论与测评技术的不断创新和持续发展而共同努力,今天我们又如约汇聚在第八届国际考试理论与测评技术研讨会上。本次会议共有五百余位各行各业的嘉宾出席,包括人力资源和社会保障部人事考试中心主任范勇先生;司法部考试中心主任姜金方先生;国家医学考试中心副主任王献成先生,欢迎各位的光临。这次会议不仅规模空前,而且邀请的嘉宾和他们即将发表的内容兼具权威和丰富的特点,我们非常荣幸邀请到剑桥大学外语考试部测评和运营部副总监格林休斯先生;教育研究委员会研究员和国际合作顾问赵煜博士;美国教育考试服务中心、ETS中国区总经理陈永汉博士以及大家非常熟悉并且连续八届担任嘉宾的ATA测评研究院院长、中国教育测量学会会员刘颖博士,他们将在接下来的会议议程中分别发表精彩的主题。在主题环节开始之前首先请出大家非常熟悉的孙振耀先生,今天将是孙振耀加入ATA之后首次在公开场合发表,让我们有请热烈的掌声欢迎振耀做开场致辞。

  孙振耀:尊敬的各位来宾、各位专家、各位朋友、合作伙伴以及尊敬的客户,大家下午好!今天是我加入ATA公司两个月又零四天,我很高兴利用这样一个非常重要的场合跟大家分享ATA本身对于互联网科技对于ATA未来的一些想法。我之前长期的时间是在IT行业服务,进入考试测评行业或者进入教育行业我是一个新兵,但是我很高兴有这样的机会与在座这么多专家跟客户朋友们一起分享科技对教育测评所带来的影响,我相信这是我们每一个人都关注的,我相信这也是所有社会都关注的一件事情。今天我的题目是“拥抱变革,互联网时代最需要的”。创新背后的基础就是要能够接受变化,我们要有从零开始的思维来看这个世界各种可能产生的变化。互联网时代对我们整个社会对教育行业以及考试测评只能起一个很大的甚至有性的变化,我希望今天各位能够了解ATA在这个变化当中所要采取的一些计划或者我们的方向。

  我是跨界过来的新兵,我利用一点时间跟大家分享我过去30多年的职场或者职业管理经验。我在出生长大,90年很高兴有机会惠普公司把我从调到,一呆超过22年的时间,这么长的时间里面我担任过惠普公司事业部的总经理,同时担任中国惠普的总裁跟惠普公司全球副总裁,我在2007年退休离开惠普公司其中最主要的心愿就是能够创业,这个过程里面我也担任过扬智科技董事长,担任过海辉集团董事长以及联发科技董事,这些都是科技行业,在2012年终于可以采取具体行动来实现我的梦想那就是创业。我个人在长期的职业生涯里面对人才的培养,对如何培养人才以及对人才本身对企业的价值有极大的兴趣,因此我决定进入教育行业,同时我认为教育行业应该可以使用科技、创新的一种模式来做现在传统教育行业所做的事情。在创业的过程里面我认识了ATA董事长跟创始人马少峰先生,我们很多讨论对这个行业的发展,八个月前我们一起探讨两家公司如果对职场人士的发展都有共同的理想,用科技手段来改变这个行业都有共同理想,为什么我们不一起做一件更伟大的事情。经过六七个月的讨论,我很高兴也很荣幸跟ATA公司合并,成为ATA公司的CEO,马少峰先生继续担任ATA的董事长。我加入ATA两个月零四天的时间,我感受到这是一家很有基础的公司,在这个行业里面非常有独特定位的公司,更重要的这是一家很有发展潜力的公司。要描述ATA其实不太容易的,因为我们是教育行业里面一个非常独特的分支就是考试测评,但同时我们也是科技行业一个非常独特的分支,用科技来做考试跟测评。同时也是人力资源行业里面一个非常独特的分支,用考试测评来招聘跟选拔人才。三个结合在一起就是ATA的面貌,我们所面对的不仅是人力资源的需求,不仅是培训行业的需求,我们面对的更多是科技的挑战,所以今天我想跟大家分享ATA对互联网时代的挑战我们的看法以及我们的做法。

  首先整个社会在起什么样的变化,这个变化可以从这两个具体的数字可以看到,一个是网民上网人数像汽车拥有量一样,多少人拥有一部汽车?中国的网民根据权威机构的统计数字已经超过6亿,也就是说中国有一半人口是上网的同时是可以上网的同时也熟悉在网络所有产生的活动。而另外非常重要的指标是所有的网民里面有多少是用移动互联网,也就是用智能手机上网的。如果问在座的各位谁没有智能手机请举手,我看应该常少的。如果问在座各位谁目前没有下载微信没有微信群的,恐怕也非常少。我要是问各位谁没有用过电商来买东西的,我看恐怕也非常得少。这个世界因为一个新的工具对这个社会产生巨大的影响,你可以描述人类用走的后来有马车有汽车有飞机有高铁,这些工具的产生对整个社会的生活习惯、生活方式整个行业的变化、生产力、效率产生不同的影响,但是更重要的是对所有经营企业我们在思考什么,它对我们的商业模式对我们未来的竞争力对我们对这个社会对企业对我们的合作伙伴的价值在起什么样的变化。我想用这几个数字来描述这个变化带来的影响,在互联网时代巨大的网民基础,在巨大的使用智能手机基础教育行业会产生什么样的变动。几个月前我去了山东曲阜拜访孔子的故乡,看到中国第一个私人学校在孔庙里面就是孔子办学的那个。几千年来人类这种授业解惑的方式其实并没有太大的变化,懂的人教不懂的,而且靠面对面的方式来传授。这种基本模式并没有太大的变化,直到互联网出现以后,互联网本身的科技普及性、覆盖以及所带来的各种其它功能已经开始在影响教育行业,2011年我筹备创业的时候思考到科技对教育行业的影响,无法预料到未来两三年的时间教育科技起这么大的变化,可以看到MOOC这种模式或者EDS这种非常有名的大型式的网络课程,有80多家机构把四百多门课程放在网上是公开的,注册学生已经超过四百万,这远超过今天这个世界上任何一所培训机构,不管是大学还是个人的培训机构覆盖的数量。内容之丰富,人群的覆盖,这是教育行业被的地方。社交的出现不管是微信、Facebook、Twitter对我们社交方式的改变,对互动方式的改变,对老师、家长、学生互动方式的改变,在美国有超过90%以上的老师是用社交这种工具跟学生跟家长互相交流或者教学,而学生与学生之间,老师跟老师之间更多用社交互相学习互相参与,让学习变得不再那么孤独,让学习变得不再那么枯燥,而且充满了乐趣。我们看到刚刚所提到的移动互联今年全球到2017年经过IDC预测会有17亿部智能手机,现在目前的笔记本电脑可能才只有1亿9千万部,这个数字会带来整个教育对随时随地学习、碎片化学习,任何时间任何地点学习,把平常无效的碎片时间结合在一起变成有效的学习时间会产生巨大的影响,更不用谈到大数据。从大数据层面,可以判断他应该学什么,怎么学习。这就是互联网对于教育行业的影响,对整个学习模式的影响会对考试测评模式带来什么影响?

  刚才提到MOOC这种公开课程把所有专业知识变成大众化,让学习的方式以学习者为中心,他学什么,在什么时间用什么方式学习,他自己有自主,不再是以前在座各位我们是老师开课我们去听课这种方式。线上学习、碎片化学习、移动学习跟社交学习会是趋势。对教育行业的影响必然会带来我们对考试测评的影响,对考试测评想象未来有很多个性化的考试测评分析。什么叫个性化?现在考试拿到一份成绩单,这个成绩单是针对这次考试的结果得到的成绩单,这一辈子考过多少次试,如果把考试结果总体做一个分析会对个人的学习效果、学习方向、个人能力产生什么样的影响?同时毫无疑问线上学习必然带来线上考评,而线上模式移动也好或者方便性可以让你即学即考,过去学好几个月来一次大考,现在马上学马上考,如果觉得学的不好可以回去再重复学习,不用等到好几个月以后再来一次。即报即考,移动化考试跟社交化考试。最近我们做了情景的,出了十几个企业里面的情景,有六百多位管理者他们参与这个情景,他们决定这个情景用什么样的答案处理,产生一种对企业文化的测评,以及情景化的学习方式跟测评方式。我们最近帮工行做一个诺新银行,这是一个虚拟银行,工行考试招聘的方式做了一个彻底变革,这些学生要考的人在银行十几个业务部门里面从里面学习到各个业务部门处理事情的要求,从它的响应里面不仅理解这个业务,更重要对银行来说用更客观的方式来选拔他所要的人才,不是一个应试,不是应付考试,而是把这个情景应用到考试的方式,这都是新的考试测评方式。

  ATA以IT科技为主实施考试的专家,在座有超过五百多个企业家跟协会是我们的客户,是我们索要服务的对象。这是以主办方为主导的方式,在ATA2.0我们希望成为互联网时代的考评专家,我们用互联网科技跟专业能力能为考生服务,为学习者服务,也为主办方服务,这是我们所希望看到的。在座是我们的主办方,我们每年考试高达870万,今年恐怕超过一千万,这是巨大的覆盖群体,我们要好好思考怎么为这些学生为这些考生提供服务,而不仅是为他们提供服务,也为ATA未来创造更大的机会。今天在座各位看得到ATA所推出的移动化考试的解决方案,等一下我们的研发部副总裁会做一个报告。我们用科技让考试测评变得更人性化,更简单,在任何时间任何地点都可以考试,不仅让主办方方便,也让考生方便。

  我们希望不仅为主办方有效实施考试服务的一家公司,我们还希望在互联网时代里面借助科技能够成为对主办方对考生对学习者对人力资源对培训机构产生影响力的考评专家。在座谢谢大家参加今天的活动,祝愿我们有一个非常成功的活动,谢谢!

  许可:各位嘉宾大家下午好!我叫许可,今天非常荣幸能够有机会代表ATA公司还有ATA研发部门跟各位领导各位嘉宾汇报ATA在移动互联网时代我们对于这个时代带来影响的思考还有研发的新技术和新产品。

  说起移动互联网跟互联网,这个话题不新,如果在五年十年以前大家参加任何一个展会谈到互联网可能觉得好像挺兴奋,过去五年时间里面大家参加任何一个跟科技相关的展会都会提到互联网。作为一个科技行业的老兵,我的一个感受在过去一年到两年里面这个世界发生了巨大的变化,变化在于两点。第一点,提互联网这件事的人很多不是IT跟互联网行业的人,很多是传统行业的家在提互联网带给我们的影响。第二点,我们看到很多在传统行业排头兵地位的企业在过去几个月里面纷纷发表感慨,好像遇到了巨大的挑战又看到了巨大的机会。无论在新东方20年的庆典上还是在昨天晚上微信朋友圈里面大家在传联想杨元庆给他的内部员工的一封邮件,都在谈在互联网时代我们应该做什么。我想都在谈互联网,但是今天谈互联网的意义可能跟十年前会很不一样,十年以前的互联网更多讲消费者互联网,但是今天的互联网更多是在谈对企业对行业深远的影响和变革的意义。今天我的内容分成三部分,第一部分跟大家分享ATA对于互联网的理解对于在移动互联网时代怎么看机遇和挑战,第二部分和第三部分重点介绍ATA最新推出的MTS新的服务产品,MTS是什么?过会儿会给大家揭开这个神秘的面纱。

  先说互联网是什么,我摘录了一句话,这句话在硅谷常著名传奇性的创业家,威廉姆斯,这个人今年41岁,他在历史上已经创了五到六家公司,都很成功,其中最成功的一家公私交Twitter,刚刚上市,市值非常高。今年9月份在硅谷的一次里面,当时他诠释了什么是互联网,他用了这样一句话,我读完之后感同。他说互联网不是一个无际的魔法世界,它只是另一个改善生活品质的引擎。这句话怎么解读?重点的含义是想说人类基本的需求在过去的一百年两百年三百年里面基本没有变化的,只是随着科技跟世界的进步不断用创新的方式满足改善我们的生活。互联网不是一个多么神奇的魔法盒,它其实只是一个新的引擎一台新的机器更加有力量能够帮助改善我们的生活。在这个含义上说我们再看移动互联网,我们认为移动互联网跟互联网的本质没有任何差别,它又是一部新的机器,跟互联网可以认为是两个时代,提供更新更便利的方式实现互联,有更多的终端可以被使用,但是在这个过程里面它本身的含义还是在看我们怎么利用最好的最新的科技技术能够帮助考生帮助主办方帮助客户提高工作跟生活的品质。这是我们认为互联网的本质。说到移动互联我们讲机遇跟挑战,在上个月我有幸参加了百度中国最大的搜索引擎三大互联网公司之一在举办专门针对行业的峰会,在那个峰会上有一个数字我一下子就记住了,在上个月在百度里面产生教育相关的检索高达5.5亿次,5.5亿次里面76%来自于PC,24%来自于移动终端包括手机、PAD。当时百度的发言人特别讲到,移动终端提高的速度非常非常快,他们完全有信心在明年1月份只不过过了一两个月,这个比例会超过30%,未来会超过40%。移动互联相比互联网它是互联网一个升级版本,它真的是到来了,这个时代对于我们来讲无论它是机遇还是挑战我们都应该勇敢地去拥抱勇敢地去面对。

  移动互联网时代来临有三方面的要素,其实促成了这个时代变得越来越真实。第一点,就在这个月中国刚刚给三大运营商发布了4G牌照,这意味着马上会有大量的4G服务套餐跟4G的手机在市场上出现。4G对于个人使用者来讲意味着在终端网络下载的速度跟3G网络比起来是提高了30倍到40倍,这是一个理论值,至少可以相信个人在手机上的应用会变得更疯狂,同时资费变得更便宜,终端手机变得更便宜,会有越来越多的人可以支付得起去融入到移动互联网这样一个生活节奏里面。第二点,只有终端是不够的,还有各种各样的云服务,大家用微信、Facebook,我们用的是一个终端,但是所有信息内容所有应用所有朋友圈的关系都在网上那就是云端的内容跟服务。我们看到在过去几年里面云服务十年前有点像虚拟故事一样的概念已经变得越来越真实了,无论是虚拟化的技术还是分布式计算的技术都变得越来越成熟,去年微软最大的在线云平台落户在国内,IBM也是在国内建了一个云平台,上周我听到一个消息SAP把全球部署其中一个最大的应用云平台放在国内。这些云平台不是只服务国内的用户服务于全球,云技术日趋成熟也是造成移动互联网变得越来越真实的一个原因。第三点也是最主要的一点,我们认为用户使用习惯的改变已经变得根深蒂固,刚才振耀问大家多少人不用智能手机,我想让大家举手的话很容易得出一个更夸张的结论,有多少人不抱着手机睡觉?相信有非常多的人每天晚上睡觉前的最后一件事是看一下手机,每天早上起来看一下手机。

  移动互联对于教育培训考试行业的影响,我们想从四方面来分享我们的观点。

  第一,在互联网时代或者在移动互联网时代生意模式发生巨大的改变,靠信息不对称赚钱的生意模式将变得越来越越来越挑战,因为这个信息你有我没有,我通过一个方式把它变成一个价值给到最终端的用户,这样的方式越来越挑战。

  第二,中国在线教育市场规模在2015年将达到1745亿,这是一个巨大的数字,今年数字才几百亿,从最近一些投资圈里的变化也能看得出来。更多的内容将在线,并且将免费。

  第三,传统的授课测评考试方式将发生改变,O2O线上线下结合最终一部分变成线上,这个已经发生在我们的身边。

  第四,正是因为在线内容越来越多,培训方式越来越多变成在线的,这种情况下跟传统考试培训方式比起来我们的教育机构我们的企业我们的用人单位就更需要用一个更公平客观的方法来测评学习的效果是怎么样的。我们认为在在线教育的时试测评技术也将变得越来越重要。

  这四点是浓缩了我们的观点,我们认为在未来的可能不用五年到十年,在这个时代所有的预测只能看三年五年。相信这四点是能够看得见的发展趋势。在ATA14年的历史我们服务过非常多的客户,在这个过程之中我们非常感谢各位尊贵的客户给了我们非常多的反馈和提醒,我们考试主办方讲试题的表现能不能变得更生动,这是机考的特点,我们的数据安全性能不能更高,在线数据并不是说比线下数据不安全,而是在线数据所有变化能到,一旦有不安全的信息我们可以发现。而线下数据有时候丢了我们都不知道,怎么让我的数据更安全?我们的企业用户他们在想有没有一套既专业又易用的系统,有时候专业跟易用两个词是矛盾的,有时候专业了就不易用,而太易用又给人感觉不专业。我们的企业用户还在问什么时候可以让我招聘的员工可以用各种各样的终端设备做测评考试,不只是提供一个界面给他们。最后也是最重要的我们的考生,现在来看考生年龄越来越年轻,对于他们的用户使用习惯来讲可以想像,当他在平时生活的时候用的是大量的互联网产品,当他突然进到考场如果看到的还是一个非常传统的界面的时候这个挑战越来越大。他会问能不能给我一个界面体现再人性化一点的软件能够让我来使用,什么时候早点拿到我的成绩分析报告。所有这些需求都对我们来讲是一个巨大的鼓舞跟动力,让我们相信ATA在考试跟测评技术的方向把握上是一个正确的方向。

  今天向大家介绍ATA在考试测评技术上服务的上我们新推出的一个概念ATA的MTS,我想特别介绍MTS不是一个产品,它其实是ATA过去14年里面积累的经验包括我们对考试业务的理解,对于我们客户需求的沉淀的一个集成。整个MTS体系架构很简单,分成两端,一端ATA MTS云服务,云服务里面集成ATA所有有过经验或者未来预期会发生的应用服务和内容服务,内容服务包括ATA自己创造或者我们被授权的内容,也包括我们合作伙伴的内容,我们的云服务会是一个平台,也包括大量的ATA应用服务,包括我们的制题、考务管理包括考试管理,所有的应用和内容会用一个崭新的云服务区开发架构在在线的云平台。另外一端是我们的用户,我们会有一系列的终端产品推出来,完全用移动互联网的思去设计开发,会给大家提供一个非常好的用户体验,会是一个非常轻薄舒适的工业设计。通过这些终端产品和云端的内容应用集成实现既专业又易用的目的MTSBOX这个盒子在我们前面一章讲的终端里面只是其中一种终端,它的作用是什么?如果我们在一个传统的考场去部署一个考场的时候左边是大家能看到通常情况下在一个考场里面需要部署的硬软件,这里面有考试机软件、加密软件、摄像头硬件、服务器等等所有硬软件点的部署。在未来我们会把所有这些功能高度集成或者对接到这一个盒子里面,而以后在未来考场里面只需要部署这一个盒子,这个盒子会有联网的时钟狗,自动多时区可以在全球部署,有定位系统,可以加上高清摄像头,有管理系统,有考试服务系统,可以对接多种终端,帮助我们快速在多种不同类型的考场里面实施我们的考试跟测评服务。它所对应的终端也是多种类型的终端,对应传统的WindowsPC和笔记本,可以有IPAD、PAD,不久的将来ATA推出专门的针对考试的ATA PAD,相对高效率低成本的情况下实施我们的考试服务。

  MTS的四大特点,第一大特点高安全性,我们的终端和云之间信息流的沟通采取特殊的加密技术,也就是说虽然走互联网,但是所有信息被保密的。同时终端设备每个终端设备会有自己的标识号一个身份代码,我们的信息不容易被破解泄漏。第二,操作易用,开机就能用,界面设计像买一部手机一样。第三,快速部署。我们终端部署只需要十几分钟或者几分钟可以准备完,考试前的准备时间大大缩短。第四,移动互联网时代所有的东西都是在线,我们提供自动更新服务,当有新的应用服务,当有新的内容服务的时候自动推送到终端帮助客户考生提升考试体验提升考试效果。MTS的服务划成三大类服务,第一类服务是内容服务,既有ATA自有内容也有合作伙伴的内容,同时我们会提供接口给客户,客户可以在MTS服务框架下去开发自己的题库,建立自己专属私密保密安全的题库。第二类服务应用服务,集成ATU在过去14年的经验,而且不断进步改良,把对于考务管理的理解,把对于在线制题技术能力的积累整合在一起。这里我们也会设的平台来吸引或者欢迎我们相关的合作伙伴制作这样的内容,内容我们会建成内容商城被别人来选购。第三大类服务终端服务,在考场里面发生的所有事情从硬件到软件到服务都可以来提供。端到端的考试运营服务,ATA未来的定位我们的合作伙伴也好考试主办方也好,如果大家有兴趣来选择其中某一个模块,我们非常愿意来提供这样的服务,但如果大家希望找到一个一站式解决方案,我们当然有这个能力也有这个意愿为大家提供端到端解决方案的服务,这是未来MTS服务框架。

  下面介绍一下MTS在三个可能的场景里面的一些应用,第一个应用在类型的考试,大家最关心的是安全,是制题技术的展现。在MTS里面采用新的制题引擎,实现更炫更不同方式的展现技术。安全刚才介绍过,这个绝对是我们MTS整个体系架构中设计的重点。第二类应用是在培训机构,MTS有一些子版本的优化改变,所有培训机构讲,教材教辅培训机构有在线云端服务,我们培训生学生很容易拿着自己的手机或者PAD可以去学这些。我们的MTS具备接口可以跟对方的系统做整合,未来想象的一个理想的学习状况,当老师在课堂上讲一门课讲一个章节的时候可以很方便用MTS部署一个在线随堂测试,所有的测试结果搜集到云端作为老师思考未来怎么去优化教学方式一个非常好的参考数据和材料,这是对培训机构会有一个特殊定制化的版本来满足我们合作伙伴的需要。第三,给企业用户提供的服务,通常情况下想到的场景比如企业里的招聘、校园招聘,传统的校园招聘很多时候用纸笔考试,纸笔考试很多时候试题方式非常简单的客观题,通过MTS可以非常快速部署的,我们可以提供更多的测评方式来帮助我们的企业用户企业的HR找到更合适更厉害的人才。企业内部测评岗位晋升,通过MTS这一套内容,在云端部署了很多对于职位、性格考量,帮助企业HR的同志提高HR的管理效率,提高整个企业在行业里的竞争力。这三个服务场景简单来讲我们都相信只是MTS一整套服务体系结构里面非常小的冰山一角,我们非常希望可以跟在座的各位嘉宾和各位同仁一起共同开发新的服务体系共同开发新的市场。怀着拥抱改变的心态,能够把中国的考试测评技术推到一个新的高度。我们的价值总结起来四个词,支持更多类型的考试。提供更多功能的创新,可以提高高效运营效率,用更少的风险,通过我们的技术和业务模式的整合希望能够提供给所有的嘉宾和客户还有考生在这四点上希望能够有很好的价值展现。ATA非常希望能够和我们的嘉宾我们的客户们在一起,把MTS做成中国或者全球最好的一个考试运营体系和服务的体系,来助力各位在事业上的成功。

  谢谢大家!

  格林休斯(剑桥大学外语考试部):非常感谢,首先我想要感谢ATA的伙伴邀请我参加今天的会议并且给我机会来给大家讲一下我们在过去两到三年当中一起做的一些非常有意思的工作,帮助少儿英语进行机考,这实际是我今天发言的题目。今年也会迎来一件盛事,百年庆祝的活动将会在今年展开。在1913年剑桥率先推出英语能力测试,在剑桥当时有三个参事者参加了书面考试,是用了12个小时。当时这常成功的,他们来参加这个考试本身就是一个成功。但是他们三个都没有及格,当时在剑桥这个反而被看作是一个成功,因为它充分展示我们的考试有多么的严格。

  我们今天要谈的是一些最新的考试,使用最新的技术,而且面对的是少儿常年轻学习英语的孩子,我今天给大家讲的是剑桥少儿英语的情况。一开始先会给大家介绍一些背景,剑桥少儿英语的考试是什么样的,它的设计目的是什么,自从90年代我们开始管理这项考试之后做了什么工作,还会谈一下我们为什么要和ATA进行合作,来研究如何可以进行合作来管理剑桥少儿英语。实际上刚才从之前两位的发言当中我已到了很多我们之后还会进行更多的讨论。之后讲一下和英语语言有关的一些挑战,比如要把这种传统的书面考试变为机考,我们讲一下这方面的开发和试考以及如何去衡量推出的这些考试是否成功。

  剑桥少儿英语这个考试定位小学的学生,在512岁这个年龄段的儿童是我们的考试目标对象,我们考试也有一系列的目标,让孩子在英语上获得一个先机而且能够培养他们实用的语言技巧,语法不是重点而是实际的语言技巧是重点。我们还会给孩子一个积极的语言考试体验,并且对孩子的进步予以励。这个考试分成,有一级,这是最小孩子考的,然后是二级A1,A2。屏幕当中的这个小猴子,我进来之前已经看到有这么一个小猴子,它经常带着一个手套的形象在我们的少儿当中也非常受欢迎。少儿英语考试有的是针对小学的剑桥英语考试,也就是让孩子在学英语的同时在成长的同时去学习英语,因此大家在底下看到一开始他们是考一级,而剑桥高级考试实际上是比较高层次的,是在你进入英国和世界其它大学旧学的时候需要再考察英语,所以从最低的一级一直到高级我们可以说提供一系列的剑桥英语考试。你必须要给他们进行这种考试,同时还有恰当的考试评估。少儿英语考试要考四种技能,阅读、写作、听力、口语。我们也会给孩子们提供成绩报告,这个报告实际上也非常重要,这是他的考试成绩单,大家可以看到剑桥的标志是一个盾牌形的标志,在这儿有阅读和写作,他得几个盾牌。在每一项都至少会得一个盾牌,盾牌数量的多少实际上说明了他成绩的好坏。而且在证书后面会说明,说明这个学生在每一个方面做的怎么样,他的能力现在到了什么程度。

  现在我们每年大概有50万考生遍布80多个国家和地区,12大考生的来源国,遍布世界各地。在东亚地区在中国还有印度都有很多考生,在南美和西班牙也有很多考生。现在我们来看一下考题是什么样的,这也是我们让考生去做的。比如让他们考听力的时候先去听,再上色再去写,我们给每个考生一些蜡笔还有铅笔让他们上色和写,这样的话他们可以在听完之后去描绘老师头发的颜色或者是学生衣服的颜色等等。听并联线,这种考题里面他们要把这里面人物的活动和相应的描述联在一起,当然它是书面为基础的考试形式,我们要考虑怎么样把它变为机考类型。这是一些更多的例子,在一开始我们所做的比较基本的让考生去听上色、写,听、联线或者选择对错。对于一些水平已经比较高的考生来说,我们要让他们要有更难的考题,这种考题形式其实对于儿童考生来说对于考生来说都有,选择正确的词写在横线。我们还有口语考试,每一个少儿考生他都必须要经过口语考试,这个是由考官来主持的,传统上都是面对面的考试。考官和考生见面,会有一系列的视觉提示,之后再进行口语的交流,待会儿还会讲到口语考试,这个挑战性比较高,如果让他能够合理而且进行也是以机考为基础的话,它其实是更难的。

  为什么选择机考?刚才ATA的领导已经讲到了,由于互联网的出现还有以技术为基础的解决方案现在已经应用于很多学校,中国在这方面肯定也是界上走在前面,ATA的同事比如我们在墨西哥做了一个测试的实验版,当时在一个学校它是一个连锁学校,每个学校都有三套IPAD,学生上课的时候随时都可以使用IPAD,我们必须适应这种支持IPAD的考试方法。现在我们看选择机考的原因还有一个,反映学生的学习经验。学生他们很多时候都已经和技术有了接触,很小的时候就开始学习一些新的技术,一些教育政策还有一些课程可能都已经落后于这种趋势了,我们发现实际上孩子是的学习经验都是基于技术的,而且他们在自己私下所体验到的技术比在学校要多,我们也希望能够在这个领域反映他们的这种学习。为了公平性和可用性,如果一个孩子他一直在使用IPAD两三岁就开始在使用的话,现在让他们进行纸笔考试对他们来说是很难的,对于孩子来讲可能是恰当的,但是对一些孩子来讲,这样产生一种障碍,所以给他们一个机考的选择尤其是像可以触摸屏的话,可以把这个障碍剔除,可以使得他们进行更好的测评。

  为什么用机考?我们和ATA一起合作的工作,可以让我们的考试中心和考生考试更加容易,我们有一个解决方案,这样他们可以在网上进行,并且我们有网上口语考试,这样的话考生来到这里一个小时到一个小时20分钟就可以把整个考试做完,包括他们的口语考试。有一种面对面的口语考试,孩子可能会用整个下午或者用一天的时间才能把这个做完,因为他们可能需要去不同的房间见不同的考官,所以这样的话整个安排起来会比较复杂,这种机考就比较简单了。另外我们也可以看到有这样一种无线的盒子技术,也是一个比较好的办法,这样的话实际上可以使用移动性,可以让我们这种考试中心把考试的解决方案能够走到哪里带到哪里。另外我们也可以有一种自动的评分,可以更快得出考试的成绩。ATA在这方面也制定出了自己的门户,在机考方面有很多的优势。下面给大家讲讲我们背景的情况,做机考1990年就开始了,在商务英语考试,还有其它考试用机考,这是第一次以机考为形式的考试20世纪90年代开始的。2005年有一个剑桥连接的办法,这个常成功的,很多考试通过这种考试,2009年博思在线考试上了网,2011年有了第一个博思线上口语考试,年轻人的考试在2013年推出来,我们跟ATA一起合作得到一些机会,利用这种机会来做一个新的考试办法,这个感觉是不一样的,这样可以让机考考试覆盖更多的靠。

  怎么样做这个工作?我们会把这些材料给上海的ATA,ATA团队会把它们在屏幕上看一看,这个还行可能有一些不太好需要改一改,我们就在底部有一个浏览,这常合作性的一种过程,大概需要几个星期。我们双方不断在上海和剑桥之间进行沟通,还有的同事不断沟通,逐渐把剑桥英语考试的题目逐渐做得越来越好,这样可以把我们这种语言的检测方法和ATA技术的专业知识合在一起,这样我们彼此双方可以互相学习。这是一个非常好的一种合作形的经验,所以我们是在2011年秋季开始的,一直走到2012年、2013年,我们做了很大的实验试考,首先在中国进行试考,然后界各地阿根廷、西班牙都做出这样一种测试,并且3月份在也做出实际的测试,并且2013年在西班牙做了这样一个实验,确实非常得好,这常长的一种开发过程。这种检测从2012年3月份一直进行到现在,当我在苏州的时候,我们在2012年11月份到苏州的时候第一次有了少儿通过IPAD考试,这个对我们来讲是一个非常大的突破,这个也是我们第一次在触摸屏上提供的考试。

  我们通过这种试考得到哪些东西?我们得到了来自考生和考官的反馈,一会儿会给大家看看他们的反馈,同时我们还有很多的数据,我们大概有四百多个考生效果的分析,对他们的考试绩效做出一种分析。另外我们还做了很多的改进,我们才会把它真正进行应用。在这里给大家展示出我们要做的工作,我们在机考测试的方法实际上跟我们年轻人考试当中机考的方法基本上差不多,我们有一些已有的产品已有的测试,每一年大概50万考生都会参加,一般来讲我们会让考官得到同样的认证证书,他们有同样的方法被测量,很多考试方法都是一样的,考试内容是一样的,这个就是数字化的。还有考问题和数量是一样的,他的这种纸的时间长短也是一样的,另外难度也是差不多的。我们必须要它的难度一样,同时结构也是一样的,我们说对于考生来讲同样的一种认证。另外考试的目的也是一样的,刚开始的时候我们谈到了他们基本上就是让人们能够起动英语的学习,给他们提供一种激励提供一种积极的反馈,必须把这些得到。这样通过机考的方法让学生更愿意学习。我刚才也说过,必须有一种国际上可以认可的剑桥英语的认证。有哪些不一样?大家可能看到我们有一些浏览的方法可能不太一样,同时反映的机制不太一样,还有检测的功能可能不太一样,比如音量可调、屏幕键盘形象可放大,还有屏幕计时器还有判分准则不一样。我给大家举一些例子看看我们所做了一些什么。通过这个可以看到,我们这里有一系列的蜡笔颜色,我们有一些浏览的特点可以让孩子改变音量的大小,这个例子展示另外一个考试特点,当孩子他们自己做之前有一种动画性的例子,大家都知道应该怎么做在考试当中。另外还可以看到底部蹦出来的小键盘,这些考试是由年轻孩子所做的,他们的手比较小,有时候手可能太小无法使用键盘,所以年轻人的考试他们使用虚拟的键盘,可以把他们的答案写在。这个是对年轻人所设计的,因为这里有很多的需求,这是其中一个例子,下面看一个听课的例子。考生把名字放在图片当中。看和读这部分有点不一样,主要跟大家讲这种考试怎么样能够让考生更容易做,并且让他们回答起来也比较容易,有时候更加简单,因为他们不需要写,他们只是选择一下就行了,读和写的部分可以看到有时间表告诉他们还剩多少时间。另外选择正确的词,这是进行机考非常合适的考试试题。他们不需要写,而考生只是需要把他们需要的选择点一下放进去就行了。下面我们看看一些细节,这样的话你们就不需要更多听我来讲,我准备给大家放一分钟的视频,当你看这个视频的时候你要知道这是一种面对面的年轻人的少儿口语考试,大家可以看看下面这些题,第一考官做什么,第二考官如何持考,第三考官的角色。我给大家讲讲我的一些看法,这个考官首先告诉孩子做什么,他会告诉考生要做哪些事情,他会创造一个听众的角色,听考生说哪些话,并且他倾听他会点头。他也会有一些提示,比如我们看到如果说考生不知道怎么回答,那么就会有一些提示跳出来,还会纠正这个考生。比如这个考生不知道云这个词怎么说他就会提示考生告诉考生,火油他会等考生答完一题之后再进入下一题,这些都是人在口语考试当中考官所做的,也是我们希望能够捕捉到的,把它运用到机考当中。

  现在我给大家展示一下机考的口语考试,比较一下其中哪个情况发生了哪个情况没有发生,同样这些问题也就是考官做什么,如何展开考试,考官的角色作用是什么。在这个议题里面考官做了什么,是不是和刚才那位男考官是一样的?仍然制订了考题设定了任务,而且充当了听众,尽管是一个虚拟听众,但是他还是在那里,我们可以看到一张非常友好的面孔,所以他是一个虚拟的观众,那么他来倾听考生的答案。但是他并不会给考生任何提示,他并不知道考生说了什么,如果考生要是没有办法发现两个图之间的区别那也没有办法,他也不去纠正考生,他也不知道考生什么时候考完,而且他也无法知道考生什么时候答完。所以说他并不是向考生是否考完的时候做出一个判断,只是看到最底下的时钟,也就是说考生可以从这个时钟看出来这道题已经花了多少时间,这也是比较人性化的。这是我们的一个解决办法,我们也搜集了一些反馈意见,希望能够确保。考官在面对面考试当中所做的这些事情不会因为机考没有出现而对考生造成不利影响。我们看一下有哪些新的变化,一个不变的地方首先仍然是一对一的,考官有一个手册,比如面对面考官的时候,考官有一个手册在手里,同时有一些视觉提示,机考通过电脑进行是统一的考试体验,对于所有的考生来说都是考官这一个人。我们有一定的对于考官的培训,但是这些考官他们都是个人,所给予考生的体验不会百分之百一样,此外我们还有一些动画角色,此外我们还有一个电脑判分流程,在这里很重要的一点要说这个判分对于少儿英语考试来说它不是自动判分的,而是由考官判分。让考官来听这些考生的答案并且打分,采用的标准和面对面考试一样的标准。

  如何确保机考和纸笔考试的可比性?在听力阅读和写作对于功能进行了调整,我们要看一下这个考生是不是回答了每一个问题,我们改变了一下考试的方式,让学生一题一题答下去对他们的分数没有影响。口语考试当中可能有20个考生在同一个房间同时考试,必须要确保音频文件的质量足够高,这样考官能够听清楚,此外还要有正确的计时,还要处理提示的问题,还有纠正的问题。我们所关注的在提示方面的一点,我们一开始的时候先看一段面对面的考试,比如要看这个考生花了多长时间来回答考题,比如考生在每个考试上花了多长时间,我们可以看到24%的考生他们在一级考试当中完成一道考题不到两秒钟,这实际上就是我们所使用的一些信息,当然有一些是我们没有使用的信息,我们不能够计算出来这个考生他们讲话讲了多长时间,因为他们需要有一段思考的时间,中间还要有停顿。我们通常会做一个大概的计算,平均在讲话之前的思考时间,所以大家可以看到有考生需要五秒钟的时间才能张口回答,另外一个考生三秒钟左右,我们也是希望能够在时间这一块保持一个平衡,让考生有足够的时间去讲话,不要让他们觉得他们就讲一点就一直沉默坐在那里。我们可以看到这里第二部分的考题是讲故事,在整个测试当中我们把整个回答时间从35秒延长到45秒,我们搜集到的反馈考生需要很多的时间,35秒很多考生没有讲完。45秒所有的考生都讲完了,有一些考生被掐了,面对面的考试里面这些是不会出现的。还有对于成功的衡量、反馈和数据分析,我们之前说了我们有一些软反馈和硬反馈,先看一下软反馈。我们发现在四百名考生当中有84%的考生喜欢在电脑上进行考试,我想这也常好的,当然不可能做到百分之百的学生都喜欢,这个电脑考试实际上是提供了一个选择,70%的考生喜欢对电脑进行口语考试,这个也是多数,当然比我们希望的水平低一些,其中有一些原因,在一开始我们还处在一个测试的阶段,还是处于测试的初步,我们还需要了解比如说设备上有什么改进,需要有比较隔音的,还要有良好的麦克风。随着改进的过程进一步推开,考生会越来越喜欢这种模式,特别是当设备合适的时候考生的接受程度会更高。这是考生的一些反馈。一位墨西哥的考生说我喜欢和电脑对话,他还画了一幅画,对着平板说HELLO,可以充分表明这些考生是多么享受这种机考的考试。这里是比较长的评论都是考生的感言,我喜欢在电脑上考试像玩游戏一样,我让我的朋友都来考。还有觉得这种考试更快捷更有趣,实际上我在考试测评这一块工作了很长时间,有时候如果说机考比纸笔考试更有意思,并不是那样,如果在IPAD那肯定更为有意思,这个考生不断的点击,实际上和传统的纸笔考试有非常大的区别,确实让考生更放松,而且让他们觉得更有意思。家长也有一些感言,他们对此也是持积极的态度,孩子在这个考试里面会感到更舒服,孩子喜欢听力,用可以听得非常清楚容易专注等等。有些考生家长说他们喜欢电脑的口语考试是因为电脑考试的时候是匿名的,并不得不面对着给你打分的这个老师,少了这层压力孩子就会觉得更轻松。此外还有数据分析和搜集,我们搜集关于提示这方面的机考和笔试考试比较的结果,来看两者之间是否有区别,原因是什么。我们发现非常有意思的结果就是在笔试和机考之间的差异不会有在家使用电脑种类不会有差异,我们看各个条曲线是什么造成纸笔考试和机考的差异。在对四百名考生的分析当中有一个因素就是考生的年龄,这是造成一定的差异,还有一个差异是国别。墨西哥和西班牙的考生有很大的差别,而且西班牙考生都比墨西哥的考生年龄大,可能这是一个造成偏差差异的因素。但是这个差别实际上是细微的,并不造成统计上有意义的差别,而且我们看到在家使用电脑种类并不会造成笔考与机考的差异。

  机考和笔考的结果具有可比性,通常在口语考试当中没有纠正没有提示,但是打分的时候考官也会说这些考生很可怜,我们没有任何给他们提示的,考官也会考虑到这种因素。我们问过考官他们打分的人,他们是不是考虑到这个因素,他们说是的,而且在打分的时候无论机考还是笔考对同一考生所研究的结果进行研究的结果发现影响这两种因素的分数是相同的,机考不会影响到机考的效果,笔考当中考的好的在机考当中同样考的好,这个并不说明机考由于设备的原因会导致在机考当中效果并不好。说到两者之间的差异,比如在线登陆还有MTS以及减少压力方面都是笔考和机考方面的差别,对于考生来说我们的结论可以让他们在笔考和机考之间做出选择,机考是另一种评价孩子能力直观有趣的方式,对于我们来说它提供给我们一个更好的方法可以让我们了解学生的表现,可以用于打分,对于我们来说利用这些结果做数据分析进行大规模的分析都更方便,因为我们可以从电脑里面来获得更多的数据。今后进一步促进口语当中人机互动,还会提供更多的知识材料给考生,还需要对于整个流程进行改进。

  今后我们已经做好准备,在苹果APP商店里面推出我们的APP作为测试,此外我们还会和ATA进行合作进行进一步的改进,在2014年之前进行全球推开,希望能够按须提供这些考试服务。

  大家有什么问题大家可以私下问我,谢谢大家!

  赵煜(教育研究委员会研究员和国际合作顾问):非常感谢ATA给我这个机会跟大家进行探讨,我的名字叫赵煜,我是教育研究委员会的研究员,同时也是国际合作顾问。我今天的题目是企业如何应用新技术实现能力和个性测试,首先我要感谢我的同事他们为我准备的PPT当中提供了很多新的想法和一些实例。今天的主要内容是这样的,我听到ATA的同仁跟我说,ACER是哪儿?我会给大家讲讲什么是ACER,关于ACER这个公司,还有ACER出版社人力资源测试一块,还有中小学或高等教育测试领域题型。教育方面非常前卫各种各样的题型大家跟我一起分享。

  ACER的,ACER是致力于扩展和推广基于研究的知识信息,开发相关的产品及服务,并用于促进终身学习。我们的座右铭促进学习,阵于治山。成立于1930年,350名员工,在、悉尼、布里思本、珀斯、阿特来德、迪拜、新德里、英国都设有办公室,ACER是一个自主的私人企业,由测量和测评界国际权威教授所领导的。ACER有一个非常大的职能部门研究部,前不久中国上海发布的匹萨报告可能能知道,匹萨是经合组织承接的项目,匹萨是ACER从2002年到2012年都是ACER承办的,我们的国际调查研究部门就是做这个匹萨的。匹萨的出题无论是人文的还是社会科学方面或者是数学和科学方面都是由研究部下面的人来出题的,国际调查研究主要就是承接国内比较大的项目在的运行,同时还有高等教育、心理测量学和方,心理测量学和方我们前面讲到了,信度、效度,这个是我们部门用来工作的方向,再有就是系统和教育测评。评估服务部其实是服务于中小学教育、高等教育和职业教育,听起来跟HR不太搭界。一会儿我给大家介绍几个他们部门出的题,ACER的出版物涵盖教育、人力资源、心理学、特殊教育学研究、语言、语音、养育,如果对这个感兴趣可以在下面的网页上看。ACER的人力资源80多年来ACER开发并向企业分发用于人才选拔和开发管理方面的测评工具,ACER主要是对于企业的经理、人力资源专业人士和管理心理学家提供全面的服务,有点像国内说的B2B。人力资源测试平台已经有十余年的先河,最初了ACER使用网络测试的先河,它把享有盛誉的人力资源笔试转换到网络上。ACER的旨非常简单,我们在人力资源的测试上我们讲究的是要灵活便捷不受时空,比如的部门如果想进行毕业生招聘的话你要是买我们ACER东西的话很简单,你只要把这个号分给相应感兴趣的考生的话做出来,你任何时间都可以做,不受时空。我们跟ATA的战略不是太一样,我们的客户群体有联邦及州的部门,同时也有猎头公司和咨询公司,他们也是采用我们的这些测试。测试的种类有很多种,有能力、个性、领导力有情商有职业规划、工作能力、组织发展培训还有360度的全方位反馈,今天我们主要看能力和个性。ACER目前有两个汉化出来的性格产品,一个是梅洁思性格类型量表,还有一个是工作场所性格指数。

  梅洁思性格类型量表简称MPTI,在国内比较火,你想进入ACER指定的测试产品,要是感兴趣这个MPTI给你帐号你进来输入我的名字、生日,梅洁思性格类型量表的界面,一共有71道题实际的题是51道,其中20道是精选模式,有人测出来做完51道题之后出来的是怎么这个人又内向又外相,分不出来怎么回事,这个时候出了精选模式,看看你到底是偏内向还是偏外向,这是一个非常简单的例子。如果大家想了解这个产品,我只能列出来这三个,感兴趣的话就看这个链接。九页的样本报告测试是计时的,你做完马上反馈到想给你做测试的这个人的手里。前面讲到性格测试方面的产品,再有能力方面的测试,能力方面的测试有一些样题,大家可以在网上看一下如果感兴趣的话。我只是给大家举几个例子,能力的测试有专业数学样题,填空、字,这个只是样题,数学在我们中国人眼里简直是不在话下。刚才给大家看这几个,这个其实就是多项选择要么就是填空,没有什么可特别的,这个HR没有什么可特别的。实际上我要重申一下,ACER的HR面向便捷任何时候不受时空,如果客户想用的话什么时候都可以用。实际ACER在技术方面除了选择题和填空题还有很多在这方面的贡献,比如说在匹萨OECD项目里面我们就提供了关于科学测试方面的视频短片,但是匹萨是OECD的项目,我们最后的产品归OECD,这个东西不能跟大家分享。还有热点点击,比如我们中国要考学生的地理,说中国首都在哪儿,你就要点了,我们系统里面会说走多远超过一百公里还是怎么样,在哪个范围内这就算对的,它会做这方面的技术支持。托拽题在ATA看来不在话下。给大家介绍一个很有意思的东西,在线写作测试,这个是一个即刻评分的在线写作测试,我们每次考语文有作文考试花费老师很多的时间去读,我们面向的群体不仅仅是面向学校群体,也面向企业群体,在学校领域我们研发了在线写作。ACER在线评估和报告系统,在线写作不仅给中小学服务也给在线写作服务,我们有研究结果出来,机考出来的分和人评分出来的分是有数据分析的,在线写作是值得提倡的,我们有科学数据在这儿。AEA工程学入学考试测试,为什么要举这个例子?当我们说HR的时候,ACER把它划在教育这块,实际上我知道在国内有很多HR方面可能我要的人才不一样,我想要工程学方面的人,我想看他能力怎么样或者说我想要做的,什么样的人真正能够做,或者我想要安保人员,我们也有这方面的测试在里面。我给大家介绍一下AEA工程学的入学测试,也是在机考界面上形成的,是一个两个半小时的测试,涉及了三个方面,有推理、人际推理、量化推理。

  工程学的入学考试工业学院的院长在一起就说我们认为在工程师的群体里面人际推理常非常重要的,为什么?工程师不仅仅跟技术打交道,也要跟人打交道,这也是一部分。所有两个半小时的题由ACER的人员出题然后内部进行判断,之后跟大学院系进行合作审题阅题,我们真正把这个题面向到大众的时候没有性别歧视,没有种族歧视,没有文化和任何教歧视。人际推理给你一个小片,你看完这个片问你,在片里面这个女士对这个男的有什么感觉,这是我们给工程师的考试当中用的题。

  在线写作测试,跟我们比较搭界的写作测试。它最后出来不是像我们想象有一个分,50分满分给你35,分的挺清楚的。比如你在描述上是多少分,你在概述是多少分,每个部分都有一个评分,在写作方面他想看什么他是有分步的。这是ACER的产品。总而言之,我们不仅仅是做计时的填空、选择题,其实我们有能力做最终热点选择的题,我们也可以做在线写作评估的题。目前国内企业里面可能有很多实际的题,你如果来面试他会给你一个企业背景的介绍,你要申请这个工作我要给你岗位的介绍,还有给你一些真正的问题,看你这个人解决问题能力怎么样。我曾经跟ATA专家老师探讨问题的时候,这个该怎么做?在机考上能不能实现?这个是可以实现的,ACER已经实现了,在匹萨的阅读写作当中已经实现了你有几份文献出现,但是我可以在同一个电脑上同一个机器上能够实现这样的东西。

  这就是我跟大家的分享。谢谢!

  陈永汉:女士们、先生们,大家下午好!我代表ETS首先感谢ATA邀请我参加今天这个会议讲一下托业考试,ATA和ETS已经建立起来就托业考试的合作关系,在过去几年已经成功实现了合作,现在我们可以回顾一下我们托业的分数还有学生在中国以及世界的状况。我主要谈的是听力和阅读考试的情况,每个学生在完成考试的时候同时要完成两页的调查表,他们要填一些个人信息,比如性别、他们学习英语的时间等等这些信息,可能大家之后也会看到这个信息的展示,但是我们每年都这样做,当我准备这个幻灯片的时候,我在获得这些信息其实遇到一些困难,因为在过去几年这些信息可能并不是特别有帮助或者我拿不到这些数据,因此我只是专注引入12年的数据,如果看一下纵向的信息,从05年、98年,中间间隔了七年。我们如果做一下纵向研究的话,看看有什么发现。

  首先介绍一下托业的历史,之后给大家做一界范围内托业的总结,最后说一下托业听力阅读考试纵向研究,跨度达到14年。这些内容对于对于学生去学习英语或者学校让学生准备考试或者公司让员工学英语,这些信息都会非常有帮助。托业考试也是历史比较悠久的一个英语考试,我们肯定是世界上最多的一个考试人数参加最多的考试,我们有七百万考生,这个数字还在增加,但实际上它的诞生是始自于77年,这个考试实际上一开始是由日本通川省请求ETS开发标准化的国际英语测试测评工具,以帮助拥有不同文化背景的企业在日本和日本人工作更容易去进行合作。这是一个背景。日本请我们ETS设计一个考试,经过很多讨论和研究之后,最终我们第一次托业考试在79年推出,当时只有三千名考生参加了考试。从79年之后考试规模迅速扩大,现在有七百万人考试,更重要的一点地域分布更广了,已经遍布一百多个国家,现在这些国家都有托业考试,有一万四千家公司把托业考试作为非常重要的考试让他们的员工提前做好托业的准备,提高自己英语技能。从79年到现在,可以看到世界变得越来越小,通过技术的发展通过全球化世界变得越来越小,这些因素都使得人们彼此沟通的方式出现了很多变化,比如沟通的工具、沟通的频率还有使用的语言都出现了变化。无论在学校也好,在职场也好,还是在社交领域也好都是如此。因此全球化和先进技术确实引发了托业的变化,现在我们看到这也是一个非常典型的代表性的考试,能够体现出来在工作场所当中一个人的英语技能。79年在日本有三千名考生,现在拓展到了韩国还有中国、、泰国,这是80年的时候。在90年代又拓展到一些欧洲国家,法国、、英国、西班牙、墨西哥、印尼,今天有一百多个国家都设立了托业考试中心,而且我们管理的考试量每年有七百万。现在有一万四千多家组织机构使用托业考试来让员工学习英语,并且作为升职的依据。大家之后可以看到考生的分布情况,很多企业公司他们在雇佣新员工的时候也在用托业考试测量他们的英语成绩,所以说大学对于托业考试的重视也在进一步增加,使用托业考试的国家和地区基本已经覆盖全球了。对于学生的托业听力阅读都会进行考试,一方面要做一个公开的考试,还有一个是机构考试,机构考试是我们允许学生在网上注册报名,到一个指定的考试中心去考试,这是公开的报名考试。机构考试通常考生是公司的员工,他们在公司里面接受考试,公司会来组织考试场地和我们在全球的伙伴来共同进行考试的组织。我们是两条,一个是公开考试,一个是机构考试,考生也是相应分成两部分。

  在我讲2012年全球托业考试之前我给大家讲讲我自己准备这个发言所做的一些准备过程,一会儿可能发现所有这些信息都是网上可以获得的,我们有21个案例报告在我们的网站上都有。我的发言常简单的,我只需要给大家展示一下我们网上的信息就行了。但是我看得越多越觉得过去的一些信息在我们的信息当中有很多是不准确的,我们看看以前的东西1998年的时候他们给了我一个问题和2012年的问题差不多是一样的。14年的过程当中我们所获得的信息没有任何变化,我知道在过去的15年当中我们可以搜集很多的信息,我在准备过程当中我给大家展示的这些信息对于很多做考试的人来讲都不是太准确不是太充分的。对于我们考试的开发商还有对怎么样能够做一个更好的英文课程设计的时候,我们所给的这些信息都不是很充分。在这里我想让们想一想,你作为一个利益相关方,你作为考试行业当中的一员怎么能够创造一个非常好的更大的一种信息源,这样的话可以让我们的客户都能够得到受益。我们这里也知道托业考试实际使用者很多,我们在这里能不能让所有的人把这个信息总结到一起,大家能共同分享。在这里想让听众真的能够看一看这些信息,看一看我们提供的信息当中是否准确,你们可以以后和我进行沟通,让我们把信息搞得更准一点。当我们谈到ATA CEO谈到互联网时代怎么能够从互联网获益的时候,我们的许可先生也谈到了4G和云计算等等,所有这些数据都是我们所说的数据开发和数据搜集,所有这些数据都可以有意无意搜集,就像我们剑桥的那位同事所说的,学生在回答问题的时间是0.015秒,都是以机考的形式来搜集的。如果用笔试方法怎么样能够更好地搜集,怎么样能够让我们学生英文的能力能够更好提升,这是我们需要考虑的一些要点。在这里我会给大家提供一些比较干的信息,大家脑子可能有一些问题,这样我们能够产生更多的行动。

  现在我们有528万考生,一般来讲有效的回复比例是82%99%,我们收到的回复是528万考生,我们针对45个国家和地区,我们只考虑五百名以上考生的国家,如果考生没有五百名不会涵盖在这个调查之中。亚洲实际上从听和读这方面来讲亚洲的得分是比较低的,从这个图很容易得出一个结论,亚洲人他们关于英语的能力当中是不是跟其它地区比较起来亚洲人的英语不太好,实际上总的来讲是这样的,在我跟我的同事谈的时候,我觉得可能是有一些条件的问题,为什么亚洲人是这样,为什么会有这样一个问题。我们都知道托业考试实际在亚洲是比较盛行的,我们有很多亚洲的考生,当我们考生的数量增加的时候平均分会受到影响,这就是为什么还会有这样一个局面,但是我们也没有非常充分的或者数据表明我的假设是不是对的。我们看看欧洲、非洲和南洲的数据,可以看到与亚洲比较起来以英语为母语的这些人从地理空间上更近一点,地理的接近性是一个原因,使得其它地区的这些人水平要更高一些,当然也是一种假设,我没有对他们进行检测,没有足够的信息来证明我的这个结论。

  考生的年龄段,60%的考生一般来讲都是不到25岁,我们可以看到很多学生很多年轻的学者来进行托业考试,年龄段从平均上来讲变得越来越年轻,以前是比较年纪大的人进行托业考试,现在越来越年轻。从这个图当中可以看到年龄段有最高托业分数的年龄段一般是26岁31岁,这些人基本已经工作毕业了,并且已经工作了一般在说英语的。第二21岁25岁,这些人在托业教育当在进行学习,并且有多年的英语学习经验。性别区分可以看到,57%的考生都是男性,在这里可以看到57%和43%这些不常准确,当然女性比例会少一点,但是她们得分更高一些。为什么会有这样一个假设,尤其女性的语言能力比男性要更强一些。托业考试的学位,58%的考生正在攻读或者已经获得本科学位,在最底下的毕业研究生和本科生托业考试成绩比其它群体更高一些,也就是说这种教育还有学习英语的年份常重要的,当你在大学的时候或者研究生当中他们一般得分是比较高的。在调查当中35%是全职工作者,58%是全日制学生来参加托业考试,全日制学生之所以参加托业考试主要是因为他们需要有这样的托业成绩,这样可以就业,很多学生毕业的时候或者研究生做托业考试,主要是能够准备好将来就业的问题。其中一个比较有趣的数据,对于全职工作者他们的分比较低,没有就业的分数比较高,没有就业的人整个比例不到8%,需要把这一个群体进行单独的分析。

  下面给大家讲讲31%的托业考试都是从事科学技术工作的,17%从事文秘行政工作,14%做市场销售工作,这些是最高分的前三类工作类别来讲。最高分数的前三类第一是教学和培训工作人员、管理工作人员、专业人士,这些人得分一般来讲是比较高的。81%的考生学习英语基本上花了六年以上甚至更多的时间,可以看到他们学习英语的时间越长就会使得他们在读和听的能力方面很强,这个证明学习的过程实际是对英语能力来讲是成正比的。45%的考生使用英语时间占一天的不到1%10%,日常英语的使用频率,如果他们使用英语的时间越多那么他们的分数越高。在英语国家的学生12%的考生会达到六个月或者以上,这也证明在英语为母语的国家你花的时间越长你读的能力越强。考托业的目的是什么?30%的人为了学习,30%的人为求职,主要的国家和地区包括智利、哥伦比亚、中国、日本、俄罗斯,为了求职参加的考生国家主要是哥斯达黎加、印度、韩国、泰国。我们讲了基本的数据系信息,下面看一下三年的数据,我从1998年、2005年到2012年做一个对比,看一下年龄、性别、学历水平、就职情况、听力阅读成绩,我得出一些信息进行总结。我们看到考生的年龄现在越来越大,全是低于25岁,主要是因为这些考生一般都是在公司工作的,而现在很多的人实际正在学习正在进行求职。性别来讲98年男性当中77%,现在只有57%,这个平衡已经达到了。学历方面,本科98年82%,现在58%有本科或者更高学历。是不是全职工作者?98年93%,现在只有35%。全日制的学生数量越来越多,从98年5%到2012年53%。参加三次以上托业考试的人从33%增加到47%。在英语国家的时间大于等于六个月,98年9%,现在12%。

  我们在亚洲发现亚洲分数的趋势以及在中国的趋势,在亚洲地区我们做这个调查的时候没有包括日本、韩国,我们实际上有三个不同的区分,除了日韩之外听力分数是271,而现在是255,这是不含日韩的亚洲地区的听力分数,这是2012年的分数,前三列是98年还有05年都是不包括日韩的,有时候我们做分析的话是比较困难的。我们再看一下红色部分,这是中国的听力分数、阅读分数和听力阅读总分数,可以看到过去七年有了很大的提高,05年到12年。最后两行是日本的听力阅读分数也有相应的提高,在过去七年里面幅度还是提高比较大,从总体上来说我相信在亚洲无论看什么样的一个基础,但是在托业阅读考试分数都是在改进的。一方面英语的教育变得更好,另外一方面用英语交流的机会会更多,这个都是一些有利的趋势可以使得受试者取得更好的成绩,这是全球的趋势。这些是基本的趋势,做进一步的分析还是不够的,我想ATA还有不同的考试服务提供者帮助我们更多搜集信息,让我们的学生让利益相关方能够从中受益。

  谢谢!

  刘颖:今天非常高兴,我是第八次站在国际研讨会的上,又有点紧张,希望大家克服七年之痒的审美疲劳。

  今天的分享分为两部分,第一部分2013中国高校通用就业力简要的内容,通用就业力我们已经从去年开始给企事业单位呈现,今天在这里非常荣幸做2013年的发布,在这之后想和大家分享新的科技互联网大数据给我们带来的考试测评冲击,希望大家可以喜欢这两个主题。2013年考试通用就业力,我们开展这项已经有两年之久,分为五部分诠释一下。项目研究背景、项目研究概况、项目研究方法、项目研究结果、企事业应用。

  随着大学生就业难的话题越来越多的企业业单位面临到另外一个问题就是太多的简历、太多的侯选者,如何从这些应征者当中挑出最合适企业的应聘者,更多的企事业单位希望了解什么样院校的特征什么样特征的学生更适合来我们的企业,基于这样一个需求,又因为ATA长期为各个企业做校园招聘的服务,目前为止已经积累了三百多万高校大学生测评的数据。我们应该为招聘单位或者企事业单位做一些事情,为他们提供一些有价值的信息,方便他们对人才进行评估和筛选。基于这样一个研究的目的,我们在去年展开通用就业力研究。研究之初我们定义了到底哪些素质是求职者无论进入哪个岗位哪个职业都是必须的,做了大量调研之后发现有三方面的素质是所有岗位所有从业者都必须要去考察的。第一,基本工作能力,也就是一个人从事工作所需要具备的基本IQ,简单来说是智商。第二,刚才陈永汉博士汇报的是英语工作的能力,因为英语必不可少在当今的社会上。第三,个性心理特征就是偏情商的部分。我们把这三者合并在一起称之为通用就业力的概念,我们也是基于这三个方面做的具体分析和研究。

  这项研究时间是从13年3月到11月,研究的对象其实是从去年校招大概一百多万学生当中抽样了七万多名样本,覆盖了中国的六个大的区域和409所普通本科高校。我们的主要内容是看一看他们在三项素质方面无论是排名也好特征也好,同时特别对211院校985工程院校做了一个详细的比对分析,最后形成了六大区域的排行榜,六大区域类各大高校的排行情况以及409所院校排名、985院校排名。我们采取的研究方法和工具主要是三类工具。第一类工具由ATA研发的EPI工具测试人的基本工作能力,第二个工具托业英语测量工具,第三个是英国引进的测量工具。EPI测查人的基本工作能力,第一对语言文字的驾驭,第二块跟工作比较相关的逻辑推理能力,第三对数字把握和数字运算的能力,第四考生对资料的统筹分析,第五考活变通思辨的能力偏创新的能力,我们叫做思维策略,这是EPI主要测查五大纬度。托业英语测试这个不用多说。第三个,引进英国的测评工具,测查职场的四个主要特征,思维特征、人际特征,和交互时的风格特征,最后做事情执行工作时的特点,分成四大模块36个主要纬度测查。有效样本数大概80多万,从中进行抽取了78523份,覆盖六大区域,十大科学门类,我们在校招数据里面很少有医学、军事学和艺术学专业的学生,这三个专业门类没有被包含在其中。第三,毕业生学历包括本科和研究生所有的本科以上学历。样本构成六大区域华东区域偏多一些,其次中南,再次是华北、西南、东北、西北区域。除了医学等几个没在列,其它都有覆盖。统计方法上用标准分合成的方法算通用就业力,我们没有办法算出他的成绩,在通用就业力的成绩只包含基本工作能力和基本英语能力这两部分,用标准分合成进行分数的合并。

  大家更关心这个研究呈现什么样的结果,我们对六大区域学生通用就业力排行,华东区最高,华北、中南、东北、西南、西北,西北区域的高校学生整体通用就业力还是比跟华东和华北相比还是适当偏弱一点。六大区域内各个高校的排名榜,华东地区英语能力、基本工作能力合成以后成绩最高的是复旦大学,其次是浙江大学,在华北地区其实也很稳定的发现每年基本上都是、北大、北外、等等依然排在前面,其它区域不再赘述,我们呈现了各个区域高校整体通用就业力的排名情况。在409所高校整体来看到底哪个高校的实力最强,总排名第一的是中国人民大学,基本工作能力排第一,英语能力排第六。我特别想一点,为什么今天做的这个排名也许跟我们大学看到的五数连的排名不一致,五数连的排名更多对大学本身的实力,我们这里更多是针对大学里边想要出来就业的这批学生的能力素质进行衡量和排名,为什么北大、大家都认为NO.1、NO.2的学校没有在这里面,北大、的学生可能更多的会选择继续深造或者出国深造,我们比的是进入职场就业的学生和其它院校的对比,我们这个报告或者这个研究的价值也就是给大家呈现进入职场就业的学生他们之间的特征是怎么样的。这是409所院校的排名大家可以作为一个参考。

  有些企事业单位说特别想看一下211学校的整体情况,我们也对211院校做了一个整体排名。大家可以在我们的上看到具体的排名情况,包括后面对985工程院校进行整体排名,总体来看排在前十的是中国人民大学、大学、复旦、南开、、浙江、中山、厦门、上海交大、南京大学(招生办)。也许大家看完以后也有这样一种认知,它的整个趋势一本类的院校整体平均成绩还是要高于二本和三本,这个趋势依然是存在的。同时我们也对基本工作能力里面五个不同的模块就不同的院校做了排名,我们往往以为大学(招生办)的学生语言能力并不很强,这次研究呈现大学的学生在言语理解能力方面依然也是很强,他们排名第一,在数字运算方面的能力是浙大排第一,时间关系不再详细展开。

  这次研究更有意义的做了一些985工程院校的学生,他们在个性心理特征方面是不是存在一些院校文化或者存在一些共同的特点。这个分析图大家可以看到确实不同院校的学生在风格个性特征方面呈现不同的态势。复旦大学对于思维里面有一个纬度评估问题,他喜不喜欢分析问题评估问题,遇到事情是不是喜欢想办法,对比农业大学和复旦大学,农业大学的学生分数比较集中,基本集中在5分4分,而复旦大学的学生相对来说离散度比较高比较分散,他们的分数集中在5分8分。这个厢式图,每一个柱状图中间价粗的部分代表一个重位数,在这个院校里面大部分的学生都集中在这个的部位。虽然复旦大学的学生更多集中在6分,但是6分以上的依然很多,而对比中国农业大学(招生办)学生更多集中在6分,其他学生都是集中在6分5分。通过这样一个厢式图可以看到各个学校的学生风格是不一样的,985工程院校大学生思维整体评分不错在6分左右。人际里面有一个纬度领导他人,偏领导力方面的素质和他们的个性特征,整体的集中分数比思维评估问题都要低一些,集中在4分5分。师范大学(微博)的学生在领导他人的时候也常集中,做老师的人都没有太强的,不太喜欢驾驭他人,都集中在4分5分区间里面。大学、大学在这方面或者动机可能更强烈一些。心理韧性方面,大学一枝独秀,也许他们的学习压力真的很大,心理韧性得分比其它院校高一些,高分段的人群多一些,跟其它院校典型的院校特征。推动成功是在执行大的纬度下,看看人有没有很强的成就,这里面看到东南大学(招生办)的学生推动成功的区间也是集中的比较窄,我们可以看到大学包括的学生推动成功的比较强,尤其北大可以看到它的平均成绩在5分或者5分以上,北大的学生看来成就、成就动机都会比较强。我们可以看到不同院校有院校的风格和院校的文化。

  我们这个在企事业单位招人用人的时候怎么去应用?之所以推出这样一个排行榜我们希望无论你的企业规模是多少,你处在什么样的行业,你处在什么样的区域,你都可以用我们的通用就业率的榜单去卯定自己需求的人才,虽然我的企业是成长型企业不是那么高大上的企业,依然可以锁定中高层次的人才,我看到到底锁定哪个层次的人才更合适。我们有一些企业对应于要求特别高重点看看哪些院校的学生英语能力偏强一点,尤其招海外派遣这种岗位的时候。呈现个性心理特征的分析图也是为了让大家了解不同院校学生之间的风格存在什么样的差异。在银行我们合作的很多客户都是大型银行,他们每年到各个院校做宣讲,对于他们来说很头疼的一件事到底选择哪些院校,哪些院校学生更适合我。很多客户说我把重点锁定的应该是财经类院校,把财经类院校进行通用就业力排名,我取前20前30锁定重点这30所院校进行招聘工作。这是可以按行业去做分类,帮助企业去做更好的人才卯定。另外根据区域,我是华东区域我应该锁定哪些学校。榜单里面给了具体的基本工作能力、外语能力等等,我们也可以结合一个岗位,比如这个岗位需要软件工程师,需要沟通协调能力,需要专业学历、专业知识背景,善于发现问题解决问题数理逻辑,可以结合我们的个性特征图,看看哪些学校的学生沟通意愿更强或者哪个学校的学生沟通能力更强,根据招聘的岗位使用这个。我们可以根据你所在的企事业单位的规模、行业、区域,结合我们的通用就业力榜单来分析哪些院校学生基本工作能力怎么样,结合各个院校学生的个性特征锁定最终招聘的目标院校,这样去使用。

  这是第一部分,简单展示我们整体的研究。第二个话题也是今天的真正内容,这个话题更应景。互联网、科技与大数据让你发现考试测评之美,其实前面所有的嘉宾包括孙振耀先生、许可先生都提到日益扑面而来的科技、大数据、互联网已经让我们不得不承认我们这个世界正在被改变,可能中国移动还在想我如何去应对电信如何应对联通这些集团的时候没有想到它会跳出来另外一个竞争对手那就是微信那就是腾讯,可能银行平时都在忙着关注其它银行情况的时候,我们也没有想到阿里巴巴也会跳出来做金融,也会有互联网金融的产生,互联网通过移动、交互改变着我们的生活和世界,现在都提到大数据来了,大数据的特征是怎么样的?其实大数据有四方面的特点,第一数据量巨大,第二类型繁多可以接纳的不仅是文本式的数据而且会分析视频等等各种非文本类的数据,第三流动性强不断的流动在生活的每一个环节和细节都在捕捉着。大数据现在给我们带来的一大困境,数据越多精准性越差,大数据虽然大家都在提,但是它其实也在干扰着我们的生活因为太多了,它的精准性下降,带给我们方便的同时也带给我们困惑。大家耳熟能详的云计算、人工智能,说一句话自动就能识别出来,无论有湖南口音还是湖北口音都能识别出来以及3D技术,所有这些都在冲击着我们的视线,着我们必须要去改变我们自己的生活和工作。我思考更多或者这个行业的人思考更多的是互联网尤其是移动互联网、科技和大数据引导我们考试测评做如何改变和相应的调整。

  它的调整、冲击、震撼最大的是把原来所有人最厌恶的一件事考试,人最厌恶的两种消费一个是看病一个是考试。大家都觉得考试是一件非常痛苦非常难受的事情,但是由于互联网由于科技由于大数据使得我们的考试测评变得越来越美丽,大家越来越享受它,越来越多的发现它绽放的光彩。我想跟大家分享这些科技的手段到底给我们考试测评带来如何的美?总结来看有四方面。第一,移动之美。第二,精准之美。第三,反馈之美。第四,衍生之美。概括来说互联网大数据和科技给我们带来的四大美,大家可能想知道到底这四大美如何去诠释它?

  第一,移动之美。不用说太多,原来我们传统的考试大家都知道需要在特定时间分配一个特定的座位选择纸笔对考生进行测量,但是今天不一样了,我们有MTS,我们有各种云计算,我们的考试可以移动化了,我们可以随时随地在任意一个移动终端对任意考生进行测评,通过这个可以去测评学习,可以在手机、平板电脑、笔记本上进行所有的测评。我们已经在手机上可以让几十位几百位高管进入蜘行网,可以就他的管理能力进行不断的测评,在测评的同时一边在选择他的答案,他也看到别人贡献的SNS别人贡献的答案是什么,让他不断去调整自己的管理能力,同时更好适应企业本身的文化也就是遵循他自己企业的问题产生他相应的管理方式。这些高管都是在手机上完成所有的测评,移动之美已经把考试测评变得非常美妙。

  第二,精准之美。由于有了大数据由于有了科技,考试测评变得越来越精准,我们的考试管理也变得越来越精准,我们考生的体验也可以给他更加精准的个性化的体验。精准之美分为三方面去阐述。第一,我们可以对人才进行更加精准的测量。第二,我们可以让考生有更加精准的体验。第三,可以有更加精准的考务动态管理。精准的测量体现在三方面,第一是我们可以通过自适应式的考试让考生不需要再答同一张试卷同样的试题就可以得到答案,可以用更短的时间完成他的考试完成他的测量。第二,由于我们现在有云计算,由于我们有大数据,所以我们可以动态更新我们的常模,不需要依靠固定的常模对人进行评估,可以动态不断往常模库填充新的数据,做出人群的比对评价。由于有了3D科技,可以用情景化视频手段3D展示我们的考试,让考生有更好的体验。人性化交互的体验,由于有大数据可以捕捉,同时设计因人而异的操作体验。我们有了大数据和云计算可以让我们实时调整考务,可以让考务管理、考生服务以及作弊都能够做到更加精准化。精准测量刚才谈到自适应考试,大家听起来很炫很神奇,其实它很简单,它的原理跟我们到医院去查视力表是一样的,从中间这行开始看起,如果中间能看见往下面走,看不见往走。自适应化考试就是借鉴了查视力的模式,先给考生一些中等的试题都答上来再加度,答不上来降低难度,这样每个人答的试题都不一样,答题时长也都不一样。第二,动态的常模,每个考生完成测评以后他的数据立刻进入常模数据库,我们实时在云端用MTS云端不断更新我们的常模数据才更精准的匹配。再有精准的测量,我们可以借助3D动画或者视频音频,使我们的考试变得更加不枯燥更加有乐趣甚至把我们的考试变成一种享受,可能我考完试就看完一个病,我考完一个试完成一个工作。我演示一下美国最新的医师考试是怎么去考的。我们重点看的是完全在模拟真实看病的病人案例,在这之前有这个病人基本情况的陈述,同时我们可以看到3D模拟视频模拟这个病人的各种特征或者各种情况,让考生感觉到他在答题时其实就是在看病,就在完成一项工作。这种情景化的考试让考生感觉是一种享受。同样今年在中国工商银行

关键词:学历类考试
0
0
0
0
0
0
0
0
下一篇:没有资料

网友评论 ()条 查看

姓名: 验证码: 看不清楚,换一个

推荐文章更多

热门图文更多

最新文章更多

关于联系我们 - 广告服务 - 友情链接 - 网站地图 - 版权声明 - 人才招聘 - 帮助

郑重声明:本站资源来源网络 如果侵犯了你的利益请联系站长删除

CopyRight 2010-2012 技术支持 FXT All Rights Reserved