| 图书基本信息 | |
| 书名: | 计算机化自适应测验:理论与方法 |
| 丛书名: | |
| 作者/主编: | 涂冬波 |
| 出版社: | 北京师范大学出版社 |
| ISBN号: | 9787303221776 |
| 出版年份: | 2017年8月 |
| 版次: | 第1 版 |
| 总页数: | 332页 |
| 开本: | 16 |
| 图书定价: | 48元 |
| 实际重量: | 522g |
| 新旧程度: | 正版全新 |
涂冬波,博士,江西师范大学心理学院教授,博士生导师,博士后合作导师,入选江西省“新世纪百千万人才工程”,美国伊利诺伊大学香槟分校访问学者。研究领域为心理统计与测量,主攻认知诊断和项目反应理论。近年来主持承担与认知诊断相关的国家自然科学基金两项,教育部课题两项,江西省社会科学重点项目等省级课题八项;在认知诊断和项目反应理论领域发表学术论文50余篇;荣获江西省社会科学成果奖二等奖一项、三等奖三项;出版学术著作三部,其中《认知诊断理论、方法与应用》为国内第1部认知诊断学术专著,开发国内第1个认知诊断分析平台www.psychometrics-studio.cn。
第*章 计算机化自适应测验
第*节 自适应测验
一、自适应原则在心理测验中的应用
二、自适应测验的主要特征
第二节 计算机化测验
一、划分标准
二、四代计算机化施测
第三节 计算机化自适应测验
一、概念
二、CAT的优势
三、CAT研究现状与未来研究方向
第二章 计算机化自适应测验理论基础、原理与开发流程
第*节 计算机化自适应测验理论基础:项目反应理论
一、项目反应理论
二、项目反应模型
三、项目反应理论假设
第二节 计算机化自适应测验原理
一、CAT的产生
二、CAT的原理
第三节 计算机化自适应测验开发流程
一、准备阶段
二、题库建设
三、CAT算法确定
四、信度与效度验证
五、正式使用与题库维护更新
第四节 CAT的构成及其测试流程
一、CAT的组成部分
二、CAT的测试流程
第三章 计算机化自适应测验流程中的相关算法与技术
第*节 CAT选题策略算法
一、Fisher信息量选题方法
二、KL信息量选题方法
三、大优先级指标选题方法
第二节 CAT参数估计方法
一、极大似然估计方法
二、贝叶斯估计方法
三、加权似然估计方法
第三节 CAT曝光率控制技术
一、条件概率方法
二、a分层方法
三、动态a分层方法
第四节 CAT终止策略
一、型终止策略
二、相对型终止策略
第四章 计算机化多阶段自适应测验
第*节 计算机化多阶段自适应测验简介
一、什么是MST
二、MST与题目级别CAT的比较
第二节 计算机化多阶段自适应测验设计
一、阶段数的确定
二、每个阶段中模块数的确定
三、每个模块的项目长度
四、统计目标与定性规范约束
五、计分方法(能力估计)
六、自适应策略与过程
七、组卷
第三节 计算机化多阶段自适应测验的技术与算法
一、路由规则
二、自动化组卷
第五章 多维计算机化自适应测验
第*节 McAT简介
一、多维项目反应理论的发展
二、MIRT与FA的关系
三、MCAT的产生
第二节 McAT中常用IRT模型
一、二级评分的多维项目反应模型
二、多级评分的多维项目反应模型
第三节 MCAq7、能力估计方法
一、极大似然估计
二、贝叶斯极大后验估计
三、贝叶斯期望后验估计
第四节 McAT选题策略
一、基于Fisher信息矩阵的选题策略
二、基于Kullback-Leibler信息量的选题策略
三、基于互信息的选题策略
四、基于连续香农熵的选题策略
第五节 McAT、终止规则
一、定长MCAT中测验长度的确定方法
二、不定长MCAT、终止规则
第六章 认知诊断计算机化自适应测验
第*节 CD-CAT简介
一、认知诊断测验
二、CD-CAT
第二节 cD-CAT、中常用认知诊断模型
一、具有认知诊断功能的IRT模型
二、规则空间模型
三、统一模型
四、融合模型
五、RRUM模型
六、DINA模型
七、高阶DINA模型
第三节 认知诊断计算机化自适应测验中的核心技术与算法
一、CD-CAT的选题方法
二、CD-CAT的参数估计
三、CD-CAT的终止规则
四、CD-CAT的在线标定
五、CD-CAT的总结与展望
第七章 可修改答案的计算机化自适应测验
第*节 可修改答案的计算机化自适应测验简介
一、RCAT优势分析
二、RCAT目前存在的问题
第二节 可修改答案的计算机化自适应测验设计与方法
一、基于测试设计视角的RCAT
二、基于选题策略视角的RCAT
三、基于模型视角的RCAT
四、总结与展望
第八章 双因子计算机化自适应测验
第*节 双因子IR7、模型简介
一、基于探索性因素分析模型的研究现状
二、基于验证性因素分析模型的研究现状
第二节 BCA7、基本过程
一、基于单维视角的BCAT过程
二、基于多维视角的BCAT过程
第三节 BCAT选题算法
一、基于单维的选题策略
二、基于多维的大Fisher信息量矩阵选题
第四节 BCAT在心理学应用中的优势
一、拟合性
二、既能反映特殊维度情况也能反映整体情况
三、减少被试的作答负担的同时保证测量的准确程度
第九章 CAT中新题参数在线标定
第*节 概述
一、在线标定的概念
二、在线标定的基本流程
三、在线标定与优设计
四、在线标定的主要设计因素
第二节 单维二级评分模型下的在线标定
一、试测题选题法
二、在线标定情境下的参数估计方法
三、试测题嵌入位置
四、试测终止规则
第三节 其他模型下的在线标定
一、认知诊断考试的在线标定
二、多维IRT的在线标定
三、单维多项评分模型的在线标定
第十章 CAT技术在实践中的应用
第*节 Multistage-CAT在GRE中的应用
一、为什么选用MST
二、GRE测验的MST设计
三、GRE测验规范
四、GRE测验MST设计的评估
第二节 CD-CAT在英语听力理解中的应用
一、题库建设
二、选题策略
三、参数估计
四、真实题库下模拟实验
五、真实测试效度验证
第三节 CAT在心理健康评估中的应用
一、研究目的
二、研究方法与过程
三、研究结果
四、讨论
五、展望
参考文献
计算机化自适应测验(Computerized Adaptive Testing,CAT)是一种全新的测验形式,采取因人施测、量体裁衣的自适应测量思想,为每名被试选择一份具有*小测量误差且*适合其自身的测验,从而达到更高的测量精度并减轻测试负担。
《心理测量学丛书·计算机化自适应测验:理论与方法》是作者多年研究及实践的总结,对计算机化自适应测验的理论、方法、技术以及应用等方面进行了全面、详细的阐述,为心理测量学及相关领域的研究者和学习者提供借鉴和参考。
这本书最让我感到震撼的,是它所蕴含的批判性思维的火种。很多专业书籍会倾向于宣传一种“最佳”的范式,但这本书却展现了惊人的客观与包容性。在介绍主流理论的同时,作者总能不失时机地指出其内在的假设前提和潜在的伦理风险。比如,在讨论测验的公平性问题时,它没有回避不同文化背景下测试效度的差异,而是深入剖析了偏见来源,并探讨了消除偏见的技术途径。这种深刻的自我反思能力,使得整本书的论述显得既扎实又充满人文关怀。它教会我的不仅是测量的技巧,更是一种对“测量”行为本身的敬畏之心——即我们所使用的工具,都可能带有我们自身思维的烙印,因此必须保持警醒和不断的迭代。阅读完毕,我感觉自己不仅仅是掌握了一套知识体系,更是获得了一种审视和改进现有评估体系的全新视角和勇气。
评分这本书的装帧设计简直是一场视觉的盛宴,硬壳的质感温润而厚重,拿在手里就有一种沉甸甸的可靠感。封面采用了一种沉稳的深蓝色调,配上烫金的书名,在光线下闪烁着低调而典雅的光芒,仿佛在无声地宣告其内容的权威性。内页的纸张选择也十分考究,米白色的纸张既保护了视力,又让油墨的呈现显得格外清晰锐利,排版布局疏密有致,字号大小适中,即便是长时间阅读也不会感到眼睛疲劳。尤其是章节标题和重要公式的突出处理,逻辑层次分明,使得原本可能有些枯燥的理论知识在视觉上得到了极大的梳理和简化。不得不提的是,书脊部分的工艺处理,平整服帖,即便是新书也能轻松摊平阅读,这对于需要频繁翻阅和对照的专业书籍来说,简直是人性化设计的典范。整体而言,这本书在物理形态上已经达到了艺术品的标准,它不仅仅是一本工具书,更像是一件值得收藏的案头精品,每一次的翻阅都成为一种享受,而不是负担。
评分初读这本书的感受,仿佛是走进了一座精心规划的知识迷宫,但这次迷宫的导览员异常清晰且富有耐心。作者的叙事风格极其严谨,如同精密的手术刀,解剖着每一个复杂的概念,不放过任何一个细微的逻辑关节。它不像某些学术著作那样,将深奥的理论堆砌在一起,让人望而生畏;相反,它更像是一位循循善诱的良师,总能在关键时刻给出恰到好处的类比和实例,将抽象的数学模型和统计学原理“翻译”成可以被理解的语言。特别是对于测验设计中的信度与效度这些核心议题的处理,作者没有停留在表面的定义,而是深入挖掘了它们在不同测验情境下的实际操作意义和潜在的局限性。阅读过程中,我时常会停下来,思考书中所提出的每一个论断,并尝试将其与我过往的实践经验进行对接,这种强烈的互动感,是很多教科书所不具备的,它真正做到了理论指导实践,而不是高高在上。
评分从应用性的角度来看,这本书的实用价值是毋庸置疑的,它为所有从事教育测量、心理评估以及人力资源测评的专业人士提供了一把精确丈量能力的“标尺”。书中所提供的具体操作指南,无论是关于项目编写规范,还是关于数据分析流程的详尽步骤,都体现了作者深厚的实务经验。它没有停留在纯粹的理论推演,而是提供了大量的流程图、表格和决策树,清晰地指引读者如何将复杂的理论模型转化为可执行的评估方案。我特别欣赏其中关于“试题质量控制”那一章节的细致入微,它不仅告诉我们如何发现低效试题,更阐述了背后的统计学原理和修正策略,真正实现了从“会用”到“精通”的跨越。对于我们这些需要定期进行大规模标准化考试的机构来说,这本书无疑是未来几年内部培训和标准制定的重要参考蓝本。
评分这本书的知识密度令人敬佩,但更令人惊喜的是其结构上的宏大叙事能力。它不仅仅是罗列了一堆公式和结论,而是构建了一个完整的、具有内在生命力的知识体系。从基础的测验构建理论出发,作者如同搭建一座摩天大楼,层层递进,稳步攀升,直到探讨到前沿的动态评估和人工智能辅助决策的应用。这种由浅入深的编排,使得即便是初学者也能找到自己的立足点,而资深的研究者也能在深层次的章节中找到挑战和启发。更值得称道的是,书中在关键转折点处,巧妙地穿插了历史回顾和不同学派的观点交锋,这让阅读过程充满了思想的张力,读者能够清晰地看到一个理论是如何在历史的长河中发展、完善乃至被挑战的过程。这不仅仅是一本“怎么做”的书,更是一本关于“为什么是这样”的深刻哲学探讨。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有