正版計算機化自適應測驗理論與方法塗鼕波北京師範大學齣版社9787303221776

正版計算機化自適應測驗理論與方法塗鼕波北京師範大學齣版社9787303221776 pdf epub mobi txt 電子書 下載 2025

塗鼕波 著
圖書標籤:
  • 計算機化測驗
  • 自適應測驗
  • 教育測量
  • 心理測量
  • 塗鼕波
  • 北京師範大學齣版社
  • 9787303221776
  • IRT
  • 教育技術
  • 測量理論
想要找書就要到 靜流書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
店鋪: 佳期如夢圖書專營店
齣版社: 北京師範大學齣版社
ISBN:9787303221776
商品編碼:29688184515
頁數:332

具體描述





圖書基本信息
書名:計算機化自適應測驗:理論與方法  
叢書名:  
作者/主編:塗鼕波  
齣版社:北京師範大學齣版社    
ISBN號:9787303221776  
齣版年份:2017年8月     
 
版次:  第1 版
總頁數:  332頁
開本:  16
圖書定價:  48元
實際重量:  522g
新舊程度:  正版全新













塗鼕波,博士,江西師範大學心理學院教授,博士生導師,博士後閤作導師,入選江西省“新世紀百韆萬人纔工程”,美國伊利諾伊大學香檳分校訪問學者。研究領域為心理統計與測量,主攻認知診斷和項目反應理論。近年來主持承擔與認知診斷相關的國傢自然科學基金兩項,教育部課題兩項,江西省社會科學重點項目等省級課題八項;在認知診斷和項目反應理論領域發錶學術論文50餘篇;榮獲江西省社會科學成果奬二等奬一項、三等奬三項;齣版學術著作三部,其中《認知診斷理論、方法與應用》為國內第1部認知診斷學術專著,開發國內第1個認知診斷分析平颱www.psychometrics-studio.cn。






第*章 計算機化自適應測驗

第*節 自適應測驗
一、自適應原則在心理測驗中的應用
二、自適應測驗的主要特徵
第二節 計算機化測驗
一、劃分標準
二、四代計算機化施測
第三節 計算機化自適應測驗
一、概念
二、CAT的優勢
三、CAT研究現狀與未來研究方嚮

第二章 計算機化自適應測驗理論基礎、原理與開發流程
第*節 計算機化自適應測驗理論基礎:項目反應理論
一、項目反應理論
二、項目反應模型
三、項目反應理論假設
第二節 計算機化自適應測驗原理
一、CAT的産生
二、CAT的原理
第三節 計算機化自適應測驗開發流程
一、準備階段
二、題庫建設
三、CAT算法確定
四、信度與效度驗證
五、正式使用與題庫維護更新
第四節 CAT的構成及其測試流程
一、CAT的組成部分
二、CAT的測試流程

第三章 計算機化自適應測驗流程中的相關算法與技術
第*節 CAT選題策略算法
一、Fisher信息量選題方法
二、KL信息量選題方法
三、大優先級指標選題方法
第二節 CAT參數估計方法
一、極大似然估計方法
二、貝葉斯估計方法
三、加權似然估計方法
第三節 CAT曝光率控製技術
一、條件概率方法
二、a分層方法
三、動態a分層方法
第四節 CAT終止策略
一、型終止策略
二、相對型終止策略

第四章 計算機化多階段自適應測驗
第*節 計算機化多階段自適應測驗簡介
一、什麼是MST
二、MST與題目級彆CAT的比較
第二節 計算機化多階段自適應測驗設計
一、階段數的確定
二、每個階段中模塊數的確定
三、每個模塊的項目長度
四、統計目標與定性規範約束
五、計分方法(能力估計)
六、自適應策略與過程
七、組捲
第三節 計算機化多階段自適應測驗的技術與算法
一、路由規則
二、自動化組捲

第五章 多維計算機化自適應測驗
第*節 McAT簡介
一、多維項目反應理論的發展
二、MIRT與FA的關係
三、MCAT的産生
第二節 McAT中常用IRT模型
一、二級評分的多維項目反應模型
二、多級評分的多維項目反應模型
第三節 MCAq7、能力估計方法
一、極大似然估計
二、貝葉斯極大後驗估計
三、貝葉斯期望後驗估計
第四節 McAT選題策略
一、基於Fisher信息矩陣的選題策略
二、基於Kullback-Leibler信息量的選題策略
三、基於互信息的選題策略
四、基於連續香農熵的選題策略
第五節 McAT、終止規則
一、定長MCAT中測驗長度的確定方法
二、不定長MCAT、終止規則

第六章 認知診斷計算機化自適應測驗
第*節 CD-CAT簡介
一、認知診斷測驗
二、CD-CAT
第二節 cD-CAT、中常用認知診斷模型
一、具有認知診斷功能的IRT模型
二、規則空間模型
三、統一模型
四、融閤模型
五、RRUM模型
六、DINA模型
七、高階DINA模型
第三節 認知診斷計算機化自適應測驗中的核心技術與算法
一、CD-CAT的選題方法
二、CD-CAT的參數估計
三、CD-CAT的終止規則
四、CD-CAT的在綫標定
五、CD-CAT的總結與展望

第七章 可修改答案的計算機化自適應測驗
第*節 可修改答案的計算機化自適應測驗簡介
一、RCAT優勢分析
二、RCAT目前存在的問題
第二節 可修改答案的計算機化自適應測驗設計與方法
一、基於測試設計視角的RCAT
二、基於選題策略視角的RCAT
三、基於模型視角的RCAT
四、總結與展望

第八章 雙因子計算機化自適應測驗
第*節 雙因子IR7、模型簡介
一、基於探索性因素分析模型的研究現狀
二、基於驗證性因素分析模型的研究現狀
第二節 BCA7、基本過程
一、基於單維視角的BCAT過程
二、基於多維視角的BCAT過程
第三節 BCAT選題算法
一、基於單維的選題策略
二、基於多維的大Fisher信息量矩陣選題
第四節 BCAT在心理學應用中的優勢
一、擬閤性
二、既能反映特殊維度情況也能反映整體情況
三、減少被試的作答負擔的同時保證測量的準確程度

第九章 CAT中新題參數在綫標定
第*節 概述
一、在綫標定的概念
二、在綫標定的基本流程
三、在綫標定與優設計
四、在綫標定的主要設計因素
第二節 單維二級評分模型下的在綫標定
一、試測題選題法
二、在綫標定情境下的參數估計方法
三、試測題嵌入位置
四、試測終止規則
第三節 其他模型下的在綫標定
一、認知診斷考試的在綫標定
二、多維IRT的在綫標定
三、單維多項評分模型的在綫標定

第十章 CAT技術在實踐中的應用
第*節 Multistage-CAT在GRE中的應用
一、為什麼選用MST
二、GRE測驗的MST設計
三、GRE測驗規範
四、GRE測驗MST設計的評估
第二節 CD-CAT在英語聽力理解中的應用
一、題庫建設
二、選題策略
三、參數估計
四、真實題庫下模擬實驗
五、真實測試效度驗證
第三節 CAT在心理健康評估中的應用
一、研究目的
二、研究方法與過程
三、研究結果
四、討論
五、展望

參考文獻





計算機化自適應測驗(Computerized Adaptive Testing,CAT)是一種全新的測驗形式,采取因人施測、量體裁衣的自適應測量思想,為每名被試選擇一份具有*小測量誤差且*適閤其自身的測驗,從而達到更高的測量精度並減輕測試負擔。

  《心理測量學叢書·計算機化自適應測驗:理論與方法》是作者多年研究及實踐的總結,對計算機化自適應測驗的理論、方法、技術以及應用等方麵進行瞭全麵、詳細的闡述,為心理測量學及相關領域的研究者和學習者提供藉鑒和參考。





《教育評價的革新之路:從標準化到個性化》 概述 本書旨在深入探討教育評價領域的前沿理論與實踐,勾勒齣教育評價從傳統標準化模式嚮更具科學性、高效性、個體化適應性方嚮發展的曆史軌跡與未來圖景。我們將聚焦於那些能夠更精準地測量學習者知識、技能和能力,同時又能為教學過程提供個性化反饋與指導的現代評價方法。本書將帶領讀者穿越評價理論的演進,剖析不同評價模式的優勢與局限,最終落腳於那些能夠實現“因材施教”的評價技術,從而為教育者、研究者以及政策製定者提供堅實的理論基礎和可操作的實踐指導。 第一章:教育評價的時代使命與理論基石 教育評價作為教育係統的重要組成部分,其根本目標在於衡量教育活動的有效性,瞭解學習者的成長與發展,並為教育決策提供科學依據。然而,隨著社會對人纔培養需求的日益多元化和精細化,傳統的評價方式——例如大規模、單一維度的紙筆測驗——已顯露齣其不足。這些測驗往往難以捕捉學習者深層次的理解、創新能力以及在復雜情境中的應用能力。 本章將首先梳理教育評價的曆史演變,從早期基於經驗的評估,到科學化、標準化測驗的興起,再到當前對更加注重個體差異和過程性評價的呼喚。我們將深入解析教育評價理論的核心概念,包括信度(Reliability)、效度(Validity)、客觀性(Objectivity)、公平性(Fairness)等基本原則,並探討這些原則在不同評價情境下的具體體現。在此基礎上,我們將引入“評價目標”(Assessment Purpose)與“評價內容”(Assessment Content)的辯證關係,強調評價設計必須緊密圍繞教育目標和知識體係構建。 同時,我們還將審視教育學、心理學等相關學科對教育評價理論發展的貢獻。例如,認知心理學關於知識錶徵和學習過程的研究,為我們理解學習者的思維模式提供瞭視角;建構主義學習理論則強調學習者在構建知識過程中的主動性,這無疑對評價方式提齣瞭新的挑戰和要求。本章將為理解後續章節中更復雜的評價理論和方法奠定堅實的理論基礎。 第二章:標準化測驗的遺産與局限 標準化測驗在教育評價史上扮演瞭至關重要的角色。它們通過統一的施測程序、評分標準和題目編製,力求在不同個體、不同群體之間建立可比性,從而為大規模選拔、學業水平監測等提供瞭便利。本章將迴顧標準化測驗的發展曆程,介紹其在教育診斷、人纔選拔、課程評估等方麵的貢獻。我們將深入剖析標準化測驗的設計原則,包括題目類型(如選擇題、填空題、簡答題)、難度控製、區分度分析等關鍵技術。 然而,標準化測驗的優勢也伴隨著不可忽視的局限性。其“標準化”的特性,在一定程度上犧牲瞭對個體差異的關注。大規模的標準化測驗往往難以反映學習者在特定知識點上的掌握程度、學習過程中的認知策略,以及在真實情境中解決問題的能力。例如,一項標準化數學測驗可能能夠準確測量學習者是否掌握瞭某個公式,但卻難以評估他們是否能靈活運用該公式解決一個實際問題。 此外,標準化測驗的“一次性”測量特性,也使得它難以捕捉學習過程中的動態變化。學生的能力並非靜止不變,而是在不斷學習和發展中。傳統的標準化測驗往往隻能提供一個靜態的測量結果,對於指導後續的教學和學習具有一定的滯後性。本章將通過具體案例分析,闡釋標準化測驗在實際應用中可能遇到的挑戰,以及對個體學習發展可能帶來的潛在負麵影響,為引入更具適應性和動態性的評價方法做好鋪墊。 第三章:教育測量的新維度:導嚮個體化與過程性的評價 麵對標準化測驗的局限,教育評價領域一直在探索新的測量維度,以更全麵、更精準地理解學習者。本章將重點介紹那些能夠超越標準化測驗束縛,更加關注個體差異和學習過程的評價方法。 首先,我們將探討“形成性評價”(Formative Assessment)的核心理念。形成性評價與終結性評價(Summative Assessment)不同,它並非旨在對學習結果進行最後的評判,而是貫穿於整個學習過程之中,為教學改進和學習者發展提供即時、有針對性的反饋。我們將介紹各種形成性評價的策略,如提問、觀察、課堂討論、學生自評互評、學習日誌等,並強調如何將這些評價活動與教學目標有機結閤,使其真正發揮“促進學習”的作用。 其次,我們將深入研究“錶現性評價”(Performance Assessment)。與傳統的紙筆測驗相比,錶現性評價要求學習者在真實或模擬的情境中展示其知識和技能的應用能力。這包括項目式學習(Project-Based Learning)中的項目成果展示、案例分析、實驗操作、口頭報告、作品集(Portfolio)等。錶現性評價能夠更有效地測量學習者的高階思維能力、解決問題的能力以及閤作能力,是評價復雜技能的有力工具。 再者,本章還將觸及“診斷性評價”(Diagnostic Assessment)。診斷性評價的目標在於識彆學習者在特定知識或技能上存在的睏難和誤區,從而為教師提供個性化的教學乾預方案。我們將探討如何通過設計具有針對性的診斷測驗,以及對測驗結果進行細緻的分析,來 pinpoint 學習者的“知識薄弱點”,並為製定個性化的學習計劃提供依據。 第四章:現代教育評價技術的融閤與發展 進入21世紀,信息技術以前所未有的速度滲透到教育的各個角落,也為教育評價帶來瞭革命性的變革。本章將聚焦於那些融閤瞭先進測量理論與現代信息技術的評價技術,它們不僅提升瞭評價的效率和準確性,更開闢瞭全新的評價模式。 我們將重點介紹“計算機化測驗”(Computerized Testing)的發展。計算機化測驗利用計算機技術進行測驗的編製、施測、評分和數據分析,相較於傳統的紙筆測驗,它在效率、靈活性和題目管理方麵具有顯著優勢。更重要的是,計算機化測驗是許多現代評價方法得以實現的技術載體。 在此基礎上,本章將深入探討“自適應測驗”(Adaptive Testing)的理論基礎與實現機製。自適應測驗是一種新型的計算機化測驗技術,它能夠根據受測者的實時錶現,動態地調整後續題目的難度。這意味著,如果受測者答對瞭一道題目,係統會給齣一道更難的題目;如果答錯,係統則會給齣更簡單的題目。這種“量體裁衣”的題目推薦方式,不僅能夠更精確地測量受測者的能力水平,還能顯著縮短測驗時間,提升受測者的答題體驗。 我們將詳細解析自適應測驗的數學模型,例如“項目反應理論”(Item Response Theory, IRT)在自適應測驗設計中的核心作用。IR T提供瞭一套強大的統計模型,用於描述題目本身的特性(如難度、區分度、猜測度)以及受測者在某個維度上的能力水平。通過IR T模型,計算機可以實時估計受測者的能力,並據此選擇最適閤當前能力水平的題目,從而實現高效、精準的測量。 本章還將展望未來教育評價技術的發展方嚮,包括與大數據分析、人工智能、學習分析(Learning Analytics)等技術的結閤,這些技術將進一步推動教育評價嚮更加智能化、個性化、預測性強的方嚮發展。 第五章:自適應測驗的設計、實施與質量保障 成功設計和實施一項自適應測驗,需要深入理解其背後的理論、精心的規劃以及嚴格的質量控製。本章將為讀者提供一套係統性的指導,涵蓋自適應測驗從概念到實際應用的各個環節。 首先,我們將詳細闡述自適應測驗的題目庫建設。一個高質量的題目庫是自適應測驗的基石。我們需要學習如何根據測量目標,科學地編製和篩選題目,並運用IR T模型對題目進行標定(Calibration),獲取題目的IR T參數。題目庫的規模、題目的質量、題目的參數標定準確性,直接影響到自適應測驗的測量精度和效率。 其次,我們將深入探討自適應測驗的算法設計。包括能力估計算法(如最大似然估計、貝葉斯估計)、題目選擇策略(如最大信息量原則、多重選擇策略)等。不同的算法和策略會影響到測驗的收斂速度、測量精度以及公平性。 再者,本章還將聚焦於自適應測驗的施測流程與技術支持。從用戶界麵的設計、操作流程的優化,到數據安全與隱私保護,都需要周密的考慮。同時,我們將討論如何處理測驗過程中的異常情況,例如網絡中斷、設備故障等。 最後,質量保障是自適應測驗成功的關鍵。我們將探討如何進行測驗的驗證與評估,包括對測量精度、效率、公平性等指標的定期監測與分析。通過持續的質量評估,我們可以不斷優化題目庫,改進算法,從而確保自適應測驗的長期有效性。本章的內容將為教育工作者和技術開發者提供實踐性的指導,幫助他們成功構建和運用自適應測驗。 第六章:自適應測驗在教育實踐中的應用與前景 自適應測驗並非僅僅是理論上的概念,它已經在教育實踐的多個領域展現齣強大的應用潛力。本章將通過豐富的案例研究,展示自適應測驗在不同教育情境下的實際應用,並展望其未來的發展前景。 我們將探討自適應測驗在基礎教育、高等教育、職業培訓以及標準化考試等領域的應用。例如,在個性化輔導係統中,自適應測驗可以根據學生的學習進度和掌握情況,動態推薦練習題目和學習資源,實現真正的“因材施教”。在大學英語四六級、GRE、GMAT等大型標準化考試中,自適應測驗的應用能夠提高考試效率,並提供更精準的能力測量。 此外,我們還將討論自適應測驗如何與在綫學習平颱、學習管理係統(LMS)深度融閤,為學習者提供全程的、個性化的學習支持。通過與學習分析技術的結閤,自適應測驗的數據還可以為教師和學校管理者提供關於學生學習狀況的深入洞察,從而支持更有效的教學決策和課程改進。 展望未來,隨著人工智能技術的不斷發展,自適應測驗將變得更加智能和人性化。例如,未來的自適應測驗可能能夠識彆學生的學習情緒、認知負荷,並據此調整測驗的難度和節奏。同時,自適應測驗的應用範圍也將進一步拓展,不僅限於知識和技能的測量,還可以用於評估學生的創造力、批判性思維等更深層次的能力。本章將激勵讀者思考自適應測驗在塑造未來教育模式中的無限可能。

用戶評價

評分

初讀這本書的感受,仿佛是走進瞭一座精心規劃的知識迷宮,但這次迷宮的導覽員異常清晰且富有耐心。作者的敘事風格極其嚴謹,如同精密的手術刀,解剖著每一個復雜的概念,不放過任何一個細微的邏輯關節。它不像某些學術著作那樣,將深奧的理論堆砌在一起,讓人望而生畏;相反,它更像是一位循循善誘的良師,總能在關鍵時刻給齣恰到好處的類比和實例,將抽象的數學模型和統計學原理“翻譯”成可以被理解的語言。特彆是對於測驗設計中的信度與效度這些核心議題的處理,作者沒有停留在錶麵的定義,而是深入挖掘瞭它們在不同測驗情境下的實際操作意義和潛在的局限性。閱讀過程中,我時常會停下來,思考書中所提齣的每一個論斷,並嘗試將其與我過往的實踐經驗進行對接,這種強烈的互動感,是很多教科書所不具備的,它真正做到瞭理論指導實踐,而不是高高在上。

評分

這本書最讓我感到震撼的,是它所蘊含的批判性思維的火種。很多專業書籍會傾嚮於宣傳一種“最佳”的範式,但這本書卻展現瞭驚人的客觀與包容性。在介紹主流理論的同時,作者總能不失時機地指齣其內在的假設前提和潛在的倫理風險。比如,在討論測驗的公平性問題時,它沒有迴避不同文化背景下測試效度的差異,而是深入剖析瞭偏見來源,並探討瞭消除偏見的技術途徑。這種深刻的自我反思能力,使得整本書的論述顯得既紮實又充滿人文關懷。它教會我的不僅是測量的技巧,更是一種對“測量”行為本身的敬畏之心——即我們所使用的工具,都可能帶有我們自身思維的烙印,因此必須保持警醒和不斷的迭代。閱讀完畢,我感覺自己不僅僅是掌握瞭一套知識體係,更是獲得瞭一種審視和改進現有評估體係的全新視角和勇氣。

評分

從應用性的角度來看,這本書的實用價值是毋庸置疑的,它為所有從事教育測量、心理評估以及人力資源測評的專業人士提供瞭一把精確丈量能力的“標尺”。書中所提供的具體操作指南,無論是關於項目編寫規範,還是關於數據分析流程的詳盡步驟,都體現瞭作者深厚的實務經驗。它沒有停留在純粹的理論推演,而是提供瞭大量的流程圖、錶格和決策樹,清晰地指引讀者如何將復雜的理論模型轉化為可執行的評估方案。我特彆欣賞其中關於“試題質量控製”那一章節的細緻入微,它不僅告訴我們如何發現低效試題,更闡述瞭背後的統計學原理和修正策略,真正實現瞭從“會用”到“精通”的跨越。對於我們這些需要定期進行大規模標準化考試的機構來說,這本書無疑是未來幾年內部培訓和標準製定的重要參考藍本。

評分

這本書的裝幀設計簡直是一場視覺的盛宴,硬殼的質感溫潤而厚重,拿在手裏就有一種沉甸甸的可靠感。封麵采用瞭一種沉穩的深藍色調,配上燙金的書名,在光綫下閃爍著低調而典雅的光芒,仿佛在無聲地宣告其內容的權威性。內頁的紙張選擇也十分考究,米白色的紙張既保護瞭視力,又讓油墨的呈現顯得格外清晰銳利,排版布局疏密有緻,字號大小適中,即便是長時間閱讀也不會感到眼睛疲勞。尤其是章節標題和重要公式的突齣處理,邏輯層次分明,使得原本可能有些枯燥的理論知識在視覺上得到瞭極大的梳理和簡化。不得不提的是,書脊部分的工藝處理,平整服帖,即便是新書也能輕鬆攤平閱讀,這對於需要頻繁翻閱和對照的專業書籍來說,簡直是人性化設計的典範。整體而言,這本書在物理形態上已經達到瞭藝術品的標準,它不僅僅是一本工具書,更像是一件值得收藏的案頭精品,每一次的翻閱都成為一種享受,而不是負擔。

評分

這本書的知識密度令人敬佩,但更令人驚喜的是其結構上的宏大敘事能力。它不僅僅是羅列瞭一堆公式和結論,而是構建瞭一個完整的、具有內在生命力的知識體係。從基礎的測驗構建理論齣發,作者如同搭建一座摩天大樓,層層遞進,穩步攀升,直到探討到前沿的動態評估和人工智能輔助決策的應用。這種由淺入深的編排,使得即便是初學者也能找到自己的立足點,而資深的研究者也能在深層次的章節中找到挑戰和啓發。更值得稱道的是,書中在關鍵轉摺點處,巧妙地穿插瞭曆史迴顧和不同學派的觀點交鋒,這讓閱讀過程充滿瞭思想的張力,讀者能夠清晰地看到一個理論是如何在曆史的長河中發展、完善乃至被挑戰的過程。這不僅僅是一本“怎麼做”的書,更是一本關於“為什麼是這樣”的深刻哲學探討。

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 靜流書站 版權所有