編輯推薦
《統計學(原書第5版)》是統計學方麵的一本經典教材,與其他同類教材相比,《統計學(原書第5版)》以清晰、簡潔的方式介紹瞭統計學的基本概念,書中很少涉及統計理論的嚴格數學證明,而是給齣瞭大量與實際應用緊密聯係的例子和練習,這些例子涉及數、理、化、天文、地理、生物等自然科學以及幾乎所有工程技術領域,有助於激發學生的學習興趣和啓發學生利用所學方法解決實際問題。此外,《統計學(原書第5版)》附錄部分還介紹瞭SAS、MINITAB、SPSS等統計軟件的使用方法。
《統計學(原書第5版)》可作為理工科各專業本科生或研究生的統計學教材,也可作為工程技術領域研究人員的參考書。
內容簡介
《統計學(原書第5版)》是一本聯係實際應用的統計教材。全書共17章,主要介紹描述性統計、概率、離散隨機變量、連續隨機變量、二元概率分布及抽樣分布、置信區間估計、假設檢驗、分類數據分析、簡單綫性迴歸、多重迴歸分析、模型構造、試驗設計的原則、試驗設計的方差分析、非參數統計、統計過程和質量控製、産品和係統的可靠性。此外,《統計學(原書第5版)》的附錄部分還介紹瞭一些統計軟件的使用方法。
《統計學(原書第5版)》內容豐富,很少涉及統計學理論的嚴格數學證明,絕大部分是與實際應用緊密聯係的例子和練習,適閤作為理工科各專業本科生、研究生的統計學教材,也可作為相關領域研究人員的參考讀物。
作者簡介
William Mendenhali擁有北卡羅來納州立大學博士學位,曾任賓夕法尼亞州Bucknell大學數學係教授,1963年至1977年擔任佛羅裏達大學統計係主任。
Terry Sincich擁有佛羅裏達大學統計學博士學位,目前為南佛羅裏達大學商業管理學院信息係統與決策科學係副教授,並獲得瞭許多研究生和本科生統計課程的教學奬,現在是美國統計協會和決策科學研究所的成員。他的研究領域是應用統計建模和分析。
內頁插圖
精彩書評
“本書在利用實際數據方麵做瞭非常好的工作……”
——Melinda McCann俄剋拉荷馬州立大學
“嚮學生極其清楚地講述瞭統計學、概率論的基本概念”
——Arnold Sweet普度大學
目錄
譯者序
前言
第1章 緒論
1.1 統計學:數據的科學
1.2 統計學的基本要素
1.3 數據類型
1.4 統計學在批判性思考中的作用
1.5 本書介紹的統計方法導引
第2章 描述性統計
2.1 描述定性數據的圖形法和數值法
2.2 描述定量數據的圖形法
2.3 描述定量數據的數值法
2.4 中心趨勢的度量
2.5 變異性的度量
2.6 相對位置的度量
2.7 檢測異常值的方法
2.8 描述性統汁歪麯事實真相
第3章 概率
3.1 概率在統計學中的作用
3.2 事件.樣本空間和概率
3.3 復閤事件
3.4 補事件
3.5 條件概率
3.6 並和交的概率法則
3.7 貝葉斯法則
3.8 計數法則
3.9 概率和統計的示例
3.10 隨機抽樣
第4章 離散隨機變量
4.1 離散隨機變量的定義
4.2 離散隨機變量的概率分布
4.3 隨機變量的期望值
4.4 一些有用的期望值定理
4.5 伯努利試驗
4.6 二項概率分布
4.7 多項概率分布
4.8 負二項概率分布和幾何概率分布
4.9 超幾何概率分布
4.10 泊鬆概率分布
4.11 矩和矩母函數
第5章 連續隨機變量
5.1 連續隨機變員
5.2 連續隨機變量的密度函數
5.3 連續隨機變量的期望值
5.4 均勻概率分布
5.5 正態概率分布
5.6 判定正態性的描述性方法
5.7 Γ型概率分布
5.8 威布爾概率分布
5.9 β型概率分布
5.10 矩和矩母函數
第6章 二元概率分布及抽樣分布
6.1 二元離散隨機變量的概率分布
6.2 二元連續隨機變量的概率分布
6.3 兩個隨機變量的函數的期望值
6.4 獨立性
6.5 兩個隨機變量的協方差和相關性
6.6 隨機變量函數的概率分布和期望值
6.7 抽樣分布
6.8 用濛特卡羅模擬逼近抽樣分布
6.9 均值與和的抽樣分布
6.10 二項分布的正態逼近
6.11 與正態分布有關的抽樣分布
第7章 用置信區間估計
7.1 點估計及其性質
7.2 求點估計:經典估計方法
7.3 求區間估計:樞軸法
7.4 總體均值的估計
7.5 兩個總體均值差的估計:獨立樣本
7.6 兩個總體均值差的估計:配對
7.7 總體比率的估計
7.8 兩個總體比率差的估計
7.9 總體方差的估計
7.10 兩個總體方差比的估計
7.11 選擇樣本容量
7.12 其他區間估計方法:自助法和貝葉斯法
第8章 假設檢驗
8.1 假設統計檢驗與置信區間的關係
8.2 統計檢驗的要素與性質
8.3 求檢驗統計量:經典方法
8.4 選擇原假設和備擇假設
8.5 檢驗總體均值
8.6 檢驗的觀測顯著性水平
8.7 檢驗兩個總體均值的差:獨立樣本
8.8 檢驗兩個總體均值的差:配對
8.9 檢驗總體比率
8.10 檢驗兩個總體比率的差
8.11 檢驗總體方差
8.12 檢驗兩個總體方差的比
8.13 其他檢驗方法:白助法和貝葉斯法
第9章 分類數據分析
9.1 分類數據和多項概率
9.2 估計單嚮錶中的類型概率
9.3 檢驗單嚮錶中的類型概率
9.4 關於雙嚮錶(列聯錶)中類型概率的推斷
9.5 固定邊緣和的列聯錶
9.6 列聯錶分析中獨立性的精確檢驗
第10章 簡單綫性迴歸
10.1 迴歸模型
10.2 模型假定
10.3 估計β0和β1:最小二乘法
10.4 最小二乘估計的性質
10.5 σ2的估計量
10.6 評價模型的效用:進行關於斜率β1的推斷
10.7 相關係數
10.8 決定係數
10.9 利用模型估計和預測
10.10 一個完整的例子
10.11 簡單綫性迴歸步驟的小結
第11章 多重迴歸分析
11.1 多重迴歸模型的一般形式
11.2 模型假定
11.3 擬閤模型:最小二乘法
11.4 用矩陣代數計算:關於單個β參數的估計和推斷
11.5 評價整體模型的恰當性
11.6 E(y)的置信區間和未來值y的預測區間
11.7 定量預測量的一階模型
11.8 定量預測量的交互作用模型
11.9 定量預測量的二階(二次)模型
11.10 檢查假定:殘差分析
11.11 某些陷阱:可估性.多重共綫性和外推
11.12 多重迴歸分析的步驟總結
第12章 模型構建
12.1 引言:為什麼模型構建是重要的
12.2 白變量的兩種類型:定量的和定性的
12.3 一元定量自變量模型
12.4 二元定量自變量模型
12.5 編碼定量自變量
12.6 一元定性自變量模型
12.7 定量和定性自變量模型
12.8 比較嵌套模型的檢驗
12.9 外部模型確認
12.10 逐步迴歸
第13章 試驗設計的原理
13.1 引言
13.2 試驗設計術語
13.3 控製試驗中的信息
13.4 減少噪聲的設計
13.5 增加容量設計
13.6 選擇樣本容量
13.7 隨機化的重要性
第14章 試驗設計的方差分析
14.1 引言
14.2 方差分析中的邏輯
14.3 單因子完全隨機化設計
14.4 隨機化區組設計
14.5 雙因子析因試驗
14.6 更復雜的析因設計
14.7 套式抽樣設計
14.8 處理均值的多重比較
14.9 檢查ANOVA假定
第15章 非參數統計
15.1 引言:分布自由檢驗
15.2 檢驗單個總體的位置
15.3 比較兩個總體:獨立隨機樣本
15.4 比較兩個總體:配對設計
15.5 比較三個或更多總體:完全隨機化設計
15.6 比較三個或更多總體:隨機化區組設計
15.7 非參數迴歸
第16章 統計過程和質量控製
16.1 全麵質量管理
16.2 計量控製圖
16.3 均值控製圖:x圖
16.4 過程變異控製圖:R圖
16.5 發現控製圖中的趨勢:遊程分析
16.6 不閤格品百分率控製圖:P圖
16.7 每個個體缺陷數控製圖:c圖
16.8 容許限
16.9 能力分析
16.10 不閤格品的抽樣驗收
16.11 其他抽樣計劃
16.12 調優操作
第17章 産品和係統的可靠性
17.1 引言
17.2 失效時間分布
17.3 危險率
17.4 壽命試驗:刪失抽樣
17.5 估計指數失效時間分布的參數
17.6 估計威布爾失效時間分布的參數
17.7 係統可靠性
附錄A矩陣代數
附錄B有用的統計錶
附錄CSAS的視窗指導
附錄DMINITAB視窗指導
附錄ESPSS視窗指導
習題簡答
精彩書摘
第2章 描述性統計
目標給齣探索、概括以及描述數據的圖形法和數值法。
2.1 描述定性數據的圖形法和數值法
假定你已經收集瞭一個感興趣的數據集,如何弄清楚它的意義?也就是說,如何去整理、總結這個數據集,使得它比較容易理解、有意義?在這一章裏,我們給齣幾種描述數據的基本統計工具,包含可以快速給齣數據直觀形象的圖錶和描述數據某種性質的數值量度。恰當的用法依賴於我們想要描述的數據類型(定量的或定性的)。
在描述定性觀測值時,我們以這樣一種方式來定義類:每個觀測值能落入一類並且隻能落入一類(或組)。然後給齣落入每一類的觀測值個數或相對於觀測值總數的比例,用這種數值方法來描述數據集閤。
定義2.1 對給定的類,類(或組)頻數是指落入這個類中的觀測值的個數。
定義2.2 對給定的類,類(或組)相對頻率是指落入這個類中的觀測值個數相對於觀測值總數的比例
為瞭說明這兩個概念。考慮一個調查核動力反應堆安全和使用能源的危險的研究人員感興趣的問題。研究人員發現自1977年以來,全世界有45起與能源有關導緻多人死亡的事故,錶2.1匯總瞭研究人員的調查結果。在這個應用中,感興趣的定性變量是與能源有關的死亡事故的原因。由錶2.1可以看到,45起事故數據分為6類(原因),匯總錶給齣瞭每類原因的頻數和相對頻率。很明顯,煤氣爆炸是最可能引起事故的原因,在45起事故中齣現瞭28次(約占62%)。
……
前言/序言
本書概要。
本書是為工程專業和自然科學專業的學生設計的。供兩個學期使用的統計學課程教材。一旦這些學生畢業,並且找到瞭工作,他們就將涉及數據的收集和分析,並且需要批判性地思考結果。這就要求他們瞭解數據描述及統計推斷的基本概念,並且熟悉丁作中需要用到的統計方法。教學法
第1-6章介紹學習統計學的目的,說明如何描述數據集,並且給齣一些概率論的基本概念。第7章和第8章介紹關於總體參數的兩種推斷方法:估計和假設檢驗。這些概念在其餘幾章中被擴展為在分析工程和科學數據時有用的主題,包括分類數據分析(第9章)。迴歸分析以及模型構造(第10-12章)。試驗設計的方差分析(第13-14章)。非參數統計(第15章)。統計質量控製(第16章)以及産品和係統的可靠性(第17章)。
我們假定讀者學習瞭兩個學期的微積分學,即讀者對微積分學原理有一個基本瞭解。要求讀者具有運用一元微分法和積分法的能力,但書中也有一些有關多元微積分的例題,作為選學內容。因此,我們在一元範圍內隻是概括地介紹理論概念,但是教師利用選學內容。例題以及練習可以很容易地將其深入到統計學理論和數學概念之中。
本書特色
本書的主要特色如下:
1.理論和應用相結閤。將數理統計的基本理論概念整閤為一門統計方法的課程,供兩個學期講授。因此,教師可以選擇將其作為以基本概念和應用統計為重點的一門課程,也可以作為偏嚮應用又介紹基本統計推斷理論方法的一門課程。
2.統計軟件應用指導。老師和學生可以選用統計軟件進行統計計算。本書介紹瞭三個流行的統計軟件包(SAS.SPSS以及MINITAB)的輸齣結果以及MicrosoftExcel的輸齣結果。附錄C附錄D以及附錄E介紹瞭菜單屏幕和對話框的使用,是為初學者設計的,這些輔導材料不需要預先使用這些軟件的經驗。
3.主題和應用的結閤範圍。為瞭滿足未來工程師和科學傢的種種需要,本書提供瞭覆蓋範圍廣泛的數據分析主題。本書對多元迴歸以及模型構造(第11章和第12章)。試驗設計的原理(第13章)。質量控製(第16章)以及可靠性(第17章)等內容的安排與通常的初等統計學教程不同。雖然這些題材通常涉及理論概念,但是講述是麵嚮應用的。
4.基於大量實際數據的練習。本書包含瞭大量的應用練習,主要是為瞭激發學生的學習興趣和啓發學生利用所學方法解決實際問題。幾乎每一個練習都是基於摘自專業期刊或者從工程和自然科學團體得到的數據或試驗結果。練習放在每章重點節的末尾以及各章的末尾。
5.“活動中的統計學”案例分析。現在本書在每章末尾新增瞭一個當代的科學研究(“活動中的統計學”)以及附帶的數據與分析。我們的目的是嚮學生展示評估發現和思考涉及的統計問題,以及應用正確的統計方法的重要性。
科技前沿的基石:現代數據分析與決策科學 導論:跨越學科的通用語言 本書旨在為所有緻力於理解和應用數據科學原理的讀者提供一個全麵且嚴謹的知識框架。在信息爆炸的時代,數據已成為驅動創新、優化流程和製定明智決策的核心資源。然而,原始數據本身是沉默的,隻有通過精確的統計方法和嚴謹的科學思維,我們纔能從中提煉齣有價值的洞察。 本書聚焦於現代工程、自然科學、商業分析乃至社會科學領域中,數據處理、模型構建和不確定性量化所必需的核心統計學概念和技術。我們相信,統計學並非僅僅是公式的堆砌,而是一種嚴謹的、批判性的思維方式,是連接理論假設與現實觀測之間的橋梁。 我們將從概率論的基礎概念齣發,逐步深入到推斷統計學的精髓,強調如何在有限樣本的基礎上對總體特性做齣可靠的陳述。本書的敘事結構旨在平衡理論的深度與實際應用的可操作性,確保讀者不僅理解“如何做”,更能理解“為什麼這樣做”。 --- 第一部分:不確定性與概率模型的基礎 本部分為後續的推斷性統計分析奠定堅實的基礎,重點在於量化和描述隨機現象。 第一章:數據描述與可視化 在任何分析開始之前,對數據的初步探索是至關重要的。本章將介紹如何有效地組織、清洗和呈現數據。我們將涵蓋描述性統計量的計算與解釋,包括集中趨勢(均值、中位數、眾數)和離散程度(方差、標準差、四分位距)的度量。特彆關注圖形化展示的技巧與陷阱,如直方圖、箱綫圖、散點圖的正確使用,以識彆潛在的模式、異常值和數據分布的形態。 第二章:隨機變量與概率分布 這是理解隨機性的核心。本章詳細闡述瞭離散型和連續型隨機變量的概念。對於離散變量,重點討論二項分布、泊鬆分布及其在計數問題中的應用。對於連續變量,我們將深入探討正態分布(高斯分布)的特性及其在自然界和工程中的普遍性,並介紹指數分布、均勻分布等其他關鍵分布。此外,還會引入期望值和方差的計算規則,為隨機變量的綫性組閤分析做準備。 第三章:聯閤分布、期望與大數定律 當多個隨機變量同時作用時,我們需要理解它們之間的相互依賴性。本章討論聯閤概率分布函數(PDF/PMF)、邊緣分布以及條件分布的概念。協方差和相關係數被引入作為衡量綫性關係強度的工具。隨後,我們將探討隨機變量函數的分布,並嚴格闡述中心極限定理(CLT)和強大數定律的意義,這些定理是所有推斷統計學方法論的理論基石,它們解釋瞭為什麼大樣本的行為可以被可靠地預測。 --- 第二部分:統計推斷的核心方法 本部分是本書的核心,旨在教授如何利用樣本信息對未知參數進行估計和檢驗。 第四章:參數估計——點估計與區間估計 本章著重於如何從觀測數據中“猜齣”總體的真實參數值。首先介紹點估計量(如樣本均值、樣本比例)的性質,包括無偏性、有效性和一緻性。隨後,我們轉嚮更具信息量的區間估計,詳細講解置信區間的構造原理,特彆是針對均值、比例和方差的置信區間,並強調置信水平的實際解釋和局限性。 第五章:假設檢驗的框架 假設檢驗是科學研究中用於對特定聲稱進行量化評估的正式程序。本章係統地構建瞭假設檢驗的邏輯框架:建立原假設($H_0$)和備擇假設($H_a$),定義檢驗統計量,並基於顯著性水平 ($alpha$) 做齣拒絕或接受的決策。重點討論第一類錯誤($alpha$錯誤)和第二類錯誤($eta$錯誤)的權衡,並引入檢驗功效(Power)的概念,指導讀者設計更具判彆力的實驗。 第六章:單樣本與雙樣本檢驗 本章將理論應用於實踐。我們將詳述針對總體均值(使用 $t$ 檢驗)、總體比例(使用 $Z$ 檢驗)和總體方差(使用 $chi^2$ 檢驗)的單樣本檢驗程序。隨後擴展到雙樣本比較,包括獨立樣本和配對樣本的 $t$ 檢驗,以及比較兩個總體比例的差異。在所有案例中,都強調瞭檢驗的前提條件(如正態性、方差齊性)的檢驗和處理方法。 --- 第三部分:統計模型的構建與應用 現代數據分析依賴於建立數學模型來描述變量間的關係,並進行預測和控製。 第七章:方差分析(ANOVA) 當需要比較三個或更多個獨立組的均值時,方差分析提供瞭一個統一且高效的框架。本章詳細介紹瞭一因子方差分析(One-Way ANOVA)的原理,即如何將總變異分解為組間變異和組內變異。隨後,擴展到多因子方差分析(Two-Way ANOVA),引入交互作用項的概念,以探究不同因素組閤對響應變量的聯閤影響。本章還包含必要的後驗檢驗(Post-hoc Tests)方法,如Tukey's HSD,以定位具體是哪些組之間存在顯著差異。 第八章:簡單綫性迴歸分析 綫性迴歸是描述兩個變量間綫性關係的基石。本章從散點圖開始,介紹最小二乘法(OLS)的原理,用以擬閤最佳擬閤綫。我們將深入探討迴歸模型的統計特性,包括最小二乘估計量的性質,決定係數 ($R^2$) 的解釋,以及模型殘差的分析,確保模型的假設(如殘差的正態性、同方差性)得到滿足。最後,介紹對斜率和截距進行假設檢驗和區間估計的方法。 第九章:多元綫性迴歸 現實世界中的現象往往受多個因素影響。本章將簡單迴歸擴展到多元模型,探討如何控製混雜變量的影響。重點分析迴歸係數的解釋,多重共綫性(Multicollinearity)的診斷與處理,以及模型選擇標準(如調整 $R^2$、AIC/BIC)。此外,本章還將討論分類變量(虛擬變量/指示變量)在迴歸模型中的納入方法,以處理定性因素對結果的影響。 --- 第四部分:非參數方法與高級主題 為瞭應對不滿足經典參數檢驗前提的數據集,或處理特定類型的計數數據,我們需要更靈活的工具。 第十章:非參數統計方法 當數據不滿足正態性或總體方差相等的要求時,非參數檢驗提供瞭一個有力的替代方案。本章介紹基於秩(Rank)的檢驗方法,包括針對單樣本的符號檢驗、適用於兩個獨立樣本的Mann-Whitney U 檢驗(非參數 $t$ 檢驗的替代)、以及適用於配對樣本的Wilcoxon符號秩檢驗。這些方法側重於中位數而非均值的比較,具有更強的魯棒性。 第十一章:卡方檢驗與擬閤優度 本章專注於分析分類數據。我們將詳細介紹卡方(Chi-Square)檢驗在兩個主要場景中的應用:擬閤優度檢驗(檢驗樣本數據是否符閤預期的理論分布)和獨立性檢驗(檢驗兩個分類變量之間是否存在關聯性,如在列聯錶中)。本章還將討論費捨爾精確檢驗,作為小樣本情況下替代卡方檢驗的工具。 第十二章:生存分析簡介與質量管理中的統計控製 為拓展讀者的視野,本章引入瞭兩個重要的應用領域。首先是生存分析的基本概念,如風險函數、Kaplan-Meier 估計和對事件發生時間數據的處理,這對可靠性工程和醫學研究至關重要。其次,我們將簡要介紹統計過程控製(SPC)圖錶,如 $ar{X}$ 和 $R$ 圖,展示如何使用統計工具來持續監控和維護製造過程的穩定性。 --- 結語 本書的最終目標是培養讀者對數據的敏銳度,使其能夠批判性地評估統計結果,並自信地設計和解釋科學或工程實驗。通過掌握這些工具,讀者將能夠把數據轉化為可執行的知識,成為驅動技術進步和問題解決的閤格決策者。