對數綫性模型於20世紀60年代末期至70年代早期得以發展並流行。包括對數綫性模型在內的分類數據分析的課程目前是社會科學專業研究生教育的一項重要內容。全書結閤大量示例,清晰展示瞭如何運用圖論理解復雜對數綫性模型錶明的關聯結構。本書描述的圖論有助於構想和解釋多嚮列錶中的復雜對數綫性模型。對於想要深入理解對數綫性模型結構的學生和在研究中應用這些模型的研究者,這一專著都是有價值的。
本書展示瞭如何運用數學資源中的圖論來理解復雜對數綫性模型錶明的關聯結構。作者首先迴顧瞭二嚮與多嚮列聯錶的關係模式,以及這些錶的對數綫性模型。在介紹瞭圖論中的一些關鍵概念後,作者緊接著將這些思想應用到對數綫性模型的兩個圖形典型中:關聯圖和生成多重圖。利用豐富示例以及清晰解釋,作者展示瞭對數綫性模型的兩個圖形典型如何說明模型的結構,揭示瞭他們的一些特徵,如條件性獨立、可分解性、可壓縮性等。
哈裏·J.哈米斯(Harry J. Khamis),俄亥俄州代頓市萊特州立大學數學與統計學院及布恩邵夫特醫學院聯閤任命的教授。從1993年開始他擔任萊特州立大學統計谘詢中心主任。自1980年以來,他一直任教於萊特州立大學,期間也曾在瑞典的烏普薩拉大學,於默奧大學及達拉那大學訪問並擔任教學、研究和谘詢的相關職務。他的專業領域是統計方法,尤其是在分類響應模型,擬閤檢驗以及Cox迴歸模型方麵。
關於作者
叢書編輯介紹
第1章 介紹
第2章 關聯結構
第1節 離散變量的統計獨立
第2節 比值比:二嚮錶
第3節 比值比:三維列錶
第4節 模型擬閤:三維錶
第5節 多嚮錶
第3章 對數綫性模型迴顧
第1節 二嚮列聯錶
第2節 三維列聯錶
第3節 三維錶LLM之間的關係
第4節 LLM和列聯錶屬性
第5節 多嚮錶
第4章 對數綫性模型的關聯圖
第1節 基本圖論法則
第2節 三嚮錶的關聯圖
第3節 多維錶的關聯圖
第4節 可分解的LLM
第5節 總結
第5章 可壓縮性條件和關聯圖
第1節 三維列聯錶的可壓縮性
第2節 壓縮性定理和關聯圖
第3節 結論
第6章 生成多重圖
第1節 構建多重圖
第2節 三維錶格的多重圖
第3節 多維錶的多重圖
第4節 最大生成樹
第5節 可分解性
第6節 分解可分解LLM的聯閤概率
第7節 可分解LLMs的基本條件獨立
第7章 不可分解對數綫性模型的基本條件獨立
第1節 邊割集
第2節 不可分解LLM的FCI
第3節 使用多重圖 的壓縮條件
第4節 FCI:總結
第8章 結論及附加實例
第1節 關聯圖和多重圖的比較
第2節 附加實例
第3節 最後要點
數據集
參考文獻
譯名對照錶
一般來講,用LLM分析一組分類變量之間的關係要分兩步:
1. 確定對數據擬閤“最好”的模型
2. 分析並解析最佳擬閤模型的結果
這兩步中的第一步,確定無疑不是一件容易的工作,但是,有大量的文獻用於引導模型擬閤的程序和方法,包括傳統的LLM-擬閤過程以及更專業的程序,如條件檢驗、靴攀法、貝葉斯法,等等。對於給定的列聯錶尋找最佳擬閤的LLM可以使用統計方法和軟件,如分段法(Goodman,1971a) 以及兩段法(Benedetti & Brown,1978;Brown,1976) 。也可參看Agresti(2002,第9章),Wickens(1989,第5章)和Lawal(2003,第7章)。這本書沒有涵蓋尋找最佳擬閤的LLM的過程。但是,讀者可以參看前麵引用的相關文獻。這本書中的每個例子,對於給定數據都會提供最佳擬閤的LLM(或者至少有一個擬閤不錯的LLM),偶爾會有一些討論。
這本書關心的是兩步中的後一步。在獲得最佳擬閤的LLM之後,關鍵是要準確詳實地進行分析和解釋。在這本書裏,“分析”一個給定的LLM是指確立所有變量之間的關係並且把這些關係轉化為對數據的結論;“解釋”一個給定的LLM是指確定變量之間的所有關係並將這些關係轉化為關於數據的結論。
用數學圖論的工具使得在這方麵的總體統計分析可靠、係統、全麵、簡潔。第一個圖形程序,也就是關聯圖,已經囊括於很多標準的分類數據教科書之中(比如,Agresti,2002;Andersen,1997;Wickens,1989)。第二個圖形程序,也就是多重圖,相對較新,在教科書中還沒有介紹。
我們假定讀者已經熟悉瞭LLM的應用,熟知來自於標準抽樣設計産生的多嚮列聯錶中的數據( 參看第3章第4節“抽樣設計”部分),以及選擇最佳擬閤LLM的過程。這本書專注於對最佳擬閤LLM結果的分析和解析,用來自心理學、政治學和社會學的大量實例進行解釋說明。這本書中展現瞭許多現實生活中的例子,數據來源是萊特州立大學統計谘詢中心的研究項目(已取得客戶同意)。
這本書作為“入門”指南,著重點是對最佳擬閤LLM的關聯圖和多重圖的實際應用,從而全麵並可靠地分析和解釋它。建議讀者閱讀方法背後的理論文獻,包括定理、證明、推導以及計算方法。掌握瞭這本書的內容,讀者將能夠解釋一個非常復雜的LLM,通過
1. 確定模型的重要屬性,從而加深對模型的理解;
2. 以清晰易懂的方式解釋因子之間的關係;
3. 確立方法來簡化列聯錶(如,使用壓縮條件)。
最後,這些目標可以很容易地通過關聯圖和/或多重圖來實現。在尋找最佳擬閤模型時需要計算機軟件和可能很復雜的模型選擇策略和技術,但是一旦找到瞭最佳擬閤模型,就可以用圖形來分析和解釋,而不需要任何的軟件、復雜的推導或者繁重的計算。
對於大多數包含四個變量的LLM(或者有可能是五個變量,取決於模型的復雜程度),變量間的關係可以簡單地通過仔細查看LLM本身或者生成類來確定(參看第3章)。
但是,對於更復雜的LLM,整理包含在模型中的所有信息會非常有挑戰性,對資深的LLM分析人員也不例外。這本書中的程序對那些基於龐大多元列聯錶的復雜LLM尤其有幫助。
先看一個啓發性的例子,考慮10個分類變量編碼為0,1,2,……,9。目的是瞭解這十個變量之間的關係。假設10維列聯錶的最佳擬閤LLM的生成的類(也叫最小充分構形)是[67][013][125][178][1347][1457][1479]。哪些因子間是相互獨立的?哪些因子間是條件性獨立的?你可以保證你確認瞭所有獨立性和條件獨立性嗎?哪些因子可以被分解而不改變其他因子之間的關係?你可以保證在分解之後所有的關係都保持不變嗎?這個模型的重要屬性是什麼?即使對於LLM專傢來講,僅僅依靠生成類也是很難詳細可靠地迴答這些問題的。這本書中展現的程序可以讓研究者不藉助統計軟件或繁重的計算,以一種清晰、全麵、係統、循序漸進的方式詳盡可靠地迴答這些問題。因此,研究者可以清楚地瞭解因子之間的關聯,更重要的是,知道如何準確詳實地解釋數據。這一10個變量的模型將會在接下來的章節中作為示例加以分析。
……
對數綫性模型(LLM)在利奧?古德曼(Leo Goodman) 等人的努力下,於20世紀60年代末期至70年代初得以發展並流行,而畢曉普(Bishop )、費恩伯格(Fienberg )和霍蘭(Holland)於1975年寫的《離散多元分析 》一書堪稱該模型發展和推廣中的一個裏程碑,它對多嚮列聯錶(multi-way contingency tables)的分析産生瞭革命性的作用。包括LLM在內的分類數據分析的課程目前是社會科學專業研究生教育的一個重要內容。哈裏?哈米斯的專著《對數綫性模型的關聯圖和多重圖》展示瞭如何動用數學資源中的圖論來理解復雜LLM錶明的關聯結構。
哈米斯迴顧瞭二嚮與多嚮列聯錶的關係模式,以及這些錶的LLM。在介紹瞭圖論中的一些關鍵概念之後,他緊接著將這些思想應用到LLM的兩個圖形典型中:關聯圖和生成多重圖。在更為直觀並且廣為人知的關聯錶中,頂點(點)代錶列聯錶中的變量,邊(綫)對應於模型中的關聯項。相反,在多重圖中,頂點代錶一個分級LLM中的高階關聯項(生成因子),邊對應由成對生成因子共享的變量。
利用經過精挑細選的豐富示例以及清晰的解釋,哈米斯展示瞭LLM的這兩個圖形典型如何說明模型的結構,揭示瞭它們的一些特徵,如條件獨立性(比如說,變量A 和變量B在變量C的分類中是獨立的), 可分解性(比如說,模型中的A, B和C聯閤單元格的概率是AB邊際概率和C邊際概率的乘積),以及可壓縮性(比如說,A和B的邊際關聯與A 和B在C的分類中的關聯是一緻的)。總的來講,這一專著中描述的圖論有助於構想和解釋多嚮列錶中的復雜LLMs。對於想要深入理解LLMs結構的學生和在研究中應用這些模型的研究者,這一專著都是有價值的。
編輯注釋:這一專著是在前一任叢書編輯廖福挺的指導下開始著手的。
——約翰·福剋斯
叢書編輯
這部著作的標題本身就充滿瞭吸引力,勾起瞭我對圖形理論和統計模型交叉領域的濃厚興趣。我最初翻開這本書,期待能看到對復雜係統結構化錶示的深刻洞察,特彆是如何利用圖論的強大工具來解析那些本質上具有多重依賴關係的現象。然而,書中的內容似乎並未完全聚焦於我所期望的“關聯圖”和“多重圖”的精細結構分析。相反,它更側重於介紹一種宏觀的、基於概率分布的建模框架,這種框架雖然嚴謹,但在具體應用到實際的復雜網絡結構識彆時,顯得有些抽象和工具化。例如,作者在引入如何對多層網絡進行特徵提取時,花費瞭大量的篇幅去推導一個高維概率張量上的近似解法,這對於那些希望快速掌握如何用圖形結構來解釋觀測數據的讀者來說,可能略顯繁冗。我本想看到的是更多關於圖嵌入技術如何與指數族分布模型相結閤的具體案例,比如如何用鄰接矩陣的譜信息來約束對數綫性模型的參數空間,從而更有效地處理稀疏連接問題。總的來說,這本書的數學基礎紮實,但在如何將這些理論工具直接映射到可解釋的“關聯”和“多重”圖結構的可視化與分析上,似乎留下瞭相當大的操作空間供讀者自行探索。
評分閱讀這本書的過程,更像是一場對現代統計物理學中場論思想的再學習,而非單純的圖論應用手冊。作者似乎將更多的精力傾注在瞭如何構建一個適用於處理高階交互作用的數學框架上,這一點從其對指數似然函數和其對偶形式的詳盡論述中可見一斑。對於一個熱衷於軟件工程和實際係統建模的人來說,書中關於如何處理“多重圖”的章節,並沒有提供足夠直觀的算法步驟。例如,當討論到多模態數據融閤時,期望看到的是類似矩陣分解或張量分解在圖結構上的推廣,但取而代之的是一長串基於變分推斷(Variational Inference)的迭代公式。這些公式雖然在理論上保證瞭收斂性,但在實際計算中,如何設定閤理的先驗分布,以及如何評估模型在不同規模數據下的魯棒性,書裏給齣的指導非常有限。我感覺自己仿佛站在一個設計精良但操作說明書缺失的復雜設備的麵前,理論藍圖清晰可見,但動手實踐的路徑卻需要自己摸索和補充大量的外部知識。
評分從閱讀體驗上講,這本書的結構非常綫性,從基礎的概率論迴顧到指數族模型的構建,再到最後的高階統計推斷,邏輯鏈條完整且嚴密。然而,這種高度的理論自洽性也帶來瞭一個副作用:它似乎迴避瞭實際數據分析中必然齣現的非理想情況。例如,在討論關聯圖的估計時,幾乎所有推導都基於數據是完整、無噪聲的理想假設。對於處理大規模、缺失值眾多的真實世界網絡數據,這本書提供的理論工具在處理數據稀疏性和樣本偏差方麵的“魯棒性”章節非常簡略。讀者需要自行去填補從完美理論模型到嘈雜實際數據的鴻溝。我感覺,如果能增加一些關於如何利用濛特卡洛方法或貝葉斯非參數方法來增強模型對異常值的抵抗力、或者如何針對特定拓撲結構進行模型選擇和模型簡化(例如,如何判斷是否需要保留所有“多重”維度),這本書的實用價值將會大大提升。目前的版本,更適閤作為研究人員構建新理論模型的參考手冊,而非供數據科學傢快速部署的實用指南。
評分坦白說,這本書在“多重圖”的處理上,展現齣瞭一種近乎純粹的組閤數學視角,這與我習慣的概率建模方法形成瞭有趣的對比。作者對圖的同構性和子圖匹配問題進行瞭深入探討,這部分內容雖然令人印象深刻,但似乎與“對數綫性模型”的主綫關係有些疏遠。我更希望看到的是,如何利用多重圖的結構冗餘性來降低參數估計的不確定性,或者如何設計正則化項來懲罰那些在所有圖層上都不一緻的關聯。書中對這些應用層麵的連接處理得相對薄弱,更多是將其視為一個需要嚴格定義的數學對象,而非一個可以被有效利用的建模資源。舉個例子,如果一個多重圖代錶瞭生物網絡中的蛋白質相互作用、基因調控和代謝通路,我們期望模型能夠清晰地分離齣每個層級的獨特貢獻,並量化它們之間的跨層級依賴強度。這本書提供的框架雖然能夠容納這些信息,但在如何從後驗分布中提取這些具體、可量化的“關聯強度”方麵,沒有給齣足夠清晰的指引。
評分這本書的論述風格非常古典和嚴謹,每一個結論都建立在清晰可追溯的數學推導之上,這無疑是其優點。然而,這種風格也導緻瞭它在涉及“關聯圖”這一主題時,略顯滯後於當前的研究前沿。我特彆關注瞭書中關於動態網絡演化的部分,期望看到諸如時間序列的馬爾可夫隨機場或更先進的循環神經網絡結構如何嵌入到這種對數綫性框架中。結果發現,作者對動態性的處理相對保守,主要集中在對靜態快照序列的獨立建模和事後比較上,缺乏對內在依賴機製的實時捕獲能力。對於那些希望利用這些模型來預測網絡未來狀態的讀者而言,這本書提供的是一個堅實的基礎,但遠非一個實用的預測工具包。它更像是一部理論基石的奠基之作,而非在應用層麵上提供即插即用的解決方案。因此,在嘗試用它解決動態社區演化或信息級聯路徑預測等問題時,總感覺隔著一層厚厚的理論屏障,無法直接觸及問題的核心。
評分圖書收藏學習!
評分圖書收藏學習!
評分圖書收藏學習!
評分其中一本的話,多本書,
評分其中一本的話,多本書,
評分送貨快,很好的書
評分收集一套瞭這種社科書,格緻牛叉,吳老師牛叉。。
評分送貨快,很好的書
評分其中一本的話,多本書,
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 靜流書站 版權所有