社会调查数据管理基于Stata 14管理CGSS数据 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

唐丽娜著

图书标签:

社会调查
数据管理
Stata
CGSS
统计分析
数据清洗
数据分析
研究方法
定量研究
社会科学

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到静流书站

book.coffeedeals.club

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

出版社：人民邮电出版社

ISBN：9787115421746

版次：1

商品编码：11958078

品牌：异步图书

包装：精装

开本：小16开

出版时间：2016-06-01

用纸：胶版纸

页数：320

正文语种：中文

具体描述

编辑推荐

1.专家推荐
中国人民大学统计系教授，中国国家调查数据库项目负责人袁卫
中国人民大学社会学系教授，长江学者，CGSS项目负责人李路路
中国人民大学中国调查与数据中心王卫东

2.填补空白
大数据时代到来，各行各业对数据管理的需求应运而生，但很多相关人员尚未树立数据管理的意识，导致大量好数据零散地分布在各机构内，而且也很难对数据做合并以做进一步的挖掘分析。因此，急需一种适合中国国情的、专门针对社会调查数据的管理标准和管理流程，本书正是这样一本填补空白性的著作。

3。实务手册
本书旨在建立一套适合中国社会调查数据管理的、科学规范的、可重复的管理流程、管理标准和管理技术，同时本书又是一本关于社会调查数据管理的、实务性的操作手册。全书重点介绍了社会调查领域从问卷设计到数据发布期间所有和数据相关的管理工作，对数据分析人员来说，学会对各种不同的数据进行科学有效的管理，可极大的提高数据的使用效率和生命周期。

内容简介

这是一本关于社会调查数据管理的实务操作手册，以国内综合性、长期性的调查数据——中国综合社会调查（CGSS）数据的管理为例，基于全新版的Stata 14软件，全面讲解了一个社会调查数据管理的完整周期，重点演示了社会调查数据管理工作中的重点和难点。本书适用于社会调查者、在校大学生、学者、研究者及其他和数据管理相关的从业者。为方便读者学习，书中所有示例数据及命令都可以从人民邮电出版社异步社区网站下载。

作者简介

唐丽娜博士，中国人民大学“中国调查与数据中心”数据管理部主任，曾著有《中国综合社会调查（CGSS）实地抽样绘图手册》，主编《2012东亚社会调查（EASS）报告——社会网络与社会资本》等图书。

第一部分　社会调查者的数据管理
第1章　导言　2
1．1　数据管理不被重视　2
1．2　数据管理内容不清　2
1．3　数据管理工作主体不明　3
1．4　数据伦理　3
1．5　本书简介和使用说明　4

第2章　数据管理的流程及内容　6
2．1　数据管理的工作流程　6
2．1．1　收集数据前的数据管理　6
2．1．2　收集数据中的数据管理　7
2．1．3　数据回收后的数据管理　7
2．2　数据管理的工作标准　8
2．3　数据管理的工作规范　9

第3章　概念与术语　11
3．1　和计算机及软件有关的术语　11
3．2　和统计有关的术语　12
3．3　和社会调查有关的术语　14
3．4　Stata的一些术语及使用通则　15
3．4．1　Stata中的常用术语　16
3．4．2　Stata命令中的通则　27
3．4．3　Stata的帮助文件　29
3．4．4　Stata 14的特点　30
3．4．5　Stata的其他帮助资源　30
3．5　中国综合社会调查　30

第4章　收集数据前的数据管理　37
4．1　问卷设计与数据管理　37
4．1．1　问卷设计的基本要素　37
4．1．2　问卷设计的注意事项　38
4．2　抽样设计与数据管理　44
4．3　数据管理人员的安排　44
4．4　访问员和数据管理　45
4．5　制定编码手册　45
4．5．1　把问题转化成变量　47
4．5．2　确定变量的取值范围　49
4．5．3　给取值贴标签　50
4．5．4　确定缺失值的取值和取值标签　50
4．5．5　制作编码手册　50

第5章　收集数据中的数据管理　53
5．1　问卷填答　53
5．1．1　纸笔调查　53
5．1．2　计算机辅助调查　55
5．2　问卷回收与保存　55
5．3　问卷审核　56
5．4　问卷提交　57

第6章　数据录入　58
6．1　提交录入　58
6．1．1　给录入方一份问卷提交清单　58
6．1．2　给录入方一份问卷编码手册　58
6．1．3　签订数据保密协议　59
6．2　录入格式　59
6．2．1　单选题的录入　59
6．2．2　多选题的录入　59
6．2．3　开放题的录入　60
6．3　双录与双校　60
6．4　用Stata双录并双校数据　60
6．4．1　交互模式录入　60
6．4．2　用命令input输入　65
6．4．3　用命令cf双校　66
6．5　提交最终的录入数据　68
6．6　如何处理已经录完的问卷　69
6．7　数据合并　69
6．7．1　append—纵向合并　70
6．7．2　merge—横向合并　90
6．7．3　joinby—横向配对合并　114
6．7．4　cross—交叉合并　116

第7章　数据的初步清理　121
7．1　检查提交的录入数据　121
7．1．1　查看观测值和变量的数量　122
7．1．2　转换数据格式　122
7．1．3　把数据读入Stata　123
7．1．4　查看识别变量　131
7．1．5　检查有无重复观测值（重复录入）　134
7．1．6　数据标签　137
7．1．7　数据注释　138
7．1．8　数据排序　140
7．2　检查数据中的变量　145
7．2．1　变量名　146
7．2．2　变量标签　149
7．2．3　变量的存储类型　153
7．2．4　变量的显示格式　156
7．2．5　给变量添加注释　159
7．3　检查数据中的取值　161
7．3．1　检查单变量取值　161
7．3．2　检查多个变量之间的逻辑一致性　177
7．4　给取值添加多套不同语种的标签　180
7．5　给数据添加变量　183
7．6　删除数据中的敏感变量　184
7．7　保存数据及相关资料　184
7．7．1　保存数据及相关资料的基本原则　184
7．7．2　在Stata里保存数据　185
7．8　如果问卷设计时没有编制编码手册，该怎么办　189
第二部分　数据使用者的数据管理
第8章　数据的深度清理　198
8．1　抽取数据　198
8．1．1　选取观测值　198
8．1．2　选取变量　204
8．1．3　选取观测值和变量　205
8．1．4　随机抽取一个子数据集　207
8．2　检验多个变量之间的逻辑关系　210
8．2．1　跳问逻辑　211
8．2．2　地理变量间的逻辑　212
8．3　创建新变量　220
8．3．1　依据字符型变量生成数值型变量　221
8．3．2　依据数值型变量生成字符型变量　226
8．3．3　用表达式生成新变量　230
8．3．4　用函数生成新变量　236
8．4　分组计算　266
8．4．1　观测值组内计算—观测值分组　266
8．4．2　观测值组间计算—变量分组　271
8．5　转换数据形状　276
8．5．1　宽数据转换成长数据　278
8．5．2　长数据转换成宽数据　286

第9章　数据的保存和存档　294
9．1　保存数据　294
9．1．1　存储格式　295
9．1．2　存储介质　295
9．2　数据存档　295
9．2．1　文档名　296
9．2．2　文件夹名及文件夹层次—目录结构　298
9．2．3　存档记录清单　298

第10章　数据发布　302
10．1　发布时间　302
10．2　发布格式　302
10．3　发布内容　302
10．4　Q&A;　302
10．5　数据更新/更正　303

总结　304

附录　305
附录A　CGSS第二期抽样方案　305
附录B　国家行政区划代码及转码小程序　315

后记　321

参考资料　322

前言/序言

《大数据时代下的社会调查数据管理与分析：以Stata 14为例》在当今信息爆炸、数据驱动的时代，社会调查数据已成为理解社会现象、洞察民情民意、指导政策制定的关键资源。然而，海量、复杂、多维度的数据并非能够被轻易驾驭。如何高效、准确地组织、清洗、转换、管理和分析这些数据，是每一位社会研究者面临的重大挑战。本书正是在这样的背景下应运而生，旨在为广大社会科学研究者、学生以及对社会调查数据感兴趣的读者，提供一套系统、实用、可操作的数据管理与分析指南。本书的核心目标是帮助读者掌握在大数据环境下，从繁杂的数据中提取有价值信息的能力。我们深知，优质的研究成果离不开可靠的数据基础。因此，本书将数据管理的每一个环节都进行了深入剖析，并结合实际操作，力求让读者在掌握理论知识的同时，也能熟练运用专业工具解决实际问题。本书内容亮点与特色：一、全面而系统的数据管理流程：本书将遵循社会调查数据从采集到最终成果产出的完整生命周期，涵盖了数据管理的关键节点。我们将从数据准备入手，详细阐述如何进行数据录入与编码，包括变量的命名、标签的设置、数值编码的规范以及缺失值的处理策略。接着，本书将深入讲解数据清洗的技术，包括识别和处理异常值、重复值、逻辑错误等，并提供多种实用技巧，确保数据的准确性和一致性。在数据整理阶段，我们将重点介绍数据转换的方法，如变量的计算、合并、拆分、重塑（长格式与宽格式转换）、以及如何进行分组聚合等。这些操作对于将原始数据转化为适合统计分析的形式至关重要。二、 Stata 14的深度应用与实战技巧：本书以Stata 14为核心分析工具，这是一套功能强大且在社会科学研究领域广泛应用的统计软件。我们不会仅仅停留在介绍Stata的基本命令，而是将深入挖掘其在数据管理方面的潜能。基础命令与高级功能结合：从`describe`、`summarize`、`codebook`等基础命令，到`generate`、`replace`、`recode`、`drop`、`keep`等数据生成与删除命令，再到`collapse`、`reshape`、`merge`、`append`、`sort`等数据整合与转换命令，本书将逐一进行详细讲解，并辅以丰富的实例。脚本化与自动化：我们将强调使用Stata的`.do`文件（脚本）进行数据管理的重要性。通过编写脚本，可以实现数据处理过程的自动化、可重复性，极大地提高工作效率，并有效避免人为错误。本书将提供大量可直接运行的脚本范例，帮助读者快速上手。变量标签与值标签的应用：准确的变量标签和值标签是提高数据可读性和理解性的关键。本书将详细介绍如何在Stata中有效地设置和管理这些标签，以及它们在后续分析中的作用。缺失值处理的精细化：缺失值是社会调查数据中普遍存在的问题，对分析结果影响甚大。本书将探讨多种缺失值处理策略，包括删除、插补（均值插补、中位数插补、回归插补等），并分析不同方法的优劣及适用场景，引导读者根据数据特点选择最合适的方法。数据结构的理解与操作： Stata支持长格式和宽格式数据，掌握两者之间的转换对于处理面板数据、多层数据等复杂结构至关重要。本书将详细讲解`reshape long`和`reshape wide`命令的用法，并通过实例演示如何处理不同类型的数据结构。三、理论与实践的深度融合：本书并非枯燥的命令手册，而是将理论知识与实际操作紧密结合。每一项数据管理技术都将在理论层面进行阐述，解释其背后的逻辑和意义，然后再通过生动、典型的案例进行Stata操作演示。案例驱动的学习模式：我们将选取具有代表性的社会调查数据场景，例如大规模人口普查、满意度调查、行为习惯调查等，在这些场景下模拟真实的数据管理需求，引导读者一步步完成数据处理任务。常见问题的解决方案：在数据管理过程中，研究者常常会遇到各种意想不到的问题，如数据编码不一致、逻辑冲突、异常数值等。本书将梳理这些常见问题，并提供切实可行的解决方案和故障排除技巧。代码注释与解释：提供的Stata代码将附带详细的注释，清晰解释每一行代码的功能，帮助读者理解和模仿。四、提升研究能力的目标：本书的最终目标是帮助读者建立起严谨、科学的数据管理意识和能力，从而为后续的统计分析和研究提供坚实的基础。提升数据质量：通过规范的数据管理流程，确保数据的准确性、一致性和完整性，避免因数据问题导致的研究偏差。提高分析效率：熟练掌握Stata的数据管理功能，可以极大地缩短数据处理时间，让研究者能够将更多精力投入到理论探索和结果解释上。增强研究的可重复性：通过脚本化的数据管理，可以清晰记录和复现整个数据处理过程，提高研究的可信度和可重复性。为深入分析奠定基础：结构清晰、质量可靠的数据是进行回归分析、多层模型、面板数据分析等高级统计分析的前提。本书将帮助读者为这些后续的复杂分析做好准备。本书读者定位：本书适合以下人群阅读：社会学、政治学、经济学、心理学、教育学、公共管理等社会科学领域的学生（本科生、硕士生、博士生）：掌握扎实的数据管理技能是完成学术研究和论文写作的关键。社会调查机构的研究人员和数据分析师：提高数据处理效率和数据质量，产出更可靠的研究报告。从事政策研究和公共事务的专业人士：更好地利用数据支持决策，提升政策制定的科学性。对社会调查数据感兴趣的任何读者：了解和学习如何从海量数据中发现社会规律。总而言之，《大数据时代下的社会调查数据管理与分析：以Stata 14为例》是一本集理论、实践、工具应用为一体的专业书籍。我们希望通过本书，能够帮助读者真正掌握社会调查数据管理的精髓，在日新月异的数据科学浪潮中，成为一名游刃有余的数据使用者和研究者。本书将是您在社会调查数据管理与分析之路上的得力助手。

用户评价

评分☆☆☆☆☆

说实话，我更关心的是数据治理和长期维护的视角。社会调查数据往往具有时效性，随着时间的推移，我们可能需要整合多期数据进行面板分析。这本书如果能清晰地指导读者如何建立一个统一的数据字典和版本控制系统，那将非常有价值。例如，当原始数据字段名称发生变化，或者新的变量被引入时，如何用Stata脚本高效地进行映射和合并，而不是每次都手动操作，这将大大提高研究效率。我尤其关注的是数据安全与隐私保护方面的内容。在处理涉及个人敏感信息的调查数据时，如何使用Stata的功能进行数据脱敏、匿名化处理，或者在多方合作研究中安全地共享数据子集，这些都是当前学术界非常关注的议题。如果书中能提供一些基于Stata的安全操作规范和最佳实践案例，帮助我们规避潜在的法律和伦理风险，那这本书的实用价值就不仅仅停留在技术层面，更能提升到方法论和职业素养的高度。

评分☆☆☆☆☆

我对数据可视化在结果呈现中的作用非常看重。虽然Stata的图形编辑能力有时被认为不如R或Python那样灵活，但我个人偏爱Stata的稳定性和结果的可复现性。因此，我期待这本书能展示如何利用Stata的图表功能（比如`twoway`或`graph region`等高级命令）来创建高质量、符合出版标准的统计图表，而不仅仅是默认的简单柱状图或散点图。特别是对于多层级分类变量的展示，如何用Stata命令生成清晰的交互式图表或复杂的多变量分布图，能够极大地方便我向非专业背景的听众解释复杂的调查发现。此外，如果书中能探讨如何将Stata生成的结果图表无缝导出到其他排版软件（如LaTeX或Word）中，并保持最高的清晰度，那将是锦上添花的一笔。纯粹的技术操作固然重要，但如何将“管理”好的数据，通过视觉化的方式有效地“传达”出去，同样是数据管理者的核心能力之一。

评分☆☆☆☆☆

这本书的标题很吸引我，因为我正打算深入研究社会科学领域的数据分析，而Stata作为统计软件中的佼佼者，其应用能力自然是重中之重。不过，我希望能从这本书中学到一些更侧重于实战操作和高级技巧的内容。比如，它能否提供一些关于大规模问卷数据清洗的系统性流程？我经常遇到的问题是，不同批次的问卷在编码和缺失值处理上存在差异，这需要一套非常健壮的管理策略。如果书中能深入探讨如何利用Stata的编程功能（如ado文件编写或更复杂的循环结构）来自动化这些重复且繁琐的清洗步骤，那就太棒了。再者，对于像CGSS这样的复杂调查数据，其抽样权重和分层设计的正确应用至关重要，我期待书中能有专门的章节详细讲解如何在Stata中准确无误地设定和运用这些权重，以确保后续分析结果的代表性和统计学意义。如果这本书只是停留在基础的数据录入和简单描述性统计层面，那对我来说吸引力就会大打折扣了。我更希望看到的是如何构建一个可持续、可追溯的数据管理框架，方便未来进行跨年度对比分析。

评分☆☆☆☆☆

我对于数据清洗和转换中的边缘情况处理抱有极大的兴趣。社会调查数据充斥着各种“意外”——不一致的回答、溢出的值、编码错误等等。我期待书中能提供针对CGSS这类大型调查特有的陷阱的深度解析和解决方案。比如，如何识别和处理那些看似有效但实际上是错误的数据点（比如年龄为200岁的人，或者收入填写为“-99”但未被标记为缺失值的记录）。这本书如果能侧重于异常值检测和稳健性分析的数据准备阶段，并展示Stata中哪些统计工具最适合处理这些“脏数据”，那才真正体现了“管理”的精髓。简单地用`mvdecode`或`replace`命令是远远不够的，我需要的是一套系统性的、基于统计假设的清洗逻辑，确保最终进入模型的数据集是尽可能“纯净”和可靠的。

评分☆☆☆☆☆

作为一名习惯于快速迭代和实验的研究者，我非常注重分析过程的透明度和可重复性。理想情况下，我希望这本书能倡导并详细教授如何使用Stata的Do文件和日志记录功能，将所有数据清洗、转换和分析步骤完全记录下来。这不仅仅是“做备份”，更是科学研究诚信的要求。我希望看到书中能提供一套完整的、高度模块化的Do文件模板，展示如何清晰地组织代码块，添加详细的注释，并利用标签（labels）和宏（macros）来增强代码的可读性和灵活性。如果书中能包含一些关于批处理和自动化报告生成的技巧，比如如何让Stata自动生成包含分析结果和图表的PDF报告，那对于那些需要定期向项目组提交进度的研究人员来说，简直是福音。研究的价值往往体现在其严谨性和可检验性上，这本书如果能在这方面提供坚实的方法论支撑，我一定会认真研读。

评分☆☆☆☆☆

刚收到。包装不错。

评分☆☆☆☆☆

看看的时候我的人生出你想起的

评分☆☆☆☆☆

东西不错，还会购买！

评分☆☆☆☆☆

正品

评分☆☆☆☆☆

正品

评分☆☆☆☆☆

很有用。