内容简介
现代计量语言学是一个严格按照科学哲学对于科学的定义构拟的语言学分支学科。本书尽量用通俗易懂的语言,介绍计量语言学的起源和发展历史,讲述该领域常见的概念、理论、模型和方法,对于常用的算法和软件等工具亦有介绍,并为初学者指明可以立即展开研究的问题及方向,既适用于课程教学,也可供相关领域的研究者参阅。本书是国家社科基金重大项目“现代汉语计量语言学研究”的成果,同时也是世界上第一部关于计量语言学的综合性导论。
作者简介
刘海涛(1962— ),博士,浙江大学求是特聘教授,博士生导师;国际世界语学院院士(Akademio de Esperanto)。Journal of Quantitative Linguistics 副主编,Glottometrics(共同)主编,Language Problems & Language Planning、Glottotheory、 Esperanto Studies 等多种国际语言学相关学术刊物的编委会成员;商务印书馆《应用语言学译丛》主编。在60余种国内外文、理、工刊物发表语言学相关文章160余篇,其中50多篇被SSCI、A&HCI;、SCI收录,是近十年来被WOS核心库(SSCI、A&HCI;、SCI)收录语言学论文*多的大中华区学者。
目录
前言
第一章 计量语言学的历史
1.1 语言量化研究思想的萌芽
1.2 语言量化研究的进一步发展
1.3 齐普夫、赫尔丹、福克斯及其研究成果
1.3.1 齐普夫
1.3.2 赫尔丹
1.3.3 福克斯
1.4 阿尔特曼学派及其研究成果
第二章 计量语言学的定律和理论
2.1 计量语言学的科学哲学基础
2.1.1 科学的核心要素及其与语言学的关系
2.1.2 从科学哲学看语言学理论
2.1.2.1 语言学理论的现状
2.1.2.2 计量语言学理论研究的对象——文本
2.1.2.3 语言理论的构建
2.2 计量语言学的定律
2.2.1 计量语言学中的三类定律
2.2.1.1 分布定律:齐普夫定律
2.2.1.2 函数定律:门策拉一阿尔特曼定律
2.2.1.3 演化定律:皮奥特洛夫斯基一阿尔特曼定律
2.2.2 计量语言学中的其他定律
2.2.2.1 词长分布定律
2.2.2.2 词长和词频相关定律
2.2.2.3 词长和多义度相关定律
2.2.2.4 多义度和同义度相关定律
2.2.2.5 同义度和词长相关定律
2.2.2.6 频次和多文度相关定律
2.2.2.7 文本块定律
2.2.2.8 成分顺序与长度和复杂度的关系
2.3 从定律到理论
2.3.1 词汇协同模型的公理
2.3.1.1 协同模型中的语言学概念
2.3.1 2协同模型中的系统需求
2.3.2 词汇协同模型的推导及检验
2.3.2.1 词汇协同模型的推导
2.3.2.2 词汇协同模型的检验
2.3.3 词汇协同模型的发展与语言学理论
第三章 计量语言学的研究方法
3.1 计量语言学研究的一般方法
3.1.1 计量语言学研究方法的特点
3.1.2 计量语言学研究的流程
3.1.3 建立协同语言学模型的具体流程
3.2 计量语言学研究的复杂网络方法
3.2.1 语言是一种复杂网络
3.2.2 语言的复杂网络模型
3.2.3 语言复杂网络的分析指标
3.2.3.1 与节点度有关的网络指标
3.2.3.2 小世界属性
3.2.3.3 相关性
3.2.3.4 中心性/势指标
3.2.4 语言复杂网络的研究现状
3.3 计量语言学的常用软件介绍
3.3.1 文本计量分析软件QUITA
3.3.1.1 文本计量指标简介
3.3.1.2 指标的计算
3.3.2 分布拟合软件Altmann-Fitter
3.3.2.1 数据文件的创建
3.3.2.2 数据文件的读取
3.3.2.3 数据拟合的具体操作
3.3.3 非线性回归与曲线拟合软件NLREG
3.3.3.1 NLREG的四个必有语句
3.3.3.2 结果的解读与可视化
3.3.4 曲线拟合软件Tablecuwe2D
3.3.4.1 数据文件的读取
3.3.4.2 利用内置函数的曲线拟合
3.3.4.3 使用自定义函数的假设检验
3.3.5 复杂网络分析软件Cytoscape
3.3.5.1 网络文件的创建
3.3.5.2 网络文件的读取
3.3.5.3 网络指标的计算
3.3.6 社会网络分析软件Pajek
3.3.6.1 Pajek的基本数据结构
3.3.6.2 网络文件的创建方法
3.3.6.3 网络文件的读取与网络图的绘制
3.3.6.4 网络分析与结果的可视化
第四章 计量语言学的研究问题
4.1 语音
4.1.1 重音和频率
4.1.2 音位的总藏和词长
4.2 语法
4.2.1 频率和不规则性
4.2.2 词序和话题
4.2.3 信息结构
4.3 语义
4.3.1 意义和频率
4.3.2 动词和名词的多义词
4.3.3 语义分割空间
4.4 词汇
4.4.1 同义词及其形态
4.4.2 词的熟悉度和频率
4.4.3 字的习得及其复杂度
4.5 文本分析
4.5.1 “弧长”
4.5.2 “作者视野”
4.5.3 主题集中度
4.6 类型学
4.6.1 “熵”和语言的粘着性
4.6.2 词素长度
4.6.3 语言的粘着性
4.7 协同语言学
4.7.1 多义度和多文度
4.7.2 汉语的词长和多义度
4.7.3 句法网络分析
4.8 语用学
4.8.1 言语行为的秩频分布
4.8.2 戏剧中人物的同质性、相似性和等级性
……
第五章 《计量语言学学报》的计量特征分析
计量语言学相关资源
计量语言学基本文献
人名索引
术语名词索引
精彩书摘
《计量语言学导论》:
目前已有一些研究者开始采用复杂网络的方法开展语言学研究,并取得了初步的研究发现。这些研究大致可分为三类:人类语言作为分层系统的复杂网络研究,基于复杂网络的语言分类,以及语言的宏观结构与微观结构之间关系的研究。
现代语言学认为,语言不仅是一种系统,而且是一种分层的系统。从语言的实际使用来看,语言的表达就可以在从意义到形式上的多个层面去考察。从系统的观点来看,语言在意义一形式维度上的不同层面可以视为不同的语言子系统。基于相同的真实语料,可以构建某种语言在意义一形式维度上的不同语言层面的复杂网络模型。通过对这些网络模型的分析与比较,可以揭示人类语言作为分层系统的整体特征,并在系统层面上揭示人类语言从形式到意义的不同层面之间的关系。研究的结果能够反映人类语言与认知之间的和谐,这种和谐为各个语言层面(子系统)的网络分析与比较的结果提供了解读。
语言分类是现代语言学中的一个重要课题。基于复杂网络的语言分类研究表明,采用动态语言网络(例如句法依存网络和词同现网络)的基本指标,可以大致反映出不同语言在语言谱系中的异同关系。复杂网络的方法注重语言的整体特征,因此是整体类型学的一种潜在方法,也是对目前广为采用的局部类型学研究方法的重要补充。同时,动态语言网络基于真实语料,有助于弥补目前类型学研究不重视真实语料的不足。另外,复杂网络的方法是一种定量的方法,基于复杂网络的类型学研究因而能够反映语言之间的异同程度。
……
计量语言学导论 电子书 下载 mobi epub pdf txt