语料库语言学

语料库语言学 pdf epub mobi txt 电子书 下载 2025

黄昌宁,李涓子 著
图书标签:
  • 语料库语言学
  • 计算语言学
  • 自然语言处理
  • 语言学
  • 文本分析
  • 数据科学
  • 语言研究
  • 语料库
  • 语言技术
  • 人工智能
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 商务印书馆
ISBN:9787100033640
版次:1
商品编码:10284754
品牌:商务印书馆(The Commercial Press)
包装:平装
丛书名: 语言与计算机丛书
开本:32开
出版时间:2002-04-01
用纸:胶版纸
页数:288
正文语种:中文

具体描述

内容简介

语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。
《语料库语言学》将系统地介绍语料库语言学这门新兴学科的研究内容和方法,既包括用计量方法来研究词汇学、词典编纂学、语法学和语义学等方面的内容,也包括语言素材的计量与计算的运用,开发众多的自然语言信息处理系统。主要章节有:语料库语言学研究的现状与展望,语料库的设计与开发,语料库的加工和管理技术,基于语料库语言学研究,语料库方法在计算语言学中的应用。

目录

第1章 绪论
第一节 什么是语料库?什么是语料库语言学?
第二节 语料库语言学的发展历史
第三节 语料库语言学的发展方向及前景
第四节 计算机在语料库语言学中的作用
第五节 语料库语言学的研究内容
第六节 本书的编排
第2章 语料库的设计与开发
第一节 语料库设计和编纂中的问题
第二节 建设一个语料库
第三节 语料库的类型
第四节 国外语料库介绍
第五节 汉语语料库的建设
第3章 语料库的加工和管理技术
第一节 语料的索引及其应用
第二节 语料库语言学中的统计
第三节 逐词索引软件及其应用
第四节 语料库标注
第4章 基于语料库方法的语言学研究
第一节 语言研究中的语料库方法
第二节 现代汉语句型统计与研究
第三节 词典学研究
第四节 汉语名词的语义分类研究
第五节 词汇一语法问题调查
第六节 语域变体(register variation)研究
第5章 语料库方法在计算语言学中的应用
第一节 汉语文本中交集型切分歧义的研究
第二节 汉语基本名词短语识别研究
第三节 基于结构词义空间的汉语词义排歧模型
附录 词性标记集
参考文献

精彩书摘

第1章 绪论
“语料库语言学已经成为语言研究的主流。基于语料库的研究不再是计算机专家的独有领域,它正在对语言研究的许多领域产生愈来愈大的影响”。这是汤姆斯(Thomas)等人1996年为祝贺语料库语言学的主要奠基人和倡导者里奇(Leech)六十诞辰而编纂的语料库语言学研究论文集的开场白。近年来,对语料库语言学类似的说法频频见于导论和方法论的专著及教科书中,它不仅仅是语料库语言学家的自誉,而且正在成为整个语言学界的共识。
第一节 什么是语料库?什么是语料库语言学?
语料库(corpus)顾名思义就是存放语言材料的仓库(或数据库)。传统上,语言学家用语料库这个术语表示可作为语言研究基础的、大量自然出现的语言数据。这些语料库可以由书面语和(或)口语的样本组成,并通常被用来代表一种特定的语言或语言变体。在计算机出现之前,研究者——特别是词典编纂者,也有语料库,只是规模小、范围窄,因而难以在学术界形成气候。近40年以来,语料库这个术语通常指以电子形式保存的语言材料,并被广泛用于语言研究和语言工程。随着计算机功效的成倍增长,语料库在规模、多样性和使用方便等方面都发生了剧烈的变化。与此同时,为了存取和加工语料库所拥有的信息,已经开发了大量专用的软件。计算机语料库迅速成为语言研究的一种普遍资源,现在世界上已经建立了许多规模较大的语料库,有些是国家级的,有些是大学和词典出版商联合研制的。另外,由于个人电脑的迅猛发展,存储数据的硬磁盘造价持续下降,研究者个人也开始建立适合自己研究兴趣的小型语料库。
……
《文本的脉络:深度解析现代语言学前沿》 引言 语言,作为人类文明的基石,其复杂性与精妙之处,历来是学者们探索不尽的领域。在现代语言学发展的宏伟图景中,对语言进行大规模、系统性分析的需求日益凸显。本书《文本的脉络:深度解析现代语言学前沿》正是在这样的时代背景下应运而生。它并非单纯的理论堆砌,而是以一种全新的视角,带领读者深入理解语言的实际运作,揭示其内在的规律与奥秘。本书旨在为语言学研究者、应用语言学者、计算机科学领域的专家,以及所有对语言本质充满好奇的读者,提供一套扎实、前沿的理论框架与实践方法。 第一章:语言学的转型与演进 本章将追溯语言学研究的历史轨迹,探讨从古典语言学到结构主义、生成主义等主要学派的演变。我们将重点分析每一次理论革新对语言学研究范式带来的颠覆性影响,并着重指出,在数字时代信息爆炸的背景下,传统的研究方法面临的挑战以及语言学向实证性、大规模数据驱动的学科转变的必然性。我们将深入探讨“语言是行为”这一核心观念的提出,以及它如何促使学者们将目光从抽象的语言规则转向真实的语言使用场景。我们将考察实证语言学兴起的原因,包括计算能力的飞跃、数据存储技术的进步,以及这些技术如何为语言学研究提供了前所未有的可能性。 第二章:实证主义的基石:语言数据采集与处理 本章将聚焦于支撑现代语言学研究的核心要素——语言数据的获取与净化。我们将详细阐述不同类型语言数据的采集方法,包括口语访谈、书面文本、网络言论、社交媒体内容等,并分析各自的优缺点及适用场景。重点将放在如何设计科学的抽样策略,以确保数据的代表性和有效性。在数据处理方面,我们将深入探讨文本的预处理技术,如分词、词性标注、句法分析、命名实体识别等,并介绍常用的自然语言处理工具和算法。此外,本章还将讨论数据清洗的关键步骤,包括噪声去除、错误纠正、敏感信息过滤等,强调高质量数据是后续所有分析的基石。我们将探讨数据源的多样性,并说明如何根据研究目标选择最合适的数据集。 第三章:量化分析的利器:统计学方法在语言学中的应用 本章将系统介绍统计学方法在语言学研究中的核心应用。我们将从描述性统计入手,讲解频率分析、分布规律、集中趋势与离散程度等基本概念,并演示如何在语言学语境下应用这些方法,例如分析词频、搭配频率等。在此基础上,我们将深入探讨推断性统计,重点介绍假设检验、置信区间、相关分析、回归分析等常用统计模型,并结合具体的语言学研究案例,说明如何运用这些工具来检验语言现象的统计学显著性,发现变量之间的关系。我们还将引入多元统计分析技术,如主成分分析、聚类分析等,阐释它们在揭示语言结构、语言变异等复杂问题上的价值。本章将强调理解统计学原理的重要性,而非仅仅停留在工具的使用层面。 第四章:结构之维:从词汇到句法的深度挖掘 本章将深入探讨语言结构在量化分析下的呈现。我们将从词汇层面入手,讲解词汇的共现分析、词义消歧、词汇选择模式等,并介绍基于频率和统计模型的词汇网络构建方法。随后,我们将转向句法结构,深入分析句法结构的统计规律,如常用句法模式的频率、词序的统计特性、依存关系的可能性等。本章将详细介绍句法分析树的统计特性,以及如何利用统计方法来评估不同句法分析结果的可靠性。我们将探讨词汇的语义关联,如词语的同现概率、语义场分析等,并介绍如何利用这些方法来揭示词语之间的深层联系。在句法层面,我们将考察不同句式的使用频率,以及句法成分的依存关系和概率分布。 第五章:语义的流转:意义的量化呈现与语境的互动 本章将聚焦于语言的意义层面,探讨如何运用量化方法来理解和分析语义。我们将介绍词汇语义的量化模型,如词向量(Word Embeddings)技术,详细阐述其原理、构建方法以及在词义表征、语义相似度计算等方面的应用。我们将进一步探讨短语和句子层面的语义分析,如情感分析、主题模型、语义角色标注等,并展示如何利用这些技术来揭示文本的深层含义。本章还将重点讨论语境对语义的影响,分析不同语境下词语和句子意义的差异,以及如何通过量化方法来捕捉这种动态变化。我们将通过具体的案例,展示如何利用词向量等技术来捕捉词语之间微妙的语义关系,以及如何通过主题模型来发现文本中的潜在主题。 第六章:语用的探秘:语言行为的实证研究 本章将把研究的视角从语言的内在结构转移到语言的实际使用,即语用学。我们将探讨如何运用量化方法来分析语言行为,例如礼貌策略、言语行为的频率和类型、会话分析中的模式识别等。我们将深入研究语篇的连贯与衔接,分析连接词、指代关系等在文本中的统计分布和功能。本章还将讨论篇章结构的统计建模,以及如何利用量化方法来揭示不同类型文本的篇章组织特点。我们将探讨语言的社会因素,如年龄、性别、社会阶层等对语言使用的影响,并展示如何通过量化分析来揭示这些因素与语言变异之间的关联。 第七章:语言变异与语言变化:动态的语言学视角 本章将关注语言的动态性,即语言变异与语言变化。我们将探讨如何利用大规模语料库来捕捉不同地理区域、社会群体之间的语言差异,并分析这些差异的统计学规律。我们将深入研究语言随时间推移而发生的演变,例如词汇的兴衰、语法结构的改变等,并利用历史语料库进行量化分析,揭示语言变化的轨迹与驱动因素。本章还将介绍语料库在语言规范研究中的作用,以及如何通过分析实际语言使用来为语言政策和语言教育提供科学依据。我们将考察语言接触对语言的影响,以及如何通过量化分析来揭示跨语言的影响和融合。 第八章:计算语言学与人工智能的交叉 本章将探讨语言学研究与计算科学、人工智能技术的深度融合。我们将介绍自然语言处理(NLP)在信息检索、机器翻译、智能问答、文本生成等领域的最新进展,并分析这些技术背后的语言学原理。本章还将讨论机器学习、深度学习等人工智能技术在语言学研究中的应用,例如情感分析模型的构建、文本分类算法的设计等。我们将强调语言学理论与计算模型的相互促进作用,指出语言学研究如何为人工智能提供理论指导,而计算方法又如何为语言学研究开辟新的途径。我们将深入分析深度学习模型在处理语言中的复杂性,例如如何捕捉上下文信息,以及如何进行端到端的语言理解。 第九章:未来展望与挑战 本章将对语言学研究的未来发展方向进行展望。我们将讨论语料库语言学在新兴领域,如数字人文、社会科学、医学等领域的潜在应用。同时,本章也将分析当前语言学研究面临的挑战,例如如何处理更大规模、更复杂的语料,如何解决语料的伦理与隐私问题,以及如何构建更具解释力的语言模型。我们将强调跨学科合作的重要性,以及如何将语言学研究的成果更好地应用于实际社会问题。我们将探讨更先进的计算模型,例如能够处理多模态信息的模型,以及如何利用这些模型来理解更复杂的语言现象。 结语 《文本的脉络:深度解析现代语言学前沿》旨在为读者勾勒出一幅现代语言学研究的宏伟蓝图。本书通过对语言数据、统计方法、语言结构、语义、语用、语言变异、计算语言学以及人工智能的深入探讨,全面展现了量化分析在理解语言本质方面的强大力量。我们相信,本书将激发读者对语言学的浓厚兴趣,并为他们在各自的研究和实践领域提供宝贵的思想启迪和方法指导。我们期望本书能够成为一座桥梁,连接理论探索与实际应用,推动语言学研究不断向前发展。

用户评价

评分

这套书的装帧设计实在是太引人注目了,封面那深邃的靛蓝色,配上烫金的字体,立刻就给人一种庄重而又富有学术气息的感觉。拿到手里沉甸甸的,纸张的质感也无可挑剔,那种微微泛黄的米白色,读起来眼睛一点都不累。我特别喜欢它在排版上的用心,行距和字号的调整都恰到好处,即便是需要长时间阅读复杂的理论章节,也不会感到视觉疲劳。当然,作为工具书,内容自然是重中之重,但外在的呈现也极大地影响了阅读体验。我一直觉得,好的书籍是能让人产生亲近感的,这本书在这一点上做得非常成功,它不仅仅是一堆文字的堆砌,更像是一件精心打磨的艺术品,让人舍不得很快就合上它,每一次翻阅都像是在进行一次仪式。我之前买过一些同类主题的书籍,很多都是影印版的复刻,装帧粗糙,阅读体验极差,但这一本完全不同,看得出出版社在制作上投入了大量的精力和成本,这对于严肃的学术阅读者来说,是极其重要的加分项。

评分

阅读体验中,一个常常被忽略但又极其关键的因素是索引和目录的实用性。这本书的索引做得堪称典范。通常,学术书的索引要么过于简单,只列出主要章节标题,要么过于冗余,把所有重复出现的词都列进去,实际查找效率很低。然而,这本书的索引设计得非常有层次感。它不仅涵盖了核心术语,还细致地标注了那些在特定上下文或具体例子中被讨论到的次要概念。例如,当我寻找关于“语料库平衡性”的讨论时,索引会直接指向正文中的具体论述段落,甚至会附带简短的上下文提示,比如“(讨论构建高标准语境下的样本偏差问题)”。这种精细化的检索设计,极大地节省了我往返于不同章节查找零散信息的时间,让知识的组织和重构变得异常高效,对于需要快速定位特定信息点的研究人员来说,这是一个实实在在的“时间管理神器”。

评分

我个人非常欣赏作者在全书最后所设置的“展望与伦理反思”章节。在很多理工科背景的学术著作中,理论阐述完毕后往往戛然而止,留下一个冷冰冰的知识结构。但在这本书的收尾部分,作者没有止步于技术层面的讨论,而是将视野拉高,探讨了大规模数据采集和应用可能带来的社会影响和潜在的伦理困境,比如隐私保护、数据偏见可能固化社会不公等深刻议题。这种超越技术范畴的关怀,显示了作者深厚的人文素养和对学科未来负责任的态度。它提醒着我们,工具的进步必须伴随着审慎的思考,这使得这本书不仅仅是一本技术手册,更是一本引导未来研究者如何负责任地进行数据驱动型研究的思想指南。读完后,我感觉自己不仅学到了方法论,更收获了一份沉甸甸的学术责任感,这对于任何一个希望在这一领域有所建树的人来说,都是极其宝贵的精神财富。

评分

这本书的资料引用和参考文献部分做得极其扎实和详尽,这对于任何需要进行深入研究或者批判性阅读的读者来说,简直是福音。我特意比对了其中几个关键概念的溯源,发现作者引用的文献大多是第一手的、甚至是有些已经非常冷门但却至关重要的早期研究。而且,很多引注的格式都非常规范,便于读者根据需要,去查找原始资料进行交叉验证。这一点尤为重要,因为在很多快速出版的概览性著作中,引文往往是敷衍了事或者只有结论而无出处,这极大地限制了学术的严谨性。但在这本书里,我能清晰地看到作者构建知识体系的逻辑链条,每一步论证都有坚实的文献基础支撑,让人读起来信心倍增,感觉自己站在了巨人的肩膀上,而不是在信息的迷雾中摸索,这无疑大大提升了这本书的学术价值和可信度。

评分

我对作者在梳理复杂概念时的那种清晰度感到由衷的钦佩。比如,书中对某个核心模型进行拆解分析时,他没有采用传统的逐层堆砌的叙事方式,而是巧妙地引入了一个历史情境的对比。通过追溯不同历史时期研究者们对于同一问题的不同理解和局限性,再逐步引出当前所采用的主流框架,这种“先破后立”的写法,使得那些原本晦涩难懂的术语和公式一下子变得立体而有生命力了。我记得有一次我被一个特定的理论卡住了好几天,换了好几本书都未能突破,但读到这里时,作者用了好几页篇幅,通过类比一个日常的交通管理系统,将抽象的计算过程可视化了。这种教学上的巧妙设计,远比生硬地罗列定义要高明得多,它真正体现了作者不仅精通该领域,更重要的是,他懂得如何将这份知识有效地传递给读者,真正做到了化繁为简,令人拍案叫绝。

评分

方能

评分

题质疑、成果展示、心得交流、小组讨论、合作学习、疑难解析、观点验证、问题综述。

评分

语料库语言学和描述的一样,好评!上周周六,闲来无事,上午上了一个上午网,想起好久没买书了,似乎我买书有点上瘾,一段时间不逛书店就周身不爽,难道男人逛书店就象女人逛商场似的上瘾于是下楼吃了碗面,这段时间非常冷,还下这雨,到书店主要目的是买一大堆书,上次专程去买却被告知缺货,这次应该可以买到了吧。可是到一楼的查询处问,小姐却说昨天刚到的一批又卖完了!晕!为什么不多进点货,于是上京东挑选书。好了,废话不说。好了,我现在来说说这本书的观感吧,一个人重要的是找到自己的腔调,不论说话还是写字。腔调一旦确立,就好比打架有了块趁手的板砖,怎么使怎么顺手,怎么拍怎么有劲,顺带着身体姿态也挥洒自如,打架简直成了舞蹈,兼有了美感和韵味。要论到写字,腔调甚至先于主题,它是一个人特有的形式,或者工具不这么说,不这么写,就会别扭工欲善其事,必先利其器,腔调有时候就是器,有时候又是事,对一篇文章或者一本书来说,器就是事,事就是器。这本书,的确是用他特有的腔调表达了对腔调本身的赞美。|发货真是出乎意料的快,昨天下午订的货,第二天一早就收到了,赞一个,书质量很好,正版。独立包装,每一本有购物清单,让人放心。帮人家买的书,周五买的书,周天就收到了,快递很好也很快,包装很完整,跟同学一起买的两本,我们都很喜欢,谢谢!了解京东2013年3月30日晚间,京东商城正式将原域名360更换为,并同步推出名为的吉祥物形象,其首页也进行了一定程度改版。此外,用户在输入域名后,网页也自动跳转至。对于更换域名,京东方面表示,相对于原域名360,新切换的域名更符合中国用户语言习惯,简洁明了,使全球消费者都可以方便快捷地访问京东。同时,作为京东二字的拼音首字母拼写,也更易于和京东品牌产生联想,有利于京东品牌形象的传播和提升。京东在进步,京东越做越大。||||好了,现在给大家介绍两本本好书谢谢你离开我是张小娴在想念后时隔两年推出的新散文集。从拿到文稿到把它送到读者面前,几个月的时间,欣喜与不舍交杂。这是张小娴最美的散文。美在每个充满灵性的文字,美在细细道来的倾诉话语。美在作者书写时真实饱满的情绪,更美在打动人心的厚重情感。从装祯到设计前所未有的突破,每个精致跳动的文字,不再只是黑白配,而是有了鲜艳的色彩,首次全彩印刷,法国著名唯美派插画大师,亲绘插图。|两年的等待加最美的文字,就是你面前这本最值得期待的新作。洗脑术怎样有逻辑地说服他人全球最高端隐秘的心理学课程,彻底改变你思维逻辑的头脑风暴。白宫智囊团、美国、全球十大上市公司总裁都在秘密学习!当今世界最高明的思想控制与精神绑架,政治、宗教、信仰给我们的终极启示。全球最高端隐

评分

新加坡是一个城市国家,原意为狮城。公元14世纪,苏门答腊的室利佛逝王国王子乘船到达该岛,看见一头野兽,当地人告知为狮子,他认为这是一个吉兆,于是决定建设这个地方。新加坡“Singapura"是梵语「狮城」之谐音,由于当地居民受古代印度文化影响较深,喜欢用梵语作为地名。而狮子具有勇猛、雄健的特征,故以此作为地名是很自然的事。

评分

学问钻研之功

评分

好书,很满意

评分

考研学子的必备书目之一经典

评分

⑤教学生抓重点.教学难免有意外,课堂难免有突变,应对教学意外、课堂突变的本领,就是我们通常说的驾驭课堂、驾驭学生的能力。对教师来说,让意外干扰教学、影响教学是无能,把意外变成生成,促进教学、改进教学是艺术。生成相对于教学预设而言,分有意生成、无意生成两种类型;问题生成、疑问生成、答案生成、灵感生成、思维生成、模式生成六种形式。生成的重点在问题生成、灵感生成。教学机智显亮点.随机应变的才智与机敏,最能赢得学生钦佩和行赞叹的亮点。教学机智的类型分为教师教的机智、学生学的机智,师生互动的机智,学生探究的机智。机智常常表现在应对质疑的解答,面对难题的措施,发现问题的敏锐,解决问题的灵活。

评分

③我们的教师为了控制课堂,总担心秩序失控而严格纪律,导致紧张有余而轻松不足。轻松的氛围,使学生没有思想顾忌,没有思想负担,提问可以自由发言,讨论可以畅所欲言,回答不用担心受怕,辩论不用针锋相对。同学们的任何猜想、幻想、设想都受到尊重、都尽可能让他们自己做解释,在聆听中交流想法、

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有