汉英评价意义分析手册——评价语料库的语料处理原则与研制方案

汉英评价意义分析手册——评价语料库的语料处理原则与研制方案 pdf epub mobi txt 电子书 下载 2025

彭宣维 等 著
图书标签:
  • 语料库语言学
  • 评价研究
  • 对比语言学
  • 汉英对比
  • 语料处理
  • 词汇语义学
  • 语料库构建
  • 语言资源
  • 计算语言学
  • 应用语言学
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 北京大学出版社
ISBN:9787301265550
版次:1
商品编码:11842579
包装:平装
开本:16开
出版时间:2015-12-01
用纸:轻型纸
页数:376
字数:350000

具体描述

编辑推荐

  评价意义的理论发展与语篇分析涉及大量而琐碎的成分识别问题,而这一任务的难度远非局外人能想象,为此我们决定开发《汉英对应评价意义语料库》,双语对照,以便为相关研究者(包括我们自己)在涉及这一领域时有一个相对客观的分析参照标准。本书逐一详细介绍了该语料库在研制过程中涉及的语料处理原则与具体操作方案,包括11个总类:小说、历史、文明史、民俗、科技史、科技、散文、政府文件、新闻报道、百科和科幻,共计118个文本,100万字词。在材料长短选取上,我们兼顾两点:一是覆盖面,二是我们自己的研究兴趣。这一工作的意义是明显的:迄今,系统功能语言学的词汇语法范畴可以归纳为7个大类:及物性、时态、语气、情态、语体、主位结构和信息结构;如果我们能够针对其中每一范畴、以语篇衔接和连贯为立足点,逐一研制建立专业语料库,结果就可以覆盖整个语言系统。这便为研究者从通用语料库使用的广博性走向深入提供了一个可供系统研究之需的资源总库,必将价值连城。

内容简介

  汉英对应评价语料库是以某一语言理论体系为基础而建立的专用双语对应语料库,基本目的是积累大量语言素材,建立通用双语对应语料库,为翻译研究、语言对比研究、语言教学、双语词典编纂等应用语言学研究提供丰富材料,促进其发展。《汉英评价意义分析手册——评价语料库的语料处理原则与研制方案》旨在阐述本语料库研制中采用的语料处理和研制原则。

作者简介

  彭宣维,北京师范大学教授,中国功能语言学会、中国英汉语篇分析研究会、中国认知诗学研究会副会长,中国认知语言学学会常务理事。2007-08富布莱特美国访问学者。

目录

目录


第一章引论
1. 评价范畴的来源: 沿革小引
2. 马丁等人的评价系统
3. 情态: 体现评价意义的词汇语法手段
4. 语篇分析的评价取向
5. 本项目的研究内容及其意义
6. 本书结构、说明及鸣谢
第二章情感意义分析
1. 引言
2. 情感意义的典型情况
3. 情感意义的非典型情况及处理方案
4. 情感意义在词汇语法层的体现
5. 小结
第三章判断意义分析
1. 引言
2. 判断意义的典型情况
3. 判断意义的非典型情况
4. 判断意义的其他特殊体现形式
5. 小结
第四章鉴赏意义分析
1. 引言
2. 鉴赏意义的典型情况
3. 鉴赏意义分析中的重要因素——语境
4. 关于鉴赏成分的统计问题
5. 鉴赏与评价系统其他范畴间的关系
6. 小结
第五章介入意义分析
1. 引言
2. 否定
3. 对立
4. 认同
5. 断言
6. 引证
7. 接纳
8. 归属
9. 小结
第六章级差意义分析
1. 引言
2. 语力: 量化
3. 语力: 强化
4. 语力: 量化与强化的区别
5. 聚焦
6. 小结
第七章结束语
参考文献
附录汉英对应评价意义语料库简介
1. 研制背景: 基于语料库的评价系统研究
2. 总体设计思路与研制过程
3. 语料检索
4. 术语解释和UAM CorpusTool的基本原理
5. 应用前景
参考文献

前言/序言







《汉英评价意义分析手册——评价语料库的语料处理原则与研制方案》 一、 导言:评价语言研究的意义与挑战 评价语言,作为人类情感、态度、立场表达的核心载体,在语言学、社会学、心理学、传播学等多个领域都扮演着至关重要的角色。无论是日常交流中的褒贬评价,还是学术研究中的客观审视,亦或是商业活动中的品牌营销,评价语都渗透其中,影响着信息的接收者和信息的传播。理解和分析评价语言,不仅有助于揭示语言使用者深层的认知与情感,更能深入洞察社会文化现象的演变与发展。 然而,对评价语言进行系统、深入的研究并非易事。评价的表达方式极其多样,既有直接的褒贬词汇,也有委婉的隐喻、讽刺,甚至可以通过语调、上下文等非语言线索来传递。此外,评价的指向性、强度、主体、客体以及评价的语境依赖性,都使得评价意义的准确捕捉与量化分析充满挑战。传统的文本分析方法往往难以穷尽评价语言的复杂性,尤其是在跨语言比较研究中,文化差异、表达习惯的差异更是增添了研究难度。 正是在这样的背景下,构建大规模、高质量的评价语料库,并对其进行科学的语料处理,成为推动评价语言研究深入发展的重要基石。评价语料库的建立,能够为量化分析、模式识别、模型构建提供坚实的数据支撑,从而摆脱依赖零散案例的局限,实现对评价语言现象的宏观把握与微观剖析。 二、 本书聚焦:评价语料库的语料处理原则与研制方案 《汉英评价意义分析手册——评价语料库的语料处理原则与研制方案》正是一部专注于解决上述挑战的力作。本书并非对评价意义本身进行泛泛的讨论,而是将研究的焦点精准地对准了评价语料库的构建与处理这一关键环节。它深刻理解,高质量的语料是后续一切评价意义分析有效性的前提。因此,本书旨在为研究者提供一套系统、可行、且具备前瞻性的理论框架与实践指南,以期帮助他们高效、规范地研制和处理评价语料库。 本书的核心价值在于其对“评价语料库”这一特定对象进行深度解构,并在此基础上提炼出了一套严谨的“语料处理原则”与一套详细的“研制方案”。这意味着,本书不是空泛的理论探讨,而是直接指向了解决实际研究问题的路径。它将引领读者从零开始,理解如何构建一个能够支撑深入评价意义分析的语料库,以及在语料库建立的过程中,需要遵循哪些核心原则,并具体采取哪些步骤。 三、 核心内容解析:语料处理原则的深度阐释 本书对“语料处理原则”的阐释,具有极强的实践指导意义。这些原则是评价语料库研制过程中必须遵循的“红线”与“指南针”,确保了语料库的科学性、系统性与可用性。 原则一:明确的语料收集目标与范围界定。 在着手收集语料之前,必须清晰界定研究的评价类型(例如,积极评价、消极评价、中性评价、情感评价、事实评价等)、评价的领域(例如,产品评论、电影评价、新闻报道、社交媒体、学术论文等)、以及所关注的评价语言特征(例如,情感极性、情感强度、评价维度、评价主体、评价客体、评价策略等)。明确的目标与范围,有助于提高语料收集的效率,避免收集无关信息,保证语料的针对性。本书将详细阐述如何根据不同的研究目的,制定精准的语料收集策略。 原则二:多源、多样化的语料来源。 为了全面反映评价语言的丰富性与复杂性,评价语料库的构建应力求语料来源的多样化。本书将强调,不应局限于单一的文本类型或平台,而应积极挖掘来自互联网评论、社交媒体、新闻媒体、论坛讨论、文学作品、学术论文等多元化的语料源。同时,要关注不同语体的评价表达差异,例如,口语化评价与书面语评价的差异,正式语境与非正式语境下的评价表达差异。 原则三:系统化的语料标注体系。 语料库的价值很大程度上取决于其标注的质量与体系。本书将重点阐述如何构建一套科学、一致、且适合评价意义分析的标注体系。这包括对评价词汇、短语、句子乃至篇章层面的识别与分类。标注内容可能涵盖: 情感极性标注: 明确评价是积极、消极还是中性。 情感强度标注: 量化评价的情感强度,例如,从“略微好评”到“极力赞扬”。 评价维度/方面标注: 识别评价所指向的具体方面,例如,对于一部电影,评价可能涉及“剧情”、“表演”、“画面”等。 评价主体与客体标注: 确定评价的发起者(谁在评价)和评价的对象(评价了什么)。 评价句式与词汇标注: 识别具体的评价表达方式,例如,形容词、副词、动词、名词短语、比喻、反讽等。 语境信息标注: 记录评价发生的具体语境,例如,所属文章、段落、时间、平台等,以备后续语境化分析。 本书将提供构建标注体系的详细步骤、考虑因素以及不同粒度的标注策略。 原则四:高质量的语料清洗与预处理。 原始语料往往包含大量噪声,例如,错别字、非规范用语、重复信息、广告信息、乱码等。本书将详细介绍针对评价语料的清洗与预处理技术,包括: 文本去噪: 移除不相关的字符、HTML标签、URL等。 文本规范化: 包括大小写转换、标点符号处理、特殊符号替换等。 分词与词性标注: 对中文语料而言,准确的分词是后续分析的基础。 实体识别与消歧: 识别评价涉及的实体,并解决多义词的问题。 去除重复与低质语料: 识别并移除重复或对研究价值不大的语料。 原则五:跨语言平行语料的构建与对齐(针对汉英)。 鉴于本书的书名包含“汉英”,本书将特别强调跨语言平行语料的重要性。平行语料库的建立,是进行跨语言评价意义比较研究的基础。本书将深入探讨: 平行语料的来源: 如何找到适合进行评价意义对比的汉英平行文本。 语料对齐技术: 如何对汉英句子、短语或词汇进行精准对齐,以支持逐句、逐词的对比分析。 翻译中的评价差异考量: 在收集翻译语料时,如何关注翻译过程中可能出现的评价表达差异,以及如何进行标注。 原则六:语料库的可扩展性与可持续性。 评价语言是动态变化的,评价语料库的生命力在于其不断更新与扩展。本书将强调设计具有良好可扩展性的语料库结构,并提出语料库维护与更新的策略,以保证语料库的长期可用性。 四、 研制方案的实践指导:从理论到实践的桥梁 在阐述了核心原则之后,本书将聚焦于“研制方案”,为读者提供一套从宏观到微观、从规划到执行的完整流程。这部分内容将是实践操作的“路线图”。 第一阶段:需求分析与方案设计。 研究目标明确: 再次强调根据具体研究问题来定义语料库的类型、规模和标注需求。 语料库架构设计: 如何设计数据库结构,以存储语料、元数据和标注信息。 技术选型: 讨论适合语料库管理的工具和平台,例如,标注工具(如Doccano, BRAT)、数据库系统、文本处理库(如NLTK, spaCy, HanLP)等。 第二阶段:语料收集与预处理。 爬虫与脚本开发: 针对不同语料源,设计高效的爬取策略和脚本。 数据过滤与清洗流程: 详细说明如何执行前面原则中提到的清洗步骤。 预处理工具的运用: 示范如何使用自动化工具完成分词、词性标注等任务。 第三阶段:标注体系的构建与实施。 标注规范编写: 详细说明如何编写清晰、易懂的标注指南,以确保标注者的一致性。 标注工具的配置与使用: 演示如何配置和使用常见的标注工具。 标注者培训与质量控制: 强调对标注人员的培训,以及如何通过抽样检查、一致性评估等方法保证标注质量。 迭代式标注: 介绍在标注过程中进行反馈和调整,以完善标注体系。 第四阶段:语料库的整合与管理。 数据格式转换与标准化: 将不同来源和格式的语料统一。 数据库导入与索引建立: 将标注好的数据导入数据库,并建立高效的查询索引。 版本控制与备份策略: 确保语料库数据的安全性和可追溯性。 第五阶段:语料库的评估与应用。 语料库统计分析: 对语料库的规模、标注分布、语言特征等进行初步统计。 语料库的查询与检索: 演示如何利用语料库进行高效的检索和数据提取。 作为模型训练数据的应用: 说明如何将语料库用于训练评价分析模型。 持续维护与更新机制: 建立语料库的长期维护与迭代计划。 五、 本书的独特性与价值 《汉英评价意义分析手册——评价语料库的语料处理原则与研制方案》的独特性在于其高度的聚焦性与实践性。它没有回避评价语言研究中的核心难点——语料的获取与处理,而是将其作为研究的出发点和落脚点。 理论与实践的完美结合: 本书不仅提供了坚实的理论基础(语料处理原则),更给出了切实可行的操作指南(研制方案)。读者可以从中找到理论依据,也能照章办事,完成语料库的构建。 汉英双语视角的突出: 针对汉英两种语言的特性,本书特别关注了跨语言语料库的构建与处理,为开展中西方文化背景下的评价语言对比研究提供了宝贵的资源和方法。 面向未来的前瞻性: 随着自然语言处理技术的飞速发展,高质量语料库的重要性愈发凸显。本书所提出的原则与方案,不仅适用于当前的研究需求,也为未来评价语言研究的发展奠定了坚实基础。 六、 结语:开启评价语言研究的新篇章 评价语言的研究具有广阔的应用前景,从智能客服的语义理解,到舆情监测的精准分析,再到跨文化交际的有效沟通,都离不开对评价语言的深入洞察。本书的出版,恰逢其时,它为致力于评价语言研究的学者、学生以及相关领域的研究人员提供了一把开启知识宝库的钥匙。 通过掌握本书所阐述的语料处理原则与研制方案,研究者们将能够系统、规范地构建属于自己的评价语料库,为后续深入的评价意义分析奠定坚实的基础。这不仅能够提升研究的效率与质量,更能推动评价语言学研究在理论与应用层面迈向新的高度。本书的价值,在于它赋能了研究者,让他们能够更有效地探索和理解人类语言中那无处不在、至关重要的“评价”维度。

用户评价

评分

对于我这种需要经常撰写项目结案报告,并且需要引用和对比大量用户反馈或专家评论的人来说,这本书提供的方法论框架比具体的数据案例本身更有启发性。我最感兴趣的是它关于“语料清洗和标注规范”的章节,这部分内容详实得近乎苛刻。它不仅仅是告诉你用哪个软件,而是探讨了在不同的标注员之间如何达成一致性(Inter-annotator Agreement),以及当出现意见分歧时,如何进行有效的仲裁和记录。这部分内容读起来,就像是偷窥了一场顶级的语言学“质检大会”。它揭示了一个残酷的现实:再精妙的算法,如果喂给它的数据是混乱或带有偏见的,最终的输出也必然是不可信的。因此,这本书的价值在于它将焦点拉回到最基础,也最容易被忽略的“输入质量”上来,这种对基础工程的重视,在浮躁的学术界中是难能可贵的。

评分

这本书带给我的整体感受,更像是一部“大型协作项目的工作纪实录”,而不是一本单纯的教科书。它充满了“我们团队是如何克服XXX挑战的”的叙事痕迹,这使得原本可能冰冷的研制过程变得生动起来。我尤其喜欢其中穿插的若干个“案例分析点”,这些点像是真实的项目拐点,记录了研究团队在面对真实语料时的困惑、争论和最终的决策。比如,他们如何决定将一个通常被认为是中性的词汇,在特定语境下标注为轻微的正面评价,这个决策过程的讨论极其引人入胜。它不是一个单向的结论,而是一个多方博弈后的最优解。这种透明化的决策记录,极大地提升了本书的实践指导意义,让读者在学习其方案时,也能学会如何在其未来的工作中,应对那些没有标准答案的灰色地带。

评分

我最近一直在跟进一些跨文化交际和翻译质量评估的项目,市面上能找到的相关资源大多集中在单一语种的语料库构建上,很少有像这样专门针对汉英评价语义的系统性梳理。这本书的价值,恰恰在于它直面了两种语言在表达褒贬态度时的文化差异和结构差异。举个例子,中文里很多时候会使用非常含蓄的、甚至带有双关意味的词汇来表达轻微的不满或赞扬,这些在直译成英文时,往往会损失掉原有的力度和色彩。这本书似乎预见了这种挑战,并在构建语料库时,特别强调了“语用对等”而非单纯的“词义对等”。我特别欣赏其中关于“评价强度量化”的部分,作者们似乎引入了一种多维度的打分机制,试图超越简单的正负二元对立,去捕捉评价的细微梯度。这对于需要进行大规模、自动化评估的系统来说,无疑提供了极具参考性的操作蓝本,让原本模糊的“感受”有了一套可操作的衡量标准。

评分

这部书的封皮设计给我一种强烈的专业感,但坦白说,刚翻开目录时,我心里还是有点打鼓的。毕竟“评价语料库”这个概念本身就带着一种学术的距离感,而“语料处理原则与研制方案”听起来更是枯燥的指南手册。我原以为这会是一本堆砌着冷冰冰的技术术语和流程图的工具书,适合那些已经在语言学领域深耕多年的专家学者翻阅。然而,当我真正沉下心来阅读其中的章节时,才发现作者显然在努力搭建一座连接理论与实践的桥梁。他们没有满足于仅仅罗列标准,而是深入探讨了在汉英对比评价语境下,如何界定和提取那些微妙的、具有倾向性的语言表达。例如,书中对“积极”和“消极”评价的边界划分,以及如何处理那些模棱两可的、需要依赖上下文才能确定的语句,都有非常细致的剖析。这种对细节的执着,让我这个并非纯粹的语言学背景的读者,也能感受到其背后庞大的系统工程和严谨的逻辑支撑。它不仅仅是告诉你“该怎么做”,更是告诉你“为什么要这样做”,这才是让一本技术性书籍拥有生命力的关键所在。

评分

如果说有什么地方让我感到略有不适,那可能就是某些章节在深入探讨特定语境下的语料提取逻辑时,文字略显晦涩,需要反复阅读才能完全消化其背后的逻辑推导。当然,这或许是领域专业性的必然产物,但对于渴望快速入门的读者来说,这道门槛设置得有点高。不过,一旦跨过去了,收获是巨大的。特别是关于“负面评价的结构化分解”,作者们似乎建立了一个非常精密的树状结构图,将一个复杂的负面评论(比如关于产品性能的不满)拆解成若干个可独立评估的小单元,比如“性能-速度”、“性能-稳定性”、“设计-美观”等。这种细致入微的拆解工作,对于后续开发基于评价的知识图谱或者情感分析模型来说,无疑是提供了最高质量的“原材料”。它体现了一种“工匠精神”,将原本模糊的语言现象,通过系统性的分解,转化为可计算、可比较的结构化数据。

评分

一如既往的好,赞一个!一如既往的好,赞一个!

评分

一如既往的好,赞一个!一如既往的好,赞一个!

评分

一如既往的好,赞一个!一如既往的好,赞一个!

评分

自己用的书

评分

自己用的书

评分

自己用的书

评分

一如既往的好,赞一个!一如既往的好,赞一个!

评分

自己用的书

评分

自己用的书

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有