产品特色
编辑推荐
1.这是一本由设计专家呈现自己17年经验的语音界面设计经典!!
2.这是由阿里资深设计师倾情翻译的语音界面设计经典!!
3.这是阿里巴巴国际UED负责人傅利民、Designaffairs合伙人小猴科技创始人兼CEO刘力丹、同济大学设计创意学院副院长孙效华、物灵科技CEO前百度少帅顾嘉唯倾情作序力荐的语音界面设计经典!!
内容简介
《语音用户界面设计:对话式体验设计原则》是一本由拥有17年从业经验的资深语音用户界面设计(VUI)系统设计专家CathyPearl撰写的语音设计经典,从VUI系统简史开始讲述,包括了语音用户界面设计的基本原则,VUI系统设计中必不可少的人物模型设计,还包括一些语音用户界面设计的进阶知识,如语音识别技术,自然语言理解、情感分析、数据收集和文本语音转换策略等,另外还介绍了语音界面用户测试的知识,以及VUI在投入实际使用后需要注意的地方,特别提到了包括家庭助理设备和可穿戴设备等如何设计VUI系统。
作者简介
Cathy Pearl,Sensely 用户体验总监,为Sensely 创造了富有同理心和对话性的虚拟护士形象。在Nuance和微软任职期间,为银行、航空、医疗公司设计了多款VUI系统,也是福特SYNC系统的设计师。在沃尔沃任职期间,她创造的对话式 ipad app 使用户可以从 Esquire magazine的生活专栏作家获得建议,与圣诞老人聊天或者与脱口秀演员说笑。
王一行,设计师。设计领域涉及交互设计、智能硬件设计、工业设计。曾先后任职于百度、网易,目前就职于阿里,从事平台设计创新工作。关注设计与技术背后的人文思考,致力于使技术为人道服务的设计实践。
目录
第1 章 导语 1
1.1 语音用户界面(VUI)简史 1
1.2 对话式用户界面 7
1.3 VUI 设计师是什么 11
1.4 聊天机器人 11
1.5 本章小结 14
第2 章 语音用户界面基本设计原则 17
2.1 移动设备与 IVR 系统设计 17
2.2 对话式设计 21
2.3 设定用户期望 25
2.4 设计工具 28
2.5 确认策略 32
2.6 命令—控制模式和对话模式 41
2.7 对话式标识 50
2.8 异常处理 52
2.9 不要责怪用户 60
2.10 新手和专家用户 61
2.11 持续跟踪上下文 63
2.12 帮助和其他通用部分 68
2.13 延迟 72
2.14 消除歧义 74
2.15 设计文档 76
2.16 无障碍设计 78
2.17 本章小结 88
第3 章 人物模型、虚拟形象、演员和视频游戏 91
3.1 人物模型 92
3.2 我的VUI 应该做成可视化的吗 98
3.3 使用虚拟角色时不该做什么 99
3.4 使用虚拟角色(或预先录制的视频)时该怎么做 103
3.5 我什么时候该在VUI 中使用视频 111
3.6 视觉VUI——最佳实践 113
3.7 视觉反馈(无虚拟角色) 124
3.8 选择一个声音 128
3.9 虚拟角色的优点 128
3.10 虚拟角色的缺点 132
3.11 本章小结 136
第4 章 语音识别技术 139
4.1 选择语音识别引擎 139
4.2 语音打断 141
4.3 N-Best 列表 156
4.4 语音识别的挑战 158
4.5 数据隐私 165
4.6 本章小结 166
第5 章 语音用户界面设计进阶 167
5.1 不同类型的语音输入 169
5.2 消除歧义 175
5.3 处理否定 182
5.4 捕获意图和对象 183
5.5 对话管理 184
5.6 不要晾着用户不管 187
5.7 VUI 要显示识别到的信息吗 188
5.8 情感分析和情绪检测 190
5.9 文本转语音和预录语音 193
5.10 说话者确认 197
5.11 “唤醒”词 199
5.12 语境 200
5.13 高级多模态交互 201
5.14 自助数据集 202
5.15 高级自然语言理解(NLU) 204
5.16 本章小结 209
第6 章 语音用户界面的用户测试 211
6.1 VUI 用户测试的特殊考虑因素 211
6.2 用户及用例背景研究 212
6.3 为真实用户设计研究方案 214
6.4 早期测试 226
6.5 可用性测试 233
6.6 衡量测试结果 239
6.7 下一步计划 240
6.8 测试汽车、硬件设备和机器人的VUI 系统 241
6.9 本章小结 244
第7 章 完成VUI 后,下一步该做什么 247
7.1 预发布测试 248
7.2 效果评估 252
7.3 日志 264
7.4 转录 266
7.5 发布阶段 268
7.6 调研 269
7.7 分析 270
7.8 工具 275
7.9 本章小结 278
第8 章 带语音功能的设备和汽车 279
8.1 设备 279
8.2 汽车和无人驾驶车辆 295
8.3 本章小结 308
后记 309
附录 书中提到的产品 311
精彩书摘
《语音用户界面设计:对话式体验设计原则》:
另一个使用热词的场景是,用户需要在对话中先暂停并完成一项操作。这种一般发生在用户需要去找一些物品来回答问题的时候,比如在续订处方的过程中,用户需要去拿一个药瓶来确认处方编号。此时系统问:“你需要一些时间来确认处方编号吗?”如果用户说“是的”,系统会提示用户在找到后说句“我回来了”或者“继续”。这也就相当于暂停了对话。
对于那些不仅仅依赖于语音的VUI系统,不建议经常使用打断功能。比如,如果你的VUI使用了预先录制的视频,就不应该使用打断功能。因为被打断时,预先录制的视频很难处理。难道视频应该突然停止吗?之后要从刚才停止的地方重新开始播放吗?当你的VUI系统有一个虚拟形象或者预先录制的视频时,它的体验会更像和一个真人进行交谈,用户往往会更有礼貌,并耐心等待系统把话说完。当虚拟形象或预录视频说话时,用户可能也在说话(与别人交谈),显然此时用户并不需要虚拟形象听自己说话。如果你的系统没有启用打断功能,请不要强制用户收听很长的列表或菜单,而应该把事情分成更多的步骤,并依靠可视化的列表来减轻认知负担。
……
前言/序言
推荐序一
我在用半语音、半打字的模式写下这段文字时,联想到语音用户界面的发展与互联网技术的发展非常类似。
在互联网时代来临之前,用户界面是以Windows为主的GUI,当用户需要工作、娱乐和游戏的时候,就购买相应的软件,安装后才可以使用。当时大部分的设计和研究方法都集中在独立程序上。大概在1998年,拨号上网时代结束,Web浏览器在功能上的完善让大家的眼光开始关注到互联网上,那时Amazon刚刚有了百万用户,WebVan和Pets.com正在蓬勃发展(这两款应用目前均已消失)。各种产品开始转向互联网,因为Web浏览器可以穿透各个程序,方便地把各种各样的内容和功能都呈现在前端页面上。之后,互联网给整个IT行业带来了深刻的变化,独立程序渐渐消失,取而代之的是在浏览器界面中的应用。
到了移动互联网的时代,一轮新的程序开发又开始了。App像雨后春笋一样涌现出来,满足用户在娱乐、游戏、工作等各个方面的需求,由于移动屏幕尺寸和网络速度的限制,单单使用一个简单的移动浏览器不能解决所有的问题。
语音和当年的浏览器一样,是一个可以穿透所有程序、解决用户所有问题的方法。当需要叫车服务的时候,我并不在乎是哪个软件在叫车,最好的情况是语音发出后,通过各个应用的比较,找出一个最佳的路线,并且最符合我使用习惯的叫车方案。语音是人类古老和自然的交互方式,在人工智能发展到可以部分理解语音的时候,语音时代开启了。语音除了在娱乐、游戏、工作上有广泛应用,还会广泛应用在IoT上。越来越多的设计师的工作会涉及语音界面设计。这本书的作者Pearl把自己17年的工作经验总结出来,介绍了语音界面的设计原则、语音识别技术、自然语言理解、语音用户研究方法,以及语音在设备上的应用。理论和实践相结合,非常实用!
这本书是天猫精灵设计团队的参考书之一,在使用过程中发现这本书非常有用,因此我们的设计师一行花时间把整本书翻译成中文分享给大家。
PaulFu
Sr.Director,UserExperience,AlibabaGroup
推荐序二
一行嘱我为他翻译的书写序,还没有看过是什么,我便欣然同意了。一行曾是我的学生。学生时代的一行就成熟得不像他的年龄。在初期时我对他说,“小心技术过于成熟而落入俗套。”事实证明我是错的。一行最大的特点是冷静并特立独行。每次问他问题,他先是沉默,想好后可以很缜密地回答,往往挑不出什么漏洞。基于这样的经验,之后的合作我便选择完全地相信他。所以我想一行精心挑选翻译的书籍,一定不会差。
一行陆续给我寄了原稿和翻译稿,我读后有一些感想:交互方式正从单纯的视觉、硬件交互转化为多感官综合的交互。每一次技术的变革都带来交互上的巨大挑战。“与机器像和人一样对话”,VUI不是一次升级,而是一个完全不同的新世界。这个世界正在来临,但又还有很多未知;这个全新的体验正呼之欲出,等待人们去定义。
VUI感性层面的需求比视觉交互和硬件交互更为复杂。除了合理的逻辑之外,场景、对话的上下文关联、角色的设定、语境的感知等都对用户体验起到了重要的作用。VUI像是给机器赋予一个新的性格。在这个领域也将产生不同的人才需求。最近遇见Dyson的设计师,他称自己为工程师,并解释他自己也不知道自己是什么样的定义,只知道伴随了产品整个的研发流程。在VUI领域,同时需要被打破的职业界限,需要更多元的职业类型介入去共同定义。他们可能是设计师,是开发者,是语言学家,是心理学家,是剧作家,等等。
最近我买了AmazonEcho,女儿每天早上向Echo问好。Echo没有屏幕,环转的灯光非常友好地展示了拟人化的倾听。我意识到VUI已经来了,它很聪明,但是又还很鲁莽;它让人兴奋,但又时时给人带来与机器对话的挫败感受。哪怕产品很智能,一个不好的VUI就像是一个聪明人无法倾听和表达一样无奈。在这个技术与设计并行发展的进程中,VUI还处在一个很早期的状态,会有很多令人困扰的问题:怎样的设计流程可以支持这个新的领域?VUI和屏幕交互是什么样的关系?什么样的场景最为适合?机器需要有什么样的性格?如何管理用户的期望值?如何弥补对话中带来的挫败体验?交互过程中的情感感受将会怎样?
VUI领域还没有太多的经验可以参考,设计教育界也还没有做好足够的应对,而这是一本来得如此及时的、难得的、实用的工具书。一行告诉我,书的内容只是一个开始,希望读者通过此书能开启一个全新的思考。
刘力丹
designaffairs合伙人、小猴科技创始人兼CEO
推荐序三
从软件工程转到工业设计专业,现在又在从事交互设计的工作,王一行一直是一个在自己喜欢的方向上执着钻研、追求完美的学生和设计师。当以往的学霸和红点得主来找我为他的译著写序时,我很是欣喜。非常钦佩一行哥(同学中的昵称)在阿里繁忙的工作之余还能挤出时间来学习新知识,并有心布道语音交互界面设计这一交互设计的新成员。
作为一种自然人机交互方式,语音交互由来以久,近年来更是被运用到了越来越多的产品之中,如从手机到智能产品、智能家居,从机器人到车载HMI。然而对语音交互的设计方法、流程,以及对其特有的设计问题的研究却非常匮乏。15年前在IBMT.J.Watson参与基于对话的语音交互系统的研究与应用实践,到现在进行多模态车载HMI的设计中,我大都是把语音交互作为交互系统中的一个重要元素加以运用。本书将语音交互作为一个与视觉交互界面(GUI)并列的界面类型,对其设计进行系统地分析、研究与实践指导,视角新颖,为对语音交互设计的深入研究打开了一片天地。相信一行精准到位的翻译可以将大家完美地带入这一交互设计的新领地。
孙效华
博士、教授、博士研究生导师
同济大学设计创意学院副院长,交互设计方向负责人
数字创意中心负责人
推荐序四
当很多人正在热议AI究竟是会帮助人类还是毁灭人类的时候,人工智能的浪潮正在悄然颠覆着我们生活的一点一滴。而基于CUI(ConversationalUserInterface,对话式用户界面)的智能产品,就好像是冲在AI浪潮最前沿的浪花,将隐藏其身下的算法和数据幻化成最能“直接拍打在用户皮肤上”的体验。作为一个新生的领域,VUI(VoiceUserInterface,语音用户交互界面)对于用户体验设计提出了更多语言学、情感塑造、逻辑搭建等方面的新要求,于是这样一本专业、全面的VUI设计指南的出现,就更显得弥足珍贵。
我在第一时间就和我的团队一起精读了英文原版,受益匪浅,相信中文译本的出版一定会帮助更多的共同前行的伙伴,受邀作序,备感荣幸。
就在我敲下这些文字的时候,大多数行业从业者都激进地把人工智能在人类历史上的重要性堪比、甚至远超过工业革命,很多人正担忧人工智能即将陆续取代一些职业并改造我们的社会化分工。我认为有一点是毫无疑问的,这是一个不可避免的智能时代,作为新生产工具的AI,除了在限定技术边界的垂直行业应用领域,各行各业都有机会被AI力收割“lowhangingfruits”来迅速提升各类生产效率,将对人类文明和产业变革产生重大影响。
回顾过去,机械设备的出现为人类带来了提升效能的工具,互联网的出现,将效能再次提升,而伴随着AI的出现,效能将进一步大规模提升。不可避免地说,在智能时代,大量重复性工作的人力工种肯定不复存在,还有很多具有结构化知识的经验性工作也会被机器智能所取代,甚至未来是创造性工作,但是更多的是通过为人赋能的方式,减轻社会劳动者和服务业的压力,将会重新进行一轮人类社会化分工。
在互联网时代,“连接”是核心关键词,如果C不能满足A和B的完整需求,那互联网有机会让A通过连接,跨过B和C直接找到D,但如果在一些场景和行业内B/C/D是稀缺性资源,那么这个情况在互联网时代就很难得到解决,AI的出现将有机会扭转这种供需关系。举例来说,以前用户看病花在预约和挂号的时间基本占到95%,真正用于医患有效沟通和问诊时间仅为5%。人工智能将代替以往所谓“互联网医疗”盲目且低效的连接,如VUI/CUI初诊问答机器人将患者进行分流,缩短医师护士等在预约和问询过程低效的重复时间,改善供需方的不对等关系。
大家都知道过去60年里人工智能经历了两次潮起潮落。现在我把这次AI的兴起,分为新AI时代的头十年和后十年。前十年是AI解决行业问题,比如前面讲的医疗、教育、信贷和金融风控等,通过大数据和机器学习迅速提升效率和准确率;新AI时代的后十年,机器智能将全面升级消费产品和用户生活场景,人工智能必将革新交互方式,进入计算无处不在的时代。下一代人机交互革命就在眼前,这将是一个激动人心的时代,就好比百年前蒸汽机、汽车、飞机等伟大产品的发明一样,如今将会出现大量被重新定义的智能产品,无人驾驶车、智能家居、家用机器人、下一个时代的个人助理等。当马车被汽车替代的时候,人们是措手不及的,同样的,AI时代的创新家们已经蓄势待发准备重新发明和改造今天陈旧的生活方式了。
我觉得赋能是人工智能对人类最重要的事情,因为这是人类进化需求的本质。人都渴望被赋能,这是天性。人发明蒸汽机、汽车、飞机、手机、计算机,从运动能力和生产效率等方面突破自身局限。大部分人沉迷于游戏,是因为在游戏中感受到自己被赋予了更大的权利和能力。这些都是顺应人性的事情,我觉得VUI最有价值的场景应用就是在人机交互过程中产生的便利性赋能。
无论是从云端到边缘在下一代硬件架构的变化,还是深度学习算法在图像识别和语音识别的单项上逐渐超过人类水平,AI的技术成熟度还在不断提升和进化过程,但是今天语音对话交互技术的发展尚还没有成熟到可以替代鼠标键盘和触摸屏。不过现阶段已经可以应用在一些特定场景下,比如用户双手不便下达快速指令、智能电视或者智能音箱上的跳步检索某一首歌或者某一个电影关键词,又或是实时机器翻译。但可以肯定的是,未来无处不在的
AI技术,必将带来交互的革命,颠覆的机会,也将属于那些极少数懂得技术边界、极具场景化思维、勇于革新的创新家们。
2016年,我和志同道合的小伙伴们一起创立了“物灵”。在工具化大工业产品思维主导的今天,我们希望去开辟另外一条路径,去创造人机共生的灵性世界。我们认为,人和产品的关系,在这个万物智能的时代,正在发生着巨大革新。我们经历了电器设备旋钮时代、键盘鼠标时代、触屏智能机时代,而现在万物智能时代的到来,很快就会将我们从鼠标键盘和低头点手机平板的触摸屏上解放出来,机器与人的交互会从不平等的单向被动模式转变为逐渐平等双向的多模态主动模式。而语音交互正是这个过程的第一步。我们认为这种互动模式的本质就是“关系”。我们把这种“基于关系的交互方式”称作RelationshipUI。物灵想要做的“智能/关系式交互”产品,不单单是计算机视觉、自然语言理解、深度学习、大数据等这些正在不断突破的AI技术的集合体,更加是一个让用户能体验到生命感,产生依赖,寄托情感的“灵物”。这本书里提到的Jibo机器人,正是RelationshipUI的一个很好的例子。我作为Jibo的董事长,物灵作为Jibo在中国的独家合作伙伴,我们和MIT的CynthiaBreazeal的团队也正在一起努力把这个可爱的小“灵物”带给中国的消费者。
当语音交互、智能匹配和个性化推送成为新一代用户的主流交互方式的时候,苹果构筑的那个以一个个各自为阵的App为核心的生态才能再一次瓦解——从移动互联到智能物联的转变,我们将经历ContextualUI取代SelectiveUI的产品形态。
而想要真正构建好这种产品和用户之间的“关系”,VUI无疑是最重要也是最自然的交互通道之一。在创业初期,我们的VUI团队一直在摸索如何设计对话内容和逻辑,创造Character,优化体验。不同于传统的GUI,由于缺乏系统性的指导和总结,我和团队做了很多的尝试,也走了很多的弯路。这本书的出现很好地帮助我们理清了VUI相关的基本框架和设计规则,而其中的很多观点,也和团队在实践过程中得到的经验有很好的切合。对每一个想要从事VUI相关领域的UX设计师、语言学家甚至工程师,这本书都能起到启蒙和指南的作用。
从我前面提到的AI前后十年的说法来看,当下我们所处的弱AI结合强产品的时代,还是有机会通过产品矩阵来形成现象级产品的,而这时正需要懂AI技术边界的设计师和产品人,来重新思考和设计使用场景。甚至都不是“寻找”应用场景了,而是要去“发明”应用场景的时代。创造出伟大的产品,在工程师把技术基础打造得差不多时,还是需要设计师、心理学家、社会学家等,去创造和拓展用户交互场景的疆界。
我们团队的一大常规团队建设内容就是一起重温那些经典的科幻电影,吸收灵感,也感叹原本只存在科幻电影里的人工智能,在这短短的几年就已经走进了我们的生活,甚至我们的现实已经在很多的场景下超越了科幻电影的设定。而我们深知,这短短几年AI爆发的背后,是几十年同行者在不同基础领域的不断积累,是像本书作者CathyPearl这样将近20年专注于VUI的探索和实践并著书立说、开放分享的精神。既然我们正在进入一
语音用户界面设计:对话式体验设计原则 电子书 下载 mobi epub pdf txt