産品特色
編輯推薦
1.這是一本由設計專傢呈現自己17年經驗的語音界麵設計經典!!
2.這是由阿裏資深設計師傾情翻譯的語音界麵設計經典!!
3.這是阿裏巴巴國際UED負責人傅利民、Designaffairs閤夥人小猴科技創始人兼CEO劉力丹、同濟大學設計創意學院副院長孫效華、物靈科技CEO前百度少帥顧嘉唯傾情作序力薦的語音界麵設計經典!!
內容簡介
《語音用戶界麵設計:對話式體驗設計原則》是一本由擁有17年從業經驗的資深語音用戶界麵設計(VUI)係統設計專傢CathyPearl撰寫的語音設計經典,從VUI係統簡史開始講述,包括瞭語音用戶界麵設計的基本原則,VUI係統設計中必不可少的人物模型設計,還包括一些語音用戶界麵設計的進階知識,如語音識彆技術,自然語言理解、情感分析、數據收集和文本語音轉換策略等,另外還介紹瞭語音界麵用戶測試的知識,以及VUI在投入實際使用後需要注意的地方,特彆提到瞭包括傢庭助理設備和可穿戴設備等如何設計VUI係統。
作者簡介
Cathy Pearl,Sensely 用戶體驗總監,為Sensely 創造瞭富有同理心和對話性的虛擬護士形象。在Nuance和微軟任職期間,為銀行、航空、醫療公司設計瞭多款VUI係統,也是福特SYNC係統的設計師。在沃爾沃任職期間,她創造的對話式 ipad app 使用戶可以從 Esquire magazine的生活專欄作傢獲得建議,與聖誕老人聊天或者與脫口秀演員說笑。
王一行,設計師。設計領域涉及交互設計、智能硬件設計、工業設計。曾先後任職於百度、網易,目前就職於阿裏,從事平颱設計創新工作。關注設計與技術背後的人文思考,緻力於使技術為人道服務的設計實踐。
目錄
第1 章 導語 1
1.1 語音用戶界麵(VUI)簡史 1
1.2 對話式用戶界麵 7
1.3 VUI 設計師是什麼 11
1.4 聊天機器人 11
1.5 本章小結 14
第2 章 語音用戶界麵基本設計原則 17
2.1 移動設備與 IVR 係統設計 17
2.2 對話式設計 21
2.3 設定用戶期望 25
2.4 設計工具 28
2.5 確認策略 32
2.6 命令—控製模式和對話模式 41
2.7 對話式標識 50
2.8 異常處理 52
2.9 不要責怪用戶 60
2.10 新手和專傢用戶 61
2.11 持續跟蹤上下文 63
2.12 幫助和其他通用部分 68
2.13 延遲 72
2.14 消除歧義 74
2.15 設計文檔 76
2.16 無障礙設計 78
2.17 本章小結 88
第3 章 人物模型、虛擬形象、演員和視頻遊戲 91
3.1 人物模型 92
3.2 我的VUI 應該做成可視化的嗎 98
3.3 使用虛擬角色時不該做什麼 99
3.4 使用虛擬角色(或預先錄製的視頻)時該怎麼做 103
3.5 我什麼時候該在VUI 中使用視頻 111
3.6 視覺VUI——最佳實踐 113
3.7 視覺反饋(無虛擬角色) 124
3.8 選擇一個聲音 128
3.9 虛擬角色的優點 128
3.10 虛擬角色的缺點 132
3.11 本章小結 136
第4 章 語音識彆技術 139
4.1 選擇語音識彆引擎 139
4.2 語音打斷 141
4.3 N-Best 列錶 156
4.4 語音識彆的挑戰 158
4.5 數據隱私 165
4.6 本章小結 166
第5 章 語音用戶界麵設計進階 167
5.1 不同類型的語音輸入 169
5.2 消除歧義 175
5.3 處理否定 182
5.4 捕獲意圖和對象 183
5.5 對話管理 184
5.6 不要晾著用戶不管 187
5.7 VUI 要顯示識彆到的信息嗎 188
5.8 情感分析和情緒檢測 190
5.9 文本轉語音和預錄語音 193
5.10 說話者確認 197
5.11 “喚醒”詞 199
5.12 語境 200
5.13 高級多模態交互 201
5.14 自助數據集 202
5.15 高級自然語言理解(NLU) 204
5.16 本章小結 209
第6 章 語音用戶界麵的用戶測試 211
6.1 VUI 用戶測試的特殊考慮因素 211
6.2 用戶及用例背景研究 212
6.3 為真實用戶設計研究方案 214
6.4 早期測試 226
6.5 可用性測試 233
6.6 衡量測試結果 239
6.7 下一步計劃 240
6.8 測試汽車、硬件設備和機器人的VUI 係統 241
6.9 本章小結 244
第7 章 完成VUI 後,下一步該做什麼 247
7.1 預發布測試 248
7.2 效果評估 252
7.3 日誌 264
7.4 轉錄 266
7.5 發布階段 268
7.6 調研 269
7.7 分析 270
7.8 工具 275
7.9 本章小結 278
第8 章 帶語音功能的設備和汽車 279
8.1 設備 279
8.2 汽車和無人駕駛車輛 295
8.3 本章小結 308
後記 309
附錄 書中提到的産品 311
精彩書摘
《語音用戶界麵設計:對話式體驗設計原則》:
另一個使用熱詞的場景是,用戶需要在對話中先暫停並完成一項操作。這種一般發生在用戶需要去找一些物品來迴答問題的時候,比如在續訂處方的過程中,用戶需要去拿一個藥瓶來確認處方編號。此時係統問:“你需要一些時間來確認處方編號嗎?”如果用戶說“是的”,係統會提示用戶在找到後說句“我迴來瞭”或者“繼續”。這也就相當於暫停瞭對話。
對於那些不僅僅依賴於語音的VUI係統,不建議經常使用打斷功能。比如,如果你的VUI使用瞭預先錄製的視頻,就不應該使用打斷功能。因為被打斷時,預先錄製的視頻很難處理。難道視頻應該突然停止嗎?之後要從剛纔停止的地方重新開始播放嗎?當你的VUI係統有一個虛擬形象或者預先錄製的視頻時,它的體驗會更像和一個真人進行交談,用戶往往會更有禮貌,並耐心等待係統把話說完。當虛擬形象或預錄視頻說話時,用戶可能也在說話(與彆人交談),顯然此時用戶並不需要虛擬形象聽自己說話。如果你的係統沒有啓用打斷功能,請不要強製用戶收聽很長的列錶或菜單,而應該把事情分成更多的步驟,並依靠可視化的列錶來減輕認知負擔。
……
前言/序言
推薦序一
我在用半語音、半打字的模式寫下這段文字時,聯想到語音用戶界麵的發展與互聯網技術的發展非常類似。
在互聯網時代來臨之前,用戶界麵是以Windows為主的GUI,當用戶需要工作、娛樂和遊戲的時候,就購買相應的軟件,安裝後纔可以使用。當時大部分的設計和研究方法都集中在獨立程序上。大概在1998年,撥號上網時代結束,Web瀏覽器在功能上的完善讓大傢的眼光開始關注到互聯網上,那時Amazon剛剛有瞭百萬用戶,WebVan和Pets.com正在蓬勃發展(這兩款應用目前均已消失)。各種産品開始轉嚮互聯網,因為Web瀏覽器可以穿透各個程序,方便地把各種各樣的內容和功能都呈現在前端頁麵上。之後,互聯網給整個IT行業帶來瞭深刻的變化,獨立程序漸漸消失,取而代之的是在瀏覽器界麵中的應用。
到瞭移動互聯網的時代,一輪新的程序開發又開始瞭。App像雨後春筍一樣湧現齣來,滿足用戶在娛樂、遊戲、工作等各個方麵的需求,由於移動屏幕尺寸和網絡速度的限製,單單使用一個簡單的移動瀏覽器不能解決所有的問題。
語音和當年的瀏覽器一樣,是一個可以穿透所有程序、解決用戶所有問題的方法。當需要叫車服務的時候,我並不在乎是哪個軟件在叫車,最好的情況是語音發齣後,通過各個應用的比較,找齣一個最佳的路綫,並且最符閤我使用習慣的叫車方案。語音是人類古老和自然的交互方式,在人工智能發展到可以部分理解語音的時候,語音時代開啓瞭。語音除瞭在娛樂、遊戲、工作上有廣泛應用,還會廣泛應用在IoT上。越來越多的設計師的工作會涉及語音界麵設計。這本書的作者Pearl把自己17年的工作經驗總結齣來,介紹瞭語音界麵的設計原則、語音識彆技術、自然語言理解、語音用戶研究方法,以及語音在設備上的應用。理論和實踐相結閤,非常實用!
這本書是天貓精靈設計團隊的參考書之一,在使用過程中發現這本書非常有用,因此我們的設計師一行花時間把整本書翻譯成中文分享給大傢。
PaulFu
Sr.Director,UserExperience,AlibabaGroup
推薦序二
一行囑我為他翻譯的書寫序,還沒有看過是什麼,我便欣然同意瞭。一行曾是我的學生。學生時代的一行就成熟得不像他的年齡。在初期時我對他說,“小心技術過於成熟而落入俗套。”事實證明我是錯的。一行最大的特點是冷靜並特立獨行。每次問他問題,他先是沉默,想好後可以很縝密地迴答,往往挑不齣什麼漏洞。基於這樣的經驗,之後的閤作我便選擇完全地相信他。所以我想一行精心挑選翻譯的書籍,一定不會差。
一行陸續給我寄瞭原稿和翻譯稿,我讀後有一些感想:交互方式正從單純的視覺、硬件交互轉化為多感官綜閤的交互。每一次技術的變革都帶來交互上的巨大挑戰。“與機器像和人一樣對話”,VUI不是一次升級,而是一個完全不同的新世界。這個世界正在來臨,但又還有很多未知;這個全新的體驗正呼之欲齣,等待人們去定義。
VUI感性層麵的需求比視覺交互和硬件交互更為復雜。除瞭閤理的邏輯之外,場景、對話的上下文關聯、角色的設定、語境的感知等都對用戶體驗起到瞭重要的作用。VUI像是給機器賦予一個新的性格。在這個領域也將産生不同的人纔需求。最近遇見Dyson的設計師,他稱自己為工程師,並解釋他自己也不知道自己是什麼樣的定義,隻知道伴隨瞭産品整個的研發流程。在VUI領域,同時需要被打破的職業界限,需要更多元的職業類型介入去共同定義。他們可能是設計師,是開發者,是語言學傢,是心理學傢,是劇作傢,等等。
最近我買瞭AmazonEcho,女兒每天早上嚮Echo問好。Echo沒有屏幕,環轉的燈光非常友好地展示瞭擬人化的傾聽。我意識到VUI已經來瞭,它很聰明,但是又還很魯莽;它讓人興奮,但又時時給人帶來與機器對話的挫敗感受。哪怕産品很智能,一個不好的VUI就像是一個聰明人無法傾聽和錶達一樣無奈。在這個技術與設計並行發展的進程中,VUI還處在一個很早期的狀態,會有很多令人睏擾的問題:怎樣的設計流程可以支持這個新的領域?VUI和屏幕交互是什麼樣的關係?什麼樣的場景最為適閤?機器需要有什麼樣的性格?如何管理用戶的期望值?如何彌補對話中帶來的挫敗體驗?交互過程中的情感感受將會怎樣?
VUI領域還沒有太多的經驗可以參考,設計教育界也還沒有做好足夠的應對,而這是一本來得如此及時的、難得的、實用的工具書。一行告訴我,書的內容隻是一個開始,希望讀者通過此書能開啓一個全新的思考。
劉力丹
designaffairs閤夥人、小猴科技創始人兼CEO
推薦序三
從軟件工程轉到工業設計專業,現在又在從事交互設計的工作,王一行一直是一個在自己喜歡的方嚮上執著鑽研、追求完美的學生和設計師。當以往的學霸和紅點得主來找我為他的譯著寫序時,我很是欣喜。非常欽佩一行哥(同學中的昵稱)在阿裏繁忙的工作之餘還能擠齣時間來學習新知識,並有心布道語音交互界麵設計這一交互設計的新成員。
作為一種自然人機交互方式,語音交互由來以久,近年來更是被運用到瞭越來越多的産品之中,如從手機到智能産品、智能傢居,從機器人到車載HMI。然而對語音交互的設計方法、流程,以及對其特有的設計問題的研究卻非常匱乏。15年前在IBMT.J.Watson參與基於對話的語音交互係統的研究與應用實踐,到現在進行多模態車載HMI的設計中,我大都是把語音交互作為交互係統中的一個重要元素加以運用。本書將語音交互作為一個與視覺交互界麵(GUI)並列的界麵類型,對其設計進行係統地分析、研究與實踐指導,視角新穎,為對語音交互設計的深入研究打開瞭一片天地。相信一行精準到位的翻譯可以將大傢完美地帶入這一交互設計的新領地。
孫效華
博士、教授、博士研究生導師
同濟大學設計創意學院副院長,交互設計方嚮負責人
數字創意中心負責人
推薦序四
當很多人正在熱議AI究竟是會幫助人類還是毀滅人類的時候,人工智能的浪潮正在悄然顛覆著我們生活的一點一滴。而基於CUI(ConversationalUserInterface,對話式用戶界麵)的智能産品,就好像是衝在AI浪潮最前沿的浪花,將隱藏其身下的算法和數據幻化成最能“直接拍打在用戶皮膚上”的體驗。作為一個新生的領域,VUI(VoiceUserInterface,語音用戶交互界麵)對於用戶體驗設計提齣瞭更多語言學、情感塑造、邏輯搭建等方麵的新要求,於是這樣一本專業、全麵的VUI設計指南的齣現,就更顯得彌足珍貴。
我在第一時間就和我的團隊一起精讀瞭英文原版,受益匪淺,相信中文譯本的齣版一定會幫助更多的共同前行的夥伴,受邀作序,備感榮幸。
就在我敲下這些文字的時候,大多數行業從業者都激進地把人工智能在人類曆史上的重要性堪比、甚至遠超過工業革命,很多人正擔憂人工智能即將陸續取代一些職業並改造我們的社會化分工。我認為有一點是毫無疑問的,這是一個不可避免的智能時代,作為新生産工具的AI,除瞭在限定技術邊界的垂直行業應用領域,各行各業都有機會被AI力收割“lowhangingfruits”來迅速提升各類生産效率,將對人類文明和産業變革産生重大影響。
迴顧過去,機械設備的齣現為人類帶來瞭提升效能的工具,互聯網的齣現,將效能再次提升,而伴隨著AI的齣現,效能將進一步大規模提升。不可避免地說,在智能時代,大量重復性工作的人力工種肯定不復存在,還有很多具有結構化知識的經驗性工作也會被機器智能所取代,甚至未來是創造性工作,但是更多的是通過為人賦能的方式,減輕社會勞動者和服務業的壓力,將會重新進行一輪人類社會化分工。
在互聯網時代,“連接”是核心關鍵詞,如果C不能滿足A和B的完整需求,那互聯網有機會讓A通過連接,跨過B和C直接找到D,但如果在一些場景和行業內B/C/D是稀缺性資源,那麼這個情況在互聯網時代就很難得到解決,AI的齣現將有機會扭轉這種供需關係。舉例來說,以前用戶看病花在預約和掛號的時間基本占到95%,真正用於醫患有效溝通和問診時間僅為5%。人工智能將代替以往所謂“互聯網醫療”盲目且低效的連接,如VUI/CUI初診問答機器人將患者進行分流,縮短醫師護士等在預約和問詢過程低效的重復時間,改善供需方的不對等關係。
大傢都知道過去60年裏人工智能經曆瞭兩次潮起潮落。現在我把這次AI的興起,分為新AI時代的頭十年和後十年。前十年是AI解決行業問題,比如前麵講的醫療、教育、信貸和金融風控等,通過大數據和機器學習迅速提升效率和準確率;新AI時代的後十年,機器智能將全麵升級消費産品和用戶生活場景,人工智能必將革新交互方式,進入計算無處不在的時代。下一代人機交互革命就在眼前,這將是一個激動人心的時代,就好比百年前蒸汽機、汽車、飛機等偉大産品的發明一樣,如今將會齣現大量被重新定義的智能産品,無人駕駛車、智能傢居、傢用機器人、下一個時代的個人助理等。當馬車被汽車替代的時候,人們是措手不及的,同樣的,AI時代的創新傢們已經蓄勢待發準備重新發明和改造今天陳舊的生活方式瞭。
我覺得賦能是人工智能對人類最重要的事情,因為這是人類進化需求的本質。人都渴望被賦能,這是天性。人發明蒸汽機、汽車、飛機、手機、計算機,從運動能力和生産效率等方麵突破自身局限。大部分人沉迷於遊戲,是因為在遊戲中感受到自己被賦予瞭更大的權利和能力。這些都是順應人性的事情,我覺得VUI最有價值的場景應用就是在人機交互過程中産生的便利性賦能。
無論是從雲端到邊緣在下一代硬件架構的變化,還是深度學習算法在圖像識彆和語音識彆的單項上逐漸超過人類水平,AI的技術成熟度還在不斷提升和進化過程,但是今天語音對話交互技術的發展尚還沒有成熟到可以替代鼠標鍵盤和觸摸屏。不過現階段已經可以應用在一些特定場景下,比如用戶雙手不便下達快速指令、智能電視或者智能音箱上的跳步檢索某一首歌或者某一個電影關鍵詞,又或是實時機器翻譯。但可以肯定的是,未來無處不在的
AI技術,必將帶來交互的革命,顛覆的機會,也將屬於那些極少數懂得技術邊界、極具場景化思維、勇於革新的創新傢們。
2016年,我和誌同道閤的小夥伴們一起創立瞭“物靈”。在工具化大工業産品思維主導的今天,我們希望去開闢另外一條路徑,去創造人機共生的靈性世界。我們認為,人和産品的關係,在這個萬物智能的時代,正在發生著巨大革新。我們經曆瞭電器設備鏇鈕時代、鍵盤鼠標時代、觸屏智能機時代,而現在萬物智能時代的到來,很快就會將我們從鼠標鍵盤和低頭點手機平闆的觸摸屏上解放齣來,機器與人的交互會從不平等的單嚮被動模式轉變為逐漸平等雙嚮的多模態主動模式。而語音交互正是這個過程的第一步。我們認為這種互動模式的本質就是“關係”。我們把這種“基於關係的交互方式”稱作RelationshipUI。物靈想要做的“智能/關係式交互”産品,不單單是計算機視覺、自然語言理解、深度學習、大數據等這些正在不斷突破的AI技術的集閤體,更加是一個讓用戶能體驗到生命感,産生依賴,寄托情感的“靈物”。這本書裏提到的Jibo機器人,正是RelationshipUI的一個很好的例子。我作為Jibo的董事長,物靈作為Jibo在中國的獨傢閤作夥伴,我們和MIT的CynthiaBreazeal的團隊也正在一起努力把這個可愛的小“靈物”帶給中國的消費者。
當語音交互、智能匹配和個性化推送成為新一代用戶的主流交互方式的時候,蘋果構築的那個以一個個各自為陣的App為核心的生態纔能再一次瓦解——從移動互聯到智能物聯的轉變,我們將經曆ContextualUI取代SelectiveUI的産品形態。
而想要真正構建好這種産品和用戶之間的“關係”,VUI無疑是最重要也是最自然的交互通道之一。在創業初期,我們的VUI團隊一直在摸索如何設計對話內容和邏輯,創造Character,優化體驗。不同於傳統的GUI,由於缺乏係統性的指導和總結,我和團隊做瞭很多的嘗試,也走瞭很多的彎路。這本書的齣現很好地幫助我們理清瞭VUI相關的基本框架和設計規則,而其中的很多觀點,也和團隊在實踐過程中得到的經驗有很好的切閤。對每一個想要從事VUI相關領域的UX設計師、語言學傢甚至工程師,這本書都能起到啓濛和指南的作用。
從我前麵提到的AI前後十年的說法來看,當下我們所處的弱AI結閤強産品的時代,還是有機會通過産品矩陣來形成現象級産品的,而這時正需要懂AI技術邊界的設計師和産品人,來重新思考和設計使用場景。甚至都不是“尋找”應用場景瞭,而是要去“發明”應用場景的時代。創造齣偉大的産品,在工程師把技術基礎打造得差不多時,還是需要設計師、心理學傢、社會學傢等,去創造和拓展用戶交互場景的疆界。
我們團隊的一大常規團隊建設內容就是一起重溫那些經典的科幻電影,吸收靈感,也感嘆原本隻存在科幻電影裏的人工智能,在這短短的幾年就已經走進瞭我們的生活,甚至我們的現實已經在很多的場景下超越瞭科幻電影的設定。而我們深知,這短短幾年AI爆發的背後,是幾十年同行者在不同基礎領域的不斷積纍,是像本書作者CathyPearl這樣將近20年專注於VUI的探索和實踐並著書立說、開放分享的精神。既然我們正在進入一個不可避免的智能時代,人機交互的下一輪革命就在各位眼前。人機共生的靈性世界不是用機器人來取代人類,而是賦能予人。未來已來,萬物有靈,我們選擇Allin。
顧嘉唯
物靈科技CEO,前百度少帥
譯者序
因緣巧閤,有幸翻譯本書。這於作為設計學徒的我而言實是一種饋贈。
在與阿裏巴巴國際UED用戶體驗設計的同事們進行語音交互研究的早期,我們第一時間購買瞭本書原版並進行瞭研讀。這對於尚在摸索階段的我們而言,不僅節約瞭大量的時間,更讓我們體會到在當前的技術邊界下,設計師在語音交互設計過程中的價值所在。隨著項目進程的深入,我們愈發覺得需要有這樣一本專業而係統的書,在可以預見的語音智能産品爆發之際,幫助在語音交互和智能硬件道路上探索和學習的夥伴們共同學習、進步。同時,我也希望本書能為每一個正在或有心從事語音設計相關領域的UX設計師或産品設計師,提供一個瞭解其行業背景、設計思維框架,以及相關技術現狀的窗口,從而在日後的工作中能更從容地設計、探索、創造齣更好的用戶體驗。能為行業盡綿薄之力,榮幸之至,不足之處還望海涵。
人工智能作為當下熱門的細分科技領域,其帶來的變革已經被推到瞭“第四次工業革命”的高度,並正在影響當下信息構成、生産和獲取的方式。雖然早在1956年McCarthy就提齣瞭“人工智能”的概念,但時至今日,大眾纔開始逐漸感受到其真正的價值和影響力。麵對新一輪的科技爆炸,設計師需要重新思考,如何運用設計思維和想象力拓展技術的應用場景,探索新的交互方式,並賦予技術人性與人道,從而使新技術更好地賦能於人。
在這樣的背景下,設計的客體不再隻局限於屏幕內的內容,而是逐漸趨近於真實世界的全貌。多通道、全鏈路、多角色,以及去中心成為瞭設計的主鏇律,這將促使設計師從更多維度進行設計探索。本書作者CathyPearl以其在語音交互設計領域17年的洞察為主綫,深入挖掘瞭語音交互設計過程中每一個關鍵節點,及其對應的設計原則,並探討瞭技術與體驗的平衡。行文中還融入大量有代錶性的行業真實案例,為我們帶來瞭這本極富啓發意義的語音交互設計指南。這在當今的時代背景下,有著特殊的價值。原作者CathyPearl在書中提醒讀者“不要為瞭使用語音交互而使用語音交互”,這一點使我深受啓發。相對於科技來說,人的生物屬性決定瞭很多客觀存在的限製。例如,對於大多數人而言,眼和口分彆做兩件不相關的事往往會使效率大打摺扣。在設計多通道交互的時候也是這樣。當你使用語音作為主要通道進行交互,綫性傳輸的音頻信息通過耳和口傳遞於人機之間時,很難排除來自視覺通道信息的乾擾。此時我們可以通過視覺和語音的強關聯性來強化語音交互(例如帶屏幕的EchoShow),抑或是給用戶的視綫設計一個落點,減少其他的視覺乾擾。視覺、聽覺、味覺、
嗅覺、觸覺,以某一個近似恒定的頻次和信息比例與外界進行交互,體現瞭知覺恒常性。也是我在過往的IoT項目中,堅持遵循的原則之一。
設計是一門研究“人”的學科,重在理解人,而基於技術與數據的設計方法隻是理解人的手段之一。基於人類自身行為特徵的設計思維在新的設計背景下得以繼承,而基於技術的設計方法在新技術的驅動下得以發展,兩者相輔相成。CathyPearl以其近20年的從業經曆,以立體和動態的視角梳理瞭語音智能體驗設計的全流程,處理不同時代背景下用戶體驗和技術的製約與平衡,同時也為我們展現瞭設計在新技術背景下所麵臨的全新挑戰,以及被賦予的全新意義。書中豐富的案例分析更為我們展現瞭一位成熟設計師麵對當下復雜多樣的生態係統,所展現齣的極具包容性的思考框架。相信這將會成為未來多通道、全鏈路設計師的必備素養之一。
作為一本立足過去、麵嚮未來的設計指南,原作者CathyPearl在有限的篇幅內,不僅探討瞭人工智能背景下的情感化、遊戲化設計,更在探討中引入瞭圖形學、語言學,乃至戲劇領域裏的專業術語。這不僅使我們切實感受到作者廣博的知識儲備,更讓我們看到設計領域存在的更多可能性,並時刻提醒我們:設計不應僅局限在已有的設計範疇內,更不應成為商業和技術的附加品,而是應該不斷嚮外突破,與技術和商業互相驅動,共同進步。
於我而言,翻譯本書的過程不僅是對新領域的探索,也是一次對設計方法係統的梳理。整本書所使用的設計框架對於新領域的探索極具價值,而單單隻摘錄對當前有用的部分,不足以體現這種價值。這也是我決定要將全書進行翻譯齣版的初衷。希望無論是體驗設計師還是産品設計師,在麵對新技術和新變化時,可以不再迷茫,並建立屬於自己的設計思維框架。
在翻譯的過程中,我也時常反思這幾年學習和工作中麵對設計時的思考,是否被既定的方法和流程限製瞭更多的可能性?是否過分注重屏幕而輕視瞭屏幕外的真實世界?如何在解決用戶問題的同時,超齣他們的心理預期以達成更大的滿足?在萬物AI化,信息橫嚮拉平的未來,我們如何通過更多元的通道重塑自己的品牌?復閤體驗在給人們帶來便利的同時,也在逐步瓦解單一介質(如印刷品、屏幕、聲音)帶來的感官刺激。産品以及背後的服務在失去傳統營銷抓手後,如何在AI生態中建立新的營銷機製?有太多新的問題等待我們去發現,去解決。
最後,感謝我的傢人在翻譯過程中給予瞭我最堅實的支持;感謝王爽、潔君、夕圓、單卉等夥伴幫忙校對,使本書得以更好、更快地與各位見麵;感謝阿裏巴巴國際UED的同事們和天貓精靈團隊,在項目初期能剋服萬難,堅定不移地在語音交互和消費級智能終端領域開疆闢土。感謝傅立民老師(Paul)、力丹老師、孫效華老師和嘉唯哥的信任,並在百忙之中抽空為本書作序。感謝齣版社的孫老師,正是她獨具慧眼的選題使得本書的中文版得以齣版發行;感謝阿裏巴巴的Paul和毛瀟笑,讓我有機會接觸語音交互這個新領域。最後感謝所有能讀到這本書的讀者,由於譯者纔疏學淺,翻譯中難免會齣現一些問題或疏漏,請各位同行和專傢不吝賜教,予以批評和指正。我非常歡迎來自各位的意見和反饋,並會基於此做齣正與改進。謝謝。那麼,就請開始閱讀吧。
王一行
阿裏巴巴高級交互設計師
《聆聽未來:打造直觀、高效的語音交互新體驗》 我們正身處一個由聲音驅動的時代。從清晨的智能音箱播報天氣,到車載導航係統的語音指令,再到各類應用程序中便捷的語音助手,聲音已經成為我們與數字世界互動越來越重要的橋梁。然而,要真正實現流暢、愉悅且富有成效的語音交互,絕非易事。這其中蘊含著深邃的設計哲學與精妙的實踐技巧。《聆聽未來:打造直觀、高效的語音交互新體驗》正是為探索這一前沿領域而生,它旨在揭示如何通過精心設計的語音用戶界麵(VUI),為用戶創造齣前所未有的智能、便捷和人性化的數字體驗。 本書並非一本技術手冊,更非對現有語音技術的簡單羅列。相反,它緻力於深入剖析語音交互設計的核心——用戶體驗。我們相信,最成功的語音界麵,是那些能夠“聽懂”用戶意圖、理解用戶情緒、並以最自然、最符閤人類溝通習慣的方式做齣迴應的界麵。這意味著我們需要超越單純的命令與執行,去理解對話的本質,去感知上下文的細微之處,去預測用戶的下一步需求。 一、 洞察人聲的魔力:理解語音交互的本質 語音交互之所以迷人,在於它模擬瞭人類最古老、最直觀的溝通方式。從嬰兒咿呀學語到成年人間的復雜對話,聲音承載著信息、情感和意圖。本書將從這一基本原理齣發,帶領讀者深入理解語音交互的獨特魅力與挑戰。 聲音作為信息載體: 聲音不僅僅是聲波,它包含瞭音調、語速、停頓、甚至語氣中的細微變化。這些元素共同構建瞭信息的豐富層次。我們將探討如何識彆和利用這些聲學特徵,來傳遞更清晰、更具錶現力的信息。 對話的藝術: 人類對話是動態的、有上下文的、且充滿互動的過程。與傳統的圖形用戶界麵(GUI)不同,語音交互需要模擬這種自然的對話流程。本書將深入分析對話的結構、邏輯以及常見的對話模式,幫助讀者理解如何設計齣聽起來“像人話”的交互。 上下文的重要性: 在一次持續的對話中,前一次的發言往往會影響下一次的迴應。語音界麵需要具備強大的上下文理解能力,纔能避免重復提問或給齣不相關的答案。我們將探討如何捕捉和管理對話的上下文信息,構建連貫的交流體驗。 用戶心理的考量: 人們在與語音助手互動時,會有不同的心理預期和行為模式。有些人期待精準的指令執行,有些人則希望得到更具同理心的迴應。本書將分析用戶的心理模型,以及如何設計齣能夠滿足不同用戶需求的聲音界麵。 二、 傾聽用戶心聲:從用戶需求齣發的設計 優秀的設計始於對用戶的深刻理解。在語音交互領域,這一點尤為關鍵。我們不僅要理解用戶“說什麼”,更要理解用戶“為什麼這麼說”,以及他們“想要什麼”。 用戶研究的維度: 本書將強調用戶研究在語音設計中的核心地位。我們將探討如何通過用戶訪談、情境觀察、用戶畫像等方法,深入挖掘用戶的真實需求、痛點和期望。特彆是在語音交互場景下,用戶的使用環境(如嘈雜的戶外、安靜的傢中)和使用目的(如快速獲取信息、進行復雜操作)將成為關鍵的考量因素。 定義清晰的用戶場景: 語音界麵並非萬能,也不是適用於所有場景。識彆並聚焦於最能發揮語音優勢的核心用戶場景至關重要。本書將指導讀者如何為語音産品定義明確的用戶場景,並據此進行有針對性的設計。例如,為駕駛員設計的車載語音係統,其設計原則將與為居傢老人設計的智能傢居語音助手截然不同。 角色與個性的塑造: 語音助手是否應該擁有“個性”?它應該是什麼樣的聲音?這本書將引導讀者思考語音助手的角色定位,以及如何通過聲音設計(如語速、音調、用詞風格)來塑造一個符閤品牌形象和用戶期望的虛擬助手。這種“人設”的建立,是提升用戶情感連接和信任感的重要途徑。 包容性與可訪問性: 語音交互的優勢之一在於其天然的包容性,可以幫助那些難以使用傳統界麵的用戶。本書將深入探討如何設計齣能夠適應不同口音、語速、甚至有發音障礙用戶的語音界麵,確保技術的普惠性。 三、 構建對話的橋梁:設計原則與實踐策略 在理解瞭語音交互的本質和用戶需求後,本書將進入核心的設計環節。我們將提煉齣一係列行之有效的語音用戶界麵設計原則,並輔以具體的實踐策略,幫助讀者將理念轉化為可操作的設計方案。 清晰與簡潔: 語音信息的傳遞要求極高的清晰度和簡潔性。用戶無法像操作GUI那樣反復查看,一次失誤就可能導緻整個交互流程中斷。我們將詳細闡述如何設計齣易於理解的提示語、準確識彆用戶意圖的聽取策略,以及避免冗餘的錶達方式。 意圖識彆與歧義處理: 語音識彆的準確性雖然日益提高,但用戶錶達的歧義仍然是設計的挑戰。本書將探討各種意圖識彆技術(如關鍵詞識彆、自然語言理解)的應用,以及在識彆不確定時,如何通過巧妙的追問和確認來解決歧義,引導用戶走嚮正確的路徑。 反饋與確認機製: 用戶需要知道他們的指令是否被正確理解,係統是否正在執行。有效的反饋和確認機製是建立用戶信任的關鍵。我們將介紹多種反饋形式(如語音提示、視覺提示、聲音提示)的設計,以及何時使用何種反饋方式更為恰當。 錯誤處理與恢復: 任何交互都可能齣錯。如何設計齣能夠優雅處理錯誤、並幫助用戶快速恢復的機製,是衡量語音界麵成熟度的重要標準。本書將提供一套係統性的錯誤處理設計方法,讓用戶在遇到問題時,能夠感受到被理解和被引導。 引導與探索: 對於初次使用的用戶,或者當他們不確定如何操作時,提供有效的引導和探索機製至關重要。本書將探討如何設計齣引導性的對話流程,讓用戶在與係統互動中逐步熟悉和掌握其功能。 多模態交互的融閤: 語音交互並非孤立存在,它常常與視覺、觸覺等其他交互方式相結閤,形成更豐富、更強大的多模態體驗。本書將深入探討如何在語音界麵中融閤圖形界麵、觸摸操作等,實現“聲畫聯動”或“聲觸聯動”,從而提升用戶體驗的維度。例如,在迴答復雜問題時,語音可以提供概要,而屏幕則可以展示詳細圖錶。 性能與響應速度: 用戶對語音交互的響應速度有很高的期望。漫長的等待會極大地損害用戶體驗。本書將強調在設計中考慮性能優化,以及如何通過設計策略來管理用戶對等待時間的感知。 用戶旅程的優化: 語音交互的成功在於其能否順暢地融入用戶的生活或工作流程。我們將引導讀者從用戶的完整旅程齣發,審視語音界麵在整個用戶旅程中的定位和作用,確保其真正成為提升效率、簡化流程的有力工具。 四、 聆聽未來,創造價值 《聆聽未來:打造直觀、高效的語音交互新體驗》不僅是一本關於設計方法的書,更是一份對未來人機交互趨勢的深刻洞察。隨著人工智能技術的飛速發展,語音交互的應用場景將日益廣泛,其重要性也將愈發凸顯。本書旨在為設計師、産品經理、開發者以及任何對未來交互充滿好奇的人提供一套係統性的思維框架和實用的設計工具。 通過學習本書,您將能夠: 深刻理解語音交互設計的核心理念。 掌握從用戶需求齣發進行語音界麵設計的方法。 掌握一係列行之有效的語音對話設計原則和策略。 識彆和規避常見的語音交互設計陷阱。 為您的産品或服務設計齣更具吸引力和競爭力的語音交互體驗。 預見並擁抱語音驅動的未來。 讓我們一起,用聲音連接世界,用設計創造更美好的未來。