可用性测试语音内容

这是在声音设计的重要时刻。我们许多人正在转向语音助手在这个时代,无论是舒适性,娱乐还是保持通知。如通过语音驱动接口的兴趣继续在世界各地达到新的高度,所以也将用户的期望和最佳实践,指导他们的设计。

文章如下

语音界面(也称为语音用户界面或VUIs)一直在重塑我们如何处理、评估和与用户界面交互的方式。有意识地努力减少人与人之间的密切接触将继续增加用户预期的声音成分的可用性在所有设备上,无论是需要一个麦克风图标,指示启用语音搜索或一个完整的语音助手的翅膀耐心等待调用。

但语音接口带来了固有的挑战和惊喜。在这个相对较新的设计领域中,口语中固有的曲折会使即使是最仔细考虑过的语音界面也很困难。毕竟,口语到处都是填料(在里面类似话语的语感UM),犹豫和停顿,以及其他干扰和言语不流畅,给设计人员和实现人员都带来了令人费解的问题。

一旦你已经建立了一个语音界面,在口语用户提供了丰富的方式介绍信息或允许交易,最容易的部分已经完成。尽管如此,语音接口也浮出水面独特的挑战,当谈到可用性测试和您的最终结果强有力的评估。但也有优点,也特别是当它涉及到可访问性和跨渠道内容战略。事实上,语音驱动的内容在于对频谱的另一个极端,从传统的网站赋予它一个额外的好处:它是分析的有效途径和压力测试是多么通道无关的内容确实是。

语音可用性的窘境#第2节

几年前,我带领一个优秀的团队,在实验室的Acquia设计和建造语音接口乔治亚州数字服务打电话询问格鲁吉亚政府,这使得佐治亚州的公民大约关键任务市民的访问内容,如选民登记,更新驾驶执照,并提交投诉企业。基于直接的常见问题中选取出来的副本Georgia.gov网站,它是第一个亚马逊Alexa的接口与集成猪跑为公众消费而建立的内容管理系统。我以前的同事建的克里斯·巴莱,它还提供了许多令人印象深刻的功能,比如允许用户为每个主题的查询请求单个政府机构的电话号码。

设计和建造的Web体验公共部门是唯一有挑战性的工作,由于周围的辅助功能要求和预算频繁挑战。出于需要,政府不仅需要在如何激发他们的公民和花钱的项目,但他们也包含如何新技术进入组合进行严格的和有条不紊。对于大多数政府机构,语音是一个完全不同的世界,与许多潜在的隐患。

在项目的一开始,数字服务格鲁吉亚队, 由...领着尼基尔·德什潘德,表达了他们最重要的需求:一个单一的内容模型覆盖所有内容,而不考虑交付渠道,因为他们只有资源来维护每个内容项的单一格式副本。尽管面临着编辑上的挑战,乔治亚州还是将亚历克斯视为一个令人兴奋的机会,为残疾公民提供无障碍解决方案。最后,由于当时语音可用性测试的例子相对较少,我们知道我们必须在飞行中学习和实验才能找到正确的解决方案。

最后,我们发现,所有我们会为其他项目执行的传统方法的可用性测试是不适合于特有的问题语音可用性. 这只是我们问题的开始。

语音接口如何提高可访问性#SECTION3

语音可用性的任何讨论都必须考虑到一些经验最丰富的语音接口的用户:谁使用辅助设备的人。毕竟,无障碍长期以来的Web体验的堡垒,但它只是在最近才那些实现语音界面的焦点。在当今世界,刷新盲文显示器和屏幕阅读器奖基于web的内容为上述所有合成语音的渲染,语音接口似乎是一种反常现象。但事实上,亚马逊Alexa的令人兴奋的潜力为残疾公民代表对格鲁吉亚作出可通过语音助理他们的内容感兴趣的主要动机之一。

周边的无障碍语音问题近年来,由于语音接口可以提供比更成熟的辅助设备更好的用户体验优势而浮出水面。由于屏幕阅读器在背诵页面内容时没有例外,因此它们有时会呈现多余的信息,并迫使用户等待的时间超过他们的意愿。此外,有了一个有效的内容模式,通常情况下,语音接口可以在比页面本身更细粒度的层次上促进与内容的有针对性的交互。

虽然它可能很难说服甚至可达价值的最具前瞻性的客户,格鲁吉亚已经不仅是一个开拓者也超越了网页内容的可访问性的承诺支持者。该州是提供一个文本到语音转换(TTS)热线电话是读取网页大声第一管辖区。毕竟,州政府必须服务全部的公民平等,没有如果,阿富汗国家发展战略,或但是。虽然这些尚早,我可以看到语音助理成为一个新的渠道,也许更快捷的渠道,由残疾用户可以访问他们所需要的内容。

管理面向离散频道的内容#section4

虽然语音可以提高内容的可访问性,但很少有情况下,web和语音是我们必须公开信息的唯一渠道。出于这个原因,我经常给那些对追求语音驱动内容感兴趣的组织的内容策略师和架构师的一个建议是从来不认为在隔离语音内容。遍布全球各地是一样的误导做法,导致了移动应用和其它分立经验提供孤立的或过时的内容,预计该网站上的所有内容应达最新的且可通过其他渠道以及用户。

毕竟,多年来,我们一直在训练自己只在网络环境中思考内容,而不是跨渠道思考。我们对链接、文件下载、图像和其他基于网络的边缘和杂项的严密假设都是网络内容的各个方面,它们很难转化为会话上下文,尤其是语音上下文。我们都越来越需要关注全渠道内容策略在横跨所有存在的今天和其他人无疑将浮出水面在地平线上的这些频道。

结构化的内容在Drupal 7的优点,Georgia.gov已经有了一个内容模型适合于问答的形式常见问题(常见问题解答)。而提问和回答格式是方便的语音助手由于对内容的查询往往以问题的形式出现,因此返回的响应同样需要尽可能地进行语音优化。

对于Georgia.gov,需要保存在所有渠道的所有内容的单一再现带领我们进行对话内容审计,其中,我们大声朗读所有常见问题页面,设身处地为语音用户着想,并确定用户如何解释书面形式与他们如何解析相同内容的口语形式之间的关键区别。在与佐治亚州的编辑团队进行了一些讨论之后,我们选择了限制行动要求(例如,“阅读更多内容”),在周围文本中缺乏清晰上下文的链接,以及其他让无法可视化所听内容的语音用户感到困惑的情况。

下面是一个包含了我们如何转换的FAQ页面的某些文本对口更适用于语音的示例的表。通过一个阅读每个句子朗读,一个,帮助我们确定哪些用户可能有些摸不着头脑,说案件“咦?”在声音方面。

以前
学习如何改变你的社会保险卡上的姓名 社会安全局可以帮助你改变你的社会保险卡上的姓名
您可以通过借记卡或直接存款接收付款。了解有关付款的更多信息。 你可以收到付款通过任一借记卡或直接存款。
了解更多关于这一点。 在乔治亚州家庭支持注册通常直接从你的薪水拉付款。但是,您可以通过您的银行帐户,信用卡,或西联网上发送自己的付款。您也可以通过邮件发送您的付款到您的法院命令提供的地址。

在类似内容的策略和内容管理领域,内容审计早已关键是了解你的内容的全貌,但它并没有结束。成功的内容审核可以从孤立的内容自动检查或过于罗嗦文章运行色域到特定品牌的语音或某些设计标准是如何附着的内容更多的定性分析。betway体育注册对于真正的准备内容策略现在和将来的频道,全面了解用户在各种情况下如何与您的内容交互是当今的一项基本要求。

其他的对话界面更容易#section5

口语本来就很难。即使是最有天赋的演说家也会遇到麻烦。它到处都是错误,开始和停止,打断,犹豫,和一系列令人眩晕的其他独特的人类犯罪。书面文字,因为它立马被记录在一个几乎是永久性的记录中,是温顺的,稳重的,和仔细考虑的比较。

当我们谈论对话界面,我们需要绘制的用户体验的范围内有明显的区别是交通书面语言而不是口语. 据我们所知书面语言与文学的相对稳固性与口语和口语传统的相对短暂性相比,在许多方面,二者之间的差异并不大。这对设计师来说意义重大,因为从用户的角度来看,口语缺乏一种图形化的对等语言,那些挠头的人可以很容易地引用。我们在处理口头上的话听觉启示,而不是像素,书面说明文字,或视觉启示。

为什么写会话接口更容易评估#section6

其中一个是聊天机器人和textbots欣赏语音接口的特权是,通过设计,也无法掩盖的用户采取上述步骤。任何会话界面用户在编写中的工作有自己先前交互的历史,可追溯到几天,几周或几个月的访问:所谓反卷. 例如,通过Facebook信使与航空公司通信的航班乘客知道,他们只需在聊天历史记录中向上滚动,就可以确认他们已经向该公司提供了电子机票号码或常旅客帐户信息。

这对信息架构和如雷贯耳的影响对话的寻路. 由于chatbot用户可以查阅自己的书面记录,所以当他们做出他们不想做的举动时,事情很难完全出错。当你不得不把几分钟前说的话从头顶上记下来,而不是滚动到几小时或几周前提供的信息时,回忆就变得困难多了。例如,一个有效的chatbot接口可以让用户跳回会话中更早的、特定的位置历史。一个例如,有效的chatbot接口可以让用户跳回会话历史中更早的特定位置。永远活在当下的语音界面没有这样的奢华。

眼睛跟踪只对视觉组件有效#章第7

在很多情况下,那些谁与聊天机器人和机器人短信(特别是那些杠杆文本消息或其他信息服务,如Facebook Messenger的,松弛,或WhatsApp的)工作有从受益的唯一特权视觉组件。一些会话接口现在将其他元素插入到机器和人之间的会话流中,例如嵌入式对话形式(就像SPACE10的会话表),允许用户进入丰富的输入或从一系列可能采取的对策选择。

眼睛跟踪的更传统的可用性测试情景的成功凸显其视觉接口,如网站,移动应用,以及其他适当性。然而,从评估语音接口是完全听觉的角度来看,眼睛跟踪仅用评估,其中同时有一种无形的讲话被测试者在寻找有限(但是从研究的角度来看还是有趣的)目的对话者,不是他们是否能成功使用的接口。事实上,眼睛跟踪仅适用于有一定的可视化组件,如亚马逊回波显示语音接口,一个可行的选择。

大声思考和同时进行的探究打断了对话的流程#section8

一种老套的可用性测试方法是有声思维,它允许使用界面的用户在与所讨论的用户体验交互时,以口头方式呈现他们对界面的经常性的定性印象。与眼睛跟踪相结合,大声思考为视觉界面(如网站和web应用程序)以及其他视觉或物理设备的可用性测试增加了相当大的维度。

另一个是同时探测(CP)。探究包括使用问题从用户那里收集关于界面的见解,以及可用性.gov描述两种类型同时,研究者在互动过程中提出问题,以及回顾,其中仅问题来一次的交互完成。

使用书面语言而不是口头语言的会话接口仍然非常适合于有声思考和并发探测方法,特别是对于需要手动输入的接口组件,例如会话形式和散布在会话本身中的其他传统UI元素。

但对于语音接口,有声思维和并发探测是备受质疑的方法,可以催化各种意想不到的后果,包括触发字意外调用(如Alexa mishearing“选择”是“页面”),并引入坏数据(例如语音转录登记两个语音接口和测试对象)。毕竟,在一个假设的有声思维或者语音接口的CP测试中,用户将负责与聊天机器人交谈,同时提供了他们的印象给评估监督检验。

语音可用性测试与回顾性探测#section9

回顾性调查(RP)是一种鲜为人知的可用性测试方法,由于它的主要缺点,在web可用性测试中很少出现:事实上,我们有糟糕的记忆,很少用接近完全准确度的任何东西来记住刚才发生的事情。(这也许可以解释为什么后斜杠加入了目前楔形文字、印刷机和其他具体化信息的方式所占据的刚性记录保存的万神殿。)

对于缺少滚动聊天记录语音助手的用户,追溯探测介绍为主题的潜力,包括在评估假回忆或曲解他们的谈话结束。尽管如此,回顾性探测允许参与者需要一些时间来形成自己的接口的印象,而不是意识流施舍增量的花絮,如将在并发探测更有可能发生。

是什么让声音可用性测试独特#section10

语音可用性测试有几个独特的特征,它们与web可用性测试或其他会话可用性测试不同,但是一些相同的原则统一了视觉界面和听觉界面。和往常一样,“尽早测试,经常测试”是一个适用于这里的咒语,因为越早开始测试,您的结果就越可靠。让一个人来管理一个测试,另一个人来记录结果或观察故障迹象,这也是一个有效的最佳实践,不仅仅是语音的可用性。

从隔音差或外部中断干扰可以破坏语音可用性测试开始之前就。许多大型组织都具有隔音的房间或使用语音可用性研究人员的录音棚。对于绝大多数人的,一个是沉默的房间就足够了,但绝对的沉默是最佳的。此外,许多科目,甚至没有在网络可用性测试非常熟悉,可能是不习惯语音可用性测试在长时间的静音是建立数据的基线规范。

我们如何使用回溯探测到的测试要求GeorgiaGov#section11

对于Ask GeorgiaGov,我们几乎完全使用了回顾性调查的方法来收集用户如何与语音驱动内容交互的一系列见解。我们试图从早期和历时的角度评估与界面的交互作用。在这个过程中,我们要求每个受试者完成两个不同的任务,这两个任务要求他们通过提问(进行搜索)、深入研究其他问题和请求相关机构的电话号码来遍历整个界面。尽管这对于任何使用可视化界面的用户来说都是一个重要的要求,但与之相反,语音界面流的单向聚焦降低了长时间意外绕行的可能性。

以下是几个示例场景:

你在乔治亚州有营业执照,但你不确定是否必须每年登记一次。和Alexa谈谈找出你需要的信息。最后,询问一个电话号码以获取更多信息。

你刚搬到乔治亚州,你知道你需要转驾照,但你不知道该怎么办。和Alexa谈谈找出你需要的信息。最后,询问一个电话号码以获取更多信息。

在测试结束后,我们还向用户提问,通过回顾性调查了解他们的印象:

  • “在1-5级,根据该方案,是您获得有用的信息?为什么或者为什么不?”
  • “在1-5级,根据该方案,在内容呈现清晰,便于理解吗?为什么或者为什么不?”
  • “你被要求问的问题的答案是什么?”

由于州政府还定期与具有如离婚和性骚扰可能创伤性的问题做公民的问题解决,我们还为参加者的选择不接受某些类别的任务组成的。

虽然这一测试过程产生了令人信服的结果,表明我们的语音界面在其所需的水平上运行,尽管它具有实验性质,但我们在可用性测试过程中也遇到了相当大的挑战。在实现的初始阶段,当bug仍然很常见时,将Amazon Alexa恢复到初始状态并快速排除问题被证明是困难的。

最后,我们发现,许多同样的教训,适用于更传奇的可用性测试的例子,也与问乔治亚戈夫有关:早期测试和经常测试的重要性,对忠实而高效的转录的需要,以及当集成不同技术时,bug惊人的持久力。尽管问到乔治亚政府在技术债务和可用性测试的角色方面与其他接口实现有许多相似之处,但我们还是非常高兴地听到真正的乔治亚人的声音,他们与州政府的接触与以前没有什么不同。

结论#section12

我们中的许多人可能正在为语音内容构建接口,以尝试新的频道,或者为残疾人和更新到网络的人构建接口。现在,他们是许多其他人的必需品,特别是随着社会距离做法继续在世界范围内流行。尽管如此,重要的是要记住,语音应该仅仅是频道不可知策略的一个组成部分,该策略为从其通常上下文中剥离的内容配备了设备。构建可用的语音驱动内容体验可以教会我们如何首先设想我们的内容环境及其未来。

我们可以用HTML编写一个页面并称之为“一天”的日子已经一去不复返了;内容现在需要通过合成语音、增强现实覆盖、数字标牌和其他用户甚至永远不会接触个人电脑的环境来呈现。通过首先关注结构化内容,着眼于克服我们在为语音和其他内容开发内容时基于网络的偏见,我们可以更好地确保我们的内容在任何设备和任何形式因素上的有效性。

八个月后,我们完成了在2017年建立问GeorgiaGov,我们进行了回顾性检查积累了在过去一年中的日志。结果是惊人的。车辆登记,驾驶执照,并包含了最常见的状态销售税搜索主题。betway必威体育平台所有交互的79.2%是成功的,对于在生产中的第一个内容驱动的Alexa的技能之一,并导致发行的电话号码的用户可致电了解更多信息的所有交互的71.2%的成绩。

但在内心深处,我们在对格鲁吉亚队的便利实施的日志中,我们发现了一些令人费解404与该保持正在录制一遍又一遍的搜索项未找到错误的“劳森的。”一些挖掘和在房间里咨询本地格鲁吉亚后,我们发现我们亲爱的网友在她的家乡话特别强的拉长被反复宣告“许可证”都没有用那一个。

正如这则轶事所强调的,正如没有一种用户体验能够真正适合每个人一样,语音内容是一种环境,在这种环境中,不完美可以突显我们在开发跨渠道内容时遗漏的考虑。正如我们有很多东西要学,当涉及到新的形状内容可以采取,因为它跳出屏幕和窗口,似乎我们的语音界面仍然有一个方法,才接管世界太多。

特别感谢尼基尔·德什潘德对于在写作过程中他的反馈。

关于作者

普雷斯顿所以

普雷斯顿所以是产品策略,开发人员倡导者,数字体验未来学家,创新引领,研究员,讲师和作者实践中的解耦Drupal(Apress出版,2018)。他是资深总监,产品策略在Oracle和一直是程序员自1999年以来,Web开发人员和设计人员自2001年以来,从2004年开始专业创作,自2007年以来一个Drupal架构师和开发人员,并自2015年本地和分布式团队的经理。

没有评论

有话要说吗?

我们已经关闭了评论,但你可以看到人们说的话,我们没有这样过。

更多来自ALA

要做的工作

“设计价值”摘自吉姆·卡尔巴赫(Jim Kalbach)的《待完成的工作》(Jobs To Done)一书,该书就创建以工作为导向的路线图和使用工作故事解决特定设计问题提出了建议。

跨文化设计

在这段来自跨文化设计的节选中,塞翁戈·阿克佩姆讨论了当你希望接触到全球受众时必须考虑的版式设计的许多方面。
设计

betway88

在这篇摘自《写作是设计》的文章中,迈克尔梅茨(Michael J.Metts)和安迪韦尔夫(Andy Welfle)讨论了在考虑可访问性的情况下写作的重要性。