人机交互技术及应用
上QQ阅读APP看书,第一时间看更新

3.4 GOMS预测模型

目标操作方法和选择行为(Goal Operator Method Selection,GOMS)模型是人机交互领域最著名的预测模型,是用于分析交互系统中用户复杂性的建模技术,主要被软件设计者用于建立用户行为模型。它采用“分而治之”的思想,将一个任务进行多层次的细化,通过目标(Goal)、操作(Operator)、方法(Method)以及选择规则(Selection Fule)四个元素来描述用户行为,如图3-7所示。

目标是用户执行任务最终想要得到的结果。它可以在不同的抽象层次中定义,如“编辑一篇文章”,高层次的目标可以定义为“编辑文章”,低层次的目标可以定义为“删除字符”,一个高层次的目标可以分解为若干个低层次目标。

操作是任务分析到最底层实现的行为,是用户为了完成任务所必须执行的基本动作,如双击鼠标左键、按下回车等。在GOMS模型中它们是原子动作,不能再被分解。一般情况下,假设用户执行每个动作需要一个固定的时间,并且这个时间间隔是与上下文无关的,如单击一下鼠标按键需要0.20s的执行时间,即操作花费的时间与用户正在完成什么样的任务或当前的操作环境没有关系。

方法是描述如何完成目标的过程。一个方法本质上来说是一个内部算法,用来确定子目标序列及完成目标所需要的操作。如在Windows操作系统下关闭一个窗口有三种方法:可以从菜单中选择CLOSE菜单项,可以使用鼠标单击右上角的“X”按钮,也可以按〈ALT+F4〉。在GOMS中,这三个子目标的分解分别称为MOUSE-CLOSE方法和F4方法。图3-8给出GOMS模型中关闭窗口这一目标的方法描述。

图3-7 GOMS模型

图3-8 关闭窗口行为描述实例

选择规则是用户要遵守的判定规则,以确定在特定环境下所使用的方法。当有多个方法可供选择时,GOMS中并不认为这是一个随机的选择,而是尽量预测可能会使用哪个方法,这就需要根据特定用户、系统状态及目标细节来预测。例如,一个名为Smith的用户,在一般情况从不使用〈ALT+F4〉方法来关闭窗口,但在玩游戏时需要使用鼠标,而使用鼠标不方便关闭窗口,所以需要使用〈ALT+F4〉方法。GOMS对此种选择的规则描述如下:

用户Smith:

Rule1:Use the MOUSE-CLOSE-METHOD unless another rule applies

Rule2:If the application is GAME,select ALT-F4 METHOD

下面给出一个基于GOMS的完整实例,这是一个任务EDITING的GOMS描述,描述了使用文字编辑器对文档进行编辑修改的操作,如图3-9所示。注意这里子目标和选择规则的使用,在3.5节中介绍的击键层次模型中是不存在的。

结合上例来简要介绍一下GOMS模型的应用。这里主要介绍任务的描述与分解过程,具体如下。

1)选出最高层的用户目标。实例中EDITING任务的最高层目标是EDIT-MANUSCRIPT。

2)写出具体的完成目标的方法,即激活子目标。实例中EDIT-MANUSCRIPT的方法是完成目标EDIT-UNIT-TASK,这也同时激活了子目标EDIT-UNIT-TASK。

3)写出实现子目标的方法。这是一个递归的过程,一直分解到最底层操作时停止。从实例的层次描述中可以了解到如何通过目标分解的递归调用获得子目标的方法。如目标EDIT-UNIT-TASK分解为ACQUIRE-UNIT-TASK和EXECUTE-NUIT-TASK两个子目标,并通过顺序执行这两个子目标的方法完成目标EDIT-UNIT-TASK。然后通过递归调用,又得到了完成目标ACQUIRE-UNIT-TASK的操作序列,这样这层目标也就分解结束;而目标EXECUTE-UNIT-TASK又得到了子目标序列,因此还需要进一步分解,直到全部成为操作序列为止。

图3-9 任务EDITING的GOMS描述实例

从上面的实例可以看出,当所有子目标实现后,对应的最高层的用户目标就得以实现。属于同一个目标的所有子目标之间可以存在多种关系,而对GOMS表示模型来讲,一般子目标之间是一种顺序关系,即目标是按顺序完成的,但如果子目标用“select:”限定,如上例中MODIFY-TEXT目标的实现,则多个子目标(或方法)之间是一种选择关系,及多个子目标只完成一个就可以了。对GOMS来讲,可以根据用户的具体情况通过选择规则进行设定。如果没有相应的规则,则一般根据用户的操作随机选择相应的方法。

GOMS作为一种人机交互界面表示的理论模型,是人机交互研究领域内少有的几个广为人知的模型之一,并被称为最成熟的工程典范,该模型在计算机系统的评估方面也有广泛应用,并且一直是计算机科学研究的一个活跃领域。

GOMS模型也有其特点。其主要的优点是能够相对容易地对不同界面或系统进行比较分析,并已被成功地应用于很多不同系统之间的比较。其中,最著名的是Emestine项目。该项目的目的是确定研究人员分析操作员使用原来系统执行任务的情况,从中搜索各种经验数据,然后使用相同的任务集对新系统进行GOMS分析,再把两类数据相比较。

GOMS模型也有其局限性。首先,从它的表示方法来看,一旦某个子目标由于某种错误而异常终止(这种错误可能是用户选择错误,也可能是操作错误,甚至是系统错误等),导致子目标无法正常实现,那么系统将无法处理。这是由于GOMS假设用户完全按一种正确的方式进行人机交互,缺乏对错误处理过程的清晰描述。实际上,即使是专家用户也可能犯错。更为重要的是,它没有考虑系统的初学者和偶尔犯错误的中间用户,而人机交互的目标就是要使系统对最大数量的用户可用,因此需要进一步拓展该模型的表示能力以支持这种错误处理。其次,GMOS方法很难预测普通用户的具体表现,因为存在许多不可预测因素,如用户的个体差异、疲劳、精神压力、学习效应、社会和机构因素等。例如,大多数用户不是按顺序执行任务,而是同时进行多项任务,并且需要处理各种中断,如与其他人交谈等。第三,GOMS预测模型只能预测可能的行为,适用于比较不同执行方式的有效性,尤其适合于分析简单、明确的任务。若大多数用户的操作方式是不可预测的,则不能使用这种方法评估系统的实际应用情况。

从上面的描述中可以看出,GOMS对任务之间的关系描述过于简单,只有顺序关系和选择关系。事实上人物之间的关系还有很多种,这也限制了它的表示能力。另外选择关系通过非形式化的附加规则描述,实现起来也比较困难。

除此之外,由于GOMS把所有的任务都看作是面向目标的,从而忽略了一些任务所要解决的问题本质以及用户间的个体差异,它的建立不是基于现有的认知心理学,故无法代表其真正的认知过程。

GOMS的理论价值不容忽视,但由于存在上述局限,还需要对其进行一定程度的扩展,并结合其他的建模方式,以更好地应用于人机交互领域。