[游戏性] 在游戏业,没有比游戏性(gamepiay)更重要、更混乱、更容易引起争议的名词了。人民普遍认为游戏性是游戏的最重要的属性,是决定游戏成功的关键。什么是游戏性?游戏性包含哪些要素?则众说纷纭,没有定论。这就出现了一个尴尬的局面——游戏性对游戏的成败怎么重要,但大家又说不清楚游戏性是什么,也没有很好的方法来保证游戏性的成功实现。当然有人会争辩说游戏性就和艺术家的知觉一样,是只可意会而不能言传的。你去问一个著名的画家怎么才能画出不朽的杰作来,或者什么才能称的上是不朽的杰作,他肯定也说不清楚。的确,游戏性和游戏设计在很大程度上决定于直觉和经验。作为工业化协作制造出来的“软件”产品,游戏和游戏性又不能停留在直觉阶段。只有在明确了自身规律之后才能保证其产品质量,可持续地制造出高质量的产品,并保障开发投资获得回报。我们知识短见工程有一个著名的论断:对于软件和软件开发过程的一个属性,如果不能明确定义的话,就不能有效的测量;如果不能测量的话,就无法改进。因此整个软件工程的思想基础就是为软件和软件开发过程定义一个属性,以及测量它们的方法,然后在通过系统化的工作去改进这些属性。同样地,对游戏性来说,如果不能确切定义它,就无法改进它。本次所要探讨的,就是如何定义游戏性,如何从多方面多角度了解它,从而进一步采用更成熟和更正规划的方法去改进游戏性铺路。
[可用性] 在探讨游戏性的问题之前,我们先从另一个角度介绍一下可用性(usability)的概念。可用性和游戏性是一个孪生兄弟——可用性是商用软件的重要属性,而游戏性则是娱乐软件的重要属性。两者之见有很多共性和千丝万缕的联系。了解了可用性的概念,有助于我们开拓视野,去更好地了解并定义游戏性。
从历史角度看可用性和游戏性 非常幸运的是,可用性的概念的定义和发展走了一条和游戏性完全不同的道路。从历史的角度来看,游戏性这个概念很早就被提出来了。从20世纪80年代中期开始(gameplay)这个词就被造了出来(这个词在英文字典里是没有的,是游戏业自己造出的词)。然后所有的游戏设计师都接受了这个词,并成为业界的标准用语。从那时候起,所以的游戏设计师都同意游戏性是游戏最重要的属性。但是,大家都谈游戏性,却都是泛泛而谈和漫而谈之,没有采用系统的方法去严谨定义,没有理论上的深化,也没有具体的分析。也就是说游戏设计师们对游戏性的认识还是处于很粗浅很原始的阶段,还只是感性经验,没有理性的量化分析。而反观可用性,这个词在商用软件领域,也别是网站方面的流行,是在90年代中期,也就是落后了游戏性10左右时间。但可用性一开始就有强大的理论基础,提出可用性概念的不是业界,而是大学研究机构。可用性的理论基础是综合了计算机科学、设计、心理学和人机交互学(Human-Computer Interaction,缩写为HCI)。在理论的基础上,实际工作者们在软件设计开发过程中,对可用性概念进行更深的分析综合,甚至对某些方面采用了量化分析的方法,从而使得他们对可用性的认识超越了一般的感性经验。更重要的是,通过对可用性的分析,开发出一系列方法、流程、规则和标准来帮助软件设计开发人员去设计更可用更好用的软件。这点需要格外强调:因为分析可用性本身是没有意义的,比事后分析一个已知软件的可用性更重要的基于分析去总结经验和规律,并以此事先指导软件的设计,设计出好用的软件。
所以从历史的角度看,游戏业在游戏性方面的工作虽然起步得很早,但其发展应用则完全落后于可用性。商用软件业在可用性方面的工作对游戏性可以有很大的借鉴意义。
[定义—评估—设计] 人机交互研究领域和商用软件业在可用性方面的工作基本上可以看成有三个步骤。首先是定义一个概念名义这个概念代表一个软件系统的基项属性。然后根据这个定义去设计一些评估方法,用来评估现有系统的这个属性。最后在评估的基础上,改出一套设计方法、工具、流程,来帮助软件设计人员更好地进行设计工作。定义的目的是为了评估,评估的目的是为了更好地设计。
[可用性的定义] 首先来看可用性的定义。初看上去,可用性和游戏性最大的共同点就是其模糊性和主观不确定性。什么是可用 ?什么是好用?一个软件,如微软的WODR字处理软件,可以帮助用户完成一定的工作任务。软件开发人员去采访用户的时候,问他们:“这个软件好用吗?”用户们会给出各种回答,“好用!所见既所得(WYSIWYG)的排版功能太棒了!”“不好用!这个标题的字体怎么改不了?”,“太过分了!怎么才能去掉那个讨厌的曲别针?”这些情态各异有时甚至相互矛盾的挥发是用户从个人的角度对一个软件的可用性做出的评估。这些评估是模糊的,因为他们是用户根据自己的体验总结的。人和人之间计算机操作技能不同,年龄不同,眼力不同,必然导致对同一个软件做出不同的结论。
对软件开发人员来说,显然不能满足于从用户那个得到这么多乱七八糟自相矛盾的评估。他们设计软件的目的,不是给一个两个用户使用,而是给成百上千敌人使用。这就带来一个问题:如果软件只能给一两个人用,那很好办,我们去和他们坐在一起,详细地了解他们的需要,他们的脾气秉性,他们的习惯和技能,然后根据这些信息去设计软件。这样设计出来的软件,肯定符合他们的要求,对于这一两个用户来说肯定是“可用”的。但问题是,现代商业软件是给成百上千人用的,他们之间的个体差异太大了,如何设计软件使得他们都满意呢?也就是说,如何设计软件使得软件对于成百上千人都是“可用”和“好用”的呢?如何综合成百上千人的意见,找出其共性,并基于共性去设计软件呢?
另一方面,可用性是一个很复杂的概念。当要户说:“怎么也搞不清楚如何设置文本?”时,他们所遇到的问题和“上次用了数学公式,这次怎么也找不到那个选项了”是不一样的。
通过上面的分析,我们看到可用性是一个很复杂的有极大主观因素的概念。我们再来看HCI研究工作者是如何解决它的定义问题的。
在西方思想库中威力最大的武器之一就是分类法了。在古希腊时就发展出的动植物分类法是西方现代科学的基础。可以说没有分类法就不会发展出进化论。分类法基本思想就是 把纷繁复杂的世界分门别类,分而击之(divide and conquer)。
我们看看分类法是如何在可用性定义上发挥作用的。分类就是首先承认这个概念十分复杂,不能简单地定义或者简单地分析,必须把它分成各方面,从各角度来分析。当用户拿到一个新的软件时,他要开打包装,安装然后使用。由于是第一次接触这个软件,必须有一个学的过程。可学习性(learnability)的概念就被分离出来了,作为可用性的第一个子概念。当学习期结束,用户完全掌握了软件的主要功能的使用后,他必须使用软件完成日常的事务性操作。在进行日常事务性操作的时候,由于用户已经对软件的主要功能烂熟于心,他基本是靠条件反射,非常迅速地完成一系列操作。也就是说,理解和记忆位于视觉匹配和肌肉反应。这样效率(efficiency)的概念就被提出来了。效率的概念是针对一个软件的主要功能的。除了那些用户每天都在使用的主要功能外,一个软件还有其他并不常用的辅助功能。这些辅助功能可能一个月被用一次(比如月度统计功能),也可能一年才被用一次(比如被黑客攻击后的数据恢复功能)。这就带来了另一个问题,当这个月费九牛二虎之力把这个冷僻的功能学会后,过几个月再用时,还记得起来如何使用吗?可记忆性(memorability)的概念又被提出来了。
所以我们看到,通过分类法,我们已经把可用性分离成了三个子概念。每个子概念都比较清楚,相互之间界限比较明确。我们可以针对不同子概念,进行深入一步的工作了。
在完成了分类法后,第二项工作就是把可用性的主观因素和客观因素分离,模糊的部分和确定的部分分离。这也是西方思想界的传统——科学有科学的领域,宗教有宗教的领域。科学解决不了的东西,属于上帝。理性于神性分开。这么做对科学的发展同样是非常重要的。可用性来说,就是要分清楚哪些部分是客观的,是共性的,是能够精确分析的;哪些部分是主观的,因人而异,模糊的,无法使用精确的量化分析处理的。
我们发现前面介绍的三个子概念——可学习性、效率、可记忆性,都是共性大于个性(如果学习没有共性的话,学校也就不可能存在了),客观大于主观。也就是说,它们都属于客观因素/经过这样分析后的可用性的定义,是一个多维的概念,即有主观的因素,又有客观的因素,同时含有多个子概念。
[可用性的评估] 在可用性定义的基础上,我们可开始进行评估工作。
首先看看客观部分。既然我们已经分离出一些子概念了,那么可以对各个子概念对症下药,设计出各种评估方法来测量之。请看列表,列出了评估可学习性和效率的部分方法。这些方法是基于认知科学(Congnitive)和心理学研究的成果发展出来的。有的是定量分析方法,有的是定性分析方法。 子概念 评估方法
可学习性 CW(Cognitive Walkthrough)方法(定性分析) 效率 Model Human Processor(定量分析) Fitt’s Law(定量分析) GOMS模型(定量分析)
为什么我们可以针对客观部分的子概念设计出这些评估方法呢?因为客观部分的子概念共性大于特性,是确定的而非模糊的。而心理学和认知科学的研究就是基于人类共性的,所以其基本理论和思想可以被HCI研究工作者用来测量这些子概念。
对于主观的部分,由于其模糊性,其特性大于共性,无法采用前述各种评估方法,必须采用实证和考察来评估。做个比喻:比如说一部电影,在使用了包括编剧、镜头、剪辑等通用的电影技术后,最后观众是否喜欢。还是得等他们到电影院里坐下来看一遍后才确定。有可能出现这种情况:一部电影,从技术角度看天衣无缝,完全符合电影学院里所有教授的理论和法则,但去不卖座。对于电影老说,由于不能事先放映并从观众处获得反馈并修改,所以其票房成败很有赌博的性质。软件设计人员们就是想到是否可以在软件开发过程中,不断地请“观众”来事先观摩并提出意见。这样的话,最后推向市场的软件产品的可用性就可以得到一定的保证。
基于这种思想,HCI研究人员提出了各种测试方法(usertest)。用户测试方法就是针对可用性的模糊性的主观性的一面设计的。使用这些方法,先对用户群采样,然后实地观察用户在使用的测试方法,如Think—Aloud—Protocol Inquiry。
通过上面的介绍,我们看到对可用性的客观部分和主观部分,我们都有不头脑感的评估方法来处理了。对客观部分,用偏理论的,偏量化的方法来处理。对主观部分,用实证和观测来处理。
[基于用户的设计] 前面说过,测试的目的是为了指导设计。我们现在有了许多评估的方法,它们如何能够帮助我们进行设计呢?显然,评估方法是不能直接指导设计的。评估方法是在一个设计方案提出后,要来对这个已经成形的设计进行评价的。也就是先有设计,后有评估。于是人们很自然地想修改并丰富设计,然后再评估,如此循环往复。这就是快速原型法的基本思想。因此,评估方法对设计显示指导作用,主要体现在搞出一个大的架构或者说模型,这种架构就叫设计流程(design process)。设计流程把设计和评估的各种方法有机地集成起来,成为软件设计时遵循的指导性纲领和策略。目前HCI领域经常提到的基于用户的设计(User—Centered Design,缩写为UCD),就是这种类型的架构。
通过前面的介绍,我们看到可用性这个概念是如何被定义的,又是如何被评估的,如何在设计中发挥作用的。我们介绍的各种评估方法和用户测试方法,以及设计流程,在目前的商业软件开发领域得到了广泛的应用。尤其是在中大规模的公司中,都建立了相应的部门负责可用性测试和设计。其效果已经得到了体现——现在的商用软件的可用性越来越得到重视,越来越得到提高。
[游戏性] 在对可用性的定义、评估、设计有了一定了解后,在来考察游戏性。
[对游戏性的思考] 迄今为止,对游戏性还没有一个很好的定义。很重要的原因,就是大家只是看到了游戏性的某些方面,而没有以一种多维的多层次的观点去看待它。换言之,没有用分类发把这个复杂的概念系统地解剖开来,一一分析之。下面就举出几个观点,作为定义游戏性的准备工作。
[游戏性的基础是可用性] 前面我们介绍的可用性,是针对商用软件说的。实际可用性的概念应该扩展到所有类型的软件。对于游戏软件来说,如果其无可用,就不能发挥娱乐的功能。比如说,如果游戏软件没有很好的学习性,玩家就不能很快地上手,大部分玩家就会知难而退,那么游戏性就是根本谈不上了。因此,游戏性的基础应该是可用性。
[游戏性不仅仅是操作性] 早期的游戏,如任天堂8位、16位机上的ACT游戏。它们的游戏性很大程度上就是操作性——眼手协条件反难度递阶。但随着游戏的发展,游戏类型的增多,游戏性就远远不仅仅是操作性了,策略和AI等要素对游戏性也越来越重要了。操作性只是游戏性一个层面上的内容。
[不同的游戏类型,其游戏性有共性] 游戏之所以为游戏,必然有独特的特征。各种类型的游戏,必然有其共性。比如说,置入感(immersion)就是 所有游戏的共性。游戏最重要的就是使得玩家可以感到自己置身于虚拟的游戏世界,暂时忘记自己所处的现实世界。这种置入感可采用多种手段获得,比如FPS中使用三维迷宫和第一视角,使得玩家和游戏主人公融为一体。而RTS使用俯视角,使得玩家有掌控全局的感觉。
[不同的游戏类型,有不同的游戏性要素] 不同类型的游戏,其游戏性有不同的要素,或者说则重不同的要素。当我们研究RTS的游戏性时,游戏性更侧重于策略和微观管理。而对FPS游戏,游戏性则侧重于任务、迷宫、战术协调。
对于同样的一个概念,不同类型的游戏侧重也有可能不同。比如说可用性中的效率概念,对FPS和RTS来说就不一样。对于RTS来说,如微软的《帝国时代》系列,使用一个鼠标就可以完成所有操作。因此其效率主要体现在鼠标的移动和鼠标案件的交替进行上。对于这种情况,可用费茨定理(Fitt’s Law)来评估其效率。而FPS,其操作是由键盘控制移动,鼠标控制瞄准和射击。对于这种情况,可用GOMS模型来评估其效率。
[游戏性的多维模型] 既然游戏性中有共性也有特性,不同的游戏类型又不同的则重,那么游戏性的定义就应该体现这种多层次的多样统一。在以上分析的基础上,笔者突出游戏性的多维模型。
这个模型可以比较完整地表达游戏性的复杂性和多样性。它是一个多维的模型,分为四层,每层中又包含不同的模块。底层是可用性层,因为可用性是游戏性的基础。可要性层中包含的模块就是我们恰面介绍的可要性中客观部分的各个子概念,如可学习性和可记忆性等。第二层是游戏层,包含了游戏性中的共性,也就是说不管什么类型的游戏都拥有的共性,如置入感等。第三层是类型层,也就是各个游戏类型所特有的具体的游戏性要素。对RPG老说,可是魔法和战斗系统的参数设置。对RTS来说,可以是武器系统平衡性和微观管理等。在类型层的上面,是情感层。它涵盖了游戏中所有主观性、模糊性的因素。
这个模型由底层到顶层,体现的是由共性到特性(可用性层代表所有软件的属性,游戏层代表游戏所特有的属性,类型层则是某种游戏类型的属性),理性到模糊,由底向上逐渐细化,由抽象到具体。
政府多维模型又是像积木一样可以自由组合。各层中的模块可根据需要进行取舍。对不同类型的游戏,肯定有不同的组合方法。游戏设计师们所要做的,是根据自己广义的娱乐理解(包括心理学的基本知识和对其他娱乐形式的了解),和对自己所专攻的某一游戏领域的知识(domain knowledge)。去确定自己所要设计游戏的游戏性模型。这个多维模型可以帮助游戏设计师更好地理解游戏性的复杂多样性,从而抓住自己所要设计游戏的游戏性中最重要的因素。当然这个模型并没有提供具体的针对某个类型游戏的游戏性的定义,这项工作应该是由游戏类型的专家来完成的。
用多维模型对游戏性进行定义的主要目的的,就在于在开始设计游戏时确定设计目标和设计策略。我们知道任何设计行为,比如工业设计人机界面设计,都要首先确定设计的目标(objectives)和策略(strate-gy)。目标是设计所要达到的最终效果(可以包括很多条目标)。策略是为了达到目标所应该采取的过程和方法。如果在开始设计时没有一个明确的目标,最后设计出来的产品必然不能达到用户的期待。有了设计目标。如果没有很好的设计策略去指导设计步骤,设计出的产品也不能保证质量。对游戏来说,显然其设计目标是使得游戏好玩,而使游戏好玩这个目标过于笼统和空泛,并不能成为设计目标。多维模型可以帮助我们确定游戏设计的目标,并进一步确定一定的设计策略。
[游戏性的评估] 我们现在有了一个游戏性的多维模型。考察这个模型,我们可以看到,表面谁难以捉摸的游戏性,还是有很多部分是可以把握的,是可以仔细研究并精确评估的。比如说可用性层的内容,既是游戏性的基础,又是最容易评估的。提出这个模型的基本思想之一就是先分离出来可以理性评估的东西,让游戏设计师们对这些东西有足够的重视。游戏性和游戏设计绝对需要知觉和天才的梦想,但基础的理性的东西同样重要,必须先把最基础的东西做好,然后再理性的基础上发挥感性的直觉和梦想,才能更好地完成游戏设计的任务。对照这个模型来说,就是自底向上,一层层地考察和评估。
对于类型层的内容,同样可以评估。因为类型层中的内容是非常具体的针对某一类型的,所以可以使用Heuristic Evaluation的方法,去总结其规律,制定标准,然后对照标准去评估新的设计。
对情感层中主观性的因素,使用用户测试的方法评估比较合适。游戏业也有一个自造的名词,叫“piaytest”,即游戏性的测试。但piaytest主要是在游戏开发已近完成后今昔感的,其目的是微调各种参数,对游戏设计的影响不大。而用户测试方法的要旨是尽量地在设计过程中邀请玩家来对设计进行评估,并用反馈指导设计。因此,游戏设计师们应该从HCI的用户测试方法中汲取有用的东西,改进他们现在所使用的piaytest方法。
上面介绍了一个游戏性的模型,和对其各层面所可以使用的评估方法和测试方法。我们说过,比定义和评估更重要的设计,游戏性的设计就是游戏设计。我们同样需要一个好的设计流程作为框架结构,然后把游戏性的各个层面和各要素的考量集成到这个设计流程里,把各种评估方法和用户测试方法集成到这个设计流程里。这样才能从根本上保证游戏的质量。
[附录:娱乐的14个要素] 对于游戏性的共性,Pierre-Alexandre Garneau在一篇文章中举例以下14种娱乐要素:
美(beauty) 置入感(immersion) 解决问题(intellectual problem solving) 竞争(competition) 社交(social interaction) 喜剧(comedy) 惊险刺激(thrill of danger) 体育运动(physical) 爱(love) 创造(creation) 权利(power) 探索和发现(discovery) 进展和完成(advancement and completion) 使用技能(application of an ability)
这14个要素基本上把游戏能够带给玩家什么乐趣总结得很清楚了。下面简单介绍一下其内容。
[美] 人类欣赏自然的或者人工的美的东西的时候会感到愉悦。对美的追求是人类的共性。
[置入感] 当一个小孩躺在阳光下的草地上,手里拿着一个玩具飞机,边舞动边嘴里发出嘟嘟嘟的声音时,他已经进入了自己所制造的幻想世界——幻想着自己开着飞机在天空中翱翔。这种人类暂时离开现实世界,进入虚拟世界体验到快乐,就是置入感。置入感一半源于人类的易于幻想和遐思,另一半要借助于人工的虚拟环境。比如电影院就是一个很好的例子。在放映电影的时候,灯光全灭,观众沉入黑暗之中,只有屏幕上的人和事,以极大的超乎自然的亮度展现在观众面前。似乎茫茫宇宙,只有观众和屏幕两个存在,这样帮助观众和屏幕的距离礼金了,更有助于观众体验甚至融入电影故事情节。对游戏来说,更有多种方法来达成置入感。而更登峰造极的方法,要数虚拟现实(Virtual Reality)系统了。通过使用全封闭式眼睛和感应手套,使得玩家可以真正投入虚拟世界汇总,忘乎所以。
[解决问题] 人类从解决问题中获得乐趣。解决问题包括对问题的诊断、动脑筋土出问题解决方并利用技能执行这一方案。它体现了脑力和体力的结合。在美国家庭里,男主任以拥有各种各样门类齐全的电工、木工工具为自豪——更让他们自豪的是周末去修修补补,同过自己的努力,去排除汽车的故障,修补房子的漏洞,或者造出新的玩意儿。在游戏中,比如说AVG游戏的解谜。而最雄辩的例子就是俄罗斯方块了(TETRIS)。
[竞争] 人类通过竞争来体现自己比别人更强,证明自己的价值。各种体育比赛的目的就是争第一,争出谁强。游戏 的街机格斗游戏是最明显的例子。玩家通过无数次的历练,力求比别人更强。FPS游戏的网上对战功能每更把人类这种基本要求发挥得淋漓尽致。
[社交] 社交是人类基本需求。ICQ和网上聊天的盛行就说明了这一点。在单机游戏时代,社交对游戏的影响不太明显。但网上游戏出现后,社交成为网上游戏成功的重要因素之一。
[喜剧] 喜剧效果在游戏中的应用还不太普遍。在所有娱乐形式中却大行其道,尤其是电影。即使很严肃的题材,也可以黑色幽默一把。像David Lynch的《Blue Velvet》这么严酷的电影中毛豆有一段充满了喜剧性的片段。可以说,对严肃题材的喜剧化处理,目前在游戏业还是一项空白。
[惊险刺激] 从危险中获得刺激和快感。这点在美国流行文化中极为重要。从千旋百转的过山车,到高耸入云的自由落体机,到蹦极,美国人是什么悬玩什么,并从中获得极大的刺激和快感。值得指出的是:这种惊险刺激是在当事人知道没有危险的情况下获得的——玩蹦极时大家知道不会出事,否则谁敢去玩。游戏也一样,玩家在玩FPS的时候,知道自己不会真被子弹射中,但当他面对敌人的时候还是同样地紧张而激动。
[体育运动] 在现实生活中,成千上万的人们怀着极大的热情投入各种体育健身运动中,在付出汗水的同时也获得了欢畅。体育运动和游戏的结合还不普遍。曾经风靡一时的跳舞机(DDR)和跳舞毯显示了把体育运动和游戏融合的巨大能量。
[爱] 爱情和性爱是其他娱乐形式永恒的主题之一。但在游戏中还不很普遍,只有日本的恋爱模拟游戏尝试了这一主题,此外RPG游戏中一般都有爱情戏。对其他类型的游戏,爱情现在处于可有可无的地位。
[创造] 上帝从乌有中创造了人类,而人类也对创造乐而不疲。从沙滩上的城堡,到小孩的积木和LEGO玩具,都是从乌有中,使用一定的原材料创造出全新的事物,并感到成就感和愉悦。
[权利] 对权利的追求是驱动人类社会生活的重要因素,公司职员都希望被提升——拥有更大的权利。权利体现在对资源的支配权利。资源包括金钱、人力、政策等。权力对游戏来说是最重要的一个要素,对策略游戏由甚。在RTS游戏中,玩家拥有无上的权力,决定己方所有单元去做什么,从而可以满足人们的领袖欲望。
[探索和发现] 对未知世界的探索和发现是人类与生俱来的欲望。从几百年前的海上环球探索,到19世纪的西部淘金,到20实际的阿波罗登月,都是这种欲望的体现。在ACT和AVG游戏中,探索和发现是最重要的属性。
[进展和完成] 人类从循环渐进接近目标的过程中得到鼓舞,以达成目标为最终乐趣。对游戏来说,也必然有这么一个过程——递阶前进,最终达成目标是很多游戏的游戏性的基础。
[使用技能] 人类对于某项技能的迷恋,通过不断的锻炼,使得这项技能更趋完美的境界,并从娴熟地使用技能中获得某种满足和成就感。比如街机格斗游戏的高手们,为了技能的提高衣带渐宽终不悔。
|