2021-人机交互-Exam2-文献阅读
Exam2-文献阅读
1. As we may think
作为科学研究与发展办公室的主任,Vannevar Bush 博士协调了大约六千名美国顶尖科学家在将科学应用于战争方面的活动。在这篇重要的文章中,他提出了当战斗停止时对科学家的激励。他敦促科学家们应该转向使我们令人眼花缭乱的知识库更易于访问的艰巨任务。多年来,发明扩大了人的体力,而不是他的心智。使拳头倍增的锤子、使眼睛锐利的显微镜以及破坏和检测的引擎是现代科学的新成果,但最终结果不尽如人意。现在,布什博士说,工具就在手边,如果开发得当,将使人类获得和掌握世代相传的知识。这些部分的完善应该是我们的科学家们从他们的战争工作中脱颖而出的首要目标。就像爱默生1837年在“美国学者”上的著名演讲一样,布什博士的这篇论文呼吁在有思想的人与我们知识的总和之间建立一种新的关系。
1.1. Background
这不是一场科学家的战争;这是一场所有人都参与其中的战争。科学家们将他们过去的专业竞争埋葬在共同事业的需求中,他们分享了很多东西,学到了很多东西。在有效的伙伴关系中工作令人振奋。现在,对许多人来说,这似乎即将结束。科学家接下来要做什么?
对于生物学家,尤其是医学家来说,几乎没有优柔寡断的余地,因为他们的战争工作几乎不需要他们离开老路。许多人确实能够在他们熟悉的和平时期实验室进行战争研究。他们的目标大致相同。
最猛烈的是物理学家,他们离开学术追求去制造奇怪的破坏性小工具,他们不得不为他们意料之外的任务设计新的方法。他们在能够击退敌人的设备上尽了自己的一份力量。他们与我们盟友的物理学家共同努力。他们在自己的内心感受到了成就的激荡。他们是一支伟大球队的一员。现在,随着和平的临近,人们会问他们在哪里可以找到值得他们最好的目标。
1.2. Part-1 世界已经进入了拥有高度可靠的廉价复杂设备的时代
人类使用科学和他的研究带来的新仪器有什么持久的好处?首先,他们增加了他对物质环境的控制。他们改善了他的食物、衣服和住所;他们增加了他的安全感,并使他部分地摆脱了赤裸裸的存在的束缚。他们让他对自己的生物过程有了更多的了解,因此他逐渐远离疾病并延长了寿命。它们阐明了他的生理和心理功能的相互作用,为改善心理健康带来了希望。
科学提供了人与人之间最快捷的交流;它提供了思想的记录,使人类能够操纵并从记录中提取内容,从而使知识在整个种族而不是个人的生命中不断发展和持久。
有越来越多的研究。但是越来越多的证据表明,随着专业化的扩展,我们今天陷入了困境。调查员被数以千计的其他工作人员的发现和结论所震惊——这些结论他没有时间去理解,更不用说记住了。然而,专业化对于进步变得越来越必要,而在学科之间架起桥梁的努力也相应地是难以做到的。
从专业上讲,我们传播和审查研究结果的方法已经有好几代人了,现在完全不适合他们的目的。如果可以评估撰写学术著作和阅读它们所花费的总时间,那么这些时间之间的比率可能会令人吃惊。那些认真地试图通过仔细和连续阅读来跟上当前思想的人,即使是在有限的领域,很可能会回避一项旨在显示上个月有多少努力可以随叫随到的考试。孟德尔关于遗传学定律的概念在一代人的时间里为世人所遗忘,因为他的出版物没有被少数能够掌握和扩展它的人所接受;无疑问,这种灾难正在我们周围重演,因为真正重要的成就在无足轻重的人群中消失了。
困难似乎不是我们鉴于当今兴趣的范围和多样性而过度出版,而是出版的范围远远超出了我们目前真正利用记录的能力。人类经验的总和以惊人的速度扩展,我们用于穿过随之而来的迷宫到达一时重要的物品的方法与方形索具时代使用的相同。
但是,随着新的强大工具的使用,出现了变化的迹象。能够在物理意义上看到事物的光电池,可以记录所见甚至未见的先进摄影术,能够在比蚊子用来振动翅膀的功率更少的引导下控制强大力量的热电子管,阴极射线管渲染可见一个事件如此短暂,相比之下,一微秒是一段很长的时间,继电器组合将比任何人类操作员更可靠地执行所涉及的运动序列,并且速度是其数千倍-有很多机械辅助可以实现转换在科学记录中。
两个世纪前,莱布尼茨发明了一种计算机,它体现了最近键盘设备的大部分基本特征,但后来无法投入使用。这种情况的经济学与它背道而驰:在大规模生产之前,建造它所涉及的劳动力超过了使用它节省的劳动力,因为它所能完成的一切都可以通过充分使用铅笔和纸来复制。而且,它会经常崩溃,因此无法依赖它;因为在当时和很久以后,复杂性和不可靠性是同义词。
巴贝奇即使在他那个时代得到了非常慷慨的支持,也无法制造出他伟大的算术机器。他的想法很合理,但当时的建设和维护成本太高了。如果法老得到了详细而明确的汽车设计,如果他完全理解这些设计,那么为一辆汽车制造数千个零件就会耗费他王国的资源,而这辆车会在第一次去吉萨。
现在可以非常经济地建造带有可互换部件的机器。尽管非常复杂,但它们的性能可靠。见证不起眼的打字机、电影摄影机或汽车。彻底了解后,电触点已不再粘连。请注意自动电话交换机,它拥有数十万个此类联系人,但仍然可靠。一个密封在薄玻璃容器中的金属蜘蛛网,一根加热到耀眼光芒的电线,简而言之,收音机的热电子管,由数亿人制造,装在包裹中,插入插座–并且它起作用了!它的游丝部件,其建造过程中涉及的精确位置和对齐方式,可能会占用一个公会的工匠数月之久;现在它是用30美分建造的。世界已经进入了一个拥有高度可靠的廉价复杂设备的时代。一定会有一些事情发生。
1.3. Part2:摄影 一种记录方式
一个记录,如果要对科学有用,就必须不断扩展,必须存储,最重要的是必须可以查阅。今天,我们通常通过写作和摄影来记录,然后是印刷;但我们也记录在胶片、蜡盘和磁线上。即使没有出现全新的录音程序,这些现有的程序肯定处于修改和扩展的过程中。
当然,摄影的进步不会停止。更快的材料和镜头、更自动化的相机、更细粒度的敏感化合物,以扩展微型相机的想法,这些都迫在眉睫。让我们将这一趋势预测为一个合乎逻辑的,如果不是不可避免的,结果。未来的相机猎犬在他的额头上戴了一个比核桃大一点的肿块。拍3平方毫米的照片,以后再投影或放大,毕竟比现在的做法只涉及10倍。该镜头具有通用焦点,可缩小到肉眼所能容纳的任何距离,这仅仅是因为它的焦距很短。胡桃木上有一个内置的光电管,就像我们现在至少在一台相机上有的那样,它可以自动调整大范围照明的曝光。胡桃里有胶卷,可进行一百次曝光,在插入胶卷夹子时,操作快门和移动胶卷的弹簧就上一次了。它产生全彩色的结果。它很可能是立体的,并用间隔玻璃眼睛记录,因为立体技术的显着改进指日可待。
拉动百叶窗的绳索可以伸到一个男人的袖子里,他的手指很容易够到。轻轻一捏,照片就拍好了。一副普通的眼镜上,靠近一个镜片的顶部有一条方形的细纹,在普通的视线之外。当一个物体出现在那个方块中时,它会被排列成它的图片。当未来的科学家在实验室或现场走动时,每次他看到值得记录的东西时,他都会按下快门,然后快门就进去了,甚至没有发出咔嗒声。这一切都很棒吗?关于它的唯一奇妙的事情是制作尽可能多的图片的想法。
会有干拍吗?它已经以两种形式出现在这里。当布雷迪拍摄他的内战照片时,曝光时印版必须是湿的。现在它必须在开发过程中变湿。将来也许根本不需要弄湿它。长期以来,有一些胶片用重氮染料浸渍,无需显影即可形成照片,因此只要操作相机,它就已经存在。暴露在氨气中会破坏未曝光的染料,然后可以将照片取出并进行检查。这个过程现在很慢,但有人可能会加快速度,而且它没有像现在让摄影研究人员忙碌那样的纹理困难。通常,能够拍下相机并立即查看图片是有利的。
现在的另一个过程是使用也很慢,而且或多或少是笨拙的。50年来,浸渍纸一直被使用,由于在纸中包含的碘化合物发生化学变化,因此在与电触点接触的每个点都会变暗。它们已被用来制作记录,因为在它们上面移动的指针可能会留下痕迹。如果指针上的电位随着它的移动而变化,则该线会根据电位变亮或变暗。
该方案现在用于传真传输。指针在纸上一个接一个地绘制一组间隔很近的线。当它移动时,它的电位会根据从远处站的电线接收到的变化电流而变化,这些变化是由类似地扫描图片的光电池产生的。在每一瞬间,所画线条的暗度都等于光电管观察到的图片上点的暗度。因此,当整个图片都被覆盖时,接收端就会出现一个复制品。
以这种方式,光电池可以像场景照片一样逐行查看场景本身。这整个装置构成了一个具有附加功能的照相机,如果需要,可以取消该功能,即在远处拍摄照片。速度慢,画面细节差。尽管如此,它确实提供了另一种干摄影的过程,即照片一拍完就完成。
一个勇敢的人可以预测这样一个过程在细节上总是笨拙、缓慢和错误的。今天的电视设备每秒传输16幅相当不错的图像,它与上述过程只涉及两个本质区别。一方面,记录是由移动的电子束而不是移动的指针完成的,因为电子束确实可以非常快速地扫过图片。另一个区别仅涉及使用在电子撞击时会瞬间发光的屏幕,而不是经过化学处理的纸或永久改变的薄膜。这个速度在电视中是必要的,因为电影而不是静止图像才是对象。
使用经过化学处理的胶片代替发光屏幕,让设备传输一张照片而不是连续照片,并使用快速相机获得干摄影结果。处理过的薄膜需要比目前的例子快得多,但它可能是。更严重的反对意见是,该计划将涉及将薄膜放入真空室内,因为电子束仅在如此稀薄的环境中才能正常运行。可以通过让电子束在隔板的一侧播放,并将薄膜压在另一侧来避免这个困难,如果这个隔板允许电子垂直于其表面通过,并防止它们从侧面散开。这样的隔断,以粗糙的形式,当然是可以建造的,它们很难支撑一般的发展。
与干摄影一样,微摄影还有很长的路要走。减少记录大小并通过投影而不是直接检查它的基本方案具有不可忽视的可能性。光学投影和照片还原的结合已经在缩微胶卷中产生了一些学术成果,其潜力非常具有启发性。今天,使用缩微胶卷,可以采用线性因子20的缩小,并且在重新放大材料进行检查时仍然可以产生完全的清晰度。限制是由胶片的颗粒度、光学系统的卓越性和所用光源的效率设定的。所有这些都在迅速改善。
假设线性比率为100以备将来使用。考虑与纸张厚度相同的薄膜,尽管更薄的薄膜肯定可以使用。即使在这些条件下,书本上的大部分普通记录与其缩微胶卷复制品之间的总系数也为10,000。大英百科全书可以缩小到火柴盒的体积。一百万卷的图书馆可以压缩到一张桌子的一端。如果自活字发明以来,人类以杂志、报纸、书籍、小册子、广告简介、信件的形式制作了一份完整的记录,其体积相当于十亿本书,整个事件,组装和压缩,可以用一辆移动的面包车拖走。当然,仅仅压缩是不够的。人们不仅需要制作和存储记录,还需要能够查阅它,这方面的事情稍后再说。甚至现代的大图书馆也不会被普遍查阅;它被少数人蚕食。
然而,就成本而言,压缩很重要。缩微胶卷《大不列颠》的材料需要五分钱,而且只要一美分就可以邮寄到任何地方。印一百万份需要多少钱?印刷一张大版的报纸,成本只有一美分的一小部分。Britannica的整个材料以缩微胶卷的形式出现在一张八又二分之一英寸的纸上。一旦可用,以未来的摄影复制方法,大量复制品可能会超过材料成本一美分。原件的编写?这介绍了该主题的下一个方面。
1.4. Part3 新的一种记录方式
为了记录,我们现在推一支铅笔或敲打打字机。然后是消化和修正的过程,然后是排版、印刷和分发的复杂过程。考虑程序的第一阶段,未来的作者是否会停止用手或打字机书写并直接与记录交谈?他通过与速记员或蜡缸交谈来间接做到这一点;但是如果他希望他的演讲直接产生打印记录,那么这些元素都存在。他需要做的就是利用现有机制并改变他的语言。
在最近的一次世界博览会上,展示了一台名为Voder的机器。一个女孩抚摸着它的键,它发出了可识别的语音。在任何时候都没有人声带进入手术过程;琴键简单地结合了一些电产生的振动,并将这些振动传递给扬声器。在贝尔实验室,有一台与此相反的机器,称为声码器。扬声器被麦克风取代,麦克风拾音。跟它说话,对应的按键就会动起来。这可能是假设系统的一个要素。
另一个元素是在速记式中发现的,这是通常在公开会议上遇到的有点令人不安的装置。一个女孩懒洋洋地敲击着钥匙,环顾房间,有时用不安的目光看着说话者。从它出现了一个打字条,用语音简化的语言记录了说话者应该说的话。后来这个条带被重新打成普通语言,因为在它的新生形式中,只有入门者才能理解它。结合这两个元素,让Vocoder运行stenotype,结果是一台机器在说话时会打字。
人们现在可以在他的实验室中想象未来的调查员。他的手是自由的,他没有被锚定。当他四处走动和观察时,他会拍照并发表评论。时间会自动记录以将两个记录联系在一起。如果他进入现场,他可能会通过无线电连接到他的录音机。当他晚上思考他的笔记时,他再次将他的评论记录在案。他的打字记录以及他的照片都可能是微型的,以便他将它们投影以供检查。
然而,在收集数据和观察结果、从现有记录中提取平行材料以及将新材料最终插入公共记录的一般主体之间,还需要进行很多工作。对于成熟的思想,没有机械的替代品。 但是创造性思维和本质上重复的思维是非常不同的东西。对于后者,有并且可能有强大的机械辅助设备。
添加一列数字是一个重复的思考过程,很久以前它就被适当地降级到机器上。确实,机器有时是由键盘控制的,并且在阅读数字和戳相应的键时会产生一种想法,但即使这样也是可以避免的。已经制造出通过光电管读取键入的数字然后按下相应键的机器;这些是用于扫描类型的光电管的组合,用于对随后的变化进行分类的电路,以及用于将结果解释为螺线管的动作以拉下键的继电器电路。
由于我们学习写数字的方式笨拙,因此需要所有这些复杂性。如果我们把它们按位置记录下来,仅仅通过在卡片上配置一组点,自动读取机制就会变得比较简单。事实上,如果点是孔,我们有Hollorith很久以前为人口普查目的生产的打孔卡机,现在在整个业务中使用。没有这些机器,某些类型的复杂企业几乎无法运营。
加法只是一种操作。进行算术计算还涉及减法、乘法和除法,此外还有一些用于临时存储结果、从存储中移除以供进一步操作以及通过打印记录最终结果的方法。用于这些目的的机器现在有两种类型:用于会计等的键盘机器,用于插入数据的手动控制,并且就操作顺序而言通常是自动控制的;和打孔卡机,其中单独的操作通常委托给一系列机器,然后卡片从一个整体转移到另一个。这两种形式都非常有用;但就复杂的计算而言,两者都还处于萌芽阶段。
在物理学家发现需要对宇宙射线进行计数后不久,快速电子计数出现了。为了他们自己的目的,物理学家们迅速建造了能够以每秒100,000次的速度计算电脉冲的热电子管设备。未来的高级算术机本质上将是电动的,它们的运行速度将是当前速度的100倍或更多。
此外,它们将比目前的商用机器用途更广,因此它们可以很容易地适应各种操作。它们将受控制卡或胶片的控制,它们会选择自己的数据并按照插入的指令对其进行操作,它们会以极高的速度进行复杂的算术计算,并将结果以这样的形式记录下来:易于分发或以后进一步操作。这样的机器会有巨大的胃口。其中一个会从一屋子女孩那里得到指令和数据,这些女孩用简单的键盘敲打,每隔几分钟就会提供一张计算结果。在数以百万计的人做复杂事情的细节事务中,总会有很多东西需要计算。
1.5. Part4
然而,思维的重复过程并不局限于算术和统计问题。事实上,每次按照既定的逻辑过程组合和记录事实时,思维的创造性方面只关心数据的选择和所采用的过程,其后的操作本质上是重复的,因此是合适的。问题归于机器。沿着这些路线没有做太多超出算术范围的事情,这主要是因为情况的经济性。商业的需要,以及显然等待的广阔市场,保证了只要生产方法足够先进,就会出现大量生产的算术机。
使用高级分析机器不存在这种情况;因为过去和现在都没有广阔的市场使用先进的数据处理方法的用户只占人口的很小一部分。然而,有用于求解微分方程的机器-以及函数和积分方程,就此而言。有许多特殊的机器,例如预测潮汐的谐波合成器。还会有更多,肯定会首先出现在科学家手中,而且数量很少。
如果科学推理仅限于算术的逻辑过程,我们对物理世界的理解就不会太远。人们不妨尝试完全通过使用概率数学来掌握扑克游戏。珠子串在平行线上的算盘,使阿拉伯人比世界其他地方早几个世纪就开始了位置计算和零的概念;它是一个有用的工具——如此有用以至于它仍然存在。
从算盘到现代的键盘记账机,相去甚远。这将是与未来算术机同等的一步。但即使是这台新机器也无法将科学家带到他需要去的地方。如果高等数学的使用者想根据既定规则解放他们的大脑去做一些比重复性细节转换更重要的事情,那么也必须避免对高等数学进行费力的详细操作。数学家不是一个可以轻易操纵数字的人;通常他不能。他甚至不是一个能轻易用微积分进行方程变换的人。他首先是一个善于在高层次上使用符号逻辑的人,尤其是他在选择所采用的操作过程时具有直觉判断力的人。
他应该能够将所有其他事情交给他的机械装置,就像他将汽车的推进装置交给引擎盖下的复杂机械装置一样自信。只有这样,数学才能切实有效地将不断增长的原子学知识应用于化学、冶金和生物学等高级问题的有用解决方案。出于这个原因,将会有更多的机器来为科学家处理高等数学。其中一些将足够奇怪,以适合当前文明文物的最挑剔的鉴赏家。
1.6. Part5
然而,科学家并不是唯一一个通过使用逻辑过程来处理数据和检查他周围世界的人,尽管他有时会通过接纳任何变得合乎逻辑的人来保持这种外观,这很像英国人的方式。劳工领袖被提升为爵士。每当采用逻辑思维过程时——也就是说,每当思想沿着公认的规律运行时——机器就有机会。形式逻辑曾经是老师检验学生灵魂的敏锐工具。简单地通过巧妙地使用继电器电路,可以很容易地构造出一种根据形式逻辑来操纵前提的机器。将一组前提放入这样的设备中并转动曲柄,它会很容易地得出一个又一个的结论,这一切都符合逻辑规律,并且不会比键盘加法机预期的更多。
逻辑会变得非常困难,毫无疑问,在它的使用中产生更多的保证会很好。用于高级分析的机器通常是方程求解器。方程变换器的想法开始出现,它将按照严格且相当先进的逻辑重新排列方程所表达的关系。数学家表达其关系的极其粗糙的方式阻碍了进展。他们采用了一种像Topsy一样发展起来的象征主义,几乎没有一致性;在那个最合乎逻辑的领域里,这是一个奇怪的事实。
一种新的象征,可能是位置象征,显然必须先于将数学变换简化为机器过程。然后,在数学家严格的逻辑之外,是逻辑在日常事务中的应用。有一天,我们可能会像现在在收银机上输入销售额一样,在机器上单击参数。但逻辑机器看起来不会像收银机,即使是简化模型。
对想法的操纵和将它们插入到记录中就到此为止了。到目前为止,我们的情况似乎比以前更糟——因为我们可以极大地延长记录;然而,即使以目前的规模,我们也很难查阅它。这比仅仅为科学研究目的提取数据要大得多;它涉及人类通过继承获得的知识而获利的整个过程。使用的主要动作是选择,在这里我们确实停止了。可能有数以百万计的美好想法,以及它们所基于的经验的描述,都被包裹在可接受的建筑形式的石墙中;但如果这位学者通过勤奋的搜索每周只能得到一个,他的综合可能跟不上现在的情况。
选择,从广义上讲,是细木工手中的一把石锛。但是,狭义上和其他方面,在选择上已经机械化了。一家工厂的人事官员将一叠几千张员工卡放入筛选机中,按照既定惯例设置代码,并在短时间内生成一份所有居住在特伦顿并会西班牙语的员工名单。例如,即使是这样的设备在将一组指纹与档案中的五百万之一进行匹配时也太慢了。这种选择设备很快就会从目前的每分钟几百次审查数据的速度加快。通过使用光电管和缩微胶卷,他们将以每秒数千个的速度检查项目,并将打印出所选项目的副本。
然而,这个过程是简单的选择:它依次检查一大组项目中的每一个,并挑选出具有某些特定特征的项目。自动电话交换机最好地说明了另一种选择形式。您拨打一个号码,机器会选择并连接一百万个可能的电台中的一个。它并没有覆盖所有这些。它只关注由第一个数字给出的类,依此类推;并因此快速且几乎无误地前往所选电台。进行选择需要几秒钟的时间,但如果在经济上保证提高速度,则可以加快该过程。如有必要,可以用热电子管开关代替机械开关,使其速度极快,从而可以在百分之一秒内完成全部选择。没有人愿意花必要的钱在电话系统中进行这种更改,但总体思路在其他地方也适用。
以大百货公司的平凡问题为例。每次进行收费销售时,都有许多事情要做。库存需要修改,销售员需要为销售提供信用,总帐需要一个条目,最重要的是,客户需要收费。已经开发了一种中央记录设备,其中大部分工作都可以方便地完成。销售员将顾客的身份证、他自己的卡以及从所售商品中取出的卡——所有打孔卡——放在展台上。当他拉动杠杆时,通过孔进行接触,中心点的机器进行必要的计算和输入,并打印出正确的收据,让销售员将其传递给客户。
但是可能有一万个收费客户在与商店做生意,在完成全部操作之前,必须有人选择正确的卡并将其插入中心局。现在,快速选择可以在一两分钟内将正确的卡片滑入到位,然后再将其放回原处。然而,另一个困难出现了。必须有人读取卡片上的总数,以便机器可以将其计算的项目添加到其中。可以想象,这些卡片可能是我所描述的干摄影类型。然后可以通过光电管读取现有的总数,并通过电子束输入新的总数。
卡片可以是微型的,因此它们占用的空间很小。他们必须迅速行动。它们不需要被转移到很远的地方,而只是到位,以便光电管和记录器可以对它们进行操作。位置点可以输入数据。在月底,可以很容易地制造出一台机器来读取这些信息并打印一张普通的账单。选择电子管时,开关中不涉及任何机械部件,只需花费很少的时间即可使用正确的卡-一秒钟就足以完成整个操作。如果需要,卡片上的整个记录可以通过钢片上的磁点来记录,而不是按照波尔森很久以前在磁线上发表演讲的方案,用光学方式观察。这种方法具有简单和易于擦除的优点。然而,通过使用摄影,人们可以安排以放大的形式投影记录,并通过使用电视设备中常见的过程进行远距离投影。
可以考虑快速选择这种形式,并将远距离投影用于其他目的。能够在一两秒钟内在操作员面前键入一百万张纸,然后可以在其中添加注释,这在很多方面都具有启发性。它甚至可能在图书馆中使用,但那是另一回事。无论如何,现在可能有一些有趣的组合。例如,人们可能会以与语音控制的打字机有关的方式对着麦克风讲话,从而做出选择。它肯定会击败通常的文件管理员。
1.7. Part6
然而,选择问题的真正核心不仅仅是图书馆采用机制的滞后,或者缺乏对其使用的设备开发。我们在获取记录方面的无能很大程度上是由索引系统的人为造成的。当任何类型的数据被放入存储中时,它们会按字母或数字排列,并通过从一个子类到另一个子类追踪信息来找到信息(如果是的话)。它只能在一个地方,除非使用重复项;必须有关于哪条路径将定位它的规则,并且规则是繁琐的。此外,找到一个项目后,必须从系统中出现并重新进入新路径。
人类的思维不是这样运作的。它通过协同运作。掌握一个项目后,它会根据大脑细胞携带的一些复杂的轨迹网,立即捕捉到由思想联想暗示的下一个项目。当然,它还有其他特点;不经常遵循的轨迹容易褪色,项目不是完全永久的,记忆是短暂的。然而,动作的速度、轨迹的错综复杂、心理画面的细节,在自然界中令人惊叹。
人不能完全希望人为地复制这种心理过程,但他当然应该能够从中学习。在次要方面他甚至可能有所提高,因为他的记录具有相对的永久性。然而,从类比中得出的第一个想法涉及选择。通过关联而不是通过索引进行选择可能尚未实现机械化。因此,人们不能希望与头脑遵循联想轨迹的速度和灵活性相提并论,但在从存储中复活的物品的持久性和清晰度方面,应该可以果断地击败头脑。
考虑未来供个人使用的设备,它是一种机械化的私人文件和库。它需要一个名字,随机生成一个名字,memex就可以了。memex是一种设备,个人可以在其中存储他的所有书籍、记录和通信,并且是机械化的,因此可以以超快的速度和灵活性进行查询。这是对他记忆的放大的准确补充。
它由一张桌子组成,虽然可以从远处操作,但它主要是他工作的家具。顶部是倾斜的半透明屏幕,上面可以投射材料,方便阅读。有一个键盘,以及成组的按钮和控制杆。否则它看起来就像一张普通的桌子。
一方面是存储的材料。改进的缩微胶卷可以很好地处理散装问题。memex内部只有一小部分用于存储,其余部分用于机械。然而,如果用户每天插入5000页材料,他需要数百年才能填满存储库,因此他可以挥霍无度,自由输入材料。
大多数memex内容都是在准备插入的缩微胶卷上购买的。各种书籍、图片、当前期刊、报纸,因此被获取并放置到位。商务信函走同样的道路。并且有直接进入的规定。memex的顶部是一个透明的压板。上面放着手写笔记、照片、备忘录等等。当一个人就位时,压下一个杠杆会使它被拍摄到memex胶片的下一个空白区域,使用干摄影。
当然,可以通过通常的索引方案来查询记录。如果用户想查阅某本书,他在键盘上敲击它的代码,这本书的标题页会立即出现在他面前,投射到他的一个查看位置上。经常使用的代码是助记符,所以他很少查阅他的代码书;但是当他这样做时,只需轻按一下键即可将其投射以供他使用。此外,他还有补充杠杆。在将这些杠杆中的一个向右偏转时,他会在他面前翻阅这本书,每一页都以一种只允许一眼识别的速度依次投射。如果他进一步向右偏转,他会一次翻阅这本书10页;更进一步,一次100页。向左偏转给了他同样的向后控制。
一个特殊的按钮将他立即转移到索引的第一页。因此,他图书馆中的任何一本书都可以比从书架上拿出来更方便地被调用和查阅。由于他有多个投影位置,他可以将一个项目保留在该位置,同时调用另一个项目。他可以添加边注和评论,利用一种可能的干摄影类型,甚至可以安排它,以便他可以通过手写笔方案来做到这一点,例如现在在铁路候车室看到的电传签名中使用的,只是就好像他面前有实体书页一样。
1.8. Part7
所有这些都是传统的,除了对当今机制和小工具的预测。然而,如果提供了关联索引的直接步骤,其基本思想是一个规定,即可以随意使任何项目立即自动选择另一个项目。这是 memex 的基本特征。将两个项目捆绑在一起的过程是重要的事情。
当用户构建一条小径时,他会为它命名,将名字插入到他的代码簿中,然后在他的键盘上敲出。在他面前是要连接的两个项目,投影到相邻的观看位置。在每一个的底部有许多空白代码空间,并设置了一个指针来指示每个项目上的一个。用户点击一个键,项目就会永久连接。在每个代码空间中出现代码字。在视野之外,但也在代码空间中,插入了一组用于光电池查看的点;在每个项目上,这些点按它们的位置指定另一个项目的索引号。
此后,在任何时候,当这些项目中的一个出现在视野中时,只需点击相应代码空间下方的按钮即可立即调用另一个。此外,当许多项目因此连接在一起形成一条轨迹时,可以通过偏转类似于用于翻书的杠杆来快速或缓慢地轮流查看它们。就好像这些实体物品已经聚集在一起,形成了一本新书。不仅如此,因为任何项目都可以连接成无数个路径。
可以说,memex的所有者对弓箭的起源和属性很感兴趣。具体来说,他正在研究为什么在十字军东征的小规模冲突中土耳其短弓明显优于英国长弓。他的memex中有数十本可能相关的书籍和文章。首先他浏览百科全书,找到有趣但粗略的文章,将其投影出来,然后,在历史中,他找到另一个相关项目,并将两者联系在一起。因此,他走,建立了许多项目的踪迹。有时,他会插入自己的评论,或者将其链接到主路径,或者通过辅助路径将其连接到特定项目。当很明显可用材料的弹性特性与弓有很大关系时,他分道扬镳,带他阅读弹性教科书和物理常数表。他插入了一页自己的手写分析。因此,他通过可用的材料迷宫建立了他感兴趣的线索。
他的足迹不会消失。几年后,他与一位朋友的谈话转向了人们抵制创新的奇怪方式,即使是至关重要的创新。他举了一个例子,事实上,脾气暴躁的欧洲人仍然没有采用土耳其弓。事实上,他有一个线索。轻触一下即可调出密码本。轻按几个键会投射出路径的头部。一个杠杆可以随意穿过它,停在有趣的项目上,在短途旅行中停下来。这是一条有趣的线索,与讨论有关。所以他设置了一个复制器,把整个轨迹拍下来,然后把它传给他的朋友,插入他自己的memex,在那里链接到更一般的轨迹。
1.9. Part8
全新形式的百科全书将出现,现成的带有关联痕迹的网格贯穿其中,准备好放入memex并在那里放大。律师可以根据自己的整个经历以及朋友和权威人士的经历得出相关的意见和决定。专利代理人随叫随到数以百万计的已发布专利,熟悉了解客户利益的每一个点。医生被病人的反应弄糊涂了,他找到了在研究早期类似病例时建立的线索,并迅速浏览了类似的病例史,并附带参考了相关解剖学和组织学的经典。化学家在有机化合物的合成上苦苦挣扎,他的实验室里摆满了所有的化学文献,其中有化合物类比的踪迹,还有对它们的物理和化学行为的旁证。
历史学家对一个民族进行了大量的按年代记述,将其与只停留在显着项目上的跳跃轨迹相提并论,并且可以在任何时间跟随当代轨迹,这些轨迹将他引导到特定时代的整个文明。开拓者是一种新职业,他们乐于通过大量的共同记录建立有用的道路。来自大师的遗产不仅成为他对世界纪录的补充,而且成为他的门徒搭建他们的整个脚手架。
因此,科学可以实现人类生产、储存和查阅种族记录的方式。更引人注目地概述未来的工具可能会令人震惊,而不是像这里所做的那样紧紧抓住现在已知并正在快速发展的方法和元素。当然,各种技术困难都被忽略了,但也被忽略了一些未知的手段,它们可能会像热电子管的出现一样猛烈地加速技术进步。为了让画面不至于太平庸,由于坚持现在的模式,不妨提一种这样的可能性,不是预言,而只是暗示,因为基于已知扩展的预言是有实质内容的,而预言建立在未知之上只是一个双重的猜测。
我们创造或吸收唱片材料的所有步骤都是通过一种感官进行的——我们触摸按键时的触觉,我们说话或聆听时的口头,我们阅读时的视觉。是不是有朝一日可以更直接地建立路径?
我们知道,当眼睛看到东西时,所有随之而来的信息都是通过视神经通道中的电振动传递到大脑的。这与电视机电缆中发生的电振动完全类似:它们将图像从看到图像的光电池传送到广播它的无线电发射器。我们进一步知道,如果我们可以用合适的工具接近那根电缆,我们就不需要接触它;我们可以通过电感应来获取这些振动,从而发现和再现正在传输的场景,就像电话线可以被窃听以获取信息一样。
打字员手臂神经中流动的冲动将翻译后的信息传送到她的手指,这些信息到达她的眼睛或耳朵,以便手指可以敲击正确的键。难道这些电流不会被截获,无论是以信息传送到大脑的原始形式,还是以奇妙的变形形式,然后它们进入手?
通过骨传导,我们已经将声音引入聋人的神经通道,以便他们可以听到。难道我们就不可能学会引入它们,而不需要先将电振动转换为机械振动,然后人体机制立即将其转换回电振动的麻烦吗?头骨上有几个电极,脑部描记仪现在会产生笔墨痕迹,这些痕迹与大脑本身发生的电现象有某种关系。的确,记录是难以理解的,除非它指出大脑机制的某些严重功能失调;但是现在谁会限制这种事情可能导致的结果呢?
在外部世界,所有形式的智能,无论是声音还是视觉,都被简化为电路中变化的电流形式,以便它们可以被传输。在人的框架内,发生了完全相同的过程。为了从一种电现象发展到另一种电现象,我们必须总是转变为机械运动吗?这是一个暗示性的想法,但在不脱离现实和即时性的情况下,几乎不需要删减。
如果能更好地回顾自己阴暗的过去,更全面客观地分析自己现在的问题,想必人的精神应该得到提升。他已经建立了一个如此复杂的文明,以至于他需要更全面地机械化他的记录,如果他要推动他的实验得出合乎逻辑的结论,而不仅仅是因为他有限的记忆力过重而陷入困境。如果他能够重新获得忘记手头不需要的各种事物的特权,并保证如果它们证明很重要,他可以再次找到它们,那么他的旅行可能会更加愉快。
科学的应用为人类建造了一座供应充足的房子,并教会他在其中健康地生活。他们使他能够用残忍的武器向另一个人投掷大批人。他们可能还允许他真正涵盖伟大的记录,并在种族经验的智慧中成长。在他学会为自己的真正利益而运用该记录之前,他可能会在冲突中丧生。然而,在将科学应用于人类的需要和欲望时,似乎是一个非常不幸的阶段,在这个阶段终止这个过程,或者对结果失去希望。
2. Mind-Prosthesis Metaphor for Design of Human-Computer Interfaces That support Better Attention Management 支持更好注意管理的思维驱动的人机交互接口设计
- 本文主要关注了人机界面设计中潜在隐喻的变化背景下的用户注意力管理问题。
- 在介绍之后,主要讨论了就像计算机上下文中断过程中的注意力保持的问题。
- 强调了当前的交互和特定的桌面比喻中潜在的问题,同时我们认为思维驱动的隐喻更适合未来的设计、注意力认知系统,并且我们提出了机遇我们的研究的一些交互设计的建议和指引。
2.1. 介绍
- 本文基于之前的研究:
- 交互设计中的比喻
- 人机交互演化过程中的隐喻:从命令行界面,到基于文本交互,再到现代化WIMP接口
- 人类的注意力会被如下的东西影响:
- 快速持续的信息访问和人员访问
- 多任务
- 其他事情的打断
- 电子化的环境
- 因为我们发现**人类注意力进程(human attentional processes)**是核心部分
- 本文的内容组织方式
- 第一节:在交互设计中的比喻的使用(显式和隐式)
- 第二节:我们讨论了以桌面比喻为核心的一种完全不同的交互设计的必要性:碎片化的任务和注意力进程的持续负载。
- 第三节:我们介绍了当前的研究,强调了一些我们关注的问题。
- 第四节:我们给出了思维驱动(mind-prosthesis)的比喻的详细描述l
2.2. 第一节:人机交互设计中的比喻和类比
- 关于比喻和类比的现代理论将机器放在核心的位置上,但是这样做存在的问题并没有能被系统的描述,很少有相关的定性评价。
- 在本文中,我们提出了第一个关于不同的两种交互的定性分析:
- 桌面交互(desktop interfaces)
- 思维驱动交互(mind-prosthesis interfaces)
- 基于这种定性/理论研究,我们开始实验和收集我们给出的第一个原型交互[Clauzel, Roda, & Stojanov 2006]的定性数据。
- 我们还讨论了两种广泛使用的人机交互(对话式和桌面式)比喻的基本假设。
- 根据他们外观,计算机被创建成了交互式伙伴
- 因此进一步外推,我们可以将HCI描述为Reddy倡导的比喻:用户想要传递给机器的信息被打包在命令中,并且通过语言通道(例如命令行)发送给接收者(计算机),计算机接收到后将解密命令,并且执行对应需要执行的操作。
- 在这种方式中,执行的延迟仅仅存在于明显的语言交互中(用户等待命令执行,并且知道计算机正在做什么)
- 但是我们并不总是习惯和计算机进行对话,就想人并不会想要和汽车对话一样。因此,很多的可视化、可聆听的部分被提供,并且这部分会被非常频繁的使用。因此在包括手机、导航和驾驶过程中的环境监测中,往往需要自动语言识别系统(ASR)的参与。
- 根据他们外观,计算机被创建成了交互式伙伴
- 为什么我们并不习惯于和汽车进行交流?
- 我们的猜想:每当在与某个实体的互动中出现对话能力的暗示时,人类就会立即跨越一个巨大的网络,对特定实体的能力有特定的期望。
- 而我们倾向于将这些实体拟人化,从而失去对它们的直接控制感。这种控制,正如其他人的情况一样,只能通过语言手段间接地进行。如果您正在驾驶汽车,您当然希望直接控制。因此,汽车控制表上的所有提示往往是非侵入性的,并且支持您的主要注意力:驾驶汽车并密切注意您面前的事物。
- 当向“窗口、图标、菜单、指针设备”(WIMP)界面演变时,基于提示的 HCI 的对话隐喻保持在一种概念混合 [Fauconnier & Turner, 2002] 与通常采用的显式桌面隐喻 WIMP 接口的实现。
- 桌面比喻邀请用户通过使用他们的肢体的虚拟延续(鼠标指针)直接操纵虚拟桌面上的项目来应用他们从物理世界中获得的知识。同时,会话隐喻仍然通过上述文本元素进行培育。最终的结果是,当我们直接在桌面上操作对象时,还有一些实体(代理?)偶尔会提示我们语言信息,有时会要求我们提供语言输入。
- 因此到如今,由于windows操作系统和苹果的mac os,WIMP-L的交互方式被广泛的运用
2.3. 第二节:对于不同的隐喻的需要
- 目前的桌面接口主要基于应用程序和文件系统基本的概念,他们被详细地设计,并且在设计上尽可能的类似(很多的工具都会有一个电子的界面)。
- 在概念上存在如下两种关联
- 应用程序 与 工具之间
- 文档 与 文件之间
- 随着电子设备的普及和互联网的发展,用户越来越希望访问和描述更多的文件,并且在更短的时间中选择处理更多的任务。
- 我们提出了双层碎片化工作模型
- 一部分的碎片任务是由多任务和中断(level 1)来生成,这一部分呢的碎片在使用提示驱动的前互联网时代最小化
- 另一部分碎片任务是由应用程序和文件(level 2)来生成
- 每一部分碎片任务都会为人类有限的认知能力带来一个新的负担,在任务、上下文、应用和文档切换都会需要唤醒人类的感知和记忆(前瞻性和回顾性),整体来看就会减少我们精准分配的注意力的总量
- 但是如今的互联网时代,信息过载和持续的中断已经成为常态。在任意给定时刻用户平均打开8个窗口,并且他们在中断前会在每个给定任务上花费11分钟。
- 中断可能会带来对主任务有用的认知信息,在一定程度上提高任务效率。
- 尤其当用户在移动环境中使用手持设备时,中断会增加用户的注意力和记忆力负载,但是也会带来压力,降低主要任务的效率
- 信息流入增加,注意力负荷增加,注意力成为稀缺资源。研究人员正在处理消息过载、注意力碎片化的新现象。
- 综合来看,近期HCI中注意力管理的问题越来越受到关注,学术期刊的专刊、组织专门的讨论论坛和研究项目也证明了这一点。
2.4. 第三节:当前解决碎片化和促进注意力分配的尝试
- 部分研究人员尝试通过讨论WIMP-L接口来解决注意力分类的问题,然而,占主导地位的WIMP-L隐喻混合并不能促进以自然方式引起注意的改进和扩展。
- 为了有用,一个新的比喻应该有自然的扩展,以便能够公正地服务于技术进步和增加底层系统的复杂性。
- 技术进步使现代CPU、RAM和硬盘存储器的速度提高了数十万倍,容量也增加了许多倍。
- 另一方面,监视器的大小增加了大约1.5到2倍(平均)。
- 当前的情况是,计算机系统可以在内部表示更复杂的实体,同时具有(几乎)相同的显示容量。
- Microsoft研究小组的一项研究表明,使用大型(42 英寸)显示器甚至双显示器或三显示器的人可以在10%到44%的时间内完成任务。这种方法的问题(即保留 WIMP-L 接口并拥有更大的显示器)有其明显的局限性。
- 此外,正如同一组研究人员所指出的更大的屏幕会带来更多的可用性问题
- 丢失鼠标追踪
- 远端获取信息:找到图片、窗口等更加困难
- 窗口管理问题:多窗口、通知等
- 任务管理问题:多窗口允许用户同时执行多个复杂的任务
- 配置问题:多任务处理的用户接口难使用
- 未能利用外围。有了更大的显示器,就可以使用真正的外围设备,并且可以利用它来获得更好的外围设备感知,以支持用户活动。
- 由此尽管用户喜欢使用更大的屏幕进行工作,其实用户的注意力管理变得更为糟糕
- 为了充分应对普适计算的趋势,Maglio 和他的同事正确地指出了一个中心概念,即注意力应该在未来的界面中:
- 如果点击式图形用户界面 (GUI) 能够广泛使用 PC,那么与普及的计算机交互的范例将是什么?
- 一种可能的方法是注意力集中的用户界面 (AUI)
- AUI是关注用户行为的计算系统的用户界面,通过传感机制监控用户
- 例如计算机视觉和语音识别以便他们可以关注用户需求,通过预测用户在明确要求之前提供适当的信息
- 他们的实验设置是在一个框架内设计的,其中AUI应该是用户意图的主动中介和解释器
- 获取用户注意力和中断用户意图是非常困难的,Hortviz曾报告“计算和通信”中的注意力模型超过5年的研究成果。在接口的非侵入性的背景下,他们提出:在推理用户的信息意识与干扰时,我们将注意力视为一种稀有商品和关键货币。
- 非常有意思的是在同一篇文章中,在谈论注意力提示时,作者引用了人类语言互动的一个例子:注意力提示是决定何时开始或对对话或项目做出有效贡献的核心。除了知道何时在对话中说话或聆听之外,注意力对于检测对话是否在进行中也很重要。更一般地说,检测或推断注意力是整个接地过程的重要组成部分——以共同的方式融合在对交流的相互理解上
- 他们的通知平台是一个跨设备的消息系统
- 这个系统通过不同消息来源的消息价值来平衡了用户的被打断的代价。
- 这个平台维护了用户注意力的概率模型,并执行了关于“理想预警、保真度和路由“的持续决策分析。
- 为了达到AUI能够推断出用户注意力在哪里的阶段,必须有一个整体的落地部分(用共享的方式融合在对通信的相互理解上),换言之,研究人员加强了WIMP-L接口中实体(中介)组建,但是我们想要强调,基于人工智能研究的最佳结果,我们仍然远远不能制造对情况有共同理解的共建,这就导致基于上述方法构建的AUI是非常复杂的。
- 为克服WIMP-L接口的上述问题而提出的一种替代方案是所谓的Anti-Mac方法,其中Mac通常保留WIMP-L接口。
- Gentner & Nielsen探索了通过违反Mac或任何其他WIMP界面的主要原则来构建更好界面的可能性。他们提出的原则包括:
- 语言的核心作用:在WIMP-L界面中,用户直接操作对象。但是这种操作相当有限(与 Unix 命令中的众多开关相比)。因此,我们应该回到命令提示符之类的地方。
- 更丰富的对象内部表示目前,关于文件的已知属性数量有限,例如:名称、大小、类型、作者等。该界面只能访问有限的信息,甚至更不可能添加/更改一些信息。在Anti-Mac界面中,可以在界面级别包含附加信息:重要性、关键字、相关文档等。
- 更具表现力的界面:由于该技术肯定可以实现更多功能,为什么要为所有文本文档保留相同的图标?我们的书架上有书,但是通过查看它们,我们可以在不打开它们的情况下猜出哪一本书。
- 专家用户:WIMP-L 接口可能适合初学者,但专家更喜欢用更复杂的操作来交换不灵活的直接操作,这些操作可以通过命令行表示。
- 上面提到的许多元素都包含在不同的当代界面中:
- 通过文件系统元数据与文件相关联,元数据包含集合(个人、工作)、优先级、相关日期(有效时限)
- 文件浏览器可以处理这些元数据并向用户建议自定义视图。此外,在显示文件列表时,某些系统提供的信息比简单的图标多(参见图 2)。例如,Linux的桌面GUI显示包含文档缩略图的文件,而不是通用图标,这就允许用户在浏览磁盘时可以看到文件内容,而不受文件名等因素的议案时
- 类似地,文件浏览器在文件锁定时显示一个锁,对快捷方式显示箭头,对系统文件显示齿轮,对其他元数据图标用户可以添加自定义元素,甚至可以定义覆盖规则。
- 智能图标的关注点是以清晰和非侵入性的方式向用户传达尽可能多的关于它们所代表的对象的信息。
- Anti-Mac方法的主要问题是它没有提供一个概括性的比喻来指导将新元素引入界面。这是因为它的负面定义。
- 在接下来的内容中,我们将描述HCI设计的意识补全比喻。我们描述了这种方法的系统应用如何促进界面的扩展,以实现更好的注意力管理。
2.5. 第四节:MPA(Mind prosthesis approach)
- 在意识补全方法背后的基本哲学是将接口作为人类认知/感知能力的增强。
- 出发点应该是增强人类用户优先的认知,工作记忆和整体注意力能力。
- 增强可以理解成功能模块的组合
- 为用户与其环境之间的结构耦合增加了多种可能性
- 或为重复性交互添加多种可能性。
- 这些功能模块(或不同的结构耦合)应该朝着超越上述人类限制的方向发展。例如,意识到我的工作内存容量有限,界面应该提供一种方法来存储和快速检索我可能需要的任何类型的对象。我应该确信我可以随时轻松快速地检索它们。
- 这种检索能力与聚焦所需信息的能力有关。
- 焦点和一般的注意力不应该被视为静态的(迄今为止大多数HCI研究中所做的),而是,正如Arvidson的工作所建议的那样,注意力应该被视为“一个过程,是动态的,通常是有压力的;它可能涉及内容和关系的重大转变。”
- Arvidson 主张我们可以在三个不同的层次上参与:
- 主题(焦点):参与主题对应于专注力。
- 上下文:根据上下文参加可以区分与主题相关的内容。
- 边缘:边缘参与可以让人们区分共同存在但与主题和上下文无关的内容。
- 这种注意力模型虽然不是认知心理学中的主流模型,但得到了实验结果的支持,似乎使我们能够解决系统设计中的两个重要问题。
- 一方面,当涉及到信息表示时,上下文与主题一样重要,它应该与主题相结合,允许用户定义主题结束和上下文开始的位置。
- 另一方面,在 Arvidson 的模型中,允许上下文元素或边缘元素成为主题的动态过程表明界面应该尽可能最好地利用这三个层次。例如,为了减弱事件或传入信息的侵入性,可以在上下文或边缘区域中表示它们。在那里,用户仍然可以注意到他们,而不会被他们正在做的事情打扰。当他们这样说时,这似乎也是 Mark Weiser 和 John Seely Brown 的建议:静态的技术同时吸引我们注意力的中心和外围,实际上在两者之间来回移动。
- MPA的想法是强调用户应该始终处于控制之中的事实。
- 注意力的边缘可以包含模糊的索引,允许人们发起手头的特定交互(例如启动特定程序;调查系统状态等)
- 当用户决定时,他们可以继续并从事特定的活动,例如屏幕底部的MAC程序栏,他为不同应用程序显示几乎无法区分的图标,用户可以悬停查看更多信息,这样子的净效果是增加了显示器的尺寸,而无需物理上更大的屏幕。
- MPA的关键特性:
- 我们认为放大屏幕上任何对象的可能性动作可能是MPA中的关键动作。缩放功能使用户能够快速全面地了解整个系统,并在任何给定时刻快速调整所需的细节级别。正如Raskin中所述,理想情况下,缩放将消除在WIMP-L界面中看到的许多中间级别(或概念)的需要,如文件名、不同应用程序的概念等。
- 另一个关键特性是用户应该立即(如果最少)获得他们选择执行的任何操作的反馈。此功能再次增加了控制感。
- 另一个有效使用边缘注意力的例子是LavaPS程序:
- 一些关于系统状态的最重要信息以模拟形式表示,而不是显示有关活动进程使用系统资源状态的大量详细信息(如 Unix 中的 ps 命令)。
- 一个进程用一个Blob来表示,它的颜色是进程名称(对于色调)和它上次运行的时间(对于饱和度)的组合。
- 该特定进程的 CPU 使用率会影响Blob的移动,并且它使用的内存越多,Blob 就越大。
- 通过这种方式,无需过多关注,用户就可以获得系统状态的摘要信息:明亮、大且移动速度快的 Blob代表使用大部分系统资源的进程。
- 最后,我们简要地提出了一些实用指南,将界面设计为支持人类注意力过程的意识补全:
- 通用缩放工具:由此我们描述了提供给用户以改变系统任何部分的演示级别的可能性。
- 例如,整个系统的快速但不太详细的视图应该随时可用。
- 另一方面,缩放特定对象(例如文本文件)应该向用户提供有关该文件的更多信息,并且如果用户决定,则在适当的应用程序中以对用户透明的方式打开该文件。
- 构建不同组织模式的可能性:例如,相同内部元素的附加视觉表示
- 连续导航:用户在抽象的空间拓扑中应该有明确的方向——用户因此可以利用他们的空间智能来处理界面
- 跟踪用户操作的历史记录(在系统级别尽可能详细):此功能将启用任何操作的撤消,以及为中断的活动生成历史背景
- 外围区域的视听提示冗余(例如用户操作或系统消息的反馈
- 筛选出(例如最小化)与手头任务无关的数据
- 符合人类短期记忆的能力
- 管理中断正在进行的用户活动的元素,允许用户就是否要将外围元素置于关注的焦点做出明智的决定
- 定制应该作为一个选项提供给用户
- 通用缩放工具:由此我们描述了提供给用户以改变系统任何部分的演示级别的可能性。
- 谷歌搜索引擎界面以及苹果iPod控制界面的成功表明,用户愿意为了简单、可预测、可重复、直观和有意义的操作而放弃许多强大(且使用复杂)的功能。
- 我们知道,要全面实现基于MPA隐喻的界面,即使在概念层面也需要彻底改变当前的操作系统设计。此外,使用基于WIMP-L的计算机系统的绝对惯性将阻止基于1MPA的接口的传播,除非它们确实提供了一些立即可用的东西。
2.6. 第五部分:总结
在本文中,我们试图简要地阐明从基于提示到现代 WIMP-L 界面的人机界面设计历史中的潜在隐喻。我们已经概述了注意力管理的主要问题,并推测基于 WIMP-L的主导隐喻没有提供可以处理这些问题的自然扩展。我们还认为,Anti Mac 方法并没有为有效的HCI设计提供统一的潜在隐喻。我们已经确定了现代系统设计中必须解决的几个问题,包括:工作碎片化问题,以及随之而来的动态注意力分配。在文章的最后一部分,我们将思维补全方法作为界面设计的一种可能的新隐喻来解决之前提出的问题。
3. The computer for the 21st Century
最深刻的技术是那些消失的技术。他们将自己融入日常生活的结构中,直到与日常生活无法区分为止。
- 以写作为例,这可能是第一个信息技术的应用
- 捕获口语的符号表示以进行长期存储的能力将信息从个人记忆的限制中解放出来。
- 如今,这个技术在工业化国家无所不在,包括书籍、杂志、报纸、街道标识、广告牌、商店招牌甚至涂鸦,传达信息。
- 相比之下,基于硅的信息技术远远还没有成为日常生活的一部分
- 电脑在很大程度上仍然处于独立的世界中,通过复杂的行话(与计算机任务无关)来理解。
- 个人电脑的神秘光环不仅仅是用户界面:我和在PARC的同事认为"个人"计算机本身的想法是错误的,笔记本电脑、发电机和知识导航器仅仅是实现信息技术真正潜力的过渡部分,这种机器不能真正使计算成为人类生活方式中不可或缺、无形的一部分。
- 我们尝试构思一种新的思考计算机的方式:考虑到自然人类环境并允许计算机本身消失在背景中的方式。
- 这种消失不是技术的根本后果,而是人类心理的根本后果:当人们做的足够好后就不再意识到它:比如你会自然的阅读一个路牌。
- 计算机科学家、经济学家和或贝尔获得者Herb Simon称之为“编译“
- 哲学家Michael Polanyi称之为”隐藏维度”
- 心理学家TK Gibson称之为“视觉不变量”
- 哲学家 Georg Gadamer 和 Martin Heidegger 称之为“地平线”和“现成的”
- ARC 的 John Seely Brown 称之为“周边”
- 本质上,所有人都说,只有当事物以这种方式消失时,我们可以不假思索的使用他们,从而专注于超越它们的新目标。
- 将计算机无缝集成到整个世界的想法与当今的许多趋势背道而驰:
- 这种情况下,无处不在的计算意味着可以携带到海滩、丛林或机场的计算机,即便是强大的笔记本电脑,可以访问全球信息网络,仍然将注意力继承到一个盒子上。
- 普适计算机除了文本和图形之外还可以使用声音和视频,但是却不使得它们成为“多媒体计算机”。
- 多媒体计算机使得电脑屏幕成为关注的焦点,而不是让他们淡入背景。
- 这种消失不是技术的根本后果,而是人类心理的根本后果:当人们做的足够好后就不再意识到它:比如你会自然的阅读一个路牌。
- 与我们的愿景截然相反的是“虚拟现实VR”:
- 试图在计算机内部构建一个世界
- 交互方式
- 用户戴上特殊的护目镜,人工场景投射到眼镜上
- 用户戴上手套甚至连体衣来感知他们的动作和手势:这样可以四处走动和操纵虚拟物体。
- 目的:让人们探索原本无法进入的领域(细胞内部、遥远行星表面、复杂数据库的信息网络)
- 虚拟现实只是地图,而不是领土,不包括其他不戴护目镜和紧身衣的人等。虚拟现实将巨大的设备集中在虚拟世界上,而不是无形地增强已经存在的世界。
- 虚拟现实的概念与无处不在的计算之间的对立非常强烈。
- 在现实生活中我们使用“embodied virtuality(具身虚拟性)”来指代将计算机从电子外壳中抽出来
- 计算机可读数据的“虚拟性”表示它可以被改变、处理和分析的所有不同方式
- 技术如何消失在后台?
- 例如:电动机的消失(廉价、小巧、高效的电动机可以为每台机器获工具提供动力源),在一个典型汽车的车间手册中,就会发现很多的电机,你通过仔细阅读可以了解他们什么时候启动,但这毫无意义。
- 大多数具有具身虚拟性的计算机在事实上和隐喻上都是不可见的,比如电灯开关、恒温箱、音箱和烤箱中的计算机。
- 作为计算机学家,更关注直接地传输和现实信息的设备,由此也就发现了两个至关重要的问题:位置和规模,无处不在的计算机必须知道它们自己的位置(而当今计算机不需要),以便调整其行为(并且不需要人工智能的提示)
3.1. 无处不在的计算机也有不同的尺寸
- 不同的尺寸适用于特定的任务:我和我的同事建立了标签(tab)、平板(pad)和板(board)这三种设备
- tab:英寸规模的设备(类似于便利贴)
- pad:英尺规模的设备(类似于一张纸、一本书)
- board:码尺规模的设备(类似于黑板、公告板)
- 一个典型房间中有多少个tab、pad和board?不同的房间可能会有一百多个tab、10-20个pad以及1-2个board,这就是我们最初部署具身虚拟性硬件的目标:每个房间数百个计算机。
- Tab:具身虚拟性的最小组成部分,它们之间是相互关联的
- Tab扩展了现有的英尺级计算机的实用性(比如雄者计算器等等)
- Tab还将承担计算机无法执行的功能
- 比如剑桥实验室优先推出的徽章,PARC和其他计算机研究实验室的计算机正在使用这些大约与ID卡大小相当的夹式计算机,这些徽章可以识别防止在环境中的接收器,从而可以跟踪他们所附着的人和物体。
- 在实验性的虚拟现实,门只对正确胸牌的佩戴者打开,电话自动转发到接收者所在的位置。
- Roy Want设计了一个Tab,包含一个小的显示器,同时用于徽章、日历和日记,可以作为计算机屏幕的扩展(缩放图标)。
- Pad:是Tab的下一步,介于一张纸和当前的笔记本电脑和掌上电脑之间。
- 例如:Bob Krivacic构建一个原型版,包含2个微处理器,1个相应大小的显示器、一个多按钮手写笔和一个无线电网络,每个房间每个人可以有数百个设备。
- Pad在一个关键方面不同于传统的便携式计算机:
- 便携式计算机随其主人随处可见,但必须随身携带的平板电脑是个失败品。
- pad目的是可以在任何地方抓取和使用。
- 将pad作为解决windows的方法
- windows由PARc发明,并由Apple在Maxintosh中推广。
- 作为一种将几种不同活动同时安装到计算机屏幕的小空间方式。
- 20年来电脑屏幕并没有变得更大,人们所说的计算机windows系统基于桌面的比喻,pad使用的是真正的桌子,在桌子上铺上许多的pad,将一天中的任务展示出来以使用任务和你的手臂屏幕范围
- Board:庭院大小的显示器
- 用途:家庭、视频屏幕和公告板
- 在办公室、公告板、白板或活动挂图
- 一块板就可以作为一个电子书柜,将文本下载到一个pad或tab上。
- 在进一步实现具象虚拟性之前,人们将不得不于习惯使用桌子上的电子和标签作为计算机屏幕的附属物。
- 操纵方法:
- 使用无线电子粉笔
- 其他人还将这些板用于改进显示硬件、新“粉笔”和交互式软件的测试平台。
- 但是为大型共享显示器和电子粉笔设置动画的软件与工作站不同:粉笔和键盘之间来回切换需要进行几步,因此该行为与使用键盘和鼠标有着本质的不同(Macintosh风格的菜单栏可能不是一个好主意)
- LiveBoard用途:
- 在普通会议室和开放区域,直接构建和使用来体验和并理解一个计算机交互增强每个房间的世界的功能。
- 作为公告板进行使用:结合徽章实现计分牌
- 用途:家庭、视频屏幕和公告板
- tab、pad和board的原型是无处不在的计算的开始
- 这个概念的真正力量不是来自这些设备中的任何一种
- 普适计算产生于所有的这些设备之间的相互作用。
- 提供令人愉悦并且高效的交互,比如:
- 选项卡可以为之前的惰性动画设置动画、声音、文件夹可以打开并显示所需的文件夹。
- 在演示中,幻灯片的文字大小、声音的音量、以及环境光的量。tab可以使其告诉传播
- 普适计算需要的技术氛围三部分:
- 同样方便的显示器的廉价、低功耗的计算机。
- 更大的显示器会带来可用性、价格昂贵等问题
- 中央处理器的处理速度快速提升
- 辅助存储设备讲不断增加容量
- 将计算机们连接在一起的网络。
- 当前存在的问题:
- 今天的软件系统几乎没有利用计算机网络的任何优势
- “分布式计算”的趋势是让网络看起来更像是磁盘、内存等,而并不是利用物理分散的独特能力
- 当前面临的挑战
- 一方面,有线和无线网络的数据传输速率都在迅速增加:千兆网络,允许进行大量的低俗传输。
- 另一方面,有线和无线网络的透明连接是一个仍然未解决的问题,目前工程师通过开发新的通信协议识别物理空间中移动的机器等来解决问题。
- 当前技术需要移动设备具有的三种不同的网络连接:微距无线、长距无线和超高速有线。但是一种以某种方式提供全部的三种功能网络连接尚未发明。
- 当前存在的问题:
- 实现普适应用程序的软件系统。
- 操作系统软硬件配置
- 当今操作系统起核心假定硬件和软件配置固定,无法在不关闭机器的情况下合理地添加硬件获操作系统软件,这不符合具象虚拟性。
- 微内核操作系统提供了一种基于微笑内核的未来操作系统,支持自动缩小和增长,以适应普适计算的动态变化需求。
- 操作系统使用情况
- 当前的窗口系统(windows)假定信息将在固定的计算及上显示,但是并不能够从一个地方移动到另一个地方上的应用程序中,为了获取较好的性能,他们采用固定屏幕和输入模式,并使用本地计算机存储有关应用程序的信息。
- 这个问题的解决方案还处于起步阶段,共享窗口的系统仍在研发,但是性能问题,并且不适用于所有应用程序,没有任何系统可以很好地处理在具象虚拟性中发现的输入多样性。
- 操作系统软硬件配置
- 同样方便的显示器的廉价、低功耗的计算机。
- 论文中提出了一个普适计算的示例
- 除了计算机可以无形的进入人们生活中,推测还指出了具现虚拟性带来的重要社会问题,其中关键是隐私问题:每个房间都有数百台计算机,所有的计算机都能感知附近的人并通过。
- 高速网络可能使迄今为止的极权主义看起来像是最无政府状态:局域网上的工作站可以被变成拦截、篡改消息。
- 政府机构、营销公司都可能使用隐形计算机中方便的相同信息。
- 这个问题的解决方案:加密技术
- 保护从一台计算机到另一台计算机的数据,并保存存储在网络系统中的私人信息。
- 一个良好的普适计算的版本应当比现在提供更好的隐私保护(数字签名)
- 另一个角度,构建计算机系统以具有与现实世界相同的隐私保护措施:比如依然计算机不能完全抵御破解,但是不留下指纹的数字等效物则无法进入。
- 将计算机推到后题啊,具象虚拟性让个人更加了解计算机连接的另一端的人,从而扭转传统个人电脑引入生活和工作场景中所产生的不健康的向心力,让在不同地点和时间之间提供透明链接让人们联系在一起。
- 我和我在PARC的同事相信,我们所说的普适计算在未来20周年可能成为计算机访问的主要模式,普适计算会让一切更快、更容易、更少心里压力和负担,改变一些显而易见的事情。
- 从社会学角度,普适计算意味着计算机成瘾者的衰落。
- 此外,普适计算及能够帮助克服信息过载的问题
4. HCI Research as Problem-Solving
4.1. Abstract
- 这篇文章对作为解决问题的人机交互 (HCI) 研究提供了元科学的解释。
- 我们以 Larry Laudan 的哲学为基础,他将问题和解决方案作为科学的基本概念进行开发。
- 我们认为大多数 HCI 研究是关于三种主要类型的问题:经验(empirical)、概念(conceptual)和建设性(constructive)。
- 我们详细阐述了Laudan的**问题解决能力(problem-solving capacity)**概念,作为确定解决方案(结果)进度的通用标准:与其问研究是否“有效”或遵循“正确”方法,不如敦促我们问它的解决方案如何提高我们解决人类使用计算机中的重要问题的能力。这为HCI提供了丰富的、生成性的和“无纪律”的观点,并解决了一些关于HCI是什么或应该是什么的现有争论。它还可能有助于在实证研究、理论、设计和工程方面统一名义上不同传统的努力。
- Author Keywords:人机交互、问题解决、科学过程、研究问题。
4.2. 介绍
- 本篇文章的灵感来自于向学生和其他研究人员描述我们的领域时产生的困惑:作为一个领域,人机交互是什么?
- 非常多的想法和学科为人机交互做出过贡献,其独特的特性是难以捉摸的。
- 人机交互具有自己的研究主题,不属于自然科学或社会科学,它不属于工程、计算机科学或设计。
- 本文的目标:
- 对95%以上的人机交互研究进行概念上的连贯解释
- 我们受到了与人机交互相关的研究的激励:没有公认的说法可以说明人机交互的众多方法如何有助于追求共同的目标。
- 相对之下,人机交互由于缺少“运动主题、主流主题和思想流派”以及“跨主题、理论、方法和人员”而受到批评。因此,某些人呼吁“硬科学”,其他人呼吁“强概念”或“跨学科”。这些都是对该领域有严重影响的问题。
- 为什么要在技术会议上费心撰写元科学论文?
- 因为这是非常重要的,科学的哲学在最坏的情况下无足轻重的问题,值得在走廊里面讨论,但是如果批评者是对的,那么我们的领域就严重瘫痪了。
- 如果目前缺乏HCI是什么以及HCI中什么是好的研究的一致看法,我们如何讲结果传达给他人、评估研究、协调努力或竞争?
- 此外,我们认为哲学的观点提供了有助于产生想法并通常提高研究质量的思维工具。
- 本文的贡献在于将人机交互描述为问题解决,如下图中Larry Laudan的科学哲学,用2个基本概念来描述科学进步:
- 研究问题(research problem):通过描述中的无能和缺席来定义,包含了我们在人机交互中传统上理解为“设计问题”的问题,但是也包含与理论和实证研究有关的问题,比如网页的审美感知问题。
- 解决方案(solution):比如从自我报告的描述到审美印象的模型,以不同方式改进了无能力或缺勤的状态,这一限定与一些传统的进步概念背道而驰:在评估理论的价值时,更重要的是问它们是否构成了对重要问题的充分解决方案,而不是问它们是否“真实”、“确证”、“得到充分证实”或在框架内是否合理 当代认识论。
- 有了这个定义,解决问题的好处是它允许覆盖比以前的研究更广泛的研究范围
- 原先的研究仅限于某些学科、主题或方法(例如,通过设计进行研究,交互批评、可用性科学或交互科学)。
- 然而,由于劳丹在发展他的观点时考虑了自然科学和社会科学,他错过了设计和工程方面的贡献。
- 扩展Laudan的哲学,提出人机交互设计中的研究问题不仅包括经验和概念,还包括建设性问题,我们提出了第一个类型学,以涵盖 HCI 中最公认的研究问题。现在可以不考虑背景传统、范式或方法来描述研究贡献。看似多学科,或者更确切地说,是超学科领域——最终是关于解决三种类型的问题。当人们谈论 HCI 时,这会显着减少考虑的维数。
- 在明确了概念基础后,我们将会回答四个问题
- 什么是人机交互研究?
- 什么是好的人机交互研究?
- 作为一个领域,人机交互是否做的很好?
- 我们是否可以将这部分做的更好?
- 我们目的是通过这些讨论表明laudan解决问题的观点不仅仅是“问题解决能力“,它为人机交互提供了一种有用、永恒并且可以操作的非学科立场。
- 与其确定研究是否采用了“正确”的方法,系统是否“新颖”或者理论“是否正确,我们不如关注它如何提高我们解决鱼人类使用计算机相关的重要问题的能力。
- 我们是否在解决正确的问题?
- 我们解决得好吗?
- 这个观点有助于我们为一些有关人机交互的长期辩论做出贡献,并且这个视角是生成出来,我们提供如何将其作为思维工具的想法,从而分析单个论文甚至整个子主题和整个领域的问题解决能力,它甚至还可以作为产生想法以改进研究进度的跳板。
- 与其确定研究是否采用了“正确”的方法,系统是否“新颖”或者理论“是否正确,我们不如关注它如何提高我们解决鱼人类使用计算机相关的重要问题的能力。
- 我们得出了一个积极结论:我们认为人机交互设计既不是非科学的(unscientific)也不是不科学(non-scientific)的,也并不处于深刻的危机中。
- 这种观点不支持正在作出的部分类型的贡献。
- 相反,在很多方面,人机交互显著提高了人类使用计算机进行问题解决的能力,并仍在继续这样做。
- 然而,这些贡献往往集中在经验性和建设性的问题上,与让人机交互更科学、跨学科、软硬或严谨的呼声想法,人机交互的系统性弱点其实是我们无法将实证性研究和建设性研究联系起来的概念贡献(理论、方法、概念和原则)
4.3. 人机交互研究的三种问题类型
- 需要强调的是:讲人机交互理解为问题解决的关键在于认识到其研究工作是围绕着一些反复出现的问题类型而展开的。
- 在某一类问题类型下有效地折叠了研究工作的多样性。
- 不仅仅简化了人机交互,并且超越了一些由方法论、理论获学科产生的偏见假设。
- 如今人们可以不受传统约束的情况下,看到一项新技术的观察研究和一项严格的实验室实验之间的异同。
- 本节我们关注一下3个问题
- 简要介绍Laudan的研究问题概念
- 扩展其类型学以涵盖对人机交互的工程和设计贡献
- 认为人机交互的贡献可以通过这种类型学来分类
- Laudan最初仅区分了两种类型的研究问题:经验的和概念的。
- 这两种是根据缺乏或无法理解或实现某些目的来定义的。
- 这两种类型也是i适用于人机交互的:为了不让设计“陷入困境”,人机交互应该涵盖工程和设计贡献。
- 人机交互作为一个领域的几乎所有定义都很清楚,因此我们建议添加一个建设性的问题类型(如上图所示)
- 这种类型与著名的巴斯德象限蒸饺,它尝试通过将“使用启发式基础研究”作为可接受的类型来拉近应用研究和基础研究之间的差距。
- 在我们看来,人机交互中所有的问题都是可以使用启发的,象限几乎没有任何洞察力。
4.3.1. 经验性问题 Empirical Problems
- 人机交互的整个场景中都充满了经验问题(如何使用鼠标悬停、众包贡献),这可能是定义最直接的类型
- 定义:实证研究旨在创建或详细描述与人类使用计算相关的现实世界现象。
- Laudan举了3个特征子类型:
- 未知现象
- 未知因素
- 未知效果
- 定性分析(尤其是民族志)是一种经常被用来阐明新现象的方法。
- 例如:1996年TOCHI稳增长“探索性学习策略的实地研究”,报告了对用户如何探索软件的观察。
- 然而,现象的构成因素只有在确定现象的“载体”之后才能暴露出来。例如:在“举例问题”中,它记录了影响介导人与人交流的现象和因素。
- 评估分析:在确定因素后,人们可以测量和量化它们对感兴趣的事物的影响。主要使用统计推断来量化最有效的效果。有评估可用性的研究发现菜单并没有带来任何好处。
4.3.2. 概念性问题 Conceptual Problems
- 概念问题是非经验性的
- 他们涉及最一般意义上的理论发展问题。
- 他们的实质并不直接与世界有关。
- 可能涉及解释经验问题的困难、交互模型中的烦人问题或者某些设计原则之间的冲突。
- Fitts定律是最著名的例子
- 它是一种统计模型,将目标移动性能(速度、准确性)与设计人员可以影像的用户界面的两个属性(选择区域的距离和宽度)联系起来
- 它解决的研究问题是目标运动的性能如何与用户界面强加的任务需求相关联。
- 我们给出如下更一般的定义:关于概念问题的工作旨在解释交互设计中发现的先前未关联的现象。
- 概念问题的回应包括理论、概念、方法、原理和模型。此外,Laudan区分了三个特征子类型:
- 难以置信 implausibility:意味着现象是不合理的、不可能的、缺乏解释的:比如1985年的HCI期刊题为“直接操作界面”的论文,是为了解释为什么GUI更直接,而命令语言界面感觉更间接。
- 不一致 inconsistency:意味着位置与数据、自身或其他位置不一致。比如人机交互中关于隐私的实证研究导致将隐私描述为两个或更多通信方之间的互惠过程。
- 不兼容 incompatibility:意味着两个位置有无法调和的假设,比如使用吞吐量(ThroughPut)作为衡量性能指标的争论。
4.3.3. 建设性问题 Constructive Problems
- 定义:建设性问题旨在理解为人类使用计算的某些目的而构建的交互式人工制品。
- 目标不是制造本身,而是它所体现的思想和原则,包含了人机交互在会议上最具有活力的一些子领域,包括交互系统、交互应用、界面和传感器技术、交互技术、输入设备、UI设计、交互设计和概念设计。
- 关键的是,这种问题类型跨越了设计和工程这两个广泛的主题,我们进一步划分为了3个子类型:
- 没有已知的解决方案,通常为交互创新新概念的工作属于这一类,例如:CHI 1997年的论文‘Tangible Bits’贡献了一种新颖的交互技术概念和技术解决方案的第一个想法,在这之前还没有本问题。
- 部分、无效或低效的解决方案:旨在改进现有交互的舍弃驱动论文。例如CHI 2001年的论文‘SenseTable’提出了一种新的电磁跟踪方法。
- 实施或部署的知识或资源不足:涉及无法实施或部署,例如CHI 2009年的论文描述了WeSpace的爹阿迪设计和部署,作为一个协作多表面系统,这很难落地。
4.4. 人机交互研究解决问题的能力
- 如果三部分类型学不能提供某种方法来提供评估结果,那么其就会变得毫无意义。
- 回答“什么是好的人机交互研究”这个问题的关键是:解决问题的能力。
- 对于Laudon而言,研究的反馈、发现和结果是解决研究问题的解决方案,而并不是解决问题的能力。
- 人们往往非正式的将解决问题的能力视为“解决方案的能力”。
- 一个强大的解决方案应当是为一个重要的、反复出现的问题提供一种通用且有效的解决方案。
- 这个概念可以用于评估研究并为其改进产生想法,因此它将解决问题的视角从描述状态升级为处方
4.5. 解决问题能力的五个方面
- Laudan讨论了解决问题的四个标准,考虑到对人机交互设计的有效性和可靠性的额担忧,我们建议添加第五个,如下:
- 重要性 Significance
- 有效性 effectiveness
- 效率 efficiency
- 转移 transfer
- 置信标准 confidence
4.5.1. 重要性
- 重要性意味着解决方案解决的问题对研究的涉众非常重要
- 涉众包含研究人员、从业者和最终用户
- 例如:对认知模型的早期研究,解决了80年代的常见的交互类型,而在90年代因为陷入无关紧要的问题而收到批评。
- Laudan没有提供平衡重要性的指标
- 在人机交互中有很多的参考点。
- 例如:对研究人员的重要内在问题可能是“交互是什么”这个问题。
- 人机交互的一个特点是:该学科的重要性通过参考社会或行业中更广泛的问题来衡量。
- 经验上:重要性是通过参考用户的调查数据来论证的。
- 在考虑新技术时,重要性的论点往往是具有推测性的,并假设所讨论的技术获现象可能不会实现的风险:这将人机交互和一些强调现实主义的邻近领域区分开。
4.5.2. 有效性
- 有效性意味着解决方案解决了所属问题的基本方面,
- 部分贡献忽略获误解了问题的有影响力的方面,例如,分布式认知观点的支持着批评当时认知科学无法解释个人和组织如何在现实世界环境中感知、参与获记忆。
- 新理论是解释环境限制和资源,以及习惯和做法,如果促成之前归因于潜意识的能力。
4.5.3. 效率
- 效率是指应用解决方案相对于获得的收益的成本。
- 例如数学模型、设计启发法和可用性测试中的错误报告的应用成本相对较低,即使不容易获得。相比之下,虽然详细的逐秒交互分析可能是全面的(因此是有效的),但它们通常很难获得且难以应用。
4.5.4. 转移
- 转移是指解决方案转移到相邻问题或问题的其他实例的程度。
- 人机交互设计中最“可转移”的解决方案是以用户为中心的设计方法和可用性测试。两者几乎普遍适用于设计项目,尽管人们可能会质疑他们解决问题的能力的其他方面。
4.5.5. 置信标准
- 置信标准是指所提出的解决方案持有的概率。
- 与其他四个标准一样,这个标准也跨越了三种问题类型。
- 在实证研究中,置信标准首先受到有效性和可靠性的影响。
- 也许使用了错误的统计检验,或者忽略了缺失的数据。
- 这些缺陷增加了结果在所讨论的研究之外不成立的风险。
- 在理论工作中,遗忘,例如忘记解决某些突出因素、反驳或对不太可能的情况的假设,会降低信心。
- 在建设性研究中,信心受到关于解决方案如何解决可能对它不利的问题的争论的影响。例如,工程师会谈论解决方案的“稳健性”,而设计师可能会争辩说给定的设计适合不同的环境。
4.6. 人机交互作为问题解决研究领域
- 解决问题的能力是指我们有效、高效地解决重要研究问题的能力,并对解决方案的有效性充满信心。
- 人机交互可以被描述为一个解决问题的领域,他有自己独特的
- 查询主题:人类对计算机的使用
- 研究问题
- 所关注的解决问题能力的类型
- 解决问题能力的提升。
- 给予上述三种问题类型,我们定义人机交互中的研究问题:人机交互中的一个研究问题是对人类使用计算中的某些现象缺乏理解,或者无法构建交互式技术来解决该现象以达到预期目的。
- 该定义认可了
- 设计师和创新者对建设的重视程度
- 实证研究人员及其对方法和可靠知识的重视
- 强调理论、概念和模型的科学家。
- 人机交互在关注人类使用计算机的领域中独特之处在于它真正强调了建设问提,这一点上它更接近设计和工程领域。
- 该定义认可了
- 这样的将人机交互作为一个领域的观点与阅读一些传统的科学研究有所不同
- Thomas Kuhn的科学范式概念:有时人机交互设计是根据平行范式来描述,但是这可能为堡垒辩护,阻止对工作的批判性评估。
- Karl Popper的批判理性主义要求对理论进行理性批判和决定性的经验检验,从解决问题角度来看,这类活动很重要,但不应排除其他活动,比如构建或识别问题。
4.7. 论文中的混合问题类型
- 对人机交互论文最直接的观察是它们通常涉及两种问题类型,例如介绍新结构的论文往往还可以描述评估研究。
- 人机交互文献现实了问题类型的所有可能的成对组合:
- 实证性-建设性:例如,对设计有影响的实证研究
- 实证性-概念性:例如,验证理论的实证研究
- 建设性-概念性:例如,用于探索设计原则的原型
- 建设性-经验性:例如,一种不仅评估而且有助于理解相关现象、因素和影响的研究技术
- 概念性-经验性:例如,在决定性测试的基础上验证或改进的理论或模型
- 概念性-建设性:例如,设计交互中理论预测现象的新方法
4.7.1. 高风险容忍度
- 第三个观察时人机交互愿意接受相对较高的不确定性和奉献来实现大收益。
- 给定设计理念所代表的改进潜力可能是位置的,只能进行回顾性评估。
4.7.2. 社会和行业塑造“意义”
- 人机交互还非常重视实际改进潜力,应对从利益相关者群体的问题到不平等等世界问题的方方面面。
- 外部利益相关者的问题经常在提及研究问题的重要性时被引用。
- 旨在解决实际问题的解决方案类型提出了预测现实世界问题的设计原则、模型和模拟、政策建议和方法建议。
- 更一般地说,可以从我们研究的相关利益相关者(无论是最终用户、从业者、设计师、开发人员还是政策制定者。他们现在可以实现哪些在阅读论文之前无法实现的目标?
- 这五个标准也可以用于实际工作。人们可以考虑解决方案对这样一个群体的重要性以及手头问题对他们的重要性。
- 相反,如果问题仍未解决,则可以评估利益相关者的成本。考虑针对特殊用户群体的基于注视的输入的研究:一个强有力的论点是,缺乏此类输入方法可能会妨碍充分参与工作或社交生活。还可以考虑重要的定量方面,例如改进可能影响多少用户以及他们遇到问题的频率。例如,在将菲茨定律应用于键盘优化时,据估计 QWERTY 布局会导致手指过度“移动英里”,从而影响生产力并导致重复性劳损。
4.7.3. 多种形式的进步
- 对任意两个人机交互主题的研究在解决问题能力类型的“分布”方面可能会有较大差异,这可能会混淆结果的比较。
- 我们在主题A还是主题B上取得更多的进展呢?
- 局外人很容易通过不同的问题解决能力标准来忽略一个话题。
- 作为例子,我们考虑两个具有不同解决问题能力的问题
- 中断:
- 定义和表征人机交互中的典型中断,解释将它们与不利影响联系起来的机制,并建议如何通过设计来改进人机交互。
- 是一组经验性、概念性和建设性问题。
- 1990年代,大多数论文关注接口设计和条件对中断成本的影响,但是受上下文较大的影响。
- 2000年代,开始将可中断性与人类记忆和认知容量相关联,展示出在常用环境中理论驱动的设计具有出色的中断容限性。
- CHI 2015的最佳论文,为突出的理论问题提供了解决方法
- 从解决问题的角度,这方面研究在过去20年的工作中成功地提高了解决问题的能力,甚至可以为真实的复杂环境提出理论基础设计方案。
- 在消极方面,其对探索新的设计机会方面表现不佳
- 交互技术
- 广义上,它一直对开发在交互过程中改变输入和输出方式以提高用户性能和满意度的技术感兴趣。
- 虽然创新了大量新技术,但研究人员仍然感慨这项技术是“点设计”驱动的,它无法解释和概括个人的原则和技术。
- 相对于中断领域,这部分研究还少
- 中断:
4.7.4. 今天的人机交互的快照
- 从解决问题的角度,我们分析了ACM HCI中的21篇最佳论文。
- 本文作者根据论文的关键部分确定的最突出的问题类型对每篇论文分类,观察结果可以概括为以下三点,我们在下面进行扩展
- 最佳论文主要关注经验和建设性类型。 概念类型的代表性不足。
- 解决问题能力的所有五个标准都被提到作为贡献的动机。 然而,我们无法就标准达成任何共识,每篇论文都遵循自己的策略。
- 在解决实际和面向理论的研究问题之间存在分歧。 这有助于 HCI 研究的不可公度性。
4.7.5. 两种问题类型的优势
- 我们可以立即发现大多数论文都解决了实证问题,例如3D平台上的辅助技术等等。
- 我们同样发现大多数论文都描述了人类与计算机交互中的未知现象,例如semaan等的工作。
- 其中的八篇论文主要是关于建设性问题。一些建设性论文与特定技术相关。
- BaseLase提出了特定的反射镜设计,用于在地板上进行交互式激光投影,其他论文则更关注构建背后的交互设计原则或概念。
- Affordance展示了一种使用肌肉电刺激来指导人们如何使用物体的方法。
- ColourID则使用改善视障用户颜色识别的工具,它试图纠正现有工具“通常使用缓慢且不精确”的事实。
- 只有一篇涉及概念问题。
- Borst等提出了一个中断模型,目的是通过综合理论来协调早起的发现。
- 他们指出了一个异常现象:需要协调早期关于中断的结果,并且为了提高我们对中断的理解,这些研究应当被正好到认知理论中。
- 最佳论文通常包含混合问题类型
- 比如:
- 调查用户对Facebook信息源算法的了解程度,并构建系统展示。
- 使用作为研究开发出来的Tyree Energy Pulse来帮助理解能源预测。
- 关注概念论文的最佳论文的明显确实应该引起警惕。
- 是这样的论文没有被评为最佳论文
- 还是这种差距在人机交互设计中普遍存在
- 比如:
4.7.6. 解决问题的能力:多种多样且定义不明确的。
- 定义问题解决强弱的标准各不相同。
- 重要性通常被清楚的阐明并提出坚实的论据,比如在社交媒体中的父亲身份研究、图像搜索中的性别偏见等等。
- 建设性论文的有效性通常更容易展示,其中特定UI概念或技术实现的演示通常足以显示有效性
- 比如Velocitap表明技术上可以以交互速率对触摸屏文本输入执行语句级别的解码。
- 很多建设性论文主张进行概念证明。
- 其他的构建问题的论文主要是评估解决方案的技术性能获用户体验。
- 经验性问题
- 往往很难令人信服的证明有效性,因为大多数问题都会和未知现象有关,仅仅有少数论文描述这些现象并展示了如何使用这些描述。
- 只有少数研究发现转移的论点。
- 对于建设性问题,转移通常通过应用实例来展示。
- Acousttruments:一组可以扩展手机传感能力的无源塑料设备通过九个机制说明了通用从
- iSkin的论文中:展示了更多的应用
- 解决方案的置信度需要通过多种方式解决,包括进行多项研究、使用大样本、进行长期随访和报告实施情况。
4.7.7. 研究和实际影响:同样普遍
- 大约一半的人机交互的最佳论文时为了解决实际问题而编写的,尤其是构建用于现实世界的交互技术。其中提供了有关如何改进现有系统的设计指南、概念和想法。
- 其中大部分是经验问题
- 很少有论文解决了构建问题,提供了从业者可以接受和使用的输出。
- 大约一半的论文明确提到提高研究人员解决问题的能力或提高知识水,比如Menking和Erickson研究了维基百科的性别差距可能与普遍的情感规则获参与策略有关。
- 一些论文还描述了对研究方法和建模的影响。
4.8. 推动人机交互向前发展
- 我们想要进一步解决的问题是:“我们能够在人机交互研究中做得更好?”
4.8.1. 更多关于可操作的交互理论的工作。
- 即使人机交互设计非常重视建设性问题,其概念工作也没有强大到足以推动它的发展。
- 进行更复杂的研究、使用更大的样本或更复杂的设置。
- 如果没有将经验发现和技术设计联系起来的概念贡献,结果仍然将无法实施:如果没有概念,建设性的贡献很容易保持点设计和实证研究点研究。
- 我们强烈建议将更多的经历放在可以将经验和建设性解决方案联系起来的综合概念、理论、方法和模型上。
- 如果没有这一部分,我们研究解决问题的能力将继续低于预期。
- 实证研究应该以假设为设计提供信息的方式进行,设计应该体现并由实证分析的假设驱动。
- 记住:建设性问题的工作可以在没有任何假设的情况下取得进展。而且,反之亦然,很多理论缺乏直接相关性的例子。
4.8.2. 写作文化的提升
- 许多论文可以更好地描述他们正在解决的问题
- 一部分论文仅仅明确了解决方案或方法,这二者都与研究问题无关。这些论文很少解释结果将如何提高我们解决问题的能力。
4.8.3. 解决问题能力的系统性提高
- 解决问题不仅仅是一种描述,还提供了一种思维工具,可以完善研究思路并产生更好的研究思路。
- 首先为了改进个人工作,可以规定使用解决问题能力的五个标准来产生如何改进的想法(如下表)
- 列出了启发式方法来评估和培养所考虑问题的解决问题的能力。
- 该列表不完整,仅仅是表明可以为每个方面生成度量标准和建设性想法。
- 其次,解决问题的能力也可以应用于整个子主题,以评估它们并看到改进的机会。以菲茨定律为例
- 可以转移到其适用于各种设备和环境,提高了解决问题的能力
- 但是可以从有效性、效率和置信度等角度进行批评
- 他没有完全解决目标运动性能的问题,仅仅是依赖于任务数据的大量聚合,
- 他忽略了认知因素和运动动力学。
- 他不是一个有效的解决方案,因为其所有参数(参数是脆弱的)必须针对每个任务和上下文进行校准。
- 解决问题的观点可以通过三种方式避免这些问题
- 通过要求研究人员解释他们的研究问题,而不是仅仅展示结果。
- 通过提高超越“点设计”、“新颖性”和“存在性证明”的结果标准。
- 推动研究人员提供更可靠的证据,从而增加信心。
- 首先为了改进个人工作,可以规定使用解决问题能力的五个标准来产生如何改进的想法(如下表)
4.8.4. 重新思考什么是“好的”研究
- 人机交互倾向于制定和采用肤浅的标准来评估起研究和目标设定(其中一些可能是完全破坏性的)
- 人机交互经常被称为跨学科或跨学科领域,但是这些观点往往将我们锁定在信息学科的系统中,解决问题的观点本质上是跨学科的,或者说是非学科的。
- 不同类型问题
- 经验类型问题不区分过去划分等级的心理、社会学、定量、定型和其他立场。
- 概念类型问题不区分设计探索产生的知识和通过认知模型产生的知识。
- 建设性问题不区分设计、工程和计算机科学类型的问题。
- 重要的是如何提高解决问题的能力,我们认为解决问题为人机交互的一些肤浅标准提供了新的反驳。
- 一些对人机交互的分析认为其过程时辩证的,从正面到反面再到综合。
- 人机交互研究始于经典认知主义,并经历了其他阶段的演变
- 认为旧问题是完全失去意义获解决方案的能力是错误的,交互中有反复出现的现象,他们一直是交互的核心。
- 进一步破坏性的标准涉及设计含义,则被认为是人机交互多学科的象征。
- Dourish认为并非所有的论文都必须提出影响,但是非正式观察表明,仍然有一些评论家和研究评估标准在强调。
- 从问题解决角度,设计含义
- 可能是一种以有效和可转移的方式为时机工作提供信息的有用方式。
- 也可能是阐明论文描述的解决方案的实际意义的一种方式。
- 我们同样认为没有理由钟爱模型而不是其他类型的理论
- Newell和Card认为人机交互应该是模型驱动的,并以预测和控制为目标。
- 模型是假设的有效表示,简洁地解释了经验现象,并且允许为设计推导出丰富的含义。
- 另一方面认为硬科学的立场过于狭隘,限制了人机交互作为一个领域的问题解决能力。
- Newell和Card认为人机交互应该是模型驱动的,并以预测和控制为目标。
- 最后评估人机交互论文的一项破坏性标准是新颖性。
- 新颖性只与解决问题的能力有关:论文可以在不新颖的前提下极大程度上提高这种能力。
- 我们认为新颖性与子类型1的贡献相关,可以极大程度上促进子类型1问题的数量。反应出快速发展的技术格局。
- 从CHI 2015样本中可以明显看出,有时对交互新概念的演示更有助于我们设计新的解决方案
- 有些情况下,实证研究首先展示了一种现象,这种现象将激发后来的研究并为实践提供信息。
- 新颖性只与解决问题的能力有关:论文可以在不新颖的前提下极大程度上提高这种能力。
4.9. 问题解决的局限性和批评。
问题解决为大多数 HCI 研究提供了一个全面且可操作的说明。但是,该视图带有自己的订阅和限制。最后,我们审查并回应从演示文稿和与其他 HCI 研究人员的互动中收集的反对意见。
正如Morozov所说,就解决问题使 HCI 走上了解决方案之路。
为了避免与更狭隘、更实用的概念(例如,设计问题和用户问题)混淆,我们已经用了一定的篇幅来定义问题和解决方案。我们并不是呼吁以这些为中心进行研究。我们的观点承认纯粹出于概念兴趣而研究交互的必要性,纯粹为了探索而开发设计,以及纯粹为了学习而研究经验现象。这些都包含在“研究问题”的概念中。
它没有将 HCI 确立为与其他学科有明显重叠和边界的学科。
我们拒绝通过列举它涉及的其他领域来定义 HCI 的观点。相反,它应该由其探究的主题、目的和特征来界定。
它忽略了艺术在 HCI 中的作用。
一些艺术努力可以被描述为问题和解决方案。考虑设计一个能激发游客体验的装置的问题。设计中的审美目标也可以作为建设性问题进行分析。但是,艺术家可能会抵制这种描述。
许多科学发现和创新源于好奇心,而不是解决问题。
解决问题并不排除好奇心。它重视识别问题的研究——甚至是“蓝天研究”,这通常是好奇心驱动的。发现问题是以后解决方案出现的前提。然而,我们同意解决问题不会以任何方式鼓励好奇心,仅仅是因为它对引导研究人员提出问题的那些活动保持沉默。
某些主题,例如用户体验,不能被描述为问题和解决方案,因为它们与不可衡量的主观品质有关。
人机交互中的几个很好的例子表明,主观性和不可衡量性可能会减缓解决问题能力的增长,但不一定会阻止改进。一个这样的例子是认知工作量的概念,它现在已经被定义和使用到这样一个水平,我们经常在我们的研究中使用这个概念(例如,TLX 问卷)。解决计算机使用中的主观品质是任何严肃的人机交互理论的必要条件。
HCI 问题往往很混乱。问题解决如何处理不明确或“邪恶”的问题?
尽管新主题起初往往含糊不清且难以理解,但我们不同意 HCI 研究应该保持混乱的观点。更好地表述的问题和更好的解决方案也能提高清晰度。
许多研究贡献都是愿景,而不是解决方案。考虑一下 Memex 和无处不在的计算。
我们认为,这种愿景可以被描述为子类型 1 的概念性和建设性问题(即不合理或没有已知的解决方案)。虽然问题解决将这种贡献类型视为关键,但它确实没有说明它们应该如何生成。
这种观点是不确定的,导致了很多“一方面”和“另一方面”。它是否允许对 HCI 采取更强硬的立场?
也许劳丹工作最薄弱的方面是,如果没有就什么是重要的达成共识,我们就无法定义解决问题的能力,因为我们无法评估“重要性”。更一般地说,我们必须接受解决问题能力的某些要素将是主观的和有争议的。对一个利益相关者来说可能重要和有效的事情对其他人来说可能大不相同。
HCI 研究的一个重要目标不是解决问题,而是对社会和行业的影响。
研究界以外的利益相关者也可以评估解决问题的能力。挑战在于将他们的问题转化为研究问题。遗憾的是,Laudan 对这个翻译过程提供的指导很少。不过,有人可能会问,为什么大学应该尝试解决行业问题。
4.10. 结束语
- 我们认为 HCI 研究是和不是极大地影响我们的会议、期刊、论文、资金申请、监督、论文主题和职业。本文提出了 HCI 研究是关于解决与人类使用计算机相关的问题的观点。我们已经展示了 HCI 在多大程度上可以用于分析单个论文以及整个研究计划。解决问题的观点还可以为研究产生想法,并为关于 HCI 研究是什么的长期辩论提供全新的视角。我们希望它也能引发新的辩论。
- 解决问题的观点应该被视为任何其他 HCI 研究贡献:通过查看 它解决的问题和 b) 它提供的解决问题能力的增加。我们已经论证并给出了初步证据,即解决问题的观点有助于解决 HCI 中的此类问题;事实上,它帮助我们开始解决当前 HCI 的一些重大概念问题,包括 HCI 研究是什么(解决问题),什么是好的 HCI 研究(提高解决问题能力的解决方案),以及如何推动我们的领域向前发展(桥接经验和建设性)。我们不假装问题解决适用于所有 HCI 研究或解决所有问题。但我们确实相信它为 HCI 中的任何论文或研究计划提供了一些很好的第一个问题:它解决了哪些问题,以及它如何提高我们解决这些问题的能力?