虽然人工智能(AI)和机器学习工具现在通常用于增强技术应用,但其中许多工具的基础很难破译。这是因为它们中的大多数都基于“黑匣子”模型,这些模型分析数据并学习对其进行预测,但不与人类用户共享这些预测背后的过程。
Meta Reality Labs的研究人员最近创建了XAIR,这是一个可以帮助开发人员使支撑AI预测的过程更容易理解的框架。该框架在作为 2023 年 CHI 计算系统中人为因素会议论文集的一部分提交和发表的一篇论文中介绍,专门设计用于创建可应用于各种增强现实 (AR) 设置的可解释人工智能 (XAI) 系统。
“随着黑匣子模型越来越多地用于日常生活中,我们越来越担心人类滥用人工智能并失去控制,”进行这项研究的两名研究人员徐徐和安娜·于告诉Tech Xplore。“这导致需要使算法更容易理解,从而导致XAI的激增。现有的研究发现,XAI可以帮助最终用户解决困惑并建立信任。因此,行业从业者试图使用XAI来改善用户体验。
AR技术允许用户查看其周围环境的修改版本,该版本集成了数字元素,声音和/或视觉增强功能。这些“数字增强”版本的现实可以通过头戴式显示器、护目镜、其他可穿戴设备,甚至简单地通过智能手机屏幕查看。
最近,一些研究人员一直在探索使用人工智能来增强AR应用程序,例如使它们对用户环境的变化做出更好的响应,或者允许他们对特定对象进行分析和预测。Xu,Yu和他们的同事着手创建一个框架,可以使这些用于AR应用程序的AI工具的结果更容易理解,从而增加用户对它们的信任。
“由于上下文感知的日常AR将需要AI模型,XAI也是必不可少的,因为最终用户将与各种AI结果进行交互,”Xu和Yu说。“XAI可以在很多方面发挥作用,例如使智能AR行为可解释,解决意外AI结果的困惑或意外,提高隐私意识以及建立信任。鉴于XAI对AR的重要性,我们的目标是回答关于在日常场景中为AR创造有效XAI体验的正确方法的研究问题。
Meta 的团队创建了 XAIR 框架,希望它能促进 XAI 在 AR 应用中的设计。他们的框架基本上解决了三个悬而未决的问题:何时、什么以及如何?这些问题的答案可用于为AR场景中的AI预测提供更有效的解释。除了帮助开发人员创建可以回答这三个问题的AI,XAIR还为从事AR应用程序的XAI的研究人员和开发人员概述了一系列关键指南。
“我们根据大规模的文献综述确定了五个关键因素,”徐和余解释说。“这些因素决定了'何时、什么、如何'方面的设计,包括两个特定于AR的因素——用户状态和上下文信息,以及三个非AR特定的因素——系统目标、用户目标和用户档案。
从本质上讲,要使用团队的框架,开发人员首先需要解决这五个因素,确定有关其用户的上下文信息,用户状态,整个系统的目标以及潜在用户的目标和配置文件。一旦他们这样做了,他们就可以简单地参考XAIR框架来适应和完善他们的XAI系统,以适应AR应用。
“随着人工智能变得越来越强大,在可预见的未来,我们可以预期人工智能将帮助自动识别这五个因素中的至少一个子集,”徐和余说。“这样框架就可以变成一个自动化或自我自动化的工具,帮助设计师改进他们在AR中的XAI设计。
作为研究的一部分,Xu,Yu和他们的同事总结了100多项植根于不同领域的研究结果,以确定在开发用于AR的XAI时应考虑的重要方面,回答何时,什么以及如何回答问题。随后,研究人员进行了涉及500多名用户的大规模调查,并与该领域的12名专家举行了研讨会。研讨会期间专家分享的调查回复和观点提供了宝贵的见解,指导了他们开发XAIR。
“XAIR是AR场景中XAI设计的第一个框架,还包括支持设计师设计思维过程的指南,”徐和Yu说。“10位设计师的设计研讨会结果表明,XAIR可以为设计师提供有意义和有见地的创意支持。我们进一步基于一种设计实施了实时AR系统,并与12个最终用户进行了测试。
为了评估其框架的价值,研究人员使用它创建了一个真正的XAI系统,并在一系列AR场景中对其进行了实时测试。他们发现用户认为该系统既透明又值得信赖,这表明他们的框架有效地指导了其开发。未来,XAIR框架可用于创建各种AI系统以增强AR应用程序,这可以解释其预测,从而被用户认为更值得信赖。
“在我们的下一个研究中,我们计划探索设计框架的自动化,随着时间的推移在AR中创建个性化的XAI体验,以及使用户能够提供反馈以进一步改进系统等,”Xu和Yu补充道。“XAIR框架为我们在未来AR系统中探索XAI交互奠定了基础和指南。最近生成式AI的爆炸式增长也非常令人兴奋,我们有兴趣探索这一趋势如何影响AR中未来的XAI设计。