本文内容:
什么是协助服务?
协助服务旨在成为直观、足智、个人生产力指南和帮助。 它通过提供精选的权威内容,帮助回答用户可能提出的有关如何使用在 support.microsoft.com 上发布的文章中讨论的产品的问题。 该系统旨在通过适应不同工作环境的实时交互式指导,帮助用户更高效地完成任务。
协助服务可以做什么?
协助服务使用大型语言模型 (LLM) 仅在 support.microsoft.com 上发布的文章中为基础。 系统提示和分类器可防止用户提出与 support.microsoft.com 上发布的文章中讨论的产品无关的问题。 协助服务的预期输入是用户关于使用 support.microsoft.com 上发布的文章中讨论的产品的文本查询。 预期的输出是定制的响应、屏幕引导式说明和各种帮助内容, (视频、图像和文本) ,所有这些都可帮助用户高效地完成任务、发现新功能和解决问题。
协助服务的预期用途是什么?
协助服务可用于多种方案。 系统的预期用途是问答方案,所有方案都基于发布到 support.microsoft.com 的文章。 以下列表并不全面,但它说明了辅助服务可以支持的问题的多样性。
-
发现:用户可以向助手服务询问在 support.microsoft.com 上发布的文章中讨论的新产品功能,该服务将提供一个答案,可以解释该功能是什么、如何使用功能以及如何访问该功能。
-
故障排除:用户可以向 Assist Service 询问如何解决 support.microsoft.com 上发布的文章(如“如何修复打印机连接问题”)中讨论的产品的问题,该服务将提供故障排除说明。
-
如何:用户可以询问 Assist Service 如何在 support.microsoft.com 上发布的文章(如“如何使用 Copilot 汇总Word文档”)中讨论的产品中执行特定任务,该服务将提供完成任务的步骤。
如何评估协助服务? 哪些指标用于度量性能?
协助服务是在Microsoft内部使用情况数据的基础上通过广泛的手动测试进行评估的。 针对冒犯性和恶意提示的自定义数据集执行了额外的评估, (用户问题) 。 此外,协助服务会持续评估用户在线反馈。
Assist Service 的准确性和性能已通过人工评估进行评估,导致 ACRUE 分数为 3.47,误差幅度为 ±0.11。 ACRUE 分数的分级为 1 到 5,5 表示最高级别的准确性和性能。 此评估提供了系统可靠性的证据。 但是,这些结果在不属于评估的用例中的泛化程度可能因数据多样性等因素而异。
协助服务有哪些限制? 用户在使用系统时如何尽量减少 Assist Service 限制的影响?
-
语言支持:助手服务目前仅以英语提供。 将来还会增加更多语言。
-
内容范围:协助服务仅限于提供有关 support.microsoft.com 上发布的文章中讨论的Microsoft产品的指导,不能回答与此范围无关的问题。
-
响应准确性:协助服务生成的内容流利且语法正确,但可能仍不准确或不合适。 系统无法理解含义或评估准确性,因此必须回顾它产生的内容并使用你的判断。
-
过度依赖:虽然 Assist Service 包含避免共享意外冒犯性内容并采取措施防止显示潜在有害内容的功能,但你仍可能会遇到意外结果。 我们一直在努力改进我们的技术,以根据我们负责任的 AI 原则主动解决问题。 与任何 AI 生成的内容一样,Assist Service 可帮助用户更高效地完成任务,但验证它提供的答案至关重要。
如何实现提供有关协助服务的反馈?
你的反馈对于帮助我们改进协助服务非常重要。 如果遇到来自 Assist Service 的有害、不准确或其他意外输出,请使用竖起大拇指图标和评论框来共享反馈或报告问题。