思科宣布了其 Webex 视频会议平台的新人工智能战略,包括可以总结会议内容和回答问题的人工智能助理,以及提高视频会议质量的生成式人工智能功能。
思科杰出工程师基思·格里芬 (Keith Griffin) 表示,这些公告于周三在该公司的 WebexOne 会议上发布,重点关注三个领域:音频智能、视频智能和语言智能。“我们的目的是将其应用于整个 Webex 套件,从我们的设备到我们的联络中心和 Webex 连接控制中心,真正在您需要辅助体验的任何地方,”他说。
用户将能够用自然语言问题提示 Webex AI 助手,并让该工具实时生成答案。新工具还可以建议对 Webex Messaging 和 Slido 中的语气、格式和措辞进行更改,并根据对话上下文提出响应建议。
人工智能生成的会议摘要旨在通过提供易于理解的错过内容摘要来帮助用户赶上错过的部分活动或整个会议。会议摘要将被组织成章节和亮点,以便用户可以跳过以找到与他们最相关的主题。Webex AI Assistant 还可以重述和总结消息,并在 Slido 中生成主题摘要。
这些新功能正处于不同的可用阶段,计划于 2023 年底前开始发货。
提高视频会议的音频和视觉质量
思科还通过推出新的 AI 编解码器来帮助用户解决仍然经常困扰视频会议的网络问题,该公司声称这是一种生成式 AI 解决方案,可以解决音频质量差的问题。编解码器是对数据流或信号进行编码或解码的设备或计算机程序。
AI 编解码器允许大量传输冗余,以从网络数据包丢失中恢复。Webex 并具有内置语音增强功能,如噪声消除、去混响和带宽扩展,可提供该公司所说的前所未有的音频清晰度。
思科表示,还将应用机器学习技术,利用超分辨率来提高视频质量,超分辨率是一种行业标准技术,无论带宽条件如何,都可以提供高视频质量的高清会议。
“该编解码器针对语音进行了全面优化,并且只需要其他编解码器的一小部分带宽,”格里芬说。“这意味着即使带宽极其有限,您也可以获得尽可能高的语音质量输出。”
他说,Webex 的 AI 编解码器使用的带宽比行业标准音频编解码器少 16 倍。
最后,思科开发的实时媒体模型(RMM)的引入将进一步增强用户的通话音频和视频质量体验。Griffin 在解释 RMM 的工作原理时表示,这些模型能够获取多个媒体流并产生多个输出,例如人和物体识别以及动作和手势等动作分析。
这些 RMM 还允许将音频和视频通道用作传统基于文本的功能中的上下文信号,例如会议摘要和亮点。
Griffin 表示:“全世界都在谈论大型语言模型和生成式人工智能,但在协作业务中,[这些功能]比文本更多。”他补充说,虽然文本是 Webex 产品的组成部分之一,但它也专注于语音、视频以及其他音频和计算机视觉输入。
“这对我们来说是一个非常令人兴奋的地方,我们将继续在这些领域寻找新问题和新解决方案,”他说。