再放大招!NVIDIA联手微软助力AI应用开发

在今年的 Microsoft Ignite 大会上,NVIDIA 与微软联合推出多个工具,帮助 Windows 开发者在 RTX AI PC 上快速构建和优化 AI 赋能的应用,使本地 AI 更加便捷。这些新工具使应用和游戏开发者能够利用强大的 RTX GPU 加速 AI 智能体、应用助手和数字人等应用的复杂 AI 工作流。

再放大招!NVIDIA联手微软助力AI应用开发-第1张-科技-土特城网

Microsoft Ignite是由Microsoft主办的面向IT决策者、IT 专业人员、企业开发人员的顶级技术大会。今年的大会地址选在了芝加哥,不仅有微软的大咖介绍最新的技术,同时也会联合合作伙伴,对最新的技术路线、概念方向进行吹风。

再放大招!NVIDIA联手微软助力AI应用开发-第2张-科技-土特城网

而在今年的 Microsoft Ignite 大会上,NVIDIA 与微软联合推出了多个工具,旨在帮助 Windows 开发者在 RTX AI PC 上快速构建和优化 AI 应用,使本地 AI 更加便捷。这些新工具使应用和游戏开发者能够利用强大的 RTX GPU 加速 AI 智能体、应用助手和数字人等应用的复杂 AI 工作流。

RTX AI PC 通过多模态小语言模型为数字人赋能

NVIDIA ACE 是一套数字人技术,可以让智能体、助手和虚拟形象栩栩如生。为了深度理解信息,以更强的情境感知能力做出响应,数字人必须能够像人一样在视觉上感知世界。

再放大招!NVIDIA联手微软助力AI应用开发-第3张-科技-土特城网

NVIDIA 在 SIGGRAPH 2024 中曾向外界介绍了交互式数字人 James。James 将 NVIDIA NIM 微服务、NVIDIA ACE 和 ElevenLabs 数字人技术相结合,可提供自然的沉浸式交互体验。

提升数字人交互的真实感,需要能够感知和理解周围环境更细微差别的技术。为此,NVIDIA 开发了多模态小语言模型,可同时处理文本和图像信息,在角色扮演方面表现出色,并针对响应速度进行了优化。

再放大招!NVIDIA联手微软助力AI应用开发-第4张-科技-土特城网

NVIDIA 即将推出的 Nemovision-4B-Instruct 模型利用最新的 NVIDIA VILA 和 NVIDIA NeMo 框架进行蒸馏、剪枝和量化,使其体积小到足以在 RTX GPU 上以开发者所需的精度运行。该模型使数字人能够理解现实世界和屏幕上的视觉图像,以做出相关的响应。多模态作为智能体工作流的基础,让我们得以窥见未来,届时数字人只需极少的用户辅助,即可进行推理并采取行动。

NVIDIA 还推出了 Mistral NeMo Minitron 128k Instruct 系列模型,这是一套专为优化的高效数字人交互而设计的长上下文小语言模型。这一系列模型提供 8B、4B 和 2B 参数版本的灵活选项,以平衡在 RTX AI PC 上运行的速度、显存用量和模型精度。模型单次推理可以处理大量数据,无需进行数据分割和重组。这些模型提供 GGUF 格式,为低功耗设备的效率进行优化,并与多种编程语言兼容。

利用面向 Windows 的 NVIDIA TensorRT Model Optimizer 加速生成式 AI

将模型引入 PC 环境时,开发者面临着有限的显存和计算资源,这为本地运行 AI 提出了挑战。开发者希望模型可以被更多人使用,同时精度损失最小。

再放大招!NVIDIA联手微软助力AI应用开发-第5张-科技-土特城网

Microsoft Ignite 大会上,NVIDIA 公布了 NVIDIA TensorRT Model Optimizer (ModelOpt) 的更新,为 Windows 开发者提供了针对 ONNX Runtime 部署的模型优化方案。借助最新更新,TensorRT ModelOpt 可将模型优化为 ONNX 格式,以便使用 CUDA、TensorRT 和 DirectML 等 GPU 运行后端在 ONNX 运行时环境中部署模型。

最新更新使模型可优化为 ONNX 检查点,以便通过 CUDA、TensorRT 和 DirectML 等执行提供商在 ONNX 运行时环境中部署模型,从而提高整个 PC 生态系统的精度和吞吐量。在部署时,与 FP16 模型相比,这些模型可将显存占用减少 2.6 倍。这可提高吞吐量,同时精度损失降到最低,使其能够在更多的 PC 上运行。

RTX AI PC 赋能 AI 应用开发者

生成式 AI 赋能的 PC 正在推动游戏、内容创作、生产力和程序开发更进一步。目前,超过 600 款 Windows 应用和游戏已在全球超过 1 亿台 GeForce RTX AI PC 上本地运行 AI,提供快速、可靠的低延迟体验。

再放大招!NVIDIA联手微软助力AI应用开发-第6张-科技-土特城网

众所周知,GeForce 显卡除了能加速游戏图形运算,还能助力 AI 应用开发者以更高的效率进行开发。历经多年经营的 CUDA 生态圈,营造了高效的 AI 应用开发环境。全球众多开发者选择 RTX AI PC 作为开发平台,直接推动了 AI 应用的快速发展。

索泰(ZOTAC)作为 NVIDIA 全球核心合作伙伴,17年来专注 GeForce RTX 系列显卡研发,为广大游戏爱好者、专业开发者及创意工作者提供了强大的 RTX AI 加速体验。

再放大招!NVIDIA联手微软助力AI应用开发-第7张-科技-土特城网

尤其是搭载 Ada Lovelace 架构 GPU 的索泰 GeForce RTX 40 系显卡,受到了全球众多专业开发者的青睐。RTX 40 系显卡核心内嵌第四代 Tensor Core,拥有强大的 AI 运算能力,赋能专门针对 CUDA 架构优化的高性能计算和并行任务。

再放大招!NVIDIA联手微软助力AI应用开发-第8张-科技-土特城网

携手你的索泰 RTX 显卡,感受“称心又称手”的 AI 应用开发体验,尽情畅想“万物AI”的未来。

免责声明:本文章由会员“极目新闻”发布如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系