空姐偷拍如何给智能体装个「AI护栏」？英伟达有3项全新微干事

发布日期：2025-01-18 00:45 点击次数：78

雷峰网音问，纽约大学持续东谈主员发现，淌若一个给定说话模子的测验数据中有0.001%的数据 “中毒”（即特意植入无理信息）空姐偷拍，那么总共测验集将可能传播这些无理。

数据“中毒”影响测验效果，AI的本色部署，安全性一样至关进击。

运筹帷幄公司Gartner意料，到2028年，AI智能体将完成至少15%的正常使命决策并被应用于33%的企业要领。宽绰的AI智能体修复需求，让企业搞定其中的信任、物理安全、集会安全以及合规性等问题显得愈加山水相连。

近日，发布了全新的保险代理式AI应用安全的NIM，这将排斥企业部署生成式AI时的安全疑虑，况兼为生成式AI的普及提供安全保险。

全新的NIM微干事是NeMo Guardrails软件器具系列的一部分，这些可移植且历程优化的推理微干事不错匡助企业提高生成式AI应用的安全性、精确性和可膨胀性。

3项NIM微干事，兼顾高安全性和低蔓延

NVIDIA NeMo Guardrails是一个开源器具包，允许修复者将可编程护栏添加到基于LLM的会话系统中，从而保险东谈主工智能系统的安全与合规。

NeMo Guardrails引入的三项全新微干事，粗略匡助AI智能体在大畛域运转时能同期保握受控举止。

内容安全NIM微干事（Content Safety NIM）使用了质料较高的东谈主工凝视数据源Aegis内容安全数据集进行测验，该数据集包含逾越35000个东谈主工标志的数据样本，由英伟达整理并开源，照旧在Hugging Face公修复布。高质料的数据集粗略有用戒备AI生成有偏见或无益的输出效果，确保恢复适当谈德圭臬。

英伟达的企业AI模子、软件与干事副总裁Kari Briski默示：“这是同类数据集结质料最高的数据源之一。”

话题戒指NIM微干事（Topic Control NIM）能将对话聚焦在历程审核的话题上，幸免离题或欠妥内容。

逃狱检测NIM微干事（Jailbreak Detection NIM）增多了对逃狱企图（指绕过模子的安全禁绝法式，让模子施行辞让的举止）的禁绝，匡助在对抗性场景中保握AI的竣工性。

起原：英伟达官方

由于“一刀切”的方法无法有用保护和戒指复杂的代理式AI使命流，通过应用多个轻量级专科模子行为护栏，修复者不错弥补在只摄取较为通用的全局策略和保护法式时可能出现的缝隙。

可编程护栏数目的增多固然能升迁保险才智，但也会导致蔓延有所飞腾，NeMo Guardrails以最小蔓延升迁保险才智，极具“性价比”。

当护栏数目为0（仅系统教唆）时，蔓延约为0.75秒，合规性为1X（基准）。

当护栏数目为1时，蔓延增多到约1秒，合规性升迁到1.1X。

当护栏数目为5时，蔓延约为1.25秒，合规性达到1.5X。

增多到5个护栏，蔓延仅增多约1.25秒。与增多1个护栏，蔓延增多1秒对比，结束显赫的优化。这标明，NeMo Guardrails在升迁保险才智的同期，对蔓延的影响较小，粗略在保证系统性能的前提下提高安全性和合规性。

给汽车、零卖、电信等行业的安全、精确、可膨胀的「AI护栏」

NeMo Guardrails已向开源社区怒放，其NIM微干事搞定企业级客户的“黄雀伺蝉”，使修复者粗略构建愈加安全、真确的AI智能体。智能体通过参考特定语境准则作念出安全、适当的恢复，况兼加强了对逃狱企图的抵抗力度，结束了在汽车、金融、医疗、制造、零卖等行业客户干事中的部署。

软件和干事搞定有打算提供商Amdocs推出的amAIz平台是一个始创性的电信生成式AI框架，通过集成NVIDIA NeMo Guardrails，增强了平台的真确AI功能，保险代理式体验的安全性、可靠性和可膨胀性，从而让干事提供商粗略安一都署AI搞定有打算。

少女自慰

Amdocs时刻集团总裁兼计谋专揽Anthony Goonetilleke默示：“像NeMo Guardrails这么的时刻关于保险生成式AI应用的安全至关进击，粗略匡助AI安全、谈德地运转。”

专注于为汽车行业提供AI搞定有打算的Cerence AI，通过NVIDIA NeMo Guardrails匡助车载助手在其CaLLM系列大说话和演义话模子的营救下提供适当语境的安全交互。

Cerence AI居品和时刻施行副总裁Nils Schanz默示：“NeMo Guardrails不错匡助咱们为汽车制造商客户提供真确的情境感知搞定有打算，并作出理智、严谨且无幻觉的恢复。”

在面向客户的专科常识应用上，更需保证AI生成式恢复的安全性与可靠性。

家居遮挡零卖商劳氏公司通过运用生成式AI老成伙计的专科常识，以此让职工在濒临客户的问题时粗略“吩咐如流”。这背后，是NVIDIA NeMo Guardrails将AI的恢复“框定”在正确的范围内，确保输出的内容“不翻车”。

劳氏公司的数据、AI和翻新高等副总裁Chandhu Nair则默示：“咱们一直在寻找方法匡助职工为客户提供超出预期的干事。通过部署NVIDIA NeMo Guardrails，保证了AI生成式恢复的安全性与可靠性，将对话强施轨则在干系和适当的内容范围内。”

值得一提的是，NeMo Guardrails还具备较好的怒放性和可膨胀性，可集成由AI安全模子和禁绝提供商构成的生态系统，以及AI可不雅察性和修复器具。营救与ActiveFence的ActiveScore（AI安全干事）集成，戒备对话式AI应用出现存害或欠妥内容，并提供可视化、分析和监控功能。

区块链基础设施公司Hive以NIM微干事方式提供适用于图像、视频和音频内容的AI生成内容检测模子，通过使用NeMo Guardrails，Hive可将其模子集成到AI应用中并进行编排。

AI可不雅测性平台Fiddler与NeMo Guardrails集成，可增强其监控功能。端到端AI修复者平台Weights & Biases正在现存NIM集成组合基础上，通过增多与NeMo Guardrails微干事的集成来膨胀W&B Weave的功能，以此升迁AI推理才智。

此外，NeMo Guardrails还提供用于AI安全测试和缝隙扫描的开源套件NVIDIA Garak，用于LLM和应用缝隙扫描，借助Garak，修复者不错发现使用LLM中的系统中存在的缝隙，发现并搞定AI模子中的潜在缺点，提高模子的稳健性与安全性。

当今，NVIDIA NeMo Guardrails微干事以及用于编排rail的NeMo Guardrails和NVIDIA Garak套件已向修复者和企业怒放，修复者按照官网上的教程就不错使用NeMo Guardrails为AI客服智能体构建AI护栏。

上一篇：探花巨乳 31省份客岁刊行新增债券4.7万亿，粤鲁浙仍居前三，江苏进步显著
下一篇：没有了

热点资讯