京东发布开源大模型安全框架,JoySafety
京东发布开源大模型安全框架JoySafety,旨在提高人工智能模型的安全性,该框架提供一系列工具和策略,帮助开发者检测模型漏洞、评估安全风险、保护数据隐私并应对潜在威胁,JoySafety的开源性质有助于促进业界合作,共同应对模型安全挑战,这一举措有助于提升人工智能技术的安全性和可靠性,为智能时代的安全问题提供有力支持。
京东正式宣布开源大模型安全防护框架 joysafety。该框架已在京东内部实现全面应用,广泛覆盖ai导购、智能物流客服、销售辅助、医疗健康咨询、商家运营平台、法务支持以及安全问答等多个业务场景,具备日均亿级调用量的承载能力,攻击拦截率超过95%,旨在为各类企业提供一套成熟、稳定且完全免费的大模型安全保障解决方案。



JoySafety 核心技术优势
- 支持多轮对话情境下的智能风险识别
- 创新采用Free-Taxi异步检测机制,显著提升响应效率,兼顾安全性与用户体验
- 构建多维度响应策略体系
- ?精准拦截:对高危内容实现即时阻断
- ⏸️红线代答:调用预设红线知识库进行合规回应
- ?智能纠偏:自动引导模型输出积极正面的回答
JoySafety 开源项目地址
https://www.php.cn/link/086188439a1f20760e30c07624ed6674
https://www.php.cn/link/24e87062155973c97360089add8e19d7
<< 上一篇
网友留言(0 条)