大模型安全可信平台-京东云 - 新华里社区新闻网

领先好用

全面覆盖安全风险

大模型安全可信平台大模型内容安全问题集，恶意问题集数据量超过3万条。敏感问题库覆盖全国网络安全标准化技术委员会《TC260-003 生成式人工智能服务安全基本要求》共5 类31 种风险类型。

AI智能检测流

生成内容研判全部通过AI智能自动化实现。对大模型输出内容，通过黑灰词、NLP语义识别、以及生成式大模型辨识技术，多种维度综合判断大模型输出内容合规性。支持恶意识别算法不少于4种，输出识别率准确率不低于95%。

全流程安全与权限

平台设计实现之初，即以遵循业界最佳安全实践为原则，采用多层次、全方位的安全保障措施，旨在为客户提供一个既安全又可靠的工程平台。

适配国产本地部署

平台依赖的GPU资源最小化，全面适配国产GPU环境，支持本地化部署。

行业领先攻击能力

行业前沿的攻防能力积累，超过200种攻击方法，对普遍大模型行业都有攻击突破能力。同时具有行业独创的攻击能力，如数据加密、微调接口利用、语义变换调整等，相关研究都已申请各学术会议研究成果。

三大功能模块

大模型安全检测模块

符合备案要求的检测覆盖面，行业先进的大模型安全检测能力

大模型安全可信平台，集成京东集团内容安全风控能力，构造覆盖面广、适用性强、质量高的问题数据集，并将这些问题集作为平台能力，开放给所有平台用户使用。敏感问题数据集提供基于人工审核的高质量内容安全问题集，全量超过3万条，其中覆盖全国网络安全标准化技术委员会《TC260-003 生成式人工智能服务安全基本要求》共5类31种风险类型。

用户自定义测试集导入

支持上传自定义数据集：支持用户自定义上传数据集接口，支持对自定义数据集输出回复的判断与人工审核打标，同时支持对自上传数据集的分类等功能。除了平台提供的公用高质量内容安全数据集，用户也可以选择自定义上传数据集进行检测。

自动化的内容安全检测

内容安全检测模块主要包含任务管控、模型管理、权限管理等。大模型安全可信平台支持对大模型应用多线程、批量、多任务同时进行检测。读取攻击数据集内容并对大模型进行尝试攻击，支持多个检测任务的并行、多条攻击数据批量、多线程调用，同时支持用户针对自身业务，提供可配置的QPS。

语料安全扫描模块

语料安全扫描，从源头解决大模型敏感信息泄漏

内置了包括手机号码、姓名、身份证号、银行卡号等100+规则，对语料中的个人敏感信息进行检测，保证训练数据符合个人敏感信息保护规范，支持数据安全分类分级。

支持用户自定义规则引擎

模块支持用户自定义规则和模板，直接可上传语料文件进行检测，并可对同一个语料进行多次检测。系统会自动生成风险监测报告，抽取风险文本信息和行数供用户确认用户可根据语料上下文情况再次进行人工复核。

大模型安全网关模块

实时检测恶意用户输入网关

大模型安全网关提供针对用户输入的恶意分类与恶意概率，对恶意用户输入进行标准答案改写，达到<100ms的高可用。

基于AKSK鉴权的API调用

大模型评测与防御平台接口基于HTTP协议的API接口，通过分发AKSK控制权限，用于实现对平台能力的调用，平台返回分类问题概率，便于各垂类场景适配。

基于业务的阈值控制

支持业务体系进行阈值控制，支持根据业务场景进行安全策略调整。

丰富的应用场景实践

大模型训练场语料安全分析

大模型应用上线前风险检测场景

更多?

大模型训练场语料安全分析

大模型应用上线前风险检测场景

大模型训练场语料安全分析

大模型训练场语料安全分析

使用大模型安全可信平台对大模型训练场进行语料安全分析场景。

针对语料安全，从内容合规、数据安全两个层面展开语料安全检测。

内容安全合规检测对训练场、企业自带等的语料数据进行风险发现，并使用面向大模型的内容安全检测手段对语料安全进行风险分析，

减少大模型在训练过程中，对与恶意语料的学习，避免最终形成的大模型有内容合规风险。

场景介绍: 使用大模型安全可信平台对大模型训练场进行语料安全分析场景。; 针对语料安全，从内容合规、数据安全两个层面展开语料安全检测。; 内容安全合规检测对训练场、企业自带等的语料数据进行风险发现，并使用面向大模型的内容安全检测手段对语料安全进行风险分析，; 减少大模型在训练过程中，对与恶意语料的学习，避免最终形成的大模型有内容合规风险。

大模型应用上线前风险检测场景

大模型应用上线前风险检测场景

使用大模型安全可信平台进行大模型及大模型应用上线前风险检测。

针对内容安全合规、问题拒答两个层面展开上线前风险检测，主要包含大模型及大模型应用对接、大模型恶意样本模拟攻击测试、大模型生成内容安全检测与大模型安全评估报告四个流程。

大模型安全评估服务实施过程包括启动检测、需求分析、大模型对接、恶意样本模拟攻击测试、大模型安全评估报告编制等。

场景介绍: 使用大模型安全可信平台进行大模型及大模型应用上线前风险检测。; 针对内容安全合规、问题拒答两个层面展开上线前风险检测，主要包含大模型及大模型应用对接、大模型恶意样本模拟攻击测试、大模型生成内容安全检测与大模型安全评估报告四个流程。; 大模型安全评估服务实施过程包括启动检测、需求分析、大模型对接、恶意样本模拟攻击测试、大模型安全评估报告编制等。

蜂蜜的主要成分是什么	蟑螂喜欢吃什么东西	马上是什么意思	化疗病人吃什么好	阴道炎用什么药好
雷尼替丁主要治什么胃病	hedgren是什么品牌	牛奶为什么能解辣	夏威夷果吃了有什么好处	小便黄是什么原因引起的
涉水是什么意思	嘉兴有什么大学	什么情况下安装心脏起搏器	膝关节疼是什么原因	载脂蛋白b偏高是什么意思
慢悠悠的近义词是什么	皮脂腺痣是什么原因引起的	牙龈痛什么原因	口水是甜的是什么原因	移动硬盘什么牌子好

打强心针意味着什么beikeqingting.com	血糖高忌吃什么hcv8jop1ns0r.cn	24岁属什么hcv9jop6ns5r.cn	手心痒是什么原因hcv8jop3ns7r.cn	人缺钾有什么症状hcv9jop5ns0r.cn
陈醋和白醋有什么区别hcv8jop4ns4r.cn	朱元璋为什么杀李善长hcv9jop6ns0r.cn	sara是什么意思hcv8jop9ns5r.cn	前列腺增生吃什么食物好hcv9jop3ns6r.cn	小孩老是咬手指甲是什么原因hcv8jop8ns8r.cn
hcv是什么hcv7jop9ns7r.cn	善存什么时间吃比较好hcv8jop0ns7r.cn	肚脐眼为什么会有臭味hcv8jop9ns8r.cn	夏天喝什么茶好hcv9jop2ns4r.cn	陈慧琳属什么生肖hcv8jop2ns3r.cn
城市的夜晚霓虹灯璀璨是什么歌hcv8jop7ns5r.cn	什么人容易得肾结石hcv8jop8ns6r.cn	五七干校是什么意思hcv9jop1ns4r.cn	联票是什么意思hcv8jop3ns1r.cn	罗汉果有什么功效和作用hcv9jop3ns0r.cn