首页 > 新车性能 > 新车性能 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

新车性能更多>>

和华为合作!庆铃兆瓦级超充重卡铃界来了 三款三星 Galaxy 平板生命周期结束,将停止获得安全更新 华硕ROG XG27UCS电竞显示器限时特惠1529元 联想至像 T34 M3 Plus 打印机:打造智能企业高效办公新体验 梧州市电商以“数商兴农”为引领 推动传统业与电商融合发展 陕西省定边县举办职工电商直播技能大赛 京东首次上线开源鸿蒙穿戴专区:299元起就能买鸿蒙5.0手表 京东校园之星才艺大奖赛区域赛开赛,武汉赛区竞赛时间确定 伯恩光学荣获BOE京东方“卓越品质奖” 酒类消费回归“品牌力”,天猫618酒水消费爆发,白酒、葡萄酒、黄酒高速增长 顺丰×淘宝天猫合作!极速上门服务,重塑电商物流体验 荣耀HONOR X14七代锐龙版轻薄本超值优惠价 荣耀Magic V5本月发布:性能升级,轻薄再突破 买卖二手手机如何更安心?人民日报记者在山东采访行业各方 手机上即可测算法定退休年龄及最低缴费年限 TCL空调广州智能产业园项目主体结构全面封顶 消息称“追觅系”新公司今年下半年发布运动相机 红米K70至尊版5G手机24GB+1TB冰璃蓝1242元 小米YU7三款车型电池供应商公布,标准版Pro版配弗迪宁德时代电池 小米汽车上周交付量细节曝光:7796辆 YU7还未发力 小米北京五棵松举办人车家生态展,家电全品类亮相 618热销中,华为笔记本 Linux版“解锁”智慧办公新潮流 华为 12.7 亿、H3C 4.6 亿、浪潮 4.5 亿、阿里 3.8 亿、ZStack 1.7 亿 影像新赛道!曝华为小米OPPO和vivo都在评估测试外挂镜头 三星在英国推广Galaxy手机防盗功能 三星新机现身 Geekbench:预计为 Galaxy Z Fold 7 全球版,多核最高 9226 分 时隔近二十年,联想再次推出数码相机:6400万像素,支持4K视频 2U扩展型服务器 联想SR588 V2成都现货促销11110元 备战618,这些快手商家用大促专属客服方案助力销售增长 助力企业开拓国际市场 宁津举办外贸电商培训