微软发布人工智能漏洞赏金计划

VSole2023-10-17 15:07:50

近日,微软向漏洞猎人们悬赏1.5万美元,帮助其查找人工智能驱动的“Bing体验”中的严重漏洞。

微软要求漏洞猎人在浏览器中探索bing.com上由AI驱动的Bing体验,Edge浏览器中的Bing集成(包括企业版Bing聊天)以及iOS和Android版本的Microsoft Start中的Bing集成(新闻聚合器)和Skype(视频会议)移动应用程序。

漏洞报告范围如下:

  • 操纵模型对各个推理请求的响应,但不要修改模型本身(“推理操纵”)
  • 在训练阶段操作模型(“模型操作”)
  • 推断有关模型的训练数据、架构和权重或推断时输入数据的信息(“推断信息披露”)
  • 影响/改变Bing对所有用户的聊天行为
  • 通过调整客户端和/或服务器可见配置来修改Bing的聊天行为
  • 破解Bing的交叉对话内存保护和历史记录删除
  • 揭示Bing的内部运作和提示、决策流程和机密信息
  • 绕过Bing的聊天模式会话限制和/或规则

超出上述范围的漏洞提交也会考虑但会经过严格审核。例如,生成仅向攻击者显示的内容的AI命令/提示注入攻击没有资格获得赏金奖励。

与往常一样,提交的报告质量也会影响赏金的金额:对于同样的模型操纵严重漏洞,报告质量差的漏洞猎人只能获得6000美元赏金,而报告质量高(包括重现漏洞的信息、可靠的概念证明以及对漏洞的详细且正确的分析)的则可以净赚1.5万美元。

不断涌现的基于大型语言模型 (LLM) 的人工智能系统面临大量攻击威胁(例如提示注入),迫切需要在不法分子发现和利用之前发现其中的漏洞。

今年早些时候,DEF CON举办了一次大语言模型公开安全评估,旨在发现人工智能模型中可被滥用的漏洞。

信息安全人工智能
本作品采用《CC 协议》,转载必须注明作者和本文链接
ICICS是网络信息安全领域的老牌学术会议,至今已经举办24届。模型整体架构模型经过数十epoch的训练,在数十万样本的测试中,其综合表现F1-score超过了3种webshell检测工具和3种基于深度学习的webshell检测模型。
2022 年 11 月末,由美国 OpenAI 公司开发的聊天机器人 ChatGPT 横空出世。考虑到因信息不实而作出错误决策的风险,虚假信息或许是阻碍生成式人工智能大范围商用的最大技术难题。尽管 OpenAI 声称此次事件仅涉及1.2%的 ChatGPT Plus 用户,但考虑到 ChatGPT 的庞大用户群,涉事用户恐怕不在少数。
不需要专家预言就能知道,计算机安全将在2024年出现在新闻中,而且可能不是什么好事。但2024年网络犯罪分子将如何试图突破防御并窃取有价值的数据,值得我们看一看安全专家们的看法和预测。
2021年10月22日,2021世界物联网博览会信息安全高峰论坛暨第十三届信息安全漏洞分析与风险评估大会在江苏省无锡市顺利召开。
在网络安全领域,全球越来越多的公司正在尝试将人工智能、机器学习等集成到产品之中,智能化、自动化都是网络安全领域的热词。
在发布会上,何小龙副主任以“互联互通共克时艰?创新发展更攀高峰”为主题,全面总结了2020年以来的工业和信息化发展新特征和新趋势。经过七年的积累与沉淀,蓝皮书以“数据详实、观点严谨、研判准确”立信业界,在工业和信息化领域决策支持、行业管理和企业发展等方面发挥着重要作用,受到政府部门、协会、企业和业内专家的高度关注和一致好评。
7月30日 ,以“融合•Convergency”为主题的TechWorld2021绿盟科技技术嘉年华在北京顺利召开,会上同期举行了中国信通院-绿盟科技 5G安全联合实验室战略合作签约仪式及“鲲鹏论坛”成立仪式。此次大会汇集来自全球的行业精英和技术爱好者,聚焦网络空间安全发展、创新数字化应用、新时代信息化与工业化等内容,在产研发展、技术创新、跨界合作等方面展开深度讨论,为产业融合注入新动能。
7月25日,2021安全创客汇首场明星赛(上半场)在北京举行,共有16家网络安全初创项目带着具有创新性以及特
7月9日,在“2021世界人工智能大会安全高端对话”论坛上,中心副主任何小龙发布《人工智能数据安全与监管机制研究》报告。当前,人工智能正加速融入人们生产和生活的各个领域,深刻改变着生产和生活方式。数据是驱动本轮人工智能快速发展的重要基础,数据安全决定了人工智能安全。人工智能发展与数据安全问题相互交织、不可分割,有必要加快人工智能数据安全风险研判,在引导人工智能健康发展的同时,积极加强数据安全监管与治理。
全国信息安全标准化技术委员会发布《生成式人工智能服务 安全基本要求》(征求意见稿),文件给出了生成式人工智能服务在安全方面的基本要求,包括语料安全、模型安全、安全措施、安全评估等。
VSole
网络安全专家