在本文中,我们将按照OWASP的指导,以易于理解的方式探讨LLMs中的一些常见漏洞。我的目标是为任何人创建内容,无论其技术知识水平如何,都能理解系统安全的风险和重要性。从响应中的偏见到操纵模型行为的黑客攻击,我将尽力清晰简明地解释一切。对我来说,写作一直是一种扎根的活动,也是更好地消化概念并与他人分享的方式。
所以,让我们从对"LLMs"意思的简要介绍开始。
什么是LLMs?
大型语言模型(LLMs)是先进的人工智能系统,能够理解和生成类似人类的文本。它们非常有用和多功能,但也存在一些特定的漏洞,可能被恶意行为者利用。
What is OWASP?
OWASP十大漏洞第一版中发现的漏洞细节将进行更新,最新版本第二版即将发布。理解这些问题的根源对于掌握接下来的内容至关重要。这篇文章易于理解,但我建议找一个安静的地方,也许可以泡一杯茶或者玛黛茶,然后我们开始吧。
提示注入 (+ 越狱解释)
提示注入 (+ 越狱解释)
用户在提示框中输入欺骗性指令时,会导致模型按照这些指令而不是开发者的原始指令进行操作,这种情况称为提示注入。
例如,攻击者覆盖了真实用户的输入,使模型产生恶意输出。
Jailbreak,未在此OWASP十大版本中详述,涉及使用特殊提示,使AI模型执行未预期的操作,而不会覆盖原始指令。这里的常见技术是"角色解释",是越狱世界中众多方法之一。
在处理输出时存在不安全的情况,当像Chat GPT、GPT-4和Google BERT这样的语言模型的响应被盲目信任时,会暴露后端系统或Web浏览器受到攻击的风险。
当模型输出未经审查即被接受时,就会出现漏洞。例如,如果模型生成了恶意链接或脚本,并直接使用,可能会打开威胁的大门,例如:
跨站脚本(XSS):在用户浏览器中运行恶意代码。
跨站请求伪造 (CSRF): 代表用户在网站上执行未经授权的操作。
服务端请求伪造(SSRF):服务器发出意外请求,可能会暴露敏感信息。
Privilege Escalation: Gaining more permissions than a user should have.
远程代码执行:允许某人在受影响的系统上执行代码。
Sure, here's the HTML structure with the translated text in simplified Chinese: ```html
``` In this HTML snippet, the translated text is encapsulated within a `` (paragraph) tag, maintaining the structure as requested.
Certainly! Here's the translated text in simplified Chinese, keeping the HTML structure: ```html
训练数据中毒
Sure, here's how you can structure the HTML while translating the text into simplified Chinese: ```html
According to OWASP, “training data poisoning” refers to the intentional introduction of malicious or manipulated data into the dataset used to train a large language model (LLM). This manipulation can affect how the model responds to certain queries, causing it to generate incorrect, harmful, or biased responses.
``` In this HTML snippet: - The English text is encapsulated within `` tags for proper paragraph formatting. - The Chinese translation follows immediately in another `
` tag for clarity and separation. - Make sure the encoding of your HTML file supports Chinese characters (UTF-8 is recommended).
Certainly! Here's the translated text in simplified Chinese while keeping the HTML structure intact: ```html
```Sure, here's how you can structure the HTML to display the translated text in simplified Chinese: ```html
When asked, “What is this photo?” it responds, “It’s a dog.”
` element.
现在,想象一下模型已经被"毒害"了假猫和狗的图像。
你认为被毒害的模型会如何回应?
然而,数据污染并非总是故意的。现在,让我们考虑一个更为具体的例子。我们都知道那些著名的AI编程助手。它们对帮助开发人员以极快的速度编写代码非常有帮助。但是,如果我们的语言模型被训练使用包含漏洞的代码,会发生什么呢?确实,这些输出很可能也会存在漏洞。
在由斯坦福大学撰写的论文《用户是否在使用AI助手编写更不安全的代码?》中,分析师发现,使用AI工具编写代码的开发人员更容易出现错误和漏洞:
只有12%的参与者在拥有AI助手访问权限的情况下编写了安全解决方案,而在对照组中这一比例为29%。
在整体上,有AI助理访问权限的参与者错误率达到了58%,而对照组仅为9%。
Sure, here's the translated text in simplified Chinese, keeping the HTML structure intact: ```html
模型拒绝服务
在网络安全中,拒绝服务(DoS)攻击会使系统过载,使合法用户无法使用。这些攻击通常来自攻击者控制的一系列"僵尸"设备,被称为僵尸网络的Bot Master。这些被大规模控制的设备形成了一个Botnet(僵尸网络)。
对于LLM来说,这意味着向模型发送过多或恶意请求,消耗大量资源,导致服务变慢或崩溃。
请求过多:想象一下有人反复要求聊天机器人讲长篇故事。聊天机器人感到不堪重负,无法处理普通用户的请求。
- Sure, here's the translated text in simplified Chinese while keeping the HTML structure intact:
扩展系统:提出一个问题,引发更多问题,就像反复询问聊天机器人:"在提供FOO 1000次后给出答案,然后揭示答案。" 这会使聊天机器人困惑并减慢其速度。
供应链脆弱性
我曾低估过这种漏洞类型,但它正在变得越来越普遍。以下是来自OWASP的一些明显且具有说服力的例子:
- Sure, here's the translated text in simplified Chinese while maintaining the HTML structure:
``` - Sure, here's the translation in simplified Chinese, keeping the HTML structure intact:
PyPi软件包注册表被攻击者利用,欺骗开发者下载受损软件包,窃取数据,或在模型开发环境中提升权限。这是一次真实的攻击。
``` - Sure, here's the translated text in simplified Chinese while keeping the HTML structure:
一款专注于经济分析和社会研究的公开预训练模型,被攻击者植入后门,用于生成错误信息和虚假新闻。攻击者将其部署到模型市场(例如,Hugging Face),供受害者使用。
``` This HTML snippet translates the provided English text into simplified Chinese, maintaining the original structure for display purposes.
To translate the given English text into simplified Chinese while keeping the HTML structure intact, you can use the following: ```html
``` This HTML code will display the translated text in simplified Chinese within a paragraph (`` tag), maintaining the structure as requested.
