谷歌承认“窃取”OpenAI模型关键信息:成本低至150元
2024-03-13 13:00
文本设置
小号
默认
大号
Plus(0条)
根据谷歌自己的说法,它不仅还原了OpenAI大模型的整个投影矩阵(projection matrix),还知道了确切隐藏维度大小。只要通过API访问,不到2000次巧妙的查询就搞定了。成本根据调用次数来看,最低20美元以内(折合人民币约150元)搞定,并且这种方法同样适用于GPT-4。 | 相关阅读(量子位)
54
东木
执大象 天下往
怎么能说“窃”?是“拿来”而已。
这次可以说是AI大模型的一次“兵棋推演”,谷歌通过一种简单而高效的方法成功揭示OpenAI大型语言模型的关键信息。该方法利用API访问模型,仅需少量的查询即可获取模型的投影矩阵和隐藏维度等关键信息。谷歌的目标是模型的嵌入投影层,通过大量查询和奇异值排序等技术,他们能够确定模型的隐藏维度大小,并且进一步揭示了模型的参数量和全局性信息。这次谷歌展示了对于生成式模型,尤其是像GPT-4、PaLM2这样的模型,即便在提供了logprobs或logit bias的情况下,其安全性也存在漏洞。
虽然这次“拿来”的成本相对较低,但这一实验为整个大模型领域的安全性敲响了警钟。作为回应,研究团队提出了一些防御措施,包括从API和模型架构两个层面进行修改,以增强模型的安全性。尤其是在研究团队在提取模型信息之前得到了OpenAI的同意,并在攻击完成后删除了相关数据,也算点到为止,友好切磋。
我觉得值得注意的是,尽管OpenAI对此做出了回应,但是谷歌这次的成功表明即使最大限度地保护模型也不一定是完全安全的。这提醒了整个行业需要持续关注模型安全性,并采取更加严密的措施来保护模型的关键信息不受损害。