首页专栏人工智能文章详情

AI 批量生成假文件迷惑黑客，都 2021 了保护数据安全还这么难？

芒果果 发布于 3 月 2 日

二战时期发生了一场最精彩的骗局，废弃防空洞里出现了一具伪装成英国海军军官的尸体，尸体上放置的假文件成功迷惑敌军掩盖了真正的西西里岛战役。这场行动被称为“肉馅行动”。

现在，这种利用虚假文件掩盖秘密的方法已经应用到了技术领域。利用多种版本的假文件可以制造干扰，从而隐藏有价值的信息。

美国达特茅斯大学计算机科学系设计的一个新的数据保护系统 WE-FORGE 使用人工智能自动生成虚假文件，以保护知识产权，如药品设计和军事技术等等。

伪造虚假文件迷惑攻击者

网络安全、技术与社会学杰出教授、安全、技术与社会研究所所长 v.s. Subrahmanian 说，“这个系统生成的文件与原始文件足够相似，看似合理，但又足够不同。”

网络安全专家已经使用“金丝雀陷阱”、“蜜糖文件”和翻译文件来制造诱饵，欺骗潜在的攻击者。WE-FORGE 改进了这些技术，使用自然语言处理自动生成多个可信和不正确的伪造文件。该系统还插入了随机元素，以防止攻击者容易识别真正的文件。

WE-FORGE 可以用来创建任何技术设计文档的大量伪造版本。当黑客攻击一个系统时，他们面临的艰巨任务是弄清楚哪些类似的文件是真实的。

Subrahmanian 表示，“使用这种技术，我们迫使对手浪费时间和精力来识别正确的文档。即使他们做到了，他们也可能没有信心认为自己做对了。”

单个文档存在数百万种可能，黑客窃取信息成本增加

创建虚假的技术文档同样令人生畏。根据研究团队的说法，一项专利可以包括超过 1000 个概念和多达 20 个可能的替代品。WE-FORGE 最终可能考虑在单个技术文档中可能需要替换的所有概念的数百万种可能性。

Subrahmanian 说：“恶意行为者现在正在窃取知识产权，并且逍遥法外,这个系统增加了盗窃政府或行业机密的成本。”

WE-FORGE 算法的工作原理是计算文档中概念之间的相似性，然后分析每个词与文档的相关程度。然后，系统将概念分类到“箱子”中，并为每个组计算可行的候选者。

参与该项目的达特茅斯大学研究生 Dongkai Chen 表示: “ WE-FORGE 也可以从原始文档的作者那里获取信息。人类和机器的聪明才智结合在一起，会进一步增加知识产权窃贼的成本。”

作为研究的一部分，研究小组伪造了一系列计算机科学和化学专利，并要求一组知识渊博的研究对象来决定哪些文件是真实的。

WE-FORGE 系统能够“持续地为每个任务生成高度可信的伪造文档”。与其他工具不同，WE-FORGE 擅长伪造技术信息，而不仅仅是隐藏简单的信息，如密码。

加强数据保护需要新方法

过去的 2020 年，企业和个人数据保护都面临着严峻的挑战。单单一年就有 200 亿条记录被盗，比 2019 年的 120 亿条增加了 66% 。

在泄露的数据中发现了用户名、密码、信用卡号码、银行账户详细信息、医疗保健信息和其他个人数据。恶意行为者利用这些珍贵的信息进行欺诈和进一步的攻击。

仅在 2020 年第一季度，荷兰政府就丢失了一个存有公民机密数据的硬盘。4 月，Zoom 在全球远程工作时期开始时丢失了 50 万个密码。6 月，甲骨文还通过在一个不安全的服务器上存储数据泄露了数十亿的网络跟踪数据……

数据泄露背后最常见的原因是某种身份验证措施的泄露ーー这可能是用户名、密码、令牌、 API-key，或者是失误的无密码服务器或应用程序。
大多数大型组织使用数据泄露防护技术，但未能防止密码泄露和帐户接管。这表明，显然需要一种新的方法，即将技术控制和即时用户意识提高结合起来，从新的角度来看待账户保护。

segmentfault 公众号

人工智能黑客数据安全

阅读 221 发布于 3 月 2 日

赞收藏

本作品系原创，采用《署名-非商业性使用-禁止演绎 4.0 国际》许可协议

SegmentFault 行业快讯

第一时间为开发者提供行业相关的实时热点资讯

关注专栏

芒果果

SegmentFault 技术编辑

一路走走看看，顺便留下点什么。

3.2k 声望

53 粉丝

关注作者

0 条评论

得票时间

提交评论

芒果果

SegmentFault 技术编辑

一路走走看看，顺便留下点什么。

3.2k 声望

53 粉丝

关注作者

宣传栏

伪造虚假文件迷惑攻击者

WE-FORGE 可以用来创建任何技术设计文档的大量伪造版本。当黑客攻击一个系统时，他们面临的艰巨任务是弄清楚哪些类似的文件是真实的。

Subrahmanian 表示，“使用这种技术，我们迫使对手浪费时间和精力来识别正确的文档。即使他们做到了，他们也可能没有信心认为自己做对了。”

单个文档存在数百万种可能，黑客窃取信息成本增加

Subrahmanian 说：“恶意行为者现在正在窃取知识产权，并且逍遥法外,这个系统增加了盗窃政府或行业机密的成本。”

作为研究的一部分，研究小组伪造了一系列计算机科学和化学专利，并要求一组知识渊博的研究对象来决定哪些文件是真实的。

WE-FORGE 系统能够“持续地为每个任务生成高度可信的伪造文档”。与其他工具不同，WE-FORGE 擅长伪造技术信息，而不仅仅是隐藏简单的信息，如密码。

加强数据保护需要新方法

过去的 2020 年，企业和个人数据保护都面临着严峻的挑战。单单一年就有 200 亿条记录被盗，比 2019 年的 120 亿条增加了 66% 。

segmentfault 公众号

人工智能自动驾驶神经网络机器学习数据挖掘 tensorflow

AI 批量生成假文件迷惑黑客，都 2021 了保护数据安全还这么难？

伪造虚假文件迷惑攻击者

单个文档存在数百万种可能，黑客窃取信息成本增加

加强数据保护需要新方法

SegmentFault 行业快讯

芒果果

芒果果

宣传栏

目录

伪造虚假文件迷惑攻击者

单个文档存在数百万种可能，黑客窃取信息成本增加

加强数据保护需要新方法

热门推荐