MD5为什么不能用来进行密码存储

在计算机科学领域，MD5（Message-Digest Algorithm 5）是一种广泛使用的加密算法，它被设计用于生成固定长度的消息摘要。这种算法通过将任意大小的输入数据压缩成一个128位的哈希值，从而提供了数据完整性和身份验证的一种方式。然而，尽管MD5非常高效且易于实现，但它已经不再推荐用于敏感信息如密码存储，因为存在多个安全问题。

首先，我们需要了解什么是MD5。简而言之，MD5是一个一元函数，它接受任意大小的输入并产生一个固定的输出。这意味着给定任何特定的输入，你总是会得到相同长度、相同格式的输出，即使输入内容巨大或微小。

但正因为其简单性和快速性，这也使得攻击者可以利用这些特点对此类系统造成威胁。在2004年，一名研究人员发现了一种名为“碰撞攻击”的方法，这种攻击能够在理论上找到两个不同的文件，使它们产生相同的哈希值。当这两份文件中有一部分相似时，比如图片和水印后的图片，那么根据当前技术水平来说，就有可能构造出与原始文件完全不同的内容却具有相同哈希值的情况。这对于依赖于哈希函数进行校验的人来说，是一种潜在风险。

此外，由于现代硬件速度极快，可以快速生成大量随机数，使得构造这样的“碰撞”变得容易。此外，在实际应用中，如果使用的是基于时间戳或者序列号等可预测因素作为盐，那么即使不直接构造碰撞，也能轻易地通过穷举尝试破解密码，因为每次尝试所需时间相比常规加密手段要短得多。

因此，不论从哪个角度来看，都很明显：如果你正在寻求保护你的用户帐户安全的话，你最好不要依赖于MD5这个老旧而脆弱的小工具。如果你必须处理敏感信息，那就应该考虑更现代、更强大的加密方案，如 bcrypt、PBKDF2 或 Argon2 等，这些都被设计用来抵抗暴力破解以及其他形式的手动和自动化攻击，并且能够适应随着计算能力提高而不断变化的情景需求。

最后，还有一个重要的问题需要提及，即当我们谈论到密码存储时，我们通常希望做的是使用一种叫做“salt”的额外步骤，它会添加到密码之前，然后再进行散列操作，以确保即使有人拥有另一个用户账户中的同样明文口令，他们仍然无法利用该口令登录其他账户。而虽然单独使用salt可以有效防止字典攻击，但是对于那些擅长运用数学知识的人来说，只要他们知道如何获取足够数量的大量hash pair（例如通过数据库泄露），他们仍然可以通过暴力破解所有hash pair来获得未知口令，而无需真正理解原来的明文口令是什么样子。因此，对于增加复杂性的额外措施也是必要的，比如设置锁定策略以限制连续错误登陆尝试次数，以及实施二因素认证以进一步提高安全性等等。

综上所述，尽管 MD5 是一种非常流行并且功能强大的工具，但由于其已知缺陷，它现在并不建议用于保存敏感数据，如密码。不过，当它被正确配置并结合适当的心智模型时，在非关键环境中还能发挥作用，比如网络传输中的数据完整性检查。在选择合适工具的时候，我们应该始终保持警觉，并考虑最新研究结果，以确保我们的系统既高效又安全。