Collections of Data Deduplication Links

  1. 入门   在大多数时候,Wikipedia是个迅速了解某个特定技术发展背景的不错选择。例如:http://en.wikipedia.org/wiki/Data_deduplication。 如果我们有机会使用某个特定的产品,其产品白皮书和手册也是不错的。例如:NetApp、EMC、Data Domain等。 此外,专业网站上的文章也非常不错。例如:http://searchdatabackup.techtarget.com/feature/Restoring-deduped-data-in-deduplication-systems。 存储行业本身的一些资源在这里有非常好的介绍:http://blog.csdn.net/liuben/archive/2010/01/09/5166538.aspx 。  
  2. 深入   如果我们需要深入一点了解技术本身,除了产品本身的白皮书之外,最好的来源就是专业杂志和会议上的Paper了。对于工程师而言,理论性太强、太超前的文章阅读起来难度可能很大,学习的效果还不好;可以退而求其次,读读那些与具体产品有关的Paper或专利;或读读综述性的文章。专业会议主要的是FAST、SNIA的Conference,多数文章都可以免费下载到。  
  3. 深入浅出   要做到这一步很有难度。特别是我们大多都无法接触到实际系统的设计文档和代码。仅仅读读文章、白皮书或Paper,容易浮在表面上,并且精力很容易被分散掉。因为有趣的主题实在是太多了。希望开源代码、社区讨论、日常工作等形式可以促使我们早日达到这个层次。  
[ Dedup ]
Written on March 5, 2011