2009年9月15日 星期二

GMail開始有廣告信進來了!這表示垃圾信有新技術

這幾天開始我的GMail信箱開始有廣告信進來了
這表示道高一尺魔高一丈,垃圾混段又開始有新技術
永不結束的戰爭啊!看Google怎麼應付囉!

2009年9月14日 星期一

EMC 刪除重複性資料

最近去上了EMC的研討會
其中有個刪除重複性資料技術引起我的興趣
大家都知道目前是個資訊爆炸的時代
且目前儲存設備的容量不斷提升、價格卻不斷下降
公司及個人的資料,容量成長是很驚人的

這也是我認為此技術有實用性的原因
尤其是這不只可以應用在EMC的自家設備上
也可以用在其他廠牌的儲存設備上
舉個應用的例子:
某人將一份重要的文件轉寄給公司的10位員工
文件大小若為5MB,則Mail Server上共花費50MB的空間
若Mail Server的儲存裝置有透過EMC的刪除重複性資料技術處理
則此空間的花費則只有5MB多(一份資料的空間加上9份標記檔)

EMC有進一步說明:此技術並非是file base的
也就是說並不是去認檔名、檔案日期、檔案大小來決定的
而是使用block base的,簡單地想像一份檔案被分為了四個小部分(ABCD)
如果兩份資料相比對,BCD都是一樣的,只有A部分不一樣(
不一樣的叫做E好了)
那麼兩個檔案所佔用的空間就是BCD再加上A和E

此技術也支援各種不同的作業系統,想的到的都有了
根據EMC的資料,用在Windows作業系統上的效果最佳
重複資料壓縮的比率最高可達到5百多比1(官方資料,聽聽就好了)
他們的說法是說在兩台windows作業系統上,有許多可能是很類似的
如果對兩台都做一份完整備份時,雷同的部分,空間就會被節省下來

對此技術蠻好奇的,希望很快就有機會可以玩到