myfinderの技術や周辺的活動のblog

2009年2月5日木曜日

gzipの効用

最近面倒を見ているサーバのログ出力が1日あたり2.5GB程度とサイズが大きくなり、
放置しておくとすぐにHDDを圧迫するため、日次で前日分のログをgzip圧縮することにした。

ここでふと、
「そういやgzip使う機会はそれなりにあるけど、どのくらいの容量をどのくらいの時間で処理できるんだろ」
という疑問が沸いたので測ってみた。
(今回使ったマシンのCPUはP4 2.8GHz)

$ time gzip -9 YYYYMMDD.log
real 2m27.162s
user 1m59.045s
sys 0m8.167s

圧縮前が2,271,220,673バイト(2.2GB)で、圧縮後が215,331,701バイト(210MB)になった。
ただの文字データ2.2GBなら2分半で10分の1程度に圧縮可能という結論が出た。

以上。
作業時間の目安なりにしてください〜

0 件のコメント: