今回は記事名の通り、データの圧縮について書きます。
まず、データを圧縮してから、再びそのデータを使用するまでには、下図の手順を踏みます。これは、どのような圧縮形式でも同じです。手順といっても、圧縮してデータのサイズを小さくして、展開して元に戻すだけです。
圧縮すると、サイズの小さい圧縮されたデータが得られるので、この状態のまま保存しておけばディスク容量の節約になります。また、ネットワークのアップロードやダウンロードには時間がかかることが多いですが、圧縮されたデータを転送する場合なら、通信にかかる時間は大幅に短くなります。

◆可逆圧縮と非可逆圧縮
圧縮方法の分類はいくつかあるのですが、その中に「可逆圧縮」と「非可逆圧縮」というものがあります。
可逆圧縮というのは、圧縮前のデータと、一度圧縮して、復号されたデータが完全に一致するものです。これにはLZHやZIPなどがあります。
一方の非可逆圧縮は、圧縮前のデータと復号されたデータが完全には一致しませんが、その代わりに、可逆圧縮に比べて圧縮されたデータのサイズが非常に小さくなります。大概のファイルは少しでもデータが変わってしまうと正常に読み込めなくなるものですが、音声や画像や映像のデータは音質や画質がいくらか落ちても大きな問題はありません。それを利用して、圧縮しやすいようにデータを少し変更してから圧縮を行うのが非可逆圧縮です。
◆圧縮・展開の操作
概要のところで、圧縮することと展開することが必要なのはどのような圧縮形式でも同じだと書きました。このことは間違いないのですが、ソフトウェアや圧縮形式によって、データを圧縮・展開する操作を人が行う必要があるものと、ファイルを保存するときにソフトウェアが自動で圧縮してくれるものがあります。
JPEGやPNGなどの画像の圧縮形式や、MPEGなどの動画の圧縮形式では、それらを編集するソフトウェアで保存すると、自動的に圧縮を行ってくれます。展開も、ファイルを開いたときにソフトウェアが自動的に行います。つまり、これらの圧縮形式は、普通にファイルを保存したり開いたりするだけで、ソフトウェアが勝手に圧縮・展開してれるわけです。
一方、Wordの文書をLZHやZIPで圧縮するときは、パソコンを使う人が圧縮の操作する必要があります。実際にやることは簡単で、圧縮解凍ソフトで圧縮したいファイルを開くだけです。LZHやZIPを開くときも、圧縮ファイルを展開する操作を人が行って、ようやく展開されて出てきたファイルを開けるようになります。
◆二重圧縮
JPEG画像をLZH圧縮するなど、既に圧縮されている画像をさらに圧縮した場合、ファイルサイズはほとんど小さくなりません。場合によっては、逆に大きくなる可能性もあります。
これはちょうど、ふとんの圧縮と同じようなものです。普通の状態のふとんは空気を多く含んでいるので、圧縮袋に入れて圧縮すればかなり小さくなります。しかし、既に圧縮したふとんを、圧縮袋ごと別の袋に入れて圧縮しても小さくなりませんし、逆に、圧縮袋を重ねる分だけ大きくなる可能性があるわけです。
【データ記憶・保存の最新記事】

