1。実行長エンコード(rle) :
-RLEは、一連のデータで連続した繰り返し値を識別および表現することにより機能します。
- これらの繰り返し値を単一の値に置き換え、その後に繰り返しのカウントを使用します。
- たとえば、データシーケンス[1、1、1、2、2、3]を考慮してください。 RLEはこれを[1、3、2、2、3、1]としてエンコードします。
-RLEは、データに値を繰り返す長期的な実行がある場合に特に効果的です。
2。セルエンコード :
-Huffman Codingとも呼ばれるセルエンコーディングは、シンボルまたは文字を順番に表すプレフィックスコードを使用します。
- 各シンボルには、その頻度または発生の確率に基づいて一意のコードワードが割り当てられます。
- より頻繁なシンボルはコードワードが短く、頻度の低いシンボルはコードワードが長くなります。
- セルエンコーディングは、データを表すために使用されるコードワードの平均長を減らすことにより圧縮を実現します。
- たとえば、データシーケンス[a、b、b、c、d、d、e]を考慮してください。セルエンコーディングを使用して、コードワード[00、10、110、1110、010、011]をシンボル[a、b、c、d、e]に割り当てることができます。
RLEとセルエンコードの主な違いは、次のように要約できます。
- 目的 :RLEは、連続した繰り返し値を排除することを目的としていますが、セルエンコーディングは平均コードワードの長さを減らすことに焦点を当てています。
- データ構造 :RLEは、Count-Pairを使用して繰り返される値を表しますが、セルエンコードは各シンボルに可変長コードワードを割り当てます。
- 効率 :RLEは、繰り返し値の長期的な実行がある場合に効果的ですが、セルエンコードは一般に、多様なシンボルを持つより大きなデータセットでより効果的です。
- 適合性 :RLEは、画像やバイナリファイルなどの繰り返しや冗長性を示すデータの圧縮に適しています。セルエンコーディングは、一般にテキスト圧縮および汎用データ圧縮アルゴリズムに使用されます。
RLEとセルの両方のエンコードには独自の強みがあり、特定のデータ特性と圧縮要件に基づいてさまざまなシナリオに適用されます。