Zur Haupt­na­vi­ga­ti­on sprin­gen [Alt]+[0] Zum Sei­ten­in­halt sprin­gen [Alt]+[1]

Da­ten­kom­pres­si­on

Ma­te­ri­al

Da­ten­kom­pres­si­on

Tausch­ord­ner: kom­pres­si­on_1.png, kom­pres­si­on_2.png

Tausch­ord­ner: Luna.​jpg

Ver­lust­freie Da­ten­kom­pres­si­on – Lau­f­län­gen­co­die­rung

Bei der Da­ten­kom­pres­si­on (auch: Da­ten­kom­pri­mie­rung) wird die Menge an Daten re­du­ziert, also ver­rin­gert. Wenn die Ver­rin­ge­rung der Da­ten­men­ge mit einem Qua­li­täts­ver­lust ein­her geht, spricht man vonver­lust­be­haf­te­ter Da­ten­kom­pres­si­on, an­sons­ten von ver­lust­frei­er Kom­pres­si­on. Dabei ist es un­we­sent­lich, ob der Qua­li­täts­ver­lust wahr­nehm­bar ist oder nicht. Re­le­vant ist nur, ob die ur­sprüng­li­che Datei aus den re­du­zier­ten Daten wie­der­her­ge­stellt wer­den kann oder nicht.

In Auf­ga­be 1 wer­den zwei Bil­der ver­gli­chen, die das­sel­be For­mat, aber ein ganz un­ter­schied­li­ches Da­ten­vo­lu­men haben. Der In­halt der Datei be­ein­flusst also deren Größe.

Die SuS ana­ly­sie­ren in Auf­ga­be 2 eine Lau­f­län­gen­co­die­rung (engl.: RLE, Run Length En­co­ding) (9s 6w 2s 1w 1s 2w 1s 1w 2s 6w 2s 1w 4s 1w 2s 6w 9s) und er­mit­teln dar­aus die Bild­da­ten.

Bei Schwarz­weiß-Bil­dern kann die In­for­ma­ti­on, dass auf 9 schwar­ze Pixel 6 weiße fol­gen, weg­ge­las­sen wer­den, weil schwar­ze und weiße Pixel sich ab­wech­seln. Die Bild­da­ten kön­nen wei­ter re­du­ziert wer­den zu: 9 6 2 1 1 2 1 1 2 6 2 1 4 1 2 6 9. Wich­tig ist hier­bei, dass eine Ver­ein­ba­rung ge­trof­fen wer­den muss, mit wel­cher Farbe be­gon­nen wird.

Im Kom­pres­si­ons­al­go­rith­mus ist fest­ge­legt, mit wie vie­len Bit eine Zahl co­diert wird. Diese Bi­tan­zahl ist nicht ab­hän­gig vom der je­wei­li­gen Datei. Denk­bar wäre al­ler­dings auch, dass ein Kom­pres­si­ons­al­go­rith­mus die Datei ana­ly­siert und die kleinst­mög­li­che Co­die­rung für eine Zahl fest­legt – in­di­vi­du­ell für jede Datei.

In Auf­ga­be 3 wird die Lau­f­län­gen­co­die­rung geübt und die Spei­cher­plat­zer­spar­nis be­rech­net. Even­tu­ell er­ken­nen die SuS be­reits an die­ser Stel­le, dass nicht immer eine Er­spar­nis er­reicht wird (Auf­ga­be 4).

Im Bild aus Auf­ga­be 2 wird bei­spiels­wei­se keine Re­du­zie­rung er­reicht. Ein ein­zel­nes Pixel be­nö­tigt (bei bi­nä­rer Spei­che­rung) 1 Bit Spei­cher, 9 Pixel be­nö­ti­gen 9 Bit Spei­cher. Kom­men 9 glei­che Pixel vor, be­nö­tigt man 4 Stel­len, um die Zahl 9 binär dar­zu­stel­len, also 4 Bit. Al­ler­dings wer­den dann auch '2 weiße Pixel' mit 4 Bit co­diert. Erst ab 5 gleich­ar­ti­gen Pixel er­gibt sich also eine Ein­spa­rung durch die Lau­f­län­gen­co­die­rung.

Nach die­ser Er­kennt­nis kann man mit den SuS Ver­bes­se­rungs­vor­schlä­ge sam­meln, um die Lauf­längencodierung ef­fek­ti­ver zu ge­stal­ten (Auf­ga­be 7 b).

Ein Ver­bes­se­rungs­vor­schlag könn­te sein, dass die Lau­f­län­gen­co­die­rung nur an­ge­wen­det wird, wenn es eine Ver­bes­se­rung bringt. Im Bei­spiel aus Auf­ga­be 2 sähe das so aus:

9 6 sswswwswss 6 sswsssswss 6 9 bzw.: 9 6 1101001011 6 1101111011 6 9

Hin­weis: Die ent­ste­hen­de Pro­ble­ma­tik er­ken­nen die SuS even­tu­ell erst, wenn die bi­nä­re Dar­stel­lung be­trach­tet wird: Wie kann un­ter­schie­den wer­den, ob es sich um eine Folge von s/w Bits han­delt (z.B. swws => 10012) oder um eine Bi­n­är­zahl (z.B. 9 => 10012)?

Kom­men in den Daten nicht nur zwei sich ab­wech­seln­de Zei­chen (s, w) vor, son­dern meh­re­re ver­schie­de­ne, muss zu­sätz­lich zur Zahl auch das Zei­chen ge­nannt wer­den, das wie­der­holt wird. Bsp.: AA­ABBBBBC­CDDDDDDEEF wird co­diert zu: A3 B5 C2 D6 E2 F1. (Auf­ga­be 5, Auf­ga­be 9)

Damit die kom­pri­mier­te Datei nicht län­ger wird als die ori­gi­na­le, könn­te man nur Zei­chen co­die­ren, die häu­fi­ger als z.B. drei­mal hin­ter­ein­an­der auf­tre­ten.

AA­ABBBBBC­CDDDDDDEEF ⇒ AA­A­B5C­C­D6EE

Hier­bei muss aber un­ter­schie­den wer­den kön­nen, ob es sich um ein Ein­zel­zei­chen oder um eine Wie­der­ho­lung han­delt. Das kann durch ein Son­der­zei­chen ge­sche­hen, wel­ches sonst nie ver­wen­det wird. z.B. AAA#B5CC#D6EE. Falls alle Zei­chen im Text vor­kom­men kön­nen, dann kann man ein mög­lichst sel­te­nes Zei­chen ver­wen­den. Kommt es nun im Text vor, muss es dort als Wie­der­ho­lung ge­kenn­zeich­net wer­den. Aus # wird dann ##1. Bsp.: ABBB#CDDDDE## ⇒ ABBB##1C#D3E##2

Die Lau­f­län­gen­co­die­rung kann auf ver­schie­de­nen Ebe­nen an­ge­wen­det wer­den: Auf Bit-Ebene wie in Auf­ga­be 1 und 2, auf Zei­chen-Ebene wie in Auf­ga­be 4 oder auch auf Pixel-Ebene wie in Auf­ga­be 5.

Hin­weis:

Bei den Auf­ga­ben wird nicht un­ter­schie­den, ob die Zah­len binär- oder ASCII-co­diert wer­den. Im All­ge­mei­nen er­gibt sich das aus der Auf­ga­ben­stel­lung. Wenn genau die­ses Thema im Un­ter­richt ver­tieft wer­den soll, dann soll­ten die Auf­ga­ben­stel­lun­gen an­ge­passt und kon­kre­ti­siert wer­den.

Hin­weis:

Die Huff­man-Co­die­rung, die sich lo­gisch an­schlie­ßen würde, ist im Bil­dungs­plan nicht vor­ge­se­hen.

 

Ver­lust­be­haf­te­te Da­ten­kom­pres­si­on

Bei der ver­lust­be­haf­te­ten Kom­pres­si­on1 wird aus einer Datei In­for­ma­ti­on ent­fernt, die spä­ter nicht wie­der­her­ge­stellt wer­den kann. Ziel ist es nun, genau sol­che In­for­ma­ti­on zu ent­fer­nen, die nicht not­wen­dig ist – man spricht von Ir­re­le­vanz­re­duk­ti­on. Ver­lust­be­haf­te­te Kom­pres­si­on fin­det meist An­wen­dung in der Bild-, Video- und Audio-Über­tra­gung.2

Die Ent­schei­dung, wel­che In­for­ma­ti­on für die Qua­li­tät des Bil­des (oder auch z.B. einer Au­dio­da­tei) we­sent­lich ist, hängt von der mensch­li­chen Wahr­neh­mung ab.

Bei Au­dio­da­tei­en könn­ten z.B. Töne, die im nicht hör­ba­ren Be­reich lie­gen, ent­fernt wer­den. Al­ler­dings ist der hör­ba­re Be­reich nicht bei allen Men­schen exakt gleich. Das Audio-For­mat MP3 lie­fert für ei­ni­ge eine völ­lig aus­rei­chen­de Musik-Qua­li­tät, für an­de­re ist MP3 in­ak­zep­ta­bel.

Die Netz­haut des mensch­li­chen Auges kann Hel­lig­keits­un­ter­schie­de viel stär­ker wahr­neh­men als Farb­un­ter­schie­de. Daher kön­nen Far­ben eher re­du­ziert wer­den als Hel­lig­keits­stu­fen, ohne dass ein qua­li­ta­ti­ver Un­ter­schied be­merkt wird. Die­sen Ef­fekt macht sich be­reits das Farb­fern­se­hen mit der YUV-422 Re­du­zie­rung zu­nut­ze.

Li­ni­en und Kan­ten sehr wich­tig für die Wahr­neh­mung von Ob­jek­ten, so wird z.B. eine Strich­zeich­nung oft schnel­ler er­kannt als ein Farb­bild des­sel­ben Ob­jekts.

Wei­ter­hin ver­stärkt die mensch­li­che Bild­ver­ar­bei­tung Kon­tras­te. Beim Ef­fekt der Mach­schen Strei­fen wer­den an den Gren­zen von ein­heit­lich ge­färb­ten Flä­chen die Kon­tras­te viel stär­ker wahr­ge­nom­men als real vor­han­den.3

Beschreibung

Bild­quel­le: Masch­sche Strei­fen.svg by Po­li­ni [CC BY-SA 3.0] via via Wi­ki­me­dia Com­mons (abger. 12.3.19)

Der JPEG-Al­go­rith­mus macht sich sol­che Ef­fek­te (unter an­de­rem) zu­nut­ze und er­reicht eine sehr star­ke Re­du­zie­rung der Da­ten­men­ge, ohne deut­li­che Qua­li­täts­ver­rin­ge­run­gen.

Neben der in­di­vi­du­el­len Wahr­neh­mung muss bei der Qua­li­täts­ent­schei­dung na­tür­lich auch be­rück­sich­tigt wer­den, für wel­chen Zweck ein Bild be­nö­tigt wird (z.B. Be­trach­tung auf dem Handy oder auf einem gro­ßen Bild­schirm; Aus­druck als Post­kar­te oder Pos­ter) sowie die Qua­li­tät des Dar­stel­lungs­me­di­ums (z.B. sehr 'gutes' Foto in Ver­bin­dung mit einem 'schlech­ten' Bea­mer, Bild­schirm bzw. Dru­cker).

Die SuS un­ter­su­chen in Auf­ga­be 11 das Aus­se­hen und Da­ten­men­ge eines JPEG-Fotos, nach­dem sie es in un­ter­schied­li­chen JPEG-Kom­pres­si­ons­gra­den ge­spei­chert haben. Wahr­schein­lich spre­chen die SuS von einer bes­se­ren oder schlech­te­ren 'Qua­li­tät' des Bil­des. Dann muss man the­ma­ti­sie­ren, dass zuvor de­fi­niert wurde, dass die 'Qua­li­tät' ab­hän­gig ist von der Auf­lö­sung und der Farb­tie­fe.

Kompressionsartefakte

Bild­quel­le: M. Klein

In Auf­ga­be 13 kann (op­tio­nal oder dif­fe­ren­zie­rend) auf den Ef­fekt der Kom­pres­si­ons­ar­te­fak­te ein­ge­gan­gen wer­den. Das sind sicht­ba­re Block­struk­tu­ren (daher Block­ar­te­fak­te), die durch eine Un­ter­tei­lung des Bil­des in (meist 8•8 Pixel) große Blö­cke bei der JPEG-Kom­pres­si­on ent­ste­hen.

Kom­pres­si­ons­ar­te­fak­te tre­ten auch bei der Audio-Kom­pres­si­on als hör­ba­re Stö­run­gen auf.

Er­gän­zung: Ver­lust­be­haf­te­te Audio-Kom­pres­si­on4

Wie bei Bil­dern spielt die Wahr­neh­mung eine große Rolle (Psy­cho­akus­tik). Zum Bei­spiel wer­den Fre­quen­zen ober­halb von ca. 20 kHz nicht wahr­ge­nom­men und kön­nen ent­fernt wer­den.

Zwei Töne wer­den erst dann als ge­trenn­te Töne wahr­ge­nom­men, wenn der Fre­quenz­be­reich weit genug aus­ein­an­der liegt. Und ein lei­ser Ton ist nach einem lau­ten Ton zu­nächst nicht hör­bar.

Durch sol­che Phä­no­me­ne kön­nen die Aus­gangs­da­ten ohne hör­ba­ren Qua­li­täts­ver­lust wei­ter re­du­ziert wer­den. Wer­den Musik, Spra­che oder Ge­räu­sche auf Werte um etwa 192 kbit/s re­du­ziert, kön­nen die meis­ten Men­schen kaum Qua­li­täts­un­ter­schie­de zum un­kom­pri­mier­ten Aus­gangs­ma­te­ri­al fest­stel­len.

Ein Stan­dard­ver­fah­ren zur Au­dio­kom­pres­si­on ist das 1982 ent­wi­ckel­te MP3-Ver­fah­ren. Der maß­geb­li­che Ent­wick­ler die­ses Ver­fah­rens ist der deut­sche Ma­the­ma­ti­ker und Elek­tro­tech­ni­ker Karl­heinz Bran­den­burg.

Bei der Qua­li­tät von Audio-Auf­nah­men muss un­ter­schie­den wer­den zwi­schen der Qua­li­tät der Auf­nah­me und der Qua­li­tät der Wie­der­ga­be.

 

1 https://​de.​wi­ki­pe­dia.​org/​wiki/​Dat​enko​mpre​ssio​n(ab­ge­ru­fen am 02.01.2019)

2 Theo­re­ti­sche Grund­la­ge bil­det die Shan­non­sche Rate-Dis­tor­ti­on-Theo­rie. Sie be­schreibt, wel­che Da­ten­über­tra­gungs­ra­te min­des­tens nötig ist, um In­for­ma­tio­nen mit einer be­stimm­ten Güte zu über­tra­gen.

3 https://​de.​wi­ki­pe­dia.​org/​wiki/​Mach­sche_​Strei­fen#/​media/​File:​Masch­sche_​Strei­fen.​svg (ab­ge­ru­fen am 12.3.19)

3 https://​de.​wi­ki­pe­dia.​org/​wiki/​Dat​enko​mpre​ssio​n (ab­ge­ru­fen am 2.1.2019)

 

 

Un­ter­richts­gang: Her­un­ter­la­den [odt][1 MB]

Un­ter­richts­gang: Her­un­ter­la­den [pdf][824 KB]

 

Wei­ter zu Di­gi­ta­li­sie­rung von Audio