Auch das Jahr 2020 hat uns abermals gezeigt, was alles durch Computercode möglich ist. Intelligente Algorithmen entwickeln Medikamente und helfen in Laboren aus, können aber auch zur Manipulation wie bei Deepfakes verwendet werden. Ein neues Tool zeigt nun, wie verpixelte Inhalte einfach wieder lesbar gemacht werden können. Die ersten Ergebnisse sehen dabei vielversprechend aus.
Grundsätzlich kann es verschiedene Gründe geben, warum Inhalte verpixelt werden. So können sensible Inhalte auf Bildern oder Passwörter auf Screenshots unkenntlich gemacht werden. Die dabei häufig angewandte Methode (linearer Boxfilter) ist eigentlich relativ simpel. Es wird lediglich die Auflösung des ausgewählten Bereichs reduziert und dieser dann mit dem Durchschnittswert aller Pixel überschrieben.

Bisher gab es beim Entpixeln von Inhalten schon einige Erfolge. 2006 schrieb D. Venkatraman in einem Artikel, wie simpel das Wiederherstellen einer Kreditkartennummer ist, sofern ein verpixeltes Bild vorliegt. Dabei werden alle möglichen Kreditkartennummern generiert, verpixelt und das Resultat mit dem Ursprungsbild verglichen. Bei Passwörtern lässt sich das aber kaum anwenden, da durch die Vielfalt an möglichen Zeichenkombinationen viel Zeit verstreichen würde.
Bevor der neu entwickelte Algorithmus loslegen kann, muss dieser wissen, welche Schriftgröße, Schriftfarbe und welcher Hintergrund verwendet werden. Dann wird eine De Bruijn Sequenz (eine mehr oder minder zufällige Reihe von Zeichen, die alle Kombinationen aus 2 Zeichen abdeckt) mit denselben Eigenschaften im Editor erstellt und ein Screenshot angefertigt. Dieser dient dann als Basis für den Algorithmus, um verpixelte Zeichen zu erkennen.

Von hier an ist der Prozess ähnlich wie bei den Kreditkartennummern. Der Algorithmus prüft Pixelblock für Pixelblock und checkt, welche Buchstabenkombination hier gültig sein könnte. Zwar gibt es hier und da noch immer einige Fehler, trotzdem könnten sich in vielen Fällen verpixelte Daten wiederherstellen lassen.
Dieser neuartige Algorithmus zeigt eindrucksvoll, inwiefern unkenntlich gemachte Informationen in Zukunft nicht mehr sicher sein könnten. Ein weiterer Grund, weshalb man sensible Daten entweder komplett abschneiden oder aber überschreiben sollte. Denn im Gegensatz zu uns wird der Computer immer einen Weg finden, um an die von ihn benötigten Informationen zu kommen.
via LinkedIn