BIT - September 2008

Janich&Klass: Ein Scanner mit Spezialauftrag

Das Stasi Puzzle

16.250 Säcke mit zerrissenen Dokumenten aus dem Ministerium für Staatssicherheit – ein gigantisches Puzzle, das von Menschenhand nicht zu bewältigen ist.

Wissenschaftler des Fraunhofer-Instituts für Produktionsanlagen und Konstruktionstechnik (IPK) in Berlin setzen in einem Pilotprojekt Teile dieses Schnipselberges automatisiert wieder zusammen.

Mithilfe einer neuartigen Scantechnologie aus dem Hause Janich & Klass werden zuvor die Schnipsel beidseitig, in hoher Qualität und Geschwindigkeit von arvato services digitalisiert.

Sind die Papierschnipsel gescannt, werden sie mithilfe der vom Fraunhofer IPK entwickelten Software virtuell zusammengesetzt.

Um die Geheimnisse des Regimes zu bewahren wurden zwischen Herbst 1989 und Januar 1990 im ehemaligen Ministerium für Staatssicherheit systematisch Akten vorvernichtet. Die Menge der Dokumente war so enorm, dass die Reißwölfe ausfielen. Ein großer Teil der Unterlagen musste per Hand zerrissen werden. Geschätzte 40 Millionen DIN-A4 Seiten wurden in je acht bis 30 Teile zerlegt. Bisher gelang es nur, einen geringen Teil dieser Dokumente zu rekonstruieren. Denn das manuelle Zusammensetzen ist sehr zeitintensiv. Um die etwa 600 Millionen Papierschnipsel von Hand zusammenzufügen, würden 30 Personen 600 bis 800 Jahre benötigen.

Der von Janich & Klass konstruierte Spezial-Scanner verarbeitet bei Arvato Services kleine Papierschnipsel mühelos und zügig. Für den Fototermin wurden die Schnipsel übrigens nebeneinander drapiert – sonst werden sie einzeln gescannt.

Forscher des Fraunhofer IPK entwickeln derzeit ein computergestütztes Verfahren, welches das Schnipselpuzzle künftig schneller und effizienter zusammensetzen kann und somit eine zeitnahe Auswertung der Unterlagen ermöglicht Auf dem automatisiertem Weg würde die Rekonstruktion etwa fünf bis sieben Jahre dauern.

Damit die Stasi-Unterlagen im automatisierten Prozess rekonstruiert werden können, müssen die Puzzle-Schnipsel zunächst beidseitig digitalisiert werden. Dafür kommen speziell für diese Aufgabenstellung entwickelte Scanner von Janich & Klass zum Einsatz.

Über das Fraunhofer IPK

Das Fraunhofer-Institut für Produktionsanlagen und Konstruktionstechnik IPK betreibt angewandte Forschung und Entwicklung auf den Gebieten zukunftsorientierter Technologien für den Produktionsprozess in Fabriken sowie anderen Anwendungsfeldern. Das IPK beschäftigt rund 210 Mitarbeiter. (www.ipk.fraunhofer.de)

„Das virtuelle Puzzeln folgt der Logik des manuellen Puzzelns“, erklärt Dr. Bertram Nickolay, Leiter der Abteilung Sicherheitstechnik am Fraunhofer IPK. Der Mensch verwendet für die Lösung dieses Geduldsspiels eine Vielzahl von Merkmalen, anhand derer er entscheidet, ob zwei Teile zueinander passen oder nicht – z.B. die Form der Teile sowie welche Farbe oder Schrift auf den Puzzlestücken zu erkennen ist. Diese Vorauswahl macht das Suchen und Finden passender Puzzlestücke leichter. „Auch der virtuelle Puzzleprozess beginnt so“, sagt Nickolay.

„Das System berechnet verschiedene beschreibende Merkmale wie Form oder Textur, um den Suchraum zu reduzieren. Innerhalb dieser kleineren Menge erfolgt die eigentliche Rekonstruktion.“ Dafür werden Schnipsel entlang ihrer Konturen auf Übereinstimmungen hin verglichen. Sind passende Teile gefunden, werden sie zu einem größeren Dokument zusammengefasst. Dann beginnt der Vorgang von vorn. Schnipsel für Schnipsel entsteht so wieder Seite für Seite der Stasiakten.

Das Pilotprojekt zur automatisierten Rekonstruktion der Stasi-Akten läuft zwei Jahre und umfasst 400 Säcke. Im Rahmen der Pilotphase geht es vor allem darum, Erkenntnisse zu Verfahren und Technik des Rekonstruktionsprozesses zu gewinnen. Auftraggeberin ist die Bundesbeauftragte für die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratischen Republik (BStU).

Über arvato services

Arvato Services, ein Tochterunternehmen der Arvato AG bietet effektive Dienstleistungen rund um Kundenkommunikation und Supply Chain Management in Europa und außereuropäischen Märkten. Rund 28.000 Menschen arbeiten weltweit für das Unternehmen. (www.arvato-services.com)

Sisyphos 07: Technische Daten:

Die Auflösung des Scanners beträgt doppelseitig und in einer Farbtiefe von 24 bit unkomprimiert 300 dpi. Er verarbeitet Papierschnipsel in den Größen von 0,5 cm x 0,5 cm bis 28 cm x 50 cm in einer Geschwindigkeit von 27 cm pro Sekunde; das entspricht einem effektiven Durchsatz von bis zu 500 qcm oder 40 MB pro Sekunde. Der geradlinige Transport mit Bändern ist für unregelmäßiges Beleggut optimiert; außerdem ist das Transportsystem frei von Rollen und Stoßkanten. Zerknitterte Schnipsel werden ab dem Prototyp 02 schattenfrei beleuchtet. Zur Vermeidung von Bildstörungen durch Staub und Verschmutzung erfolgt die Papierführung glaslos. Nebeneinander liegende Schnipsel werden automatisch separiert.

Diese Webseite verwendet technische Cookies, die für den Betrieb der Seite erforderlich sind. Wir benötigen keine Zustimmung von Ihnen für die Verwendung dieser Cookies. Weitere Informationen finden Sie in unserer Datenschutzerklärung.