Das Bundesarchiv bewahrt zerrissene Stasi-Akten im Umfang von 40 bis 55 Millionen Seiten auf. Diese sollen durch automatische virtuelle Rekonstruktion wiederhergestellt werden. Ein vorangegangenes Pilotprojekt konnte die Aufgabe nur unzureichend abschließen, wie sogar die Tagesschau am 21.04.2023 berichtet. Nun wurde ein Interessenbekundungsverfahren für ein zweiteiliges Projekt bestehend aus Scanprozess und virtueller Rekonstruktion ausgeschrieben. Dabei bewerben wir uns um die automatische virtuelle Rekonstruktion. Die Kernaufgabe ist die Entwicklung eines automatisierten Verfahrens zur Anordnung von eingescannten Dokumentschnipseln zu ganzen Seiten und vollständigen Dokumenten.
Ende Januar waren wir zu Besuch im Stasi-Unterlagen-Archiv, um mit der Vizepräsidentin des Bundesarchivs Alexandra Titze zu sprechen und unseren Ansatz vorzustellen. LangTec als forschungsnaher Technologieanbieter zeichnet sich hierbei durch einen innovativen KI-basierten Ansatz aus, welcher eine effiziente Verarbeitung der großen Text-und Datenmengen, die die Menge an Stasi-Unterlagen unweigerlich darstellen, ermöglicht.
Wir verfolgen die Thematik weiter gespannt und freuen uns, auf eine mögliche Zusammenarbeit!