Kategorie | Forschungsprojekt |
Bearbeitungszeitraum | 01.05.2022 - 31.10.2022 |
Status | laufend |
Autor | Sergej Levich, doc2data / BGW |
In der Praxis beschränkt sich die Digitalisierung von Dokumenten größtenteils auf Texterkennung und Verschlagwortung, weswegen viele Aufgaben in der Sachbearbeitung noch immer manuell, und damit mühsam, fehleranfällig und nicht barrierefrei, ausgeführt werden.
In den letzten Jahren haben KI-Modelle signifikante Sprünge in den Bereichen Sprachverarbeitung (NLP) und Verständnis von Dokumentendaten gemacht, sodass die Verwaltungsarbeit damit maßgeblich entlastet werden kann. Diese Technologien sind aktuell jedoch nur großen Anbietern oder einem sehr technischen Publikum zugänglich.
Auf Basis der neuen Open-Source-Bibliothek doc2data soll bei der BGW das Potential von state-of-the-art KI-Modellen für die Verarbeitung von Dokumenten untersucht werden.
Konkret werden zwei Aufgabenstellungen im Posteingang durch die KI adressiert:
Die KI wird auf unstrukturierten und unverarbeiteten PDF-Daten als Input angelernt.
Der Autor freut sich über Interessenten zum inhaltlichen Austausch über das Projekt. Bei Interesse wenden Sie sich bitte an unser sigOffice – wir stellen gerne den Kontakt her.