Automatisierte Bankauszugsverarbeitung mit n8n

Dieser Workflow ermöglicht die Umwandlung eines Bankauszugs in Markdown und verwendet dabei Vision Language Models.

Automatisierte Bankauszugsverarbeitung mit n8n

Die Website nutzt die Wordpress-Infrastruktur.

Server: Unser Server befindet sich in einem Unternehmen mit Sitz in Deutschland. Er hat eine hohe und schnelle Internetverbindung. Es gibt eine Generatorunterstützung für ununterbrochenen Strom.

Workflow Übersicht

Dieser n8n Workflow führt die Umwandlung eines Bankauszugs in Markdown durch. Dabei wird das Dokument in Bildform umgewandelt, um die Daten mithilfe eines Sprachmodells zu extrahieren. Im Folgenden wird jeder Knoten des Workflows detailliert beschrieben.

1. Manual Trigger

Name: When clicking ‘Test workflow’
Typ: Manual Trigger
Funktion: Dieser Knoten dient als Startpunkt des Workflows. Der Workflow wird manuell ausgelöst, wenn der Benutzer auf „Test workflow“ klickt.

2. Google Gemini Chat Model

Name: Google Gemini Chat Model
Typ: Language Model Chat Node
Funktion: Dieser Knoten nutzt Googles Gemini API um Konversationen zu führen. Hierbei wird das Sprachmodell genutzt, um automatische Antworten zu generieren.
Einstellungen: Der Modus ‘models/gemini-1.5-pro-latest’ wurde gewählt, da er aktuell die neuesten Fähigkeiten bietet.

3. Sort Pages

Name: Sort Pages
Typ: Sort Node
Funktion: Dieser Knoten sortiert die Seiten des Dokuments anhand des Dateinamens.
Einstellungen: Mit der Sortierfelddefinition ‘fileName’ wird entschieden, dass die Seiten nach ihrem Dateinamen sortiert werden sollen.

4. Get Bank Statement

Name: Get Bank Statement
Typ: Google Drive Node
Funktion: Dieser Knoten lädt den Bankauszug aus einem Google Drive-Konto herunter.
Einstellungen: Der fileId wird verwendet, um die spezifische Datei herunterzuladen.

5. Split PDF into Images

Name: Split PDF into Images
Typ: HTTP Request Node
Funktion: Dieser Knoten sendet das PDF-Dokument an einen Webservice, der es in Bilder umwandelt.
Einstellungen: Die Parameter definieren das Bildformat, als JPG, und die DPI-Einstellungen, um die Bildqualität zu steuern.

6. Extract Zip File

Name: Extract Zip File
Typ: Compression Node
Funktion: Entpackt die ZIP-Datei, die die Bilder enthält, um Zugriff auf die Einzelbilder zu erhalten.

7. Images To List

Name: Images To List
Typ: Code Node
Funktion: Konvertiert die extrahierten Bilder in eine Liste, die für die weitere Verarbeitung vorbereitet ist.

8. Resize Images For AI

Name: Resize Images For AI
Typ: Image Editing Node
Funktion: Schneidet die Größe der Bilder, um die Leistung des Sprachmodells zu optimieren.
Einstellungen: Die Bilder werden auf 75% ihrer ursprünglichen Größe reduziert.

9. Transcribe to Markdown

Name: Transcribe to Markdown
Typ: Language Model Node
Funktion: Dieses Modell transkribiert die Bilder in Markdown, sodass die strukturellen und textlichen Inhalte bewahrt bleiben.

10. Combine All Pages

Name: Combine All Pages
Typ: Aggregation Node
Funktion: Kombiniert die Texte aller Seiten zu einem einzelnen Markdown-Dokument.

11. Extract All Deposit Table Rows

Name: Extract All Deposit Table Rows
Typ: Information Extractor Node
Funktion: Extrahiert spezifisch die Zeilen mit Einzahlungen aus dem transkribierten Markdown.

Ergebnis

Nach dem Ausführen dieses Workflows wurde der Bankauszug erfolgreich in Markdown konvertiert und die relevanten Einzahlungsdaten extrahiert. Dies ermöglicht eine einfache Analyse und Verarbeitung der Finanztransaktionen.

Download Link: Workflow herunterladen

Facebook
Twitter
LinkedIn

Andere Projekte