Workflow Übersicht
Dieser n8n Workflow führt die Umwandlung eines Bankauszugs in Markdown durch. Dabei wird das Dokument in Bildform umgewandelt, um die Daten mithilfe eines Sprachmodells zu extrahieren. Im Folgenden wird jeder Knoten des Workflows detailliert beschrieben.
1. Manual Trigger
Name: When clicking ‘Test workflow’
Typ: Manual Trigger
Funktion: Dieser Knoten dient als Startpunkt des Workflows. Der Workflow wird manuell ausgelöst, wenn der Benutzer auf „Test workflow“ klickt.
2. Google Gemini Chat Model
Name: Google Gemini Chat Model
Typ: Language Model Chat Node
Funktion: Dieser Knoten nutzt Googles Gemini API um Konversationen zu führen. Hierbei wird das Sprachmodell genutzt, um automatische Antworten zu generieren.
Einstellungen: Der Modus ‘models/gemini-1.5-pro-latest’ wurde gewählt, da er aktuell die neuesten Fähigkeiten bietet.
3. Sort Pages
Name: Sort Pages
Typ: Sort Node
Funktion: Dieser Knoten sortiert die Seiten des Dokuments anhand des Dateinamens.
Einstellungen: Mit der Sortierfelddefinition ‘fileName’ wird entschieden, dass die Seiten nach ihrem Dateinamen sortiert werden sollen.
4. Get Bank Statement
Name: Get Bank Statement
Typ: Google Drive Node
Funktion: Dieser Knoten lädt den Bankauszug aus einem Google Drive-Konto herunter.
Einstellungen: Der fileId wird verwendet, um die spezifische Datei herunterzuladen.
5. Split PDF into Images
Name: Split PDF into Images
Typ: HTTP Request Node
Funktion: Dieser Knoten sendet das PDF-Dokument an einen Webservice, der es in Bilder umwandelt.
Einstellungen: Die Parameter definieren das Bildformat, als JPG, und die DPI-Einstellungen, um die Bildqualität zu steuern.
6. Extract Zip File
Name: Extract Zip File
Typ: Compression Node
Funktion: Entpackt die ZIP-Datei, die die Bilder enthält, um Zugriff auf die Einzelbilder zu erhalten.
7. Images To List
Name: Images To List
Typ: Code Node
Funktion: Konvertiert die extrahierten Bilder in eine Liste, die für die weitere Verarbeitung vorbereitet ist.
8. Resize Images For AI
Name: Resize Images For AI
Typ: Image Editing Node
Funktion: Schneidet die Größe der Bilder, um die Leistung des Sprachmodells zu optimieren.
Einstellungen: Die Bilder werden auf 75% ihrer ursprünglichen Größe reduziert.
9. Transcribe to Markdown
Name: Transcribe to Markdown
Typ: Language Model Node
Funktion: Dieses Modell transkribiert die Bilder in Markdown, sodass die strukturellen und textlichen Inhalte bewahrt bleiben.
10. Combine All Pages
Name: Combine All Pages
Typ: Aggregation Node
Funktion: Kombiniert die Texte aller Seiten zu einem einzelnen Markdown-Dokument.
11. Extract All Deposit Table Rows
Name: Extract All Deposit Table Rows
Typ: Information Extractor Node
Funktion: Extrahiert spezifisch die Zeilen mit Einzahlungen aus dem transkribierten Markdown.
Ergebnis
Nach dem Ausführen dieses Workflows wurde der Bankauszug erfolgreich in Markdown konvertiert und die relevanten Einzahlungsdaten extrahiert. Dies ermöglicht eine einfache Analyse und Verarbeitung der Finanztransaktionen.
Download Link: Workflow herunterladen