Extraktion von Text aus PDF und Bildern mit Vertex AI (Gemini) in CSV

Dieser Workflow extrahiert Textdaten aus PDF- und Bilddateien und speichert sie als CSV-Datei.

Extraktion von Text aus PDF und Bildern mit Vertex AI (Gemini) in CSV

Die Website nutzt die Wordpress-Infrastruktur.

Server: Unser Server befindet sich in einem Unternehmen mit Sitz in Deutschland. Er hat eine hohe und schnelle Internetverbindung. Es gibt eine Generatorunterstützung für ununterbrochenen Strom.

1. Google Gemini Chat Model

Typ: Langchain Chat Node

Zweck: Dieser Node verwendet das Google Gemini-Modell, um Text aus den Daten zu extrahieren.

Einstellungen:

  • Model Name: models/gemini-1.5-pro-latest

Diese Einstellungen wurden gewählt, um die neueste Version des Modells zu verwenden.

2. Get PDF or Images

Typ: Google Drive Trigger

Zweck: Dieser Node überwacht einen bestimmten Ordner in Google Drive auf neue PDF- oder Bilddateien.

Einstellungen:

  • Event: fileCreated
  • TriggerOn: specificFolder
  • FolderToWatch: 1HOeRP5iwccg93UPUYmWYD7DyDmRREkhj

3. Route based on PDF or Image

Typ: Switch Node

Zweck: Dieser Node entscheidet, ob die Datei ein PDF oder ein Bild ist, und leitet sie entsprechend weiter.

Einstellungen:

  • Rules:
    • PDF Regel: application/pdf
    • Image Regel: image/

4. Download PDF

Typ: Google Drive Node

Zweck: Dieser Node lädt eine PDF-Datei von Google Drive herunter.

Einstellungen:

  • Operation: download
  • FileId: vom vorherigen Node abgerufen

5. Download Image

Typ: Google Drive Node

Zweck: Läd ein Bild von Google Drive herunter.

Einstellungen:

  • Operation: download
  • FileId: vom vorherigen Node abgerufen

6. Extract data from PDF

Typ: Extract Node

Zweck: Dieser Node extrahiert die Daten aus der heruntergeladenen PDF-Datei.

Einstellungen:

  • Operation: pdf

7. Send data to A.I.

Typ: HTTP Request Node

Zweck: Sendet die extrahierten Daten an ein KI-Modell zur Verarbeitung.

Einstellungen:

  • URL: https://openrouter.ai/api/v1/chat/completions
  • Method: POST
  • JSON Body: Enthält Daten über die Transaktionen.

8. Convert to CSV

Typ: Convert Node

Zweck: Konvertiert die von der KI zurückgegebenen Daten in ein CSV-Format.

Einstellungen:

  • Options: Standardoptionen verwendet.

9. Upload to Google Drive

Typ: Google Drive Node

Zweck: Dieser Node lädt die CSV-Datei in einen bestimmten Google Drive-Ordner hoch.

Einstellungen:

  • Name: aktuelles Datum verwendet
  • FolderId: ID von ‚CSV Exports‘

10. Convert to CSV2

Typ: Convert Node

Zweck: Eine zweite Konvertierung für Bilder, um sicherzustellen, dass alle Daten in CSV-Format konvertiert werden.

Einstellungen:

  • Options: Standardoptionen verwendet.

11. Upload to Google Drive1

Typ: Google Drive Node

Zweck: Lädt die konvertierte CSV-Datei für das Bild in den Google Drive hoch.

Einstellungen:

  • Name: aktuelles Datum verwendet
  • FolderId: ID von ‚CSV Exports‘

Ergebnis

Mit diesem Workflow können Benutzer einfach PDF- und Bilddateien in CSV konvertieren, ohne dies manuell tun zu müssen. Er automatisiert den gesamten Prozess der Datenerfassung und -verarbeitung.

Für detaillierte Erklärungen zu spezifischen Nodes schauen Sie bitte in die jeweiligen Abschnitte.

Download Link

Facebook
Twitter
LinkedIn

Andere Projekte