Workflow zur PDF-Verarbeitung mit LlamaParse und Speicherung in Airtable

Dieser Workflow automatisiert den Prozess des Hochladens und Verarbeitens von Rechnungen aus Google Drive und speichert die Ergebnisse in Airtable.

Workflow zur PDF-Verarbeitung mit LlamaParse und Speicherung in Airtable

Die Website nutzt die Wordpress-Infrastruktur.

Server: Unser Server befindet sich in einem Unternehmen mit Sitz in Deutschland. Er hat eine hohe und schnelle Internetverbindung. Es gibt eine Generatorunterstützung für ununterbrochenen Strom.

Schritt-für-Schritt-Erklärung der Nodes

1. Node: Google Drive

  • Typ: Google Drive
  • Funktion: Lädt eine Datei von Google Drive herunter.
  • Einstellungen:
    • fileId: Die ID der Datei, die heruntergeladen werden soll.
    • operation: download

2. Node: Upload File

  • Typ: HTTP Request
  • Funktion: Sendet die heruntergeladene Datei zur Analyse an LlamaParse.
  • Einstellungen:
    • url: URL der API, an die die Datei gesendet wird.
    • method: POST
    • contentType: multipart-form-data
    • bodyParameters:
      • webhook_url: Ziel-Webhook für die Antwort.
      • file: Die Datei, die hochgeladen werden soll.
      • disable_ocr: true
      • disable_image_extraction: True

3. Node: Google Drive Trigger

  • Typ: Google Drive Trigger
  • Funktion: Überwacht einen bestimmten Ordner in Google Drive auf neu erstellte Dateien.
  • Einstellungen:
    • event: fileCreated
    • folderToWatch: ID des zu überwachenden Ordners.

4. Node: Create Invoice

  • Typ: Airtable
  • Funktion: Erstellt einen neuen Rechnungseintrag in Airtable.
  • Einstellungen:
    • base: Airtable-DatenbankID die verwendet wird.
    • table: Tabelle für Rechnungen.

5. Node: Create Line Item

  • Typ: Airtable
  • Funktion: Fügt Artikel zur Rechnung in der Airtable-Datenbank hinzu.
  • Einstellungen:
    • base: Gleiche Datenbank wie oben.
    • table: Tabelle für Rechnungsartikel.

6. Node: OpenAI – Extract Line Items

  • Typ: HTTP Request
  • Funktion: Versendet die erhaltenen Daten an OpenAI zur Verarbeitung.
  • Einstellungen:
    • url: OpenAI API Endpoint.
    • jsonBody: Felder, die an OpenAI gesendet werden, einschließlich der Anfrage und dem zu verarbeitenden Inhalt.

7. Node: Set Fields

  • Typ: Set
  • Funktion: Definiert die Felder, die an die OpenAI API übergeben werden, einschließlich Schema und Prompt.
  • Einstellungen:
    • prompt: Anfrage zur Datenverarbeitung.
    • schema: Das Schema für die erwarteten Antworten von OpenAI.

8. Node: Process Line Items

  • Typ: Code
  • Funktion: Verarbeitet die von OpenAI zurückgegebenen Daten und formatiert sie für Airtable.
  • Einstellungen:
    • jsCode: Definierte Logik zur Extraktion und Formatierung der Artikel-Daten.

9. Node: Webhook

  • Typ: Webhook
  • Funktion: Empfängt Daten von der LlamaParse API und leitet sie an andere Nodes weiter.
  • Einstellungen:
    • httpMethod: POST

Ergebnis

Dieser Workflow sortiert automatisch Rechnungen aus Google Drive, analysiert zentrale Rechnungsdaten über LlamaParse und speichert die extrahierten Informationen in Airtable zur leicht zugänglichen und strukturierten Datenüberwachung.

Der gesamte Prozess reduziert den manuellen Aufwand und ermöglicht eine schnellere und genauere Verwaltung von Rechnungsinformationen.

Facebook
Twitter
LinkedIn

Andere Projekte