RAG Workflow Für Unternehmensdokumente, die in Google Drive gespeichert sind

Dieser Workflow ermöglicht es, Unternehmensdokumente in Google Drive zu aktualisieren und zu verarbeiten, indem sie in eine Vektor-Datenbank geladen werden, um sie für Suchanfragen und KI-gestützte Antworten verfügbar zu machen.

RAG Workflow Für Unternehmensdokumente, die in Google Drive gespeichert sind

Die Website nutzt die Wordpress-Infrastruktur.

Server: Unser Server befindet sich in einem Unternehmen mit Sitz in Deutschland. Er hat eine hohe und schnelle Internetverbindung. Es gibt eine Generatorunterstützung für ununterbrochenen Strom.

Workflow Übersicht

In diesem Workflow nutzen wir n8n, um Unternehmensdokumente von Google Drive zu verarbeiten. Der Workflow besteht aus mehreren Knoten, die zusammenarbeiten, um Daten zu laden, zu verarbeiten und Ergebnisse anzuzeigen.

Node Beschreibungen:

1. Google Drive File Created

Typ: Trigger Node
Was macht es: Überwacht einen bestimmten Ordner in Google Drive und löst eine Aktion aus, wenn eine Datei erstellt wird.
Einstellungen:
– event: fileCreated
– folderToWatch: Der spezifische Ordner (INNOVI PRO), der überwacht wird.

2. Google Drive File Updated

Typ: Trigger Node
Was macht es: Ähnlich wie der vorherige Knoten, dieser überwacht den Ordner auf Dateien, die aktualisiert werden.
Einstellungen:
– event: fileUpdated
– folderToWatch: Der spezifische Ordner (INNOVI PRO), der überwacht wird.

3. Download File From Google Drive

Typ: HTTP Request
Was macht es: Läd die Datei von Google Drive, die gerade erstellt oder aktualisiert wurde.
Einstellungen:
– fileId: ID der Datei, die von vorherigen Knoten übergeben wird.
– operation: download

4. Pinecone Vector Store

Typ: Vector Store
Was macht es: Fügt die heruntergeladene Datei in den Pinecone Vektor-Datenbankindex ein.
Einstellungen:
– mode: insert
– pineconeIndex: company-files

5. Default Data Loader

Typ: Document Loader
Was macht es: Lädt die Daten aus der Datei, die zuvor heruntergeladen wurde.
Einstellungen:
– dataType: binary
– binaryMode: specificField

6. Recursive Character Text Splitter

Typ: Text Splitter
Was macht es: Zerlegt den Text in kleinere Abschnitte, um die Verarbeitung durch KI zu erleichtern.
Einstellungen:
– chunkOverlap: 100

7. Embeddings Google Gemini

Typ: Embedding Node
Was macht es: Erzeugt Einbettungen für den Text, sodass er für die KI verarbeitet werden kann.
Einstellungen:
– modelName: models/text-embedding-004

8. AI Agent

Typ: AI Agent
Was macht es: Beantwortet Anfragen basierend auf den Unternehmensrichtlinien und -dokumenten.
Einstellungen:
– systemMessage: Konfiguration für den Agenten, um relevante Informationen abzurufen.

9. Vector Store Tool

Typ: Tool Node
Was macht es: Ermöglicht dem AI Agent, Informationen aus den Vektordaten abzurufen.
Einstellungen:
– name: company_documents_tool
– description: Retrieve information from any company documents

10. Window Buffer Memory

Typ: Memory Node
Was macht es: Speichert den Kontext für die KI, während sie arbeitet.
Einstellungen: Einfach ohne spezielle Konfigurationen.

11. Google Gemini Chat Model

Typ: Chat Model Node
Was macht es: Verwendet das Gemini-Modell zur Generierung von Antworten.
Einstellungen:
– modelName: models/gemini-2.0-flash-exp

12. Pinecone Vector Store (Retrieval)

Typ: Vector Store
Was macht es: Ruft Informationen aus der Pinecone-Datenbank ab.
Einstellungen:
– mode: list
– pineconeIndex: company-files

Ergebnis

Mit diesem Workflow können Benutzer Unternehmensdokumente effizient verwalten und den Informationen durch KI-Support zugänglich machen. Dadurch wird die Bearbeitung der Anfragen von Mitarbeitern erheblich verbessert, indem relevante Dokumente in Echtzeit abgerufen werden können.