RAG Workflow Für Unternehmensdokumente, die in Google Drive gespeichert sind

Dieser Workflow ermöglicht es, Unternehmensdokumente in Google Drive zu aktualisieren und zu verarbeiten, indem sie in eine Vektor-Datenbank geladen werden, um sie für Suchanfragen und KI-gestützte Antworten verfügbar zu machen.

RAG Workflow Für Unternehmensdokumente, die in Google Drive gespeichert sind

Die Website nutzt die Wordpress-Infrastruktur.

Server: Unser Server befindet sich in einem Unternehmen mit Sitz in Deutschland. Er hat eine hohe und schnelle Internetverbindung. Es gibt eine Generatorunterstützung für ununterbrochenen Strom.

Workflow Übersicht

In diesem Workflow nutzen wir n8n, um Unternehmensdokumente von Google Drive zu verarbeiten. Der Workflow besteht aus mehreren Knoten, die zusammenarbeiten, um Daten zu laden, zu verarbeiten und Ergebnisse anzuzeigen.

Node Beschreibungen:

1. Google Drive File Created

  • Typ: Trigger Node
  • Was macht es: Überwacht einen bestimmten Ordner in Google Drive und löst eine Aktion aus, wenn eine Datei erstellt wird.
  • Einstellungen:
    event: fileCreated
    folderToWatch: Der spezifische Ordner (INNOVI PRO), der überwacht wird.

2. Google Drive File Updated

  • Typ: Trigger Node
  • Was macht es: Ähnlich wie der vorherige Knoten, dieser überwacht den Ordner auf Dateien, die aktualisiert werden.
  • Einstellungen:
    event: fileUpdated
    folderToWatch: Der spezifische Ordner (INNOVI PRO), der überwacht wird.

3. Download File From Google Drive

  • Typ: HTTP Request
  • Was macht es: Läd die Datei von Google Drive, die gerade erstellt oder aktualisiert wurde.
  • Einstellungen:
    fileId: ID der Datei, die von vorherigen Knoten übergeben wird.
    operation: download

4. Pinecone Vector Store

  • Typ: Vector Store
  • Was macht es: Fügt die heruntergeladene Datei in den Pinecone Vektor-Datenbankindex ein.
  • Einstellungen:
    mode: insert
    pineconeIndex: company-files

5. Default Data Loader

  • Typ: Document Loader
  • Was macht es: Lädt die Daten aus der Datei, die zuvor heruntergeladen wurde.
  • Einstellungen:
    dataType: binary
    binaryMode: specificField

6. Recursive Character Text Splitter

  • Typ: Text Splitter
  • Was macht es: Zerlegt den Text in kleinere Abschnitte, um die Verarbeitung durch KI zu erleichtern.
  • Einstellungen:
    chunkOverlap: 100

7. Embeddings Google Gemini

  • Typ: Embedding Node
  • Was macht es: Erzeugt Einbettungen für den Text, sodass er für die KI verarbeitet werden kann.
  • Einstellungen:
    modelName: models/text-embedding-004

8. AI Agent

  • Typ: AI Agent
  • Was macht es: Beantwortet Anfragen basierend auf den Unternehmensrichtlinien und -dokumenten.
  • Einstellungen:
    systemMessage: Konfiguration für den Agenten, um relevante Informationen abzurufen.

9. Vector Store Tool

  • Typ: Tool Node
  • Was macht es: Ermöglicht dem AI Agent, Informationen aus den Vektordaten abzurufen.
  • Einstellungen:
    name: company_documents_tool
    description: Retrieve information from any company documents

10. Window Buffer Memory

  • Typ: Memory Node
  • Was macht es: Speichert den Kontext für die KI, während sie arbeitet.
  • Einstellungen: Einfach ohne spezielle Konfigurationen.

11. Google Gemini Chat Model

  • Typ: Chat Model Node
  • Was macht es: Verwendet das Gemini-Modell zur Generierung von Antworten.
  • Einstellungen:
    modelName: models/gemini-2.0-flash-exp

12. Pinecone Vector Store (Retrieval)

  • Typ: Vector Store
  • Was macht es: Ruft Informationen aus der Pinecone-Datenbank ab.
  • Einstellungen:
    mode: list
    pineconeIndex: company-files

Ergebnis

Mit diesem Workflow können Benutzer Unternehmensdokumente effizient verwalten und den Informationen durch KI-Support zugänglich machen. Dadurch wird die Bearbeitung der Anfragen von Mitarbeitern erheblich verbessert, indem relevante Dokumente in Echtzeit abgerufen werden können.

Facebook
Twitter
LinkedIn

Andere Projekte