RAG Workflow Für die Analyse von Unternehmensgewinnen

Dieser Workflow ist darauf ausgelegt, die Gewinnberichte von Google über die letzten drei Quartale zu analysieren und zu berichten.

RAG Workflow Für die Analyse von Unternehmensgewinnen

Die Website nutzt die Wordpress-Infrastruktur.

Server: Unser Server befindet sich in einem Unternehmen mit Sitz in Deutschland. Er hat eine hohe und schnelle Internetverbindung. Es gibt eine Generatorunterstützung für ununterbrochenen Strom.

Workflow Beschreibung

In diesem Workflow kombinieren wir mehrere Nodes, um die Gewinnberichte von Google zu analysieren. Hier ist eine Schritt-für-Schritt-Erklärung der einzelnen Nodes:

1. Pinecone Vector Store

Typ: Pinecone Vector Store

Zweck: Dieser Node wird verwendet, um Daten in einem Pinecone-Vektor-Store zu speichern. Hier speichern wir die Dokumente, die die Gewinnberichte enthalten.

Einstellungen:

  • Mode: insert – Dies ermöglicht das Hinzufügen neuer Daten in den Vektor-Store.
  • Pinecone Index: company-earnings – Der Index, in dem die Daten gespeichert werden.

2. Embeddings Google Gemini

Typ: Embeddings Google Gemini

Zweck: Diese Node erstellt Embeddings für die Gewinnberichte, die zur semantischen Suche im Vektor-Store verwendet werden.

Einstellungen:

  • Model Name: models/text-embedding-004 – Dies ist das spezifische Modell von Google, das für die Erstellung von Embeddings genutzt wird.

3. Default Data Loader

Typ: Default Data Loader

Zweck: Diese Node lädt PDF-Dokumente, die die Gewinnberichte enthalten, zur weiteren Verarbeitung.

Einstellungen:

  • Loader: pdfLoader – Der Loader, der verwendet wird, um PDF-Dokumente zu laden.
  • Data Type: binary – Dies ist der Datentyp der geladenen Dateien.

4. Recursive Character Text Splitter

Typ: Recursive Character Text Splitter

Zweck: Diese Node teilt den geladenen Text in kleinere Abschnitte, um eine effiziente Analyse durchzuführen.

Einstellungen:

  • Options: Keine speziellen Optionen eingestellt, der Standardmodus wird verwendet.

5. Loop Over Items

Typ: Split In Batches

Zweck: Diese Node durchläuft die geladenen Elemente in Batches, um die Verarbeitung zu optimieren.

Einstellungen:

  • Options: Keine speziellen Optionen eingestellt.

6. When clicking ‘Test workflow’

Typ: Manual Trigger

Zweck: Dies ist der Trigger, der den Workflow manuell auslöst.

Einstellungen:

  • Keine speziellen Einstellungen.

7. AI Agent

Typ: Agent

Zweck: Der AI-Agent analysiert die Daten und erstellt Berichte basierend auf den letzten drei Quartalen der Google-Gewinnberichte.

Einstellungen:

  • Text: Definiert die Aufgabe des AI-Agenten, einschließlich der Anweisung zur Berichterstattung und Analyse.
  • Options: Hier sind die Anweisungen für den Agenten enthalten, um relevante Daten aus den Vektor-Daten zu entnehmen.

8. Vector Store Tool

Typ: Tool Vector Store

Zweck: Dies ist ein Werkzeug, das es dem Agenten ermöglicht, aus dem Vektor-Store nützliche Informationen abzurufen.

Einstellungen:

  • Name: company_financial_earnings_data_tool – Dies ist der Name des Werkzeugs.
  • Description: Kurze Beschreibung des Zwecks des Werkzeugs.

9. Google Gemini Chat Model1

Typ: Chat Model Google Gemini

Zweck: Dieses Modell wird verwendet, um Dialoge für die Analyse und Antwortgenerierung zu ermöglichen.

Einstellungen:

  • Model Name: models/gemini-2.0-flash-exp – Das spezifische Modell für die Chat-Interaktionen.

10. OpenAI Chat Model

Typ: OpenAI Chat Model

Zweck: Für die zusätzliche Verarbeitung von Daten durch OpenAI wird dieser Node verwendet.

Einstellungen:

  • Options: Standardoptionen, die beibehalten werden.

11. Pinecone Vector Store (Retrieval)

Typ: Pinecone Vector Store

Zweck: Diese Node wird verwendet, um Informationen aus dem Vektor-Store abzurufen.

Einstellungen:

  • Options: Keine speziellen Optionen eingestellt.
  • Pinecone Index: company-earnings – Der Index, der verwendet wird, um Daten abzurufen.

12. Save Report to Google Docs

Typ: Google Docs

Zweck: Diese Node speichert den generierten Bericht in einem Google-Dokument.

Einstellungen:

  • Operation: update – Aktualisiert das Dokument mit dem neuen Inhalt.
  • Document URL: Gibt die URL des Google-Dokuments an, wo der Bericht gespeichert werden soll.

13. Embeddings Google Gemini (retrieval)

Typ: Embeddings Google Gemini

Zweck: Diese Node ermöglicht das Abrufen von Embeddings für zuvor gespeicherte Daten.

Einstellungen:

  • Model Name: models/text-embedding-004 – Das speziellierte Modell für das Abrufen von Embeddings.

14. List Of Files To Load (Google Sheets)

Typ: Google Sheets

Zweck: Diese Node lädt die Liste der Dateien, die aus Google Drive verarbeitet werden müssen.

Einstellungen:

  • Document ID: Identifiziert die Google-Tabelle, die die Dateilisten enthält.
  • Sheet Name: Der Name des spezifischen Blatts innerhalb der Datei.

15. Download File From Google Drive

Typ: Google Drive

Zweck: Mit dieser Node wird die gewünschte Datei von Google Drive heruntergeladen.

Einstellungen:

  • File ID: Identifiziert die spezifische zu ladende Datei.
  • Operation: download – Die Datei wird heruntergeladen.

16. Sticky Note

Typ: Sticky Note

Zweck: Eine Notiz mit wichtigen Schritten zur Einrichtung des Workflows.

Inhalt: Hinweise zur Vorbereitung und Konfiguration der Google Cloud, APIs, Pinecone-Einstellungen usw.

Ergebnis

Dieser Workflow ermöglicht es, die Gewinnberichte von Google effektiv zu analysieren und die Ergebnisse in einem strukturierten Format zu präsentieren. Er liefert wertvolle Erkenntnisse über die finanziellen Leistungsfähigkeiten des Unternehmens und visualisiert diese in Google Docs.

Für weitere Informationen oder spezifische Analysen wenden Sie sich bitte an uns!

Download Link

Facebook
Twitter
LinkedIn

Andere Projekte