Workflow zur Verwaltung von WordPress-Inhalten mit RAG & GenAI

Dieser Workflow ermöglicht es, Inhalte von einer WordPress-Website abzurufen, sie zu analysieren und auf verschiedene Weise zu verarbeiten, um eine verbesserte Benutzererfahrung zu bieten.

Workflow zur Verwaltung von WordPress-Inhalten mit RAG & GenAI

Die Website nutzt die Wordpress-Infrastruktur.

Server: Unser Server befindet sich in einem Unternehmen mit Sitz in Deutschland. Er hat eine hohe und schnelle Internetverbindung. Es gibt eine Generatorunterstützung für ununterbrochenen Strom.

1. Wenn auf ‘Test workflow’ geklickt wird

Diese Node dient als manueller Trigger, um den Workflow manuell zu starten. Benutzer können damit die Ausführung des gesamten Workflows auslösen.

2. Embeddings OpenAI

Diese Node nutzt das OpenAI-Modell text-embedding-3-small zur Erstellung von Embeddings für Textdaten. Die erzielten Embeddings sind speziell für spätere Analysen oder Vergleiche optimiert.

3. Default Data Loader

Hier wird mit der Node ein Standard-Datenlader verwendet, um Inhalte in JSON-Format zu laden. Die Konfiguration ermöglicht es, Metadaten wie Titel, URL, Veröffentlichungsdatum usw. aus den Eingabedaten zu extrahieren.

4. Token Splitter

Diese Node zerteilt Texte in kleinere Segmente (Chunks), um effektive Embeddings zu erhalten. Mit einem Chunk-Größe von 300 und Überlappung von 30 werden Texte für präzisere Datenverarbeitung aufbereitet.

5. Embeddings OpenAI1

Eine zweite Instanz der Embeddings-Nodes, die dasselbe Modell verwendet, um Texte zu analysieren und zu verarbeiten.

6. OpenAI Chat Model

Diese Node verwendet das GPT-4o-mini Modell von OpenAI, um Antworten auf eingehende Bedürfnisse oder Fragen der Benutzer anhand der gespeicherten Inhalte zu generieren.

7. Postgres Chat Memory

Hier wird der Speicher für das Chatgespräch in einer PostgreSQL-Datenbank erfasst. Die Tabelle speichert frühere Interaktionen und deren Metadaten.

8. Respond to Webhook

Diese Node sendet die finalen Antworten zurück an den Aufrufer des Webhooks. Diese Node ist entscheidend, um mit Benutzern über das Web zu kommunizieren.

9. Set fields

Mit dieser Node können spezifische Felder im Workflow gesetzt werden, um sicherzustellen, dass die Daten den Anforderungen der nachfolgenden Node entsprechen. Hier werden z.B. Dokumentnamen, URLs und Identifikatoren definiert.

10. Store documents on Supabase

Diese Node interagiert mit der Supabase-DB, um Dokumente zu speichern. Sie stellt sicher, dass die Daten strukturiert und effizient eingegeben werden.

11. Loop Over Items

Diese Node ermöglicht die Verarbeitung von Datensätzen in Chargen, sodass mehrdimensionale Dokumente effizienter analysiert werden können.

12. Filter

Filter-Nodes werden verwendet, um sicherzustellen, dass nur veröffentlichte und nicht geschützte Inhalte in die nachfolgenden Prozesse gelangen. Dies stellt sicher, dass nur relevante Daten verarbeitet werden.

13. Merge Nodes

Diese Node integriert Daten von verschiedenen Quellen (z.B. Blogbeiträge und Seiten), sodass sie als kohärenter Datensatz verarbeitet werden können.

14. Supabase – Create documents table

Hier wird eine PostgreSQL-Tabelle zur Speicherung von Dokumenten erstellt. Die Tabelle ermöglicht die Speicherung der Inhalte und ihrer Metadaten, die für die Embedding-Analyse wichtig sind.

15. AI Agent

Der AI-Agent stellt sicher, dass Fragen von Benutzern effektiv beantwortet werden, indem er auf relevante Informationen aus der Datenbank zugreift. Die Verarbeitung erfolgt in der Programmiersprache, die der Benutzer verwendet hat.

16. Store workflow execution history

Mit dieser Node wird jede Ausführung des Workflows in Supabase aufgezeichnet, was wertvolle Informationen für das Monitoring und das Debugging bereitstellt.

17. Postgres – Filter on existing documents

Dieser Knoten filtert die Dokumente nach spezifischen Kriterien. Dies hilft bei der Identifikation, ob Updates erforderlich sind oder ob neue Dokumente hinzugefügt werden müssen.

18. Switch Node

Die Switch-Node leitet den Prozess basierend auf der Existenz von Dokumenten in der Datenbank um und führt entweder Lösch- oder Insert-Operationen durch.

19. Supabase – Delete row if documents exists

Wenn ein Dokument existiert, wird diese Node verwendet, um sicherzustellen, dass die alten Daten gelöscht werden, bevor neue Daten hinzugefügt werden. Dies schützt die Datenintegrität.

20. Summary

Zusammenfassend lässt sich sagen, dass dieser Workflow eine vollständige Pipeline für das Abrufen, Verarbeiten, Speichern und Bereitstellen von WordPress-Inhalten ermöglicht, um eine verbesserte Benutzererfahrung in einer GenAI-Anwendung zu schaffen.