Workflow zur API-Schemaextraktion und -generierung

Dieser n8n-Workflow automatisiert den Prozess, um API-Dokumentationen zu recherchieren und relevante API-Operationen aus diesen Dokumentationen zu extrahieren, während er gleichzeitig die Ergebnisse in Google Sheets speichert.

Workflow zur API-Schemaextraktion und -generierung

Die Website nutzt die Wordpress-Infrastruktur.

Server: Unser Server befindet sich in einem Unternehmen mit Sitz in Deutschland. Er hat eine hohe und schnelle Internetverbindung. Es gibt eine Generatorunterstützung für ununterbrochenen Strom.

Workflow zur API-Schemaextraktion und -generierung

Dieser Workflow besteht aus mehreren Knoten, die zusammenarbeiten, um API-Dokumentationen zu recherchieren, relevante Informationen zu extrahieren und die Ergebnisse in einer Google-Tabelle zu speichern.

1. Wenn ‚Test Workflow‘ geklickt wird

Node Name: When clicking ‘Test workflow’
Typ: manualTrigger
Funktion: Dieser Knoten löst den Workflow manuell aus.

2. Websuche nach API-Schema

Node Name: Web Search For API Schema
Typ: httpRequest
Funktion: Dieser Knoten sendet eine POST-Anfrage an eine API, um Suchergebnisse für API-Dokumentationen zu erhalten.
Einstellungen:
- URL: https://api.apify.com/v2/acts/serping~fast-google-search-results-scraper/run-sync-get-dataset-items
- Method: POST
- Body-Parameter: Enthält Suchbegriffe und die Anzahl der Ergebnisse pro Seite.

3. Scrape Webpage Contents

Node Name: Scrape Webpage Contents
Typ: httpRequest
Funktion: Dieser Knoten extrahiert den Inhalt von Webseiten, die aus der vorherigen Websuche erhalten wurden.
Einstellungen:
- URL: Die URL wird dynamisch aus den vorherigen Knoten übernommen.
- JSON-Body: Legt fest, welche Daten von der Webseite extrahiert werden sollen.

4. Ergebnisse in Liste umwandeln

Node Name: Results to List
Typ: splitOut
Funktion: Diese Knoten teilt die Ergebnisse auf, um sie weiter zu verarbeiten.
Einstellungen:

5. Text in Blöcke aufteilen

Node Name: Recursive Character Text Splitter1
Typ: textSplitterRecursiveCharacterTextSplitter
Funktion: Teile den extrahierten Text in handhabbare Blöcke.
Einstellungen:
- Chunk Size: 4000

6. Inhaltschunks setzen

Node Name: Content Chunking @ 50k Chars
Typ: set
Funktion: Dieser Knoten speichert die aufgeteilten Inhalte in einer speziell definierten Struktur.
Einstellungen:
- Werte: Enthält die Chunkgrößen und die ursprünglichen URLs.

7. Chunks aufteilen

Node Name: Split Out Chunks
Typ: splitOut
Funktion: Teilt die Chunks für die weitere Verarbeitung auf.

8. Dokumenteinbettungen speichern

Node Name: Store Document Embeddings
Typ: vectorStoreQdrant
Funktion: Speichert die verarbeiteten Dokumenteinbettungen in einem Vektor-Store.

9. API-Dokumentation prüfen

Node Name: Has API Documentation?
Typ: textClassifier
Funktion: Prüft, ob die enthaltenen Dokumente API-Schema-Dokumentationen enthalten.

10. API-Operationen extrahieren

Node Name: Extract API Operations
Typ: informationExtractor
Funktion: Extrahiert alle relevanten API-Operationen aus den Dokumenten.

11. Ergebnisse in Google Sheets speichern

Node Name: Append Row
Typ: googleSheets
Funktion: Fügt die extrahierten Informationen in eine Google-Tabelle ein.

Ergebnis

Der Workflow ist nun vollständig konfiguriert und bereit zur Ausführung. Nach der Durchführung wird eine Google-Tabelle mit den extrahierten API-Operationen erstellt, die leicht überprüft und verwaltet werden kann.

Download Link: Hier klicken, um die Datei herunterzuladen