Workflow zur API-Schemaextraktion und -generierung

Dieser n8n-Workflow automatisiert den Prozess, um API-Dokumentationen zu recherchieren und relevante API-Operationen aus diesen Dokumentationen zu extrahieren, während er gleichzeitig die Ergebnisse in Google Sheets speichert.

Workflow zur API-Schemaextraktion und -generierung

Die Website nutzt die Wordpress-Infrastruktur.

Server: Unser Server befindet sich in einem Unternehmen mit Sitz in Deutschland. Er hat eine hohe und schnelle Internetverbindung. Es gibt eine Generatorunterstützung für ununterbrochenen Strom.

Workflow zur API-Schemaextraktion und -generierung

Dieser Workflow besteht aus mehreren Knoten, die zusammenarbeiten, um API-Dokumentationen zu recherchieren, relevante Informationen zu extrahieren und die Ergebnisse in einer Google-Tabelle zu speichern.

1. Wenn ‚Test Workflow‘ geklickt wird

  • Node Name: When clicking ‘Test workflow’
  • Typ: manualTrigger
  • Funktion: Dieser Knoten löst den Workflow manuell aus.

2. Websuche nach API-Schema

  • Node Name: Web Search For API Schema
  • Typ: httpRequest
  • Funktion: Dieser Knoten sendet eine POST-Anfrage an eine API, um Suchergebnisse für API-Dokumentationen zu erhalten.
  • Einstellungen:
    • URL: https://api.apify.com/v2/acts/serping~fast-google-search-results-scraper/run-sync-get-dataset-items
    • Method: POST
    • Body-Parameter: Enthält Suchbegriffe und die Anzahl der Ergebnisse pro Seite.

3. Scrape Webpage Contents

  • Node Name: Scrape Webpage Contents
  • Typ: httpRequest
  • Funktion: Dieser Knoten extrahiert den Inhalt von Webseiten, die aus der vorherigen Websuche erhalten wurden.
  • Einstellungen:
    • URL: Die URL wird dynamisch aus den vorherigen Knoten übernommen.
    • JSON-Body: Legt fest, welche Daten von der Webseite extrahiert werden sollen.

4. Ergebnisse in Liste umwandeln

  • Node Name: Results to List
  • Typ: splitOut
  • Funktion: Diese Knoten teilt die Ergebnisse auf, um sie weiter zu verarbeiten.
  • Einstellungen:

5. Text in Blöcke aufteilen

  • Node Name: Recursive Character Text Splitter1
  • Typ: textSplitterRecursiveCharacterTextSplitter
  • Funktion: Teile den extrahierten Text in handhabbare Blöcke.
  • Einstellungen:
    • Chunk Size: 4000

6. Inhaltschunks setzen

  • Node Name: Content Chunking @ 50k Chars
  • Typ: set
  • Funktion: Dieser Knoten speichert die aufgeteilten Inhalte in einer speziell definierten Struktur.
  • Einstellungen:
    • Werte: Enthält die Chunkgrößen und die ursprünglichen URLs.

7. Chunks aufteilen

  • Node Name: Split Out Chunks
  • Typ: splitOut
  • Funktion: Teilt die Chunks für die weitere Verarbeitung auf.

8. Dokumenteinbettungen speichern

  • Node Name: Store Document Embeddings
  • Typ: vectorStoreQdrant
  • Funktion: Speichert die verarbeiteten Dokumenteinbettungen in einem Vektor-Store.

9. API-Dokumentation prüfen

  • Node Name: Has API Documentation?
  • Typ: textClassifier
  • Funktion: Prüft, ob die enthaltenen Dokumente API-Schema-Dokumentationen enthalten.

10. API-Operationen extrahieren

  • Node Name: Extract API Operations
  • Typ: informationExtractor
  • Funktion: Extrahiert alle relevanten API-Operationen aus den Dokumenten.

11. Ergebnisse in Google Sheets speichern

  • Node Name: Append Row
  • Typ: googleSheets
  • Funktion: Fügt die extrahierten Informationen in eine Google-Tabelle ein.

Ergebnis

Der Workflow ist nun vollständig konfiguriert und bereit zur Ausführung. Nach der Durchführung wird eine Google-Tabelle mit den extrahierten API-Operationen erstellt, die leicht überprüft und verwaltet werden kann.

Download Link: Hier klicken, um die Datei herunterzuladen

Facebook
Twitter
LinkedIn

Andere Projekte