Workflow zur API-Schemaextraktion und -generierung
Dieser Workflow besteht aus mehreren Knoten, die zusammenarbeiten, um API-Dokumentationen zu recherchieren, relevante Informationen zu extrahieren und die Ergebnisse in einer Google-Tabelle zu speichern.
1. Wenn ‚Test Workflow‘ geklickt wird
- Node Name: When clicking ‘Test workflow’
- Typ: manualTrigger
- Funktion: Dieser Knoten löst den Workflow manuell aus.
2. Websuche nach API-Schema
- Node Name: Web Search For API Schema
- Typ: httpRequest
- Funktion: Dieser Knoten sendet eine POST-Anfrage an eine API, um Suchergebnisse für API-Dokumentationen zu erhalten.
- Einstellungen:
- URL:
https://api.apify.com/v2/acts/serping~fast-google-search-results-scraper/run-sync-get-dataset-items - Method: POST
- Body-Parameter: Enthält Suchbegriffe und die Anzahl der Ergebnisse pro Seite.
- URL:
3. Scrape Webpage Contents
- Node Name: Scrape Webpage Contents
- Typ: httpRequest
- Funktion: Dieser Knoten extrahiert den Inhalt von Webseiten, die aus der vorherigen Websuche erhalten wurden.
- Einstellungen:
- URL: Die URL wird dynamisch aus den vorherigen Knoten übernommen.
- JSON-Body: Legt fest, welche Daten von der Webseite extrahiert werden sollen.
4. Ergebnisse in Liste umwandeln
- Node Name: Results to List
- Typ: splitOut
- Funktion: Diese Knoten teilt die Ergebnisse auf, um sie weiter zu verarbeiten.
- Einstellungen:
5. Text in Blöcke aufteilen
- Node Name: Recursive Character Text Splitter1
- Typ: textSplitterRecursiveCharacterTextSplitter
- Funktion: Teile den extrahierten Text in handhabbare Blöcke.
- Einstellungen:
- Chunk Size: 4000
6. Inhaltschunks setzen
- Node Name: Content Chunking @ 50k Chars
- Typ: set
- Funktion: Dieser Knoten speichert die aufgeteilten Inhalte in einer speziell definierten Struktur.
- Einstellungen:
- Werte: Enthält die Chunkgrößen und die ursprünglichen URLs.
7. Chunks aufteilen
- Node Name: Split Out Chunks
- Typ: splitOut
- Funktion: Teilt die Chunks für die weitere Verarbeitung auf.
8. Dokumenteinbettungen speichern
- Node Name: Store Document Embeddings
- Typ: vectorStoreQdrant
- Funktion: Speichert die verarbeiteten Dokumenteinbettungen in einem Vektor-Store.
9. API-Dokumentation prüfen
- Node Name: Has API Documentation?
- Typ: textClassifier
- Funktion: Prüft, ob die enthaltenen Dokumente API-Schema-Dokumentationen enthalten.
10. API-Operationen extrahieren
- Node Name: Extract API Operations
- Typ: informationExtractor
- Funktion: Extrahiert alle relevanten API-Operationen aus den Dokumenten.
11. Ergebnisse in Google Sheets speichern
- Node Name: Append Row
- Typ: googleSheets
- Funktion: Fügt die extrahierten Informationen in eine Google-Tabelle ein.
Ergebnis
Der Workflow ist nun vollständig konfiguriert und bereit zur Ausführung. Nach der Durchführung wird eine Google-Tabelle mit den extrahierten API-Operationen erstellt, die leicht überprüft und verwaltet werden kann.
Download Link: Hier klicken, um die Datei herunterzuladen