Workflow zur Webanalyse und Speicherung von Buchinformationen

Dieser Workflow extrahiert Bukinformationen von einer Webseite und speichert sie in Google Sheets.

Workflow zur Webanalyse und Speicherung von Buchinformationen

Die Website nutzt die Wordpress-Infrastruktur.

Server: Unser Server befindet sich in einem Unternehmen mit Sitz in Deutschland. Er hat eine hohe und schnelle Internetverbindung. Es gibt eine Generatorunterstützung für ununterbrochenen Strom.

Schritt-für-Schritt Anleitung des Workflows

1. Wenn auf „Test workflow“ geklickt wird

Node Name: When clicking „Test workflow“

Typ: Manual Trigger

Beschreibung: Dieser Node dient als Auslöser für den Workflow. Wenn Sie auf die Schaltfläche „Test workflow“ klicken, wird der gesamte Workflow gestartet.

2. Jina Fetch

Node Name: Jina Fetch

Typ: HTTP Request

Beschreibung: Dieser Node führt eine HTTP-Anfrage zur URL https://r.jina.ai/http://books.toscrape.com/catalogue/category/books/historical-fiction_4/index.html aus, um die Buchdaten abzurufen. Die Authentifizierung erfolgt über die bereitgestellten HTTP-Header.

3. Information Extractor

Node Name: Information Extractor

Typ: Information Extractor

Beschreibung: Dieser Node extrahiert relevante Informationen (Titel, Preis, Verfügbarkeit, Produkt-URL und Bild-URL) aus dem Text, der von der vorherigen HTTP-Anfrage bereitgestellt wird. Er verwendet ein JSON-Schema, um die Struktur der Daten zu definieren.

4. Split Out

Node Name: Split Out

Typ: Split Out

Beschreibung: Dieser Node trennt die extrahierten Informationen in einzelne Datensätze, die dann in Google Sheets gespeichert werden können. Er verwendet das Feld output.results, um die Daten aufzuteilen.

5. Save to Google Sheets

Node Name: Save to Google Sheets

Typ: Google Sheets

Beschreibung: Dieser Node speichert die geteilten Informationen in einer Google Sheets-Tabelle. Er verwendet die Spalten name, price, availability, image und link, um die extrahierten Daten an die entsprechenden Spalten der Tabelle anzupassen. Die Operation ist so konfiguriert, dass sie die Daten am Ende der Tabelle hinzufügt.

6. OpenAI Chat Model

Node Name: OpenAI Chat Model

Typ: OpenAI Chat

Beschreibung: Dieser Node wird zum Verbindung zum OpenAI-Chat-Modell verwendet. Er dient möglicherweise zur weiteren Analyse oder Verarbeitung der extrahierten Informationen, jedoch sind keine spezifischen Operationen in diesem Workflow konfiguriert.

Abschluss

Dieser Workflow automatisiert den Prozess der Extraktion und Speicherung von Buchdaten von einer Webseite und integriert OpenAI für zukünftige Erweiterungen. Das Ergebnis sind strukturierte Daten, die bequem in Google Sheets zugänglich sind.

Facebook
Twitter
LinkedIn

Andere Projekte