User Dokumentation
DataSets

Best Practices

4min

Was genau kann ich mit DataSets machen?

Möglichkeiten von DataSets:

  • Importierte Rohdaten für die weitere Verarbeitung vorbereiten
  • Datenqualität verbessern
  • Unvollständige oder kaputte Datensätze ausfiltern
  • Daten aus unterschiedlichen Quellen in einem Datensatz zusammenzuführen
  • Datenfeeds vorbereiten
  • Dynamische DataSets im Workflow generieren und bereitstellen

Praktische Tipps / Best Practice

Was ist eine Stage?

Eine Stage bildet immer das Ergebnis einer Query an einem bestimmten Punkt der DataPipeline ab. Jede Stage hat eine eigene Funktionalität, wie z. B. das Filtern der Daten. Die Stages sind dabei hierarchisch aufgebaut, das heißt wenn Stage 3 von 5 getestet wird, werden nur die Stages 1 bis 3 ausgeführt. Aktuell sind drei Stages in yedi verfügbar: Filter, Join und Transformer.

Kann ich mehrere Stages zu einem DataSet hinzufügen?

Ja, das geht. Dazu können die Stages ganz einfach über das Plus Symbol hinzugefügt werden. 

Kann ich die Reihenfolge der Stages im Nachhinein ändern?

Ja, das geht. Die gewünschten Stages können einfach per Drag & Drop verschoben werden.

Wie kann ich alle Datensätze filtern, bei denen ein bestimmtes Feld gefüllt ist?

  1. Filter Stage hinzufügen
  2. Gewünschtes Feld auswählen
  3. Operator != wählen
  4. Als Wert "null" eingeben

In der Vorschau sind nun alle Datensätze zu sehen, bei denen das gewünschte Feld ungleich null, also gefüllt ist