Best Practices
4 min
was genau kann ich mit datasets machen? \<font color="#0c121d">möglichkeiten von datasets \</font> \<font color="#0c121d">importierte rohdaten für die weitere verarbeitung vorbereiten\</font> \<font color="#0c121d">datenqualität verbessern\</font> \<font color="#0c121d">unvollständige oder kaputte datensätze\</font> \<font color="#0c121d">ausfiltern\</font> \<font color="#0c121d">daten aus unterschiedlichen quellen in einem datensatz zusammenzuführen\</font> \<font color="#0c121d">datenfeeds vorbereiten\</font> \<font color="#0c121d">dynamische datasets im workflow generieren und bereitstellen\</font> praktische tipps / best practice \<font color="#0c121d">wie wird mit variablen innerhalb eines datasets gearbeitet?\</font> \<font color="#0c121d">bei der verarbeitung von variablen innerhalb eines datasets wird zwischen source, output, foreign, parameter und config variablen unterschieden\</font> \<font color="#0c121d">source felder aus der lokalen datenstruktur\</font> \<font color="#0c121d">output felder, die in einer vorherigen stage innerhalb des datasets definiert wurde\</font> n \<font color="#0c121d">foreign felder aus einer externen datenstruktur (nur im rahmen der join stage)\</font> \<font color="#0c121d">parameter innerhalb des datasets definierte parameter\</font> \<font color="#0c121d">config global definierte konfigurationswerte \</font> \<font color="#0c121d">auf variablen wird immer mittels dotnotation und doppelt geschweiften klammern zugegriffen das feld "id" aus der lokalen datenstruktur würde demnach mit "{{source id}}" angesprochen werden \</font> \<font color="#0c121d"> alternativ kann aber auch das dropdown menü für die auswahl von variablen genutzt werden\</font> wie aktiviere ich die variablenauswahl ? \<font color="#0c121d">statt eines dropdown menüs oder schiebereglers kann man in yedi auch manuell eine variable auswählen die variablenauswahl wird aktiviert, indem man auf die geschweiften klammern { } neben dem feld klickt \</font> kann ich ein neues dataset basierend auf einem bestehenden dataset anlegen? \<font color="#0c121d">ja, das geht wenn ein neues dataset angelegt wird, gibt es die möglichkeit, ein bestehendes dataset als datenstruktur auszuwählen der output der pipeline aus dem bestehenden dataset wird dann als quell datenstruktur für das neue dataset genutzt \</font>