Nutzt jemand von euch Data Dictionaries, um Datenanalysen zu vereinfachen?
Ich arbeite mit R und verbinde dabei viele verschiedene csv-Dateien. Dabei verliere ich manchmal den Überblick über die Variablen in den verscheidenen Datensets. Ich verliere viel Zeit damit herauszufinden, warum die gleichen Personalnummern in mehreren Zeilen vorkommen (manchmal ist es, weil der Beschäftigungsgrad gewechselt hat, manchmal weil die Person das Team gewechselt hat etc.). Wenn man dann die Datensets miteinander verbindet mittels diesen Personalnummern, dann wird das ganze noch komplizierter. Danach verliere ich viel Zeit, das nachzuvollziehen, was nun wie verbunden wurde. Habt ihr eine gute Lösung, wie man sich in kurzer Zeit einen Überblick über die verschiedenen Datensets auf systematischer/replizierbarer Weise verschaffen kann? Damit man auch in Zukunft noch versteht, wie die Datensätze aufgebaut sind? Vielleicht Datenwörterbücher? Vielen Dank für eure Hilfe schon mal im Voraus!
1 Antwort
Im Anhang sende ich dir eine aktuelle Studie und auf Seite 38 findest du ein Fallbeispiel der BLKB. Ich könnte mir vorstellen, dass dich ein Peer-Austausch mit Jonas Stampfler weiterbringen könnte. Alternativ kannst du bei ...