Destringing Variablen In Stata Forex




Destringing Variablen In Stata ForexStaten: Datenanalyse und statistische Software Nicholas J. Cox, Durham University, UK Wenn die Zerstorung in die Stata 7 integriert wurde, wurde sie weitgehend umgeschrieben. (In gewisser Weise verletzte die ursprungliche Destringing-Befehl Statarsquos Philosophie, weil es zu einfach war, um viel von Ihrem Datensatz andern, ohne die Sicherung der buchstabieren einige einstweilige Verfugung wie z. B. ersetzen.) Grundsatzlich wurde beschlossen, zu scharfen Die Unterscheidung zwischen destring und encode. Mehr oder weniger entlang der folgenden Zeilen: encode ist fur Situationen konzipiert, in denen Sie eine Zeichenfolgenvariable haben, die typischerweise einen aussagekraftigen nichtnumerischen Text enthalt (z. B. mannlich, weiblich) und die aquivalente Information als numerische Variable mit Beschriftungen haben mochten. Das geht zuruck in die Geschichte von Stata. Destring ist fur Situationen konzipiert, in denen Sie eine Zeichenfolgenvariable haben, die typischerweise aussagekraftigen numerischen Text (z. B. 1, 2) enthalt, die Sie in die numerische Variable konvertieren mochten, die es richtig sein soll. Normalerweise ist diese Variable jetzt String wegen eines Fehlers. Vielleicht war der Fehler bei Ihnen, denn was Sie ursprunglich in Statas Data Editor eingegeben wurde, war nicht numerisch. Oder vielleicht ist der numerische Text durch nichtnumerischen Text von einer fruheren Operation (z. B. in einer Kalkulationstabelle) verunreinigt, und Stata entdeckte das. (In der Tat, destring wurde weitgehend geschrieben, weil die Leute, die zu Stata neu waren, Probleme hatten, wann immer sie beschreibenden Text in der ersten Zeile des Dateneditors, Kalkulationstabellenstil schrieben. Stata entschied, dass eine solche Spalte eine Zeichenfolgenvariable enthielt, mit ihrer ldquofirst Impressions countrdquo-Regel. In der Lage zu entkommen, diese Situation mit einem einzigen destring war oft trostlich fur diese Benutzer.) Der Mittelgrund zwischen diesen Problemen ist realisieren, dass eine Zeichenfolge Variable mit mannlichen und weiblichen ist oft nicht viel fur die Datenanalyse in Stata, und dass Sie nur Das numerische Aquivalent (mit Wertelabel). Destring selbst hat eine STB-Geschichte, die bis 1997 zuruckgeht, und es kann sein, dass einige Benutzer an die Tatsache gewohnt haben, dass sie en masse kodieren konnte (und dass fur diese Benutzer das Wegwerfen der ursprunglichen String-Variablen in Ordnung war). Was empfehlen wir fur alle, die Stata 7 oder neuer in dieser Position verwenden Unser bester Rat ist, dass Sie mehrere Variablen auf einmal mit foreach codieren konnen. Vielleicht nach dem folgenden Code: Alternativ, betrachten Sie die Benutzer-schriftliche Programm multencode (SSC). Wenn Sie die falschen Zeichenfolgenvariablen loschen und die ursprunglichen Namen verwenden mochten, geben Sie an: Die IDRE Statistische Beratungsgruppe migriert die Website im Februar zum WordPress CMS, um die Wartung und die Erstellung neuer Inhalte zu erleichtern. Einige unserer alteren Seiten werden entfernt oder archiviert, so dass sie nicht langer erhalten bleiben. Wir werden versuchen, Redirects beizubehalten, damit die alten URLs weiterhin so gut funktionieren, wie wir konnen. Willkommen beim Institut fur Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata Class Notes Zahlen von n bis N Einfuhrung Stata hat zwei eingebaute Variablen namens n und N. N ist die Stata-Notation fur die aktuelle Beobachtungsnummer. N in der ersten Beobachtung 1, 2 im zweiten, 3 im dritten und so weiter. N ist die Stata-Notation fur die Gesamtzahl der Beobachtungen. Wir sehen, wie n und N arbeiten. Wie Sie sehen konnen, enthalt die Variable id die Beobachtungsnummer, die von 1 bis 7 lauft, und nt die Gesamtzahl der Beobachtungen, die 7 ist. Zahlen mit mit n und N in Verbindung mit dem Befehl kann einige sehr nutzliche Ergebnisse liefern. Naturlich mussen wir, um den by-Befehl zu verwenden, zuerst unsere Daten auf der by-Variablen sortieren. Nun ist n1 die Beobachtungsnummer innerhalb jeder Gruppe und n2 die Gesamtzahl der Beobachtungen fur jede Gruppe. Um die niedrigste Punktzahl fur jede Gruppe aufzulisten, verwenden Sie Folgendes: Um die hochste Punktzahl fur jede Gruppe zu verwenden, verwenden Sie Folgendes: Eine weitere Verwendung von n Verwenden Sie n, um herauszufinden, ob es doppelte ID-Nummern in den folgenden Daten gibt: Die Beobachtungen 6 und 7 haben die gleichen Identifikationsnummern und unterschiedliche Werte. Duplikate finden Mit Hilfe von N konnen Sie doppelte Beobachtungen finden. In diesem Beispiel sortieren wir die Beobachtungen durch alle Variablen. Dann verwenden wir alle Variablen in der by-Anweisung und set set n gleich der Gesamtzahl der identischen Beobachtungen. Schlie?lich listen wir die Beobachtungen auf, fur die N gro?er als 1 ist, wodurch die doppelten Beobachtungen identifiziert werden. Wenn Sie eine Menge von Variablen in der Datenmenge haben, konnte es lange dauern, um sie alle zweimal eingeben. Wir konnen die Wildcard verwenden, um anzuzeigen, dass wir alle Variablen verwenden mochten. Weiter in den neuesten Versionen von Stata konnen wir kombinieren Art und durch in eine einzige Aussage. Unten ist eine vereinfachte Version des Codes, die genau die gleichen Ergebnisse wie oben ergibt. Der Inhalt dieser Website sollte nicht als eine Bestatigung fur eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universitat von Kalifornien verstanden werden.