Viele Vornamen

26 Sep

Bei twapperlyzer versuche ich über die Vornamen das Geschlecht zu bestimmen. Bis heute hatte ich dazu ca 11 Tausend Namen aus dieser Datei. Das war mich noch etwas wenig heute habe ich noch etwas recherchiert und habe noch diese Datei mit ca 40 Tausend Namen gefunden. Die beiden Dateien enthalten noch einige Meta-Informationen, wie die Wahrscheinlichkeit das das Geschlecht stimmt oder die Herkunft des Namens. Da ich nur die Namen brauchte habe ich beide vereint und  weiterverarbeitet zu jeweils einer Datei mit 19461 weiblichen Vornamen und einer Datei mit 20784 männlichen Vornamen. Beides sind eigentlich txt Dateien in denen die Namen durch einen Zeilenumbruch getrennt sind.

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: