Hilfe:Personendaten

Aus Worumwiki
Version vom 1. April 2009, 11:03 Uhr von Klm46 (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Abkürzung: Hilfe:PD

< Hilfe < Bausteine und Vorlagen < Personendaten
Wikipedia-PND-Logo.png

Personendaten sind spezielle Metadaten, die in Artikel über Personen aufgenommen werden, damit sie daraus automatisch extrahiert und weiterverarbeitet werden können. Sie bestehen aus einer Reihe von Datenfeldern wie beispielsweise Name, Geburtstag und Kurzbeschreibung einer Person.

Bearbeitungsstand 11. Oktober 2008: 233.772 Artikel mit Personendaten in der deutschsprachigen Wikipedia. (Die englischsprachige Ausgabe, 25. Oktober 2008: über 30.000 Artikel mit Personendaten.)

Kopiervorlage

{{Personendaten
|NAME=
|ALTERNATIVNAMEN=
|KURZBESCHREIBUNG=
|GEBURTSDATUM=
|GEBURTSORT=
|STERBEDATUM=
|STERBEORT=
}}
  1. Kopiervorlage ans Ende (zwischen die Kategorie- und Interwiki-Links) eines Personenartikels kopieren
  2. Datenfelder ausfüllen (siehe Datenfelder). Dabei beachten: Leere Datenfelder (etwa bei lebenden Personen Sterbedatum und Sterbeort) nicht löschen, nur unausgefüllt lassen! Auch wenn nur ein (oder gar kein) Alternativname vorhanden ist, muss das Datenfeld dennoch ALTERNATIVNAMEN im Plural heißen!
  3. Fertig

Die Vorlage sollte am Ende des Artikels stehen, nach allen Weblinks, Navigationsleisten und den Kategorieangaben. Hinter den Personendaten folgen nur noch die Sprachlinks („Interwiki-Links“).

Vorlage:Personendaten, der Quelltext

Verwendung

Personendaten werden mittels einer Vorlage in den Artikel eingefügt, deren Ausgabe standardmäßig nicht sichtbar ist und bei Bedarf für normale Nutzer eingeschaltet werden kann.

Beispiel: Das gibt man ein

{{Personendaten
|NAME=Magellan, Ferdinand
|ALTERNATIVNAMEN=Magalhães, Fernão de (portugiesisch); Magallanes, Fernando de (spanisch)
|KURZBESCHREIBUNG=portugiesischer Seefahrer, der für die spanische Krone segelte
|GEBURTSDATUM=1480
|GEBURTSORT=[[Sabrosa]], Portugal
|STERBEDATUM=27. April 1521
|STERBEORT=[[Mactan]], Philippinen
}}

Beispiel: So sieht es für Benutzer aus, die die Anzeige von Metadaten eingeschaltet haben:

Datei:Personendaten-Beispiel update.png

Personengruppen erhalten keine Personendaten. Wenn möglich, werden diese bei den jeweiligen Einzelpersonen in die Weiterleitung eingetragen. (Beispiel: Das Autorenduo Erckmann-Chatrian hat keine Personendaten, diese finden sich unter „Emile Erckmann“ und „Alexandre Chatrian“.)

Ansicht einschalten

Die Ansicht kann mittels eines Gadget in den eigenen Einstellungen aktiviert werden.

Wenn nach Speichern und Cache-Leerung unter dieser Zeile ein Block angezeigt wird, ist die Anzeige von Metadaten eingeschaltet.

Datenfelder

Als Grundlage sind für einen Personendatensatz die Datenfelder NAME, ALTERNATIVNAMEN, KURZBESCHREIBUNG, GEBURTSDATUM, GEBURTSORT, STERBEDATUM und STERBEORT vorgesehen. Die Felder können in Zukunft möglicherweise erweitert werden – dies sollte jedoch in Absprache geschehen.

Feldname Beispiele
NAME

Magellan, Ferdinand
Droste-Hülshoff, Annette von
Gaulle, Charles de
Wolfram von Eschenbach
Heino

ALTERNATIVNAMEN

Magalhães, Fernão de (portugiesisch); Magallanes, Fernando de (spanisch)
Schmidt, Johann Kaspar (wirklicher Name)

KURZBESCHREIBUNG

portugiesischer Seefahrer, der für die spanische Krone segelte
deutscher Philosoph

GEBURTSDATUM

1480
25. Oktober 1806

GEBURTSORT

Sabrosa, Portugal
Bayreuth

STERBEDATUM

27. April 1521
25. Juni 1856

STERBEORT

Mactan, Philippinen
Berlin

Name

Im Feld NAME wird der Name, unter dem die Person bekannt ist (das Lemma), in Ansetzungsform nach RAK eingetragen, also Nachname Komma Vorname. Bei Unsicherheit hilft beispielsweise ein Blick in die Deutsche Nationalbibliografie unter http://dnb.d-nb.de. Dies ist nicht zwangsläufig der echte Name der Person, sondern sollte immer der bekannteste Name sein (z. B. „Heino“).

Bei Personen des Mittelalters, die einen Herkunftsnamen tragen (von Aue, de Troyes, of Monmouth), wird immer nach dem Vornamen angesetzt. Es heißt also Wolfram von Eschenbach, keinesfalls Eschenbach, Wolfram von.

Verlinkungen sollte es bei diesem Feld nicht geben.

Datum

In den Feldern GEBURTSDATUM und STERBEDATUM wird das Datum wie in der Wikipedia üblich eingetragen, also 12. Januar 1323 und nicht TT.MM.JJJJ (z. B. 12. 01. 1923). Ist nicht das volle Datum bekannt, sind auch die Angaben März 1323, nur 1323 oder gar 14. Jahrhundert korrekt.

Siehe auch: Datumskonventionen

Spezielle Regeln, vor allem für ungenaue und unsichere Datumsangaben, nennt die folgende Tabelle. (Bei ungenauen und unsicheren Daten erlaubt sie gelegentlich zwei Formulierungen: um 777, wie auch unsicher: 777. In der Regel sollte man sich bei der Wahl von der Angabe in der Quelle leiten lassen. Also etwa: circa wird zu um; wohl wird zu unsicher.)

falsch richtig Bedeutung & Bemerkungen
[[3. April]] [[1940]] 3. April 1940 Datumsfelder sollten nicht verlinkt sein.
Ein Artikel sollte aber nicht geändert werden,
nur um einen solchen Link zu tilgen.
Die Beseitigung ist jedoch erwünscht,
wenn ein Artikel ohnehin verändert wird.
4. Jänner 1234
4. 1. 1234
04. Januar 1234
4. Januar 1234 einheitliche Schreibweise,
um automatische Auswertung zu erleichtern
123 v. u. Z.
123 v. d. Z.
123 v.Chr.
123 v.&nbsp;Chr.
123 v. Chr. dito
123 n. Chr.
123 u. Z.
123 dito
Frühjahr 43 v. Chr.
2. Hälfte 43 v. Chr.
Spätsommer 43 v. Chr.
43 v. Chr. Vergröberung,
um automatische Auswertung zu erleichtern
lebte im späten 8. und frühen 9. Jahrhundert 8. Jahrhundert
9. Jahrhundert
für GEBURTSDATUM
für STERBEDATUM
vor 837 vor
schließt hier immer das angegebene Datum mit ein
vor dem 18. Juli 837 vor 18. Juli 837
dokumentiert 1108
bezeugt 1108
erwähnt 1108
nachweisbar seit 1108
vor 1108 für GEBURTSDATUM
nach 837 nach
schließt hier immer das angegebene Datum mit ein
nach dem 18. Juli 837 nach 18. Juli 837
später als 1245
frühestens 1245
verschollen 1245
vermisst 1245
1245 (oder später)
nicht vor 1245
nach 1245 für STERBEDATUM
837-843 zwischen 837 und 843 zwischen
schließt hier immer beide angegebenen Daten mit ein
nach 3. Mai 93 und vor 5. Mai 103 zwischen 3. Mai 93 und 5. Mai 103
2. Hälfte des 9. Jh.
Ende des 9. Jahrhunderts
zwischen 850 und 900
6. Mai vor 987
6. Mai nach 987
6. Mai zwischen 987 und 993
6. Mai um 987
der Tag ist bekannt, das Jahr nicht genau
6. Mai 19xx 6. Mai 20. Jahrhundert
940 od. 945
940; nach anderen Quellen 945
940 (oder 945)
940 oder 945 oder soll nur zwischen vollständigen Daten stehen,
nicht zwischen Tagen oder Monatsnamen;
mehr als zwei Alternativen sind zulässig
3. oder 4. April 940
3./4. April 940
3. April 940 oder 4. April 940
3. April oder Mai 940
3. April/Mai 940
3. April 940 oder 3. Mai 940
3. April 940 oder 941
3. April 940/941
3. April 940 oder 3. April 941
3./4. Jahrhundert 3. Jahrhundert oder 4. Jahrhundert
ungefähr 837
gegen 837
etwa 837
circa 837
ca. 837
~837
um 837 um
(kleines) Intervall um das angegebene Datum
geboren Mai 1705 und getauft 17. Mai 1705
17. Mai 1705 (Taufe)
getauft 17. Mai 1705 getauft bzw. begraben
beziehen sich auf die gesamte Datumsangabe,
dies kann nur am Anfang stehen
(jedoch nach eventuellem unsicher: )
beerdigt 14. Juni 1705
14. Juni 1705 (Beerdigung)
14. Juni 1705 (Begräbnis)
begraben 14. Juni 1705
wahrscheinlich 1460
vermutlich 1460
wohl 1460
1460(?)
unsicher: 1460 unsicher
bezieht sich auf die gesamte Datumsangabe,
es kann nur am Anfang stehen
3.(?) März 1460
3. März(?) 1460
3. März 1460(?)
wohl 3. März 1460
unsicher: 3. März 1460
unsicher: um 1111
unsicher: 1. Mai 999 oder 1. Juni 999
unsicher: getauft 17. Mai 1705
unsicher: begraben 14. Juni 1705
nicht bekannt
unbekannt
ungewiss
 ?
Es sollte geprüft werden,
ob eine grobe Angabe wie etwa
3. Jahrhundert
oder sogar nur
3. Jahrhundert oder 4. Jahrhundert
möglich ist.
Falls nicht: Feld leer lassen.
die folgenden Formen sollen bis zur noch ausstehenden endgültigen Entscheidung toleriert werden
333/32 v. Chr. 333/332 v. Chr. ein bekanntes Jahr eines anderen Kalenders
(griechisch/islamisch/iranisch/usw.),
welches durch zwei aufeinanderfolgende
julianische oder gregorianische Jahre
– durch / getrennt – wiedergegeben wird;
nicht gemeint ist:
333 v. Chr. oder 332 v. Chr.;
neben dem / darf kein Leerzeichen stehen
1332/33 1332/1333
um 335/325 v. Chr. (kleines) Intervall
um die angegebene Zeitspanne;
bitte ausschließlich nach um verwenden,
für andere Fälle ist zwischen richtig;
neben dem / darf kein Leerzeichen stehen
um 1870/80 um 1870/1880

In vielen Ländern – so in Russland bis zum Vorlage:JULGREGDATUM, aber auch in Deutschland bis zu unterschiedlichen Zeiten (oft Vorlage:JULGREGDATUM) – galt der Julianische Kalender noch längere Zeit weiter, nachdem am Vorlage:JULGREGDATUM der heute verwendete Gregorianische Kalender eingeführt wurde. In den Personendaten sollte ausschließlich das Datum nach dem Gregorianischen Kalender verwendet werden. Im Artikel selbst können beide Datumsangaben stehen. Siehe hierzu: Umrechnung zwischen Julianischem und Gregorianischem Kalender und Vorlage:JULGREGDATUM.

Verlinkungen sollte es bei diesen Feldern nicht geben.

Alternativnamen

Im Feld Alternativnamen sollten alle anderen Namen notiert werden, die auf die Person zutreffen, vor allem wirkliche Namen, wenn der Hauptname ein Pseudonym ist. Die Alternativnamen sollten ebenso wie der Hauptname angesetzt werden. In runden Klammern kann dahinter angegeben werden, um was für eine Art von Namen es sich handelt, diese Beschreibung sollte keine Abkürzung sein, also (Pseudonym) statt [Pseud.]. Mehrere Attribute werden durch ein Komma getrennt. Mehrere Namen werden mit Semikolon getrennt, welchem ein Leerzeichen folgen sollte. (Bitte nicht sämtliche Vornamen als Alternativnamen aufführen, sondern nur jene, die, wie z. B. abweichende Familiennamen und Pseudonyme, von besonderer Bedeutung sind.)

Verlinkungen sollte es bei diesem Feld nicht geben. Eine Verwendung von Vorlagen zur Fremdsprachenunterstützung sollte es nicht gehen. Die Verwendung der Vorlage:lang ist hierbei aber noch nicht abschließend geklärt, sie wird derzeit geduldet.

Kurzbeschreibung

Dieses Feld soll sehr kurz die Person beschreiben. Dabei empfiehlt sich zuerst die Nationalität, dann den Beruf und zuletzt ihre herausragende Leistung (z. B. Erfindung von XY) zu nennen.

Beispiele
  • deutscher Musiker
  • US-amerikanischer Astronaut
  • spanischer Politiker (XY-Partei)
  • mexikanischer Politiker; Ministerpräsident 1920–1922
  • deutscher Widerstandskämpfer (20. Juli 1944)

Geburtsort, Sterbeort

Während bei den anderen Datenfeldern die Verlinkung unnötig ist, sollten Geburts- und Sterbeort wie in Artikeln möglichst exakt auf einen Artikel verweisen, damit sie sich später automatisch auswerten lassen:

So nicht

  • Vila Real, [[Alto Trás-os-Montes|Trás-os-Montes]], [[Portugal]]
    Geburtsort ist weder „Alto Trás-os-Montes“ noch „Portugal“

So ja

  • [[Vila Real]], Trás-os-Montes, Portugal

Auch in Ordnung

  • [[Vila Real]], Portugal
  • [[Vila Real]], [[Alto Trás-os-Montes|Trás-os-Montes]], [[Portugal]]

Achtung: Es gibt zahlreiche Orte gleichen Namens, also nicht auf die falsche Stadt verlinken, nur weil sie ebenso heißt wie die gemeinte. Es soll auch dann verlinkt werden, falls der entsprechende Ortsartikel noch nicht existiert.

Ungenaue Angaben werden mit einem „bei“ eingeleitet, also beispielsweise „bei Berlin“.

Falls der Geburts- oder Sterbeort unsicher ist, so sollte dies einheitlich mit „unsicher:“ gekennzeichnet werden, also zum Beispiel „unsicher: Berlin“.

Zur Geschichte der Personendaten

Ohne einheitliche Formatierung bei Artikeln über Personen ist es sehr schwer, Personendaten aus den Artikeln zu extrahieren. Bei der Konvertierung für die erste Wikipedia-CD wurden halbautomatisch über 25.000 Personennamen nach den Regeln für die alphabetische Katalogisierung lemmatisiert und als allernotwendigste Teile eines Personendatensatzes Name, Kurzbeschreibung, Geburtsdatum, Geburtsort, Sterbedatum und Sterbeort ausgezeichnet.

Im Vorfeld der Erstellung der zweiten CD wurden die Personendaten in der heutigen Form eingeführt, damit die Daten zum einen nicht für jede CD erneut erstellt werden müssen und zum anderen auch für andere Projekte genutzt werden können. Die Einbindung begann im Dezember 2004. Directmedia, der Ersteller der Wikipedia-CD, unterstützte das Projekt im Januar 2005 mit einer „Tagging Party“.

Nach der deutschsprachigen Wikipedia hat Ende Dezember 2005 auch die englischsprachige Ausgabe diese Art von Metadaten eingeführt.

Eine wichtige Anwendung ist die Wikipedia-DVD, die Personendaten lassen sich aber auch anderweitig nutzen, beispielsweise zur Erstellung von Geburtstagslisten oder für eine Personensuche. Zusätzlich zu den eigentlichen Personendaten gibt es PND-Links zur Verlinkung von anderen Anbietern auf die Wikipedia und umgekehrt sowie Personenkategorien.

Arbeiten mit den Personendaten

Eintragen neuer Personendaten

Das Tool Benutzer:APPER/Personendaten und www.apper.de/pd generiert für eine Anzahl neuer Artikel selbstständig das Personendatenfeld, das dann in den Artikel eingetragen werden kann.

Extraktion der Personendaten

Die Extraktion der Personendaten und PND-Links ist entweder aus einer SQL-Datenbank oder direkt aus dem XML-Dump möglich. Weiteres siehe unter /Datenextraktion.

Download der Personendaten

Die im aktuellen Dump der deutschsprachigen Wikipedia enthaltenen Personendaten können unter tools.wikimedia.de/~sk heruntergeladen werden. Die CSV-Datei wird durch Tabulatoren getrennt und enthält neben den Personendaten auch die Kategorien und Defaultsort-Einträge. Die Datei ist über 100 MB groß (gezippt 25 MB) enthält über 200000 Zeilen.

Eine andere Datenquelle finden sich unter: http://toolserver.org/~voj/pd/staging-area/.

Abfragen und Auswerten von Personendaten


Wartung der Personendaten

Die Wartung der vorhandener Personendaten erfolgt mit Hilfe einiger Skripts, deren Ausgaben und Ergebnisse hier zu finden sind:

Statistik

Datum Artikel PND-Nummern Prozent PND
2005-09-07 56.258 14.506 26%
2005-11-27 64.875 15.476 24%
2005-12-11 67.946 15.697 23%
2006-02-12 79.532 17.328 23%
2006-03-20 86.830 18.069 21%
2006-04-20 90.636 19.152 21%
2006-06-05 95.534 19.977 21%
2006-08-03 101.737 21.569 21%
2006-11-05 116.015 24.130 21%
2006-11-30 120.285 24.792 21%
2007-04-02 145.760 28.189 19%
2007-04-28 152.645 29.106 19%
2007-05-24 157.561 30.989 20%
2007-07-01 163.444 31.462 19%
2007-10-09 178.734 38.830 22%
2007-12-17 187.452 40.059 21%
2008-02-21 197.446 43.103 22%

Siehe auch

WIKIPEDIA Hinweis: Dieser Artikel basiert auf einem Text, der aus der freien Enzyklopädie Wikipedia übernommen wurde. Eine Liste der ursprünglichen Autoren befindet sich auf der Versionsseite des entsprechenden Artikels.