Hilfe:Personendaten: Unterschied zwischen den Versionen
(kein Unterschied)
|
Version vom 26. März 2009, 17:22 Uhr
Abkürzung: Hilfe:PD
Personendaten sind spezielle Metadaten, die in Artikel über Personen aufgenommen werden, damit sie daraus automatisch extrahiert und weiterverarbeitet werden können. Sie bestehen aus einer Reihe von Datenfeldern wie beispielsweise Name, Geburtstag und Kurzbeschreibung einer Person.
Bearbeitungsstand 11. Oktober 2008: 233.772 Artikel mit Personendaten in der deutschsprachigen Wikipedia. (Die englischsprachige Ausgabe, 25. Oktober 2008: über 30.000 Artikel mit Personendaten.)
Inhaltsverzeichnis
Kopiervorlage
{{Personendaten |NAME= |ALTERNATIVNAMEN= |KURZBESCHREIBUNG= |GEBURTSDATUM= |GEBURTSORT= |STERBEDATUM= |STERBEORT= }} |
|
Die Vorlage sollte am Ende des Artikels stehen, nach allen Weblinks, Navigationsleisten und den Kategorieangaben. Hinter den Personendaten folgen nur noch die Sprachlinks („Interwiki-Links“).
- Vorlage:Personendaten, der Quelltext
Verwendung
Personendaten werden mittels einer Vorlage in den Artikel eingefügt, deren Ausgabe standardmäßig nicht sichtbar ist und bei Bedarf für normale Nutzer eingeschaltet werden kann.
Beispiel: Das gibt man ein
{{Personendaten |NAME=Magellan, Ferdinand |ALTERNATIVNAMEN=Magalhães, Fernão de (portugiesisch); Magallanes, Fernando de (spanisch) |KURZBESCHREIBUNG=portugiesischer Seefahrer, der für die spanische Krone segelte |GEBURTSDATUM=1480 |GEBURTSORT=[[Sabrosa]], Portugal |STERBEDATUM=27. April 1521 |STERBEORT=[[Mactan]], Philippinen }}
Beispiel: So sieht es für Benutzer aus, die die Anzeige von Metadaten eingeschaltet haben:
Datei:Personendaten-Beispiel update.png
Personengruppen erhalten keine Personendaten. Wenn möglich, werden diese bei den jeweiligen Einzelpersonen in die Weiterleitung eingetragen. (Beispiel: Das Autorenduo Erckmann-Chatrian hat keine Personendaten, diese finden sich unter „Emile Erckmann“ und „Alexandre Chatrian“.)
Ansicht einschalten
Die Ansicht kann mittels eines Gadget in den eigenen Einstellungen aktiviert werden.
Wenn nach Speichern und Cache-Leerung unter dieser Zeile ein Block angezeigt wird, ist die Anzeige von Metadaten eingeschaltet.
Personendaten | |
---|---|
NAME | Magellan, Ferdinand |
ALTERNATIVNAMEN | Magalhães, Fernão de (portugiesisch); Magallanes, Fernando de (spanisch) |
KURZBESCHREIBUNG | portugiesischer Seefahrer, der für die spanische Krone segelte |
GEBURTSDATUM | 1480 |
GEBURTSORT | Sabrosa, Portugal |
STERBEDATUM | 27. April 1521 |
STERBEORT | Mactan, Philippinen |
Datenfelder
Als Grundlage sind für einen Personendatensatz die Datenfelder NAME, ALTERNATIVNAMEN, KURZBESCHREIBUNG, GEBURTSDATUM, GEBURTSORT, STERBEDATUM und STERBEORT vorgesehen. Die Felder können in Zukunft möglicherweise erweitert werden – dies sollte jedoch in Absprache geschehen.
Feldname | Beispiele |
---|---|
NAME |
Magellan, Ferdinand |
ALTERNATIVNAMEN |
Magalhães, Fernão de (portugiesisch); Magallanes, Fernando de (spanisch) |
KURZBESCHREIBUNG |
portugiesischer Seefahrer, der für die spanische Krone segelte |
GEBURTSDATUM |
1480 |
GEBURTSORT | |
STERBEDATUM |
27. April 1521 |
STERBEORT |
Name
Im Feld NAME wird der Name, unter dem die Person bekannt ist (das Lemma), in Ansetzungsform nach RAK eingetragen, also Nachname Komma Vorname. Bei Unsicherheit hilft beispielsweise ein Blick in die Deutsche Nationalbibliografie unter http://dnb.d-nb.de. Dies ist nicht zwangsläufig der echte Name der Person, sondern sollte immer der bekannteste Name sein (z. B. „Heino“).
Bei Personen des Mittelalters, die einen Herkunftsnamen tragen (von Aue, de Troyes, of Monmouth), wird immer nach dem Vornamen angesetzt. Es heißt also Wolfram von Eschenbach, keinesfalls Eschenbach, Wolfram von.
Verlinkungen sollte es bei diesem Feld nicht geben.
Datum
In den Feldern GEBURTSDATUM und STERBEDATUM wird das Datum wie in der Wikipedia üblich eingetragen, also 12. Januar 1323 und nicht TT.MM.JJJJ (z. B. 12. 01. 1923). Ist nicht das volle Datum bekannt, sind auch die Angaben März 1323, nur 1323 oder gar 14. Jahrhundert korrekt.
Siehe auch: Datumskonventionen
Spezielle Regeln, vor allem für ungenaue und unsichere Datumsangaben, nennt die folgende Tabelle. (Bei ungenauen und unsicheren Daten erlaubt sie gelegentlich zwei Formulierungen: um 777, wie auch unsicher: 777. In der Regel sollte man sich bei der Wahl von der Angabe in der Quelle leiten lassen. Also etwa: circa wird zu um; wohl wird zu unsicher.)
falsch | richtig | Bedeutung & Bemerkungen |
---|---|---|
[[3. April]] [[1940]] | 3. April 1940 | Datumsfelder sollten nicht verlinkt sein. Ein Artikel sollte aber nicht geändert werden, nur um einen solchen Link zu tilgen. Die Beseitigung ist jedoch erwünscht, wenn ein Artikel ohnehin verändert wird. |
4. Jänner 1234 4. 1. 1234 04. Januar 1234 |
4. Januar 1234 | einheitliche Schreibweise, um automatische Auswertung zu erleichtern |
123 v. u. Z. 123 v. d. Z. 123 v.Chr. 123 v. Chr. |
123 v. Chr. | dito |
123 n. Chr. 123 u. Z. |
123 | dito |
Frühjahr 43 v. Chr. 2. Hälfte 43 v. Chr. Spätsommer 43 v. Chr. |
43 v. Chr. | Vergröberung, um automatische Auswertung zu erleichtern |
lebte im späten 8. und frühen 9. Jahrhundert | 8. Jahrhundert 9. Jahrhundert |
für GEBURTSDATUM für STERBEDATUM |
vor 837 | vor schließt hier immer das angegebene Datum mit ein | |
vor dem 18. Juli 837 | vor 18. Juli 837 | |
dokumentiert 1108 bezeugt 1108 erwähnt 1108 nachweisbar seit 1108 |
vor 1108 | für GEBURTSDATUM |
nach 837 | nach schließt hier immer das angegebene Datum mit ein | |
nach dem 18. Juli 837 | nach 18. Juli 837 | |
später als 1245 frühestens 1245 verschollen 1245 vermisst 1245 1245 (oder später) nicht vor 1245 |
nach 1245 | für STERBEDATUM |
837-843 | zwischen 837 und 843 | zwischen schließt hier immer beide angegebenen Daten mit ein |
nach 3. Mai 93 und vor 5. Mai 103 | zwischen 3. Mai 93 und 5. Mai 103 | |
2. Hälfte des 9. Jh. Ende des 9. Jahrhunderts |
zwischen 850 und 900 | |
6. Mai vor 987 6. Mai nach 987 6. Mai zwischen 987 und 993 6. Mai um 987 |
der Tag ist bekannt, das Jahr nicht genau | |
6. Mai 19xx | 6. Mai 20. Jahrhundert | |
940 od. 945 940; nach anderen Quellen 945 940 (oder 945) |
940 oder 945 | oder soll nur zwischen vollständigen Daten stehen, nicht zwischen Tagen oder Monatsnamen; mehr als zwei Alternativen sind zulässig |
3. oder 4. April 940 3./4. April 940 |
3. April 940 oder 4. April 940 | |
3. April oder Mai 940 3. April/Mai 940 |
3. April 940 oder 3. Mai 940 | |
3. April 940 oder 941 3. April 940/941 |
3. April 940 oder 3. April 941 | |
3./4. Jahrhundert | 3. Jahrhundert oder 4. Jahrhundert | |
ungefähr 837 gegen 837 etwa 837 circa 837 ca. 837 ~837 |
um 837 | um (kleines) Intervall um das angegebene Datum |
geboren Mai 1705 und getauft 17. Mai 1705 17. Mai 1705 (Taufe) |
getauft 17. Mai 1705 | getauft bzw. begraben beziehen sich auf die gesamte Datumsangabe, dies kann nur am Anfang stehen (jedoch nach eventuellem unsicher: ) |
beerdigt 14. Juni 1705 14. Juni 1705 (Beerdigung) 14. Juni 1705 (Begräbnis) |
begraben 14. Juni 1705 | |
wahrscheinlich 1460 vermutlich 1460 wohl 1460 1460(?) |
unsicher: 1460 | unsicher bezieht sich auf die gesamte Datumsangabe, es kann nur am Anfang stehen |
3.(?) März 1460 3. März(?) 1460 3. März 1460(?) wohl 3. März 1460 |
unsicher: 3. März 1460 | |
unsicher: um 1111 | ||
unsicher: 1. Mai 999 oder 1. Juni 999 | ||
unsicher: getauft 17. Mai 1705 | ||
unsicher: begraben 14. Juni 1705 | ||
nicht bekannt unbekannt ungewiss ? – |
Es sollte geprüft werden, ob eine grobe Angabe wie etwa 3. Jahrhundert oder sogar nur 3. Jahrhundert oder 4. Jahrhundert möglich ist. Falls nicht: Feld leer lassen. | |
die folgenden Formen sollen bis zur noch ausstehenden endgültigen Entscheidung toleriert werden | ||
333/32 v. Chr. | 333/332 v. Chr. | ein bekanntes Jahr eines anderen Kalenders (griechisch/islamisch/iranisch/usw.), welches durch zwei aufeinanderfolgende julianische oder gregorianische Jahre – durch / getrennt – wiedergegeben wird; nicht gemeint ist: 333 v. Chr. oder 332 v. Chr.; neben dem / darf kein Leerzeichen stehen |
1332/33 | 1332/1333 | |
um 335/325 v. Chr. | (kleines) Intervall um die angegebene Zeitspanne; bitte ausschließlich nach um verwenden, für andere Fälle ist zwischen richtig; neben dem / darf kein Leerzeichen stehen | |
um 1870/80 | um 1870/1880 |
In vielen Ländern – so in Russland bis zum Vorlage:JULGREGDATUM, aber auch in Deutschland bis zu unterschiedlichen Zeiten (oft Vorlage:JULGREGDATUM) – galt der Julianische Kalender noch längere Zeit weiter, nachdem am Vorlage:JULGREGDATUM der heute verwendete Gregorianische Kalender eingeführt wurde. In den Personendaten sollte ausschließlich das Datum nach dem Gregorianischen Kalender verwendet werden. Im Artikel selbst können beide Datumsangaben stehen. Siehe hierzu: Umrechnung zwischen Julianischem und Gregorianischem Kalender und Vorlage:JULGREGDATUM.
Verlinkungen sollte es bei diesen Feldern nicht geben.
Alternativnamen
Im Feld Alternativnamen sollten alle anderen Namen notiert werden, die auf die Person zutreffen, vor allem wirkliche Namen, wenn der Hauptname ein Pseudonym ist. Die Alternativnamen sollten ebenso wie der Hauptname angesetzt werden. In runden Klammern kann dahinter angegeben werden, um was für eine Art von Namen es sich handelt, diese Beschreibung sollte keine Abkürzung sein, also (Pseudonym) statt [Pseud.]. Mehrere Attribute werden durch ein Komma getrennt. Mehrere Namen werden mit Semikolon getrennt, welchem ein Leerzeichen folgen sollte. (Bitte nicht sämtliche Vornamen als Alternativnamen aufführen, sondern nur jene, die, wie z. B. abweichende Familiennamen und Pseudonyme, von besonderer Bedeutung sind.)
Verlinkungen sollte es bei diesem Feld nicht geben. Eine Verwendung von Vorlagen zur Fremdsprachenunterstützung sollte es nicht gehen. Die Verwendung der Vorlage:lang ist hierbei aber noch nicht abschließend geklärt, sie wird derzeit geduldet.
Kurzbeschreibung
Dieses Feld soll sehr kurz die Person beschreiben. Dabei empfiehlt sich zuerst die Nationalität, dann den Beruf und zuletzt ihre herausragende Leistung (z. B. Erfindung von XY) zu nennen.
- Beispiele
- deutscher Musiker
- US-amerikanischer Astronaut
- spanischer Politiker (XY-Partei)
- mexikanischer Politiker; Ministerpräsident 1920–1922
- deutscher Widerstandskämpfer (20. Juli 1944)
Geburtsort, Sterbeort
Während bei den anderen Datenfeldern die Verlinkung unnötig ist, sollten Geburts- und Sterbeort wie in Artikeln möglichst exakt auf einen Artikel verweisen, damit sie sich später automatisch auswerten lassen:
So nicht
- Vila Real, [[Alto Trás-os-Montes|Trás-os-Montes]], [[Portugal]]
- Geburtsort ist weder „Alto Trás-os-Montes“ noch „Portugal“
So ja
- [[Vila Real]], Trás-os-Montes, Portugal
Auch in Ordnung
- [[Vila Real]], Portugal
- [[Vila Real]], [[Alto Trás-os-Montes|Trás-os-Montes]], [[Portugal]]
Achtung: Es gibt zahlreiche Orte gleichen Namens, also nicht auf die falsche Stadt verlinken, nur weil sie ebenso heißt wie die gemeinte. Es soll auch dann verlinkt werden, falls der entsprechende Ortsartikel noch nicht existiert.
Ungenaue Angaben werden mit einem „bei“ eingeleitet, also beispielsweise „bei Berlin“.
Falls der Geburts- oder Sterbeort unsicher ist, so sollte dies einheitlich mit „unsicher:“ gekennzeichnet werden, also zum Beispiel „unsicher: Berlin“.
Zur Geschichte der Personendaten
Ohne einheitliche Formatierung bei Artikeln über Personen ist es sehr schwer, Personendaten aus den Artikeln zu extrahieren. Bei der Konvertierung für die erste Wikipedia-CD wurden halbautomatisch über 25.000 Personennamen nach den Regeln für die alphabetische Katalogisierung lemmatisiert und als allernotwendigste Teile eines Personendatensatzes Name, Kurzbeschreibung, Geburtsdatum, Geburtsort, Sterbedatum und Sterbeort ausgezeichnet.
Im Vorfeld der Erstellung der zweiten CD wurden die Personendaten in der heutigen Form eingeführt, damit die Daten zum einen nicht für jede CD erneut erstellt werden müssen und zum anderen auch für andere Projekte genutzt werden können. Die Einbindung begann im Dezember 2004. Directmedia, der Ersteller der Wikipedia-CD, unterstützte das Projekt im Januar 2005 mit einer „Tagging Party“.
Nach der deutschsprachigen Wikipedia hat Ende Dezember 2005 auch die englischsprachige Ausgabe diese Art von Metadaten eingeführt.
Eine wichtige Anwendung ist die Wikipedia-DVD, die Personendaten lassen sich aber auch anderweitig nutzen, beispielsweise zur Erstellung von Geburtstagslisten oder für eine Personensuche. Zusätzlich zu den eigentlichen Personendaten gibt es PND-Links zur Verlinkung von anderen Anbietern auf die Wikipedia und umgekehrt sowie Personenkategorien.
Arbeiten mit den Personendaten
Eintragen neuer Personendaten
Das Tool Benutzer:APPER/Personendaten und www.apper.de/pd generiert für eine Anzahl neuer Artikel selbstständig das Personendatenfeld, das dann in den Artikel eingetragen werden kann.
Extraktion der Personendaten
Die Extraktion der Personendaten und PND-Links ist entweder aus einer SQL-Datenbank oder direkt aus dem XML-Dump möglich. Weiteres siehe unter /Datenextraktion.
Download der Personendaten
Die im aktuellen Dump der deutschsprachigen Wikipedia enthaltenen Personendaten können unter tools.wikimedia.de/~sk heruntergeladen werden. Die CSV-Datei wird durch Tabulatoren getrennt und enthält neben den Personendaten auch die Kategorien und Defaultsort-Einträge. Die Datei ist über 100 MB groß (gezippt 25 MB) enthält über 200000 Zeilen.
Eine andere Datenquelle finden sich unter: http://toolserver.org/~voj/pd/staging-area/.
Abfragen und Auswerten von Personendaten
- Geburts- und Sterbelisten: tools.wikimedia.de/~voj/pd
- Wikipedia-Personensuche, einige Beispielabfragen:
- Wikipedia:WikiProjekt Vorlagenauswertung, (derzeit nur einfache Abfragen möglich) Beispiele:
Wartung der Personendaten
Die Wartung der vorhandener Personendaten erfolgt mit Hilfe einiger Skripts, deren Ausgaben und Ergebnisse hier zu finden sind:
Statistik
Datum | Artikel | PND-Nummern | Prozent PND |
---|---|---|---|
2005-09-07 | 56.258 | 14.506 | 26% |
2005-11-27 | 64.875 | 15.476 | 24% |
2005-12-11 | 67.946 | 15.697 | 23% |
2006-02-12 | 79.532 | 17.328 | 23% |
2006-03-20 | 86.830 | 18.069 | 21% |
2006-04-20 | 90.636 | 19.152 | 21% |
2006-06-05 | 95.534 | 19.977 | 21% |
2006-08-03 | 101.737 | 21.569 | 21% |
2006-11-05 | 116.015 | 24.130 | 21% |
2006-11-30 | 120.285 | 24.792 | 21% |
2007-04-02 | 145.760 | 28.189 | 19% |
2007-04-28 | 152.645 | 29.106 | 19% |
2007-05-24 | 157.561 | 30.989 | 20% |
2007-07-01 | 163.444 | 31.462 | 19% |
2007-10-09 | 178.734 | 38.830 | 22% |
2007-12-17 | 187.452 | 40.059 | 21% |
2008-02-21 | 197.446 | 43.103 | 22% |
Siehe auch
af:Wikipedia:Persoondata als:Wikipedia:Personendaten da:Wikipedia:Persondata en:Wikipedia:Persondata fr:Wikipédia:Métadonnées personne nl:Wikipedia:Persoonsgegevens sl:Wikipedija:Osebni podatki vi:Wikipedia:Dữ liệu nhân vật