Wikipedia:Botcafé
welkom in het Botcafé van Wikipedia,
een centraal punt voor overleg over alle zaken op Wikipedia die met bots te maken hebben |
Als je een bot-probleem hebt, geef dan een uitgebreide beschrijving van het probleem, alsook de volledige foutmeldingen: dit vergemakkelijkt het opsporen van de oorzaak en versnelt het zoeken naar een oplossing. |
Geautomatiseerde lijst van àlle atleten?
[bewerken | brontekst bewerken]Goedendag, vandaag kwam op mijn overleg van gebruiker @Piet.Wijker de vraag of ik bereid zou zijn om vele fouten in de categorisering van atleten te laten staan ten behoeve van deze (als ik het goed heb handmatig bijgehouden) lijst. Naast dat mij onduidelijk is wat die twee zaken met elkaar te maken hebben (maar dat kan gebruiker Piet Wijker wellicht nog uitleggen), vraag ik mij vooral af of een bot met de technische mogelijkheden die er tegenwoordig zijn, niet in staat is om die lijst bij te houden? Het lijkt me een redelijk eenvoudige alfabetische lijst van àlle atleten ter wereld. En misschien kan zo'n bot daar (of in een tweede afzonderlijke lijst) dan zelfs nog wat functionaliteit aan toevoegen? Zoals ook de nationaliteit vermelden? En dat dan sorteerbaar maken? Of aantallen per land vermelden? Graag hoor ik wat er wel of juist niet mogelijk is. Met vriendelijke groeten en alvast bedankt voor de moeite, LeeGer 12 nov 2024 23:48 (CET)
- De 1e vraag is wat Piet.Wijker hanteert als criterium voor een atleet. Er staan 5872 atleten op die pagina, allemaal met een item op Wikidata.
- 5847 hebben beroep (P106) = atleet (Q11513337) (of een subklasse daarvan)
- 5817 hebben sport (P641) = atletiek (Q542) (of een subklasse daarvan)
- 4243 hebben een World Athletics-identificatiecode (P1146)
- 5858 hebben 1 (of meer) van de bovenstaande 3
- Die overige 14 zijn allemaal vrij magere items. Dus het is goed mogelijk dat de lijst bij te houden is via Wikidata. –bdijkstra (overleg) 13 nov 2024 20:20 (CET)
- Wikidata wil nog weleens onvolledig zijn. De categorie:Atleet bevat zelf geen artikelen over atleten, dus met deepcategory:"Atleet naar nationaliteit" krijg je alle atleten. Daarvan kan een bot een alfabetische lijst maken. Sorteren op nationaliteit geeft problemen met de atleten met meerdere nationaliteiten. We zouden ze meermaals kunnen opnemen in een sorteerbare tabel, maar dat staat stom als je sorteert op naam. Een alternatief is het maken van een (extra) lijst met een kopje per nationaliteit. Zegt u het maar ... Wikiwerner (overleg) 13 nov 2024 20:53 (CET)
- Wikipedia wil ook nog weleens onvolledig zijn. Wat is je punt? Als je de basisgegevens op Wikidata invult hebben anderstaligen er ook nog wat aan. –bdijkstra (overleg) 13 nov 2024 21:12 (CET)
- Het doel is een zo volledig mogelijke lijst van atleten die hier een artikel hebben. Ze zijn allemaal gecategoriseerd, want anders hadden ze nog gestaan in de lijst van ongecategoriseerde pagina's. Het is aannemelijk dat dat sowieso op nationaliteit is. In ieder geval levert het doorzoeken van de categorie naar nationaliteit nog iets meer atleten op dan via Wikidata. Uiteraard is het prima om vervolgens Wikidata aan te vullen. Wikiwerner (overleg) 13 nov 2024 21:31 (CET)
- Zijn dubbele vermeldingen eruit te filteren? Liefst ook geautomatiseerd? LeeGer 13 nov 2024 22:37 (CET)
- Het doel is een zo volledig mogelijke lijst van atleten die hier een artikel hebben. Ze zijn allemaal gecategoriseerd, want anders hadden ze nog gestaan in de lijst van ongecategoriseerde pagina's. Het is aannemelijk dat dat sowieso op nationaliteit is. In ieder geval levert het doorzoeken van de categorie naar nationaliteit nog iets meer atleten op dan via Wikidata. Uiteraard is het prima om vervolgens Wikidata aan te vullen. Wikiwerner (overleg) 13 nov 2024 21:31 (CET)
- Wikipedia wil ook nog weleens onvolledig zijn. Wat is je punt? Als je de basisgegevens op Wikidata invult hebben anderstaligen er ook nog wat aan. –bdijkstra (overleg) 13 nov 2024 21:12 (CET)
- @Bdijkstra Even terzijde, is er een lijstje van die 14 overigen? LeeGer 13 nov 2024 22:35 (CET)
- Wikidata wil nog weleens onvolledig zijn. De categorie:Atleet bevat zelf geen artikelen over atleten, dus met deepcategory:"Atleet naar nationaliteit" krijg je alle atleten. Daarvan kan een bot een alfabetische lijst maken. Sorteren op nationaliteit geeft problemen met de atleten met meerdere nationaliteiten. We zouden ze meermaals kunnen opnemen in een sorteerbare tabel, maar dat staat stom als je sorteert op naam. Een alternatief is het maken van een (extra) lijst met een kopje per nationaliteit. Zegt u het maar ... Wikiwerner (overleg) 13 nov 2024 20:53 (CET)
- –bdijkstra (overleg) 14 nov 2024 14:05 (CET)
- Dank u LeeGer 14 nov 2024 15:30 (CET)
- Die Stein Kuiper (willekeurig eentje aangeklikt) blijkt wel gewoon zo'n identificatiecode te hebben: https://worldathletics.org/athletes/netherlands/stein-kuiper-14214118 LeeGer 14 nov 2024 15:41 (CET)
- Wikidata is uitermate geschikt voor het koppelen van identificatiecodes. Helaas zijn er nog veel die hardnekkig in hun bubbel blijven en niets willen betekenen voor ander(stalig)e wiki's. –bdijkstra (overleg) 14 nov 2024 16:49 (CET)
- Of ze weten (net als ik) niet zo goed waar dat ingevuld moet worden? Ik neem aan dat dit op Wikidata moet maar waar dan? Geen idee. Ik denk dat bijvoorbeeld @Piet.Wijker dat ook niet weet. LeeGer 14 nov 2024 17:20 (CET)
- Er moet dan op het Wikidata-item van de atleet (ik heb ze hierboven gelinkt ter uitnodiging om een kijkje te nemen) een verklaring worden toegevoegd van het type World Athletics-identificatiecode (P1146) en als waarde vul je dan het nummer in. Er zijn ook Wikidata-snelcursussen. –bdijkstra (overleg) 14 nov 2024 17:40 (CET)
- Ik heb het nu ingevuld maar het komt op mij erg onlogisch over om een profiel of identiteitsnummer dan toe te voegen niet onder "Andere sites" maar als "verklaring" en ook dat dat dan moet als P1146 in plaats van gewoon iets als "World Athletics-identificatie". LeeGer 14 nov 2024 18:45 (CET)
- Dat gedeelte van 'Wikipedia' t/m 'Andere sites' gaat exclusief over wikipagina's op WMF-projecten. En je had i.p.v. P1146 ook "World At" kunnen typen. –bdijkstra (overleg) 14 nov 2024 19:11 (CET)
- Ik heb het nu ingevuld maar het komt op mij erg onlogisch over om een profiel of identiteitsnummer dan toe te voegen niet onder "Andere sites" maar als "verklaring" en ook dat dat dan moet als P1146 in plaats van gewoon iets als "World Athletics-identificatie". LeeGer 14 nov 2024 18:45 (CET)
- Er moet dan op het Wikidata-item van de atleet (ik heb ze hierboven gelinkt ter uitnodiging om een kijkje te nemen) een verklaring worden toegevoegd van het type World Athletics-identificatiecode (P1146) en als waarde vul je dan het nummer in. Er zijn ook Wikidata-snelcursussen. –bdijkstra (overleg) 14 nov 2024 17:40 (CET)
- Of ze weten (net als ik) niet zo goed waar dat ingevuld moet worden? Ik neem aan dat dit op Wikidata moet maar waar dan? Geen idee. Ik denk dat bijvoorbeeld @Piet.Wijker dat ook niet weet. LeeGer 14 nov 2024 17:20 (CET)
- Wikidata is uitermate geschikt voor het koppelen van identificatiecodes. Helaas zijn er nog veel die hardnekkig in hun bubbel blijven en niets willen betekenen voor ander(stalig)e wiki's. –bdijkstra (overleg) 14 nov 2024 16:49 (CET)
- –bdijkstra (overleg) 14 nov 2024 14:05 (CET)
- In de data die ik gebruik voor de geboorte- en overlijdenslijsten staat 5753 personen met de aanduiding atleet (ik kan niet teruggaan naar die beroepsaanduiding vanuit subklassen). Daarmee zijn lijsten te maken. Het kan ook direct uit Wikidata, met de mogelijkheden van ListeriaBot. Voorwaarde dan is dat we de ontbrekende gegevens toevoegen (met name de 25 personen die nu niet dat beroep hebben).
- De vraagstelling van LeeGer is sturend, door aan te geven dat er sprake zou zijn van vele fouten in de categorisering. Ze voldoen niet aan het plaatje dat LeeGer heeft van hoe de categorieën in zijn ogen gebruikt zouden moeten worden. Die blik op de categorieën wordt echter niet door de complete gemeenschap gedeeld. Met vriendelijke groet, RonnieV (overleg) 14 nov 2024 13:45 (CET)
- Mijn vraagstelling is niet sturend, onze richtlijnen rondom categoriseren zijn dat wel. Zie Help:Gebruik van categorieën. Die richtlijnen zijn niet door mij opgesteld en dus niet mijn persoonlijke "plaatje". Dat beweren is framing, net als de bewering dat dat niet door de gemeenschap gedeeld zou worden. Ik volg simpelweg de richtlijnen en de werkwijze die gebruiker Piet Wijker wenst en toepast is volledig in strijd met die richtlijnen. Zie Help:Gebruik van categorieën#Subcategorieën en je leest het zelf. LeeGer 14 nov 2024 14:57 (CET)
- Hier is de lijst van atleten die wel gecategoriseerd staan, maar niet voorkomen op de portaallijst:
- Alexander Roncevic, ook (nog) niet te vinden via Wikidata
- Amaury Paquet
- Anne Knijnenburg
- Ewald Grep
- Fabien Pasquasy, ook (nog) niet te vinden via Wikidata
- Hunter McIntyre, ook (nog) niet te vinden via Wikidata
- Kyree King
- Lauren Hoffman
- Marianne Polderman-Kortekaas
- Matthieu Bonne, ook (nog) niet te vinden via Wikidata
- Megan Jacoby, ook (nog) niet te vinden via Wikidata
- Orlando van Amson, ook (nog) niet te vinden via Wikidata
- Ruth Chepng’etich
- Salma Paralluelo
- Steven Maginelle
- Vincent Kipkemoi
- Ward Leunckens
- Blijkbaar is niet iedereen op de hoogte van de telmethode van Piet en gebruikt niet iedereen Wikidata volledig. Misschien kunnen we ook zoeken welke atleten wel vindbaar zijn in Wikidata, maar niet in de categorieën staan en niet voorkomen op de portaallijst? Wikiwerner (overleg) 16 nov 2024 18:15 (CET)
- Dank voor de lijst, op een andere manier had ik die ook al verzameld voor Piet, maar ze zijn nog niet allemaal verwerkt. --Xymph (overleg) 16 nov 2024 18:21 (CET)
- In de Wikidata Query Service krijg ik telkens een time-out als ik probeer te zoeken op beroep=atleet (zelfs zonder subklassen). Met sport=atletiek kreeg ik eerder geen time-out, maar nu wel. Misschien heeft het ook te maken met dat het zaterdagavond is. Via de World Athletics-code kreeg ik wel resultaten: [1] - 4342 items met een artikel op Wikidata, dus er ontbreken er sowieso 99 op de portaallijst. –bdijkstra (overleg) 16 nov 2024 19:37 (CET)