Naar inhoud springen

Wikipedia:Botcafé

Onderwerp toevoegen
Uit Wikipedia, de vrije encyclopedie
Laatste reactie: 29 dagen geleden door Bdijkstra in het onderwerp Geautomatiseerde lijst van àlle atleten?
WP:BC verwijst door naar deze pagina. Voor informatie over bureaucraten op dit project, zie Wikipedia:Bureaucraat.
welkom in het Botcafé van Wikipedia,

een centraal punt voor overleg over alle zaken op Wikipedia die met bots te maken hebben

Gebruik de chat!, kanaal pywikipediabot (Engels) of wikipedia-nl (Nederlands)

Als je een bot-probleem hebt, geef dan een uitgebreide beschrijving van het probleem, alsook de volledige foutmeldingen: dit vergemakkelijkt het opsporen van de oorzaak en versnelt het zoeken naar een oplossing.

Geautomatiseerde lijst van àlle atleten?

[bewerken | brontekst bewerken]

Goedendag, vandaag kwam op mijn overleg van gebruiker @Piet.Wijker de vraag of ik bereid zou zijn om vele fouten in de categorisering van atleten te laten staan ten behoeve van deze (als ik het goed heb handmatig bijgehouden) lijst. Naast dat mij onduidelijk is wat die twee zaken met elkaar te maken hebben (maar dat kan gebruiker Piet Wijker wellicht nog uitleggen), vraag ik mij vooral af of een bot met de technische mogelijkheden die er tegenwoordig zijn, niet in staat is om die lijst bij te houden? Het lijkt me een redelijk eenvoudige alfabetische lijst van àlle atleten ter wereld. En misschien kan zo'n bot daar (of in een tweede afzonderlijke lijst) dan zelfs nog wat functionaliteit aan toevoegen? Zoals ook de nationaliteit vermelden? En dat dan sorteerbaar maken? Of aantallen per land vermelden? Graag hoor ik wat er wel of juist niet mogelijk is. Met vriendelijke groeten en alvast bedankt voor de moeite, LeeGer 12 nov 2024 23:48 (CET)Reageren

De 1e vraag is wat Piet.Wijker hanteert als criterium voor een atleet. Er staan 5872 atleten op die pagina, allemaal met een item op Wikidata.
Die overige 14 zijn allemaal vrij magere items. Dus het is goed mogelijk dat de lijst bij te houden is via Wikidata. –bdijkstra (overleg) 13 nov 2024 20:20 (CET)Reageren
Wikidata wil nog weleens onvolledig zijn. De categorie:Atleet bevat zelf geen artikelen over atleten, dus met deepcategory:"Atleet naar nationaliteit" krijg je alle atleten. Daarvan kan een bot een alfabetische lijst maken. Sorteren op nationaliteit geeft problemen met de atleten met meerdere nationaliteiten. We zouden ze meermaals kunnen opnemen in een sorteerbare tabel, maar dat staat stom als je sorteert op naam. Een alternatief is het maken van een (extra) lijst met een kopje per nationaliteit. Zegt u het maar ... Wikiwerner (overleg) 13 nov 2024 20:53 (CET)Reageren
Wikipedia wil ook nog weleens onvolledig zijn. Wat is je punt? Als je de basisgegevens op Wikidata invult hebben anderstaligen er ook nog wat aan. –bdijkstra (overleg) 13 nov 2024 21:12 (CET)Reageren
Het doel is een zo volledig mogelijke lijst van atleten die hier een artikel hebben. Ze zijn allemaal gecategoriseerd, want anders hadden ze nog gestaan in de lijst van ongecategoriseerde pagina's. Het is aannemelijk dat dat sowieso op nationaliteit is. In ieder geval levert het doorzoeken van de categorie naar nationaliteit nog iets meer atleten op dan via Wikidata. Uiteraard is het prima om vervolgens Wikidata aan te vullen. Wikiwerner (overleg) 13 nov 2024 21:31 (CET)Reageren
Zijn dubbele vermeldingen eruit te filteren? Liefst ook geautomatiseerd? LeeGer 13 nov 2024 22:37 (CET)Reageren
@Bdijkstra Even terzijde, is er een lijstje van die 14 overigen? LeeGer 13 nov 2024 22:35 (CET)Reageren
d:Q126122203 Marcel Swinnen
d:Q114452403 Michel de Maat
d:Q101798987 Tuur Bras
d:Q117674387 Alfons Van Achten
d:Q130378491 Henri Regemeutter
d:Q113363109 Robert Delannoit
d:Q110268272 Antoine Matagne
d:Q125913457 Stein Kuiper
d:Q126174604 Roger Jaspers
d:Q113407461 Remi Van Ophem
d:Q125768846 Hendrikus Jacobus Gorter
d:Q124414585 Louis Roy
d:Q130404080 Leendert van der Lugt
d:Q111609819 Fritz Delarge
bdijkstra (overleg) 14 nov 2024 14:05 (CET)Reageren
Dank u LeeGer 14 nov 2024 15:30 (CET)Reageren
Die Stein Kuiper (willekeurig eentje aangeklikt) blijkt wel gewoon zo'n identificatiecode te hebben: https://worldathletics.org/athletes/netherlands/stein-kuiper-14214118 LeeGer 14 nov 2024 15:41 (CET)Reageren
Wikidata is uitermate geschikt voor het koppelen van identificatiecodes. Helaas zijn er nog veel die hardnekkig in hun bubbel blijven en niets willen betekenen voor ander(stalig)e wiki's. –bdijkstra (overleg) 14 nov 2024 16:49 (CET)Reageren
Of ze weten (net als ik) niet zo goed waar dat ingevuld moet worden? Ik neem aan dat dit op Wikidata moet maar waar dan? Geen idee. Ik denk dat bijvoorbeeld @Piet.Wijker dat ook niet weet. LeeGer 14 nov 2024 17:20 (CET)Reageren
Er moet dan op het Wikidata-item van de atleet (ik heb ze hierboven gelinkt ter uitnodiging om een kijkje te nemen) een verklaring worden toegevoegd van het type World Athletics-identificatiecode (P1146) en als waarde vul je dan het nummer in. Er zijn ook Wikidata-snelcursussen. –bdijkstra (overleg) 14 nov 2024 17:40 (CET)Reageren
Ik heb het nu ingevuld maar het komt op mij erg onlogisch over om een profiel of identiteitsnummer dan toe te voegen niet onder "Andere sites" maar als "verklaring" en ook dat dat dan moet als P1146 in plaats van gewoon iets als "World Athletics-identificatie". LeeGer 14 nov 2024 18:45 (CET)Reageren
Dat gedeelte van 'Wikipedia' t/m 'Andere sites' gaat exclusief over wikipagina's op WMF-projecten. En je had i.p.v. P1146 ook "World At" kunnen typen. –bdijkstra (overleg) 14 nov 2024 19:11 (CET)Reageren
In de data die ik gebruik voor de geboorte- en overlijdenslijsten staat 5753 personen met de aanduiding atleet (ik kan niet teruggaan naar die beroepsaanduiding vanuit subklassen). Daarmee zijn lijsten te maken. Het kan ook direct uit Wikidata, met de mogelijkheden van ListeriaBot. Voorwaarde dan is dat we de ontbrekende gegevens toevoegen (met name de 25 personen die nu niet dat beroep hebben).
De vraagstelling van LeeGer is sturend, door aan te geven dat er sprake zou zijn van vele fouten in de categorisering. Ze voldoen niet aan het plaatje dat LeeGer heeft van hoe de categorieën in zijn ogen gebruikt zouden moeten worden. Die blik op de categorieën wordt echter niet door de complete gemeenschap gedeeld. Met vriendelijke groet, RonnieV (overleg) 14 nov 2024 13:45 (CET)Reageren
Mijn vraagstelling is niet sturend, onze richtlijnen rondom categoriseren zijn dat wel. Zie Help:Gebruik van categorieën. Die richtlijnen zijn niet door mij opgesteld en dus niet mijn persoonlijke "plaatje". Dat beweren is framing, net als de bewering dat dat niet door de gemeenschap gedeeld zou worden. Ik volg simpelweg de richtlijnen en de werkwijze die gebruiker Piet Wijker wenst en toepast is volledig in strijd met die richtlijnen. Zie Help:Gebruik van categorieën#Subcategorieën en je leest het zelf. LeeGer 14 nov 2024 14:57 (CET)Reageren
Hier is de lijst van atleten die wel gecategoriseerd staan, maar niet voorkomen op de portaallijst:
Blijkbaar is niet iedereen op de hoogte van de telmethode van Piet en gebruikt niet iedereen Wikidata volledig. Misschien kunnen we ook zoeken welke atleten wel vindbaar zijn in Wikidata, maar niet in de categorieën staan en niet voorkomen op de portaallijst? Wikiwerner (overleg) 16 nov 2024 18:15 (CET)Reageren
Dank voor de lijst, op een andere manier had ik die ook al verzameld voor Piet, maar ze zijn nog niet allemaal verwerkt. --Xymph (overleg) 16 nov 2024 18:21 (CET)Reageren
In de Wikidata Query Service krijg ik telkens een time-out als ik probeer te zoeken op beroep=atleet (zelfs zonder subklassen). Met sport=atletiek kreeg ik eerder geen time-out, maar nu wel. Misschien heeft het ook te maken met dat het zaterdagavond is. Via de World Athletics-code kreeg ik wel resultaten: [1] - 4342 items met een artikel op Wikidata, dus er ontbreken er sowieso 99 op de portaallijst. –bdijkstra (overleg) 16 nov 2024 19:37 (CET)Reageren