Wikipediadiskussion:Projekt alla platser-städning
Avståndet till huvudstaden i stora länder, särskilt Kanada
[redigera wikitext]Lsjbots formulering om avståndet till huvudstaden har diskuterats lite, men har ofta blivit kvar vid städningarna. För Kina och Australien har den ändrats med bot till avståndet till provinsens/delstatens huvudstad. Något liknande för Kanada föreslogs 2019 men blev aldrig genomfört då. Jag skulle vilja ta upp den frågan igen. Det finns några saker som gör uppgiften lite svårare än för Australien och Kina:
- I hälften av provinserna är en annan stad större än huvudstaden, i några fall avsevärt större. Ottawa är varken provinshuvudstad eller provinsens största stad, men är närmaste storstad för ett område i östra Ontario och västra Quebec.
- Språkförhållandena påverkar också vilken stad som ses som "närmast" av lokalbefolkningen (för länge sen läste jag om en studie från 60-talet där detta hade kvantifierats utifrån antalet telefonsamtal mellan olika orter mellan Ottawa och Montreal).
- Territorierna och andra nordliga områden är närmast väglöst land, där det spelar stor roll vilka få vägar, järnvägar och flyglinjer som finns. Som F.d. 82.212.68.183 påpekade i den gamla diskussionen är territoriehuvudstäderna inte heller särskilt stora och deras lägen inte särskilt kända, så de är inte så användbara för orientering.
- Många artiklar har redan bearbetats av människohand i större eller mindre utsträckning. Det vore i många fall ändå önskvärt att robotjustera avståndsangivelserna men jag kan tänka mig att det blir knepigare och mer riskabelt att ta hand om specialfall.
Utifrån detta föreslår jag följande "referensstäder" som en utgångspunkt för diskussion, den slutliga listan kan bli annorlunda:
- Vancouver Island: "provinshuvudstaden Victoria"
- British Columbias fastland (och närliggande mindre öar): "provinsens största stad Vancouver"
- Alberta: "provinshuvudstaden Edmonton" (Calgary är bara något större och det är inte mödan värt att avgöra var gränsen ska dras)
- Saskatchewan: "provinshuvudstaden Regina" (samma som med Alberta för Saskatoon)
- Manitoba: "provinshuvudstaden Winnipeg"
- Ontario utom Eastern Ontario enligt någon definition: "provinshuvudstaden Toronto"
- Eastern Ontario och Outaouais: "huvudstaden Ottawa", dvs ingen åtgärd
- Côte-Nord, Saguenay–Lac-Saint-Jean, Gaspésie–Îles-de-la-Madeleine, Bas-Saint-Laurent, Chaudière-Appalaches, Capitale-Nationale: "provinshuvudstaden Québec"
- Montréal (region), Laval: "Montréals centrum" (se nedan)
- Resten av Québec: "provinsens största stad Montréal" (jfr [1][2] för Nord-du-Québec, Abitibi-Témiscamingue ligger visserligen "bortom" Outaouais men kommunikationsstråken är mer inriktade på Montreal än Ottawa)
- New Brunswick: "provinshuvudstaden Fredericton" (visserligen bara tredje störst men mest centralt belägen och ingen stad är särskilt stor)
- Prince Edward Island: "provinshuvudstaden Charlottetown"
- Nova Scotia: "provinshuvudstaden Halifax"
- Newfoundland och Labrador: "provinshuvudstaden St. John's"
- Territorierna: ingen åtgärd tills vidare
Likt för regionerna Montreal och Laval bör "s centrum" läggas till även för andra områden som ligger mindre än säg 50 km från den punkt som används för att representera staden. Det skulle kanske kunna snävas in för Fredericton, Charlottetown och St. John's, men i de andra fallen är det mycket sannolikt att stadsgränsen eller tätbebyggelsens utkant ligger betydligt närmare än stadens centrum (se t ex Pontiac som ur kommunal synvinkel gränsar till Ottawa).
I samma veva skulle "i den xxx delen av landet" kunna bearbetas eller strykas helt. I humangeografin finns knappast "södra Kanada" utan bara områden som är lite mindre nordliga än de andra. Den demografiska mittpunkten är vad jag vet inte officiellt fastställd men jag gjorde en överslagsräkning och kom fram till att de nord-sydliga och öst-västliga 50-percentilerna möts någonstans norr om Toronto och väster om Montreal. F.d. 82.212.68.183 föreslog att provinserna och territorierna är tillräckligt få för att i sig ange del av landet, och jag är böjd att hålla med. Möjligtvis skulle man kunna ange del av provins istället men jag tror inte att det är värt besväret.
@Taxelson: Har du möjligtvis kvar botkoden?
Vilka andra länder bör bearbetas på liknande vis? Brasilien? Kongo-Kinshasa? //Essin (diskussion) 30 november 2024 kl. 16.02 (CET)
- @Essin: Botkod till de projekt jag körde då finns nog mestadels publicerat med länkar från min användarsida, men att försöka få igång det igen känns som ett alltför stort projekt för mig. Dokumentationen är nog tyvärr också väl fragmentarisk. Jag körde php-skripten lokalt under XAMPP (Windowsdator), och ställde in väldigt lång exekveringstid (flera timmar). Jag vet att principen var att scriptet utgick från en lista med de artiklar som skulle gås igenom, sedan kollades om de uppfyllde vissa kriterier, bl.a ej mänskligt redigerade, och sedan sparades en uppdaterad artikelversion av koden lokalt på datorn för de artiklar som kunde bearbetas (delmängd av dem i listan). Dessa filer kunde sedan via något annat script (ej PHP) kopieras så att det blev åtkomliga för AWB som laddade upp filen (en del tecken som är tillåtna i WP-namn men inte i Windows behövde ges temporära namn i Windows-mappen). Man fick hålla tummarna för att ingen uppdaterade i mellantiden, då historikkollen då hade hunnit bli några timmar gammal. Taxelson (diskussion) 30 november 2024 kl. 17.38 (CET)
- Tack ändå! Det är väl Användare:Taxelson/AustralienPuts.php som är kärnan i arbetet? Någon som är mer slängd i programmering än jag kanske kan utgå från den för en ny botkod. //Essin (diskussion) 30 november 2024 kl. 19.09 (CET)
"Någonstans norr om Toronto och väster om Montreal" stämmer bra med det svar jag fick när jag frågade ChatGPT om Kanadas demografiska centrum, nämligen i närheten av Marmora and Lake(en):
Jag gjorde först ett försök att med hjälp av uppgifterna som finns i Wikidata om folkmängd (P1082) och geografiska koordinater (P625) för de tio objekt som är instans av (P31) provins i Kanada (Q11828004) samt för Norra Kanada (Q764146) få en grov uppskattning av Kanadas demografiska centrum. Det hamnade också i Ontario, men i västra delen och betydligt längre norrut, någon halvmil norr om Otoskwin Lake(ceb) "in the middle of nowhere".
SPARQL-fråga |
---|
#defaultView:Map
#title: Kanadas demografiska centrum som en viktat medelvärde av de 10 provinserna + Norra Kanadas koordinater med respektive provins folkmängd som vikter
SELECT ?coord ?svlabel ?folkm ?rgb ?layer WHERE {
{
{ ?item wdt:P31 wd:Q11828004. }
UNION
{ ?item wdt:P361 wd:Q16. }
?item wdt:P625 ?coord;
rdfs:label ?svlabel. FILTER((LANG(?svlabel)) = "sv")
?item p:P1082 ?p1082stm.
?p1082stm ps:P1082 ?folkm.
OPTIONAL { ?p1082stm pq:P585 ?p585. } FILTER(((YEAR(?p585)) = 2021 ) || (!(BOUND(?p585))))
BIND('0000FF' AS ?rgb) BIND('Kanadas provinser + Norra Kanada' AS ?layer)
}
UNION
{
SELECT ?rgb ?layer (STRDT(CONCAT("Point(", STR((SUM(?p1082 * ?long)) / (SUM(?p1082))), " ", STR((SUM(?p1082 * ?lat)) / (SUM(?p1082))), ")"), geo:wktLiteral) AS ?coord) (SUM(?p1082) AS ?folkm) WHERE {
{ ?item wdt:P31 wd:Q11828004. }
UNION
{ ?item wdt:P361 wd:Q16. }
?item (p:P625/psv:P625) ?p625node.
?p625node wikibase:geoLatitude ?lat; wikibase:geoLongitude ?long.
?item p:P1082 ?p1082stm .
?p1082stm ps:P1082 ?p1082 .
OPTIONAL { ?p1082stm pq:P585 ?p585. } FILTER((YEAR(?p585)) = 2021 || (!(BOUND(?p585))) )
BIND('FF0000' AS ?rgb) BIND('Demografiskt center (grovt beräknat)' AS ?layer)
}
GROUP BY ?layer ?rgb
}
UNION
{
SELECT ?rgb ?layer ?coord {
wd:Q4864807 wdt:P625 ?coord .
BIND('006600' AS ?rgb) BIND('Marmora and Lake (från ChatGPT)' AS ?layer)
}
}
}
|
På kartan som visas är de tio provinserna och Norra Kanada markerade med blå prickar och det framräknade demografiska centret markerat med en röd prick. Marmora and Lake (centret enligt ChatGPT) är markerat med en grön prick. Klicka på en prick för att se namnet på provinsen och den folkmängd som använts i beräkningen. Det ser ut som om Kanadas befolkning är koncentrerad till gränstrakterna mot USA i sydost, vilket framgår tydligt av den här bilden. Det är ändå lite förvånande att British Columbia och Alberta med sammanlagt mer än 9 miljoner invånare inte gör att demograficentrum hamnar längre västerut. Det skulle kanske gå att plocka fram en bättre uppskattning med hjälp av Wikidata om motsvarande beräkning gjordes för alla Kanadas "kommuner" (eller "census areas"?) i stället för "provinserna", men jag vet inte vilka typ av objekt som man då ska inkludera och inte heller om det finns folkmängd (P1082) och geografiska koordinater (P625) i Wikidata för alla (icke upphörda) "kommuner". --Larske (diskussion) 30 november 2024 kl. 19.58 (CET)
- Demografisk mittpunkt: jag är inte säker på att jag förstår begreppet, men är det möjligen skärningspunkten mellan en östvästlig och en nordsydlig median-värdeslinjer? Då spelar avståndet ingen roll. Jag tänkte dock spontant "demografisk tyngdpunkt" där jag tänkte mig att "momentarmens längd" skulle ha betydelse, som i fysikalisk tyngdpunktsberäkning, men ett sådant värde vore betydligt krångligare att beräkna, så det är kanske bäst att låta bli (wp:OR?) för den här tillämpningen i alla fall! Taxelson (diskussion) 30 november 2024 kl. 20.13 (CET)
- Precis. Det hade varit intressant att veta var den verkliga tyngdpunkten ligger (men så icke-trivialt att det nog inte bör användas i artiklarna) men som en första approximation räknade jag ut var medianerna möttes (för ganska länge sedan, jag minns inte exakt vad jag kom fram till då men det var i samma område som Larske). //Essin (diskussion) 1 december 2024 kl. 11.57 (CET)
Jag tycker den där listan ser rimlig ut för ett robotprojekt. Att få bort avstånd till Ottawa tror jag skulle vara en förbättring i nästan alla artiklar, och det är i alla fall inte någon försämring. Informationen säger sällan något relevant i de enskilda artiklarna.
Även "xxx delen av landet" kan vara bra att ta bort helt. Men det bör inte ersättas med "del av provinsen". I alla fall inte utan en bra definition på vad som är södra, östra, osv i de olika provinserna, för att undvika liknande problem som för hela landet när befolkningen mest finns i södra delarna av många provinser.
Vid manuell städning eller utökning kan man anpassa ännu mer till vad som är relevant för varje enskild plats. När jag städat i Kanada har jag nog tagit bort både avstånd till huvudstaden och i vilket väderstreck platsen ligger i landet. Ibland har jag ersatt det med något mer relevant för platsen: "i stadens centrum" (en stadspark), "i Montréals storstadsområde" (en kommun), "på västra sidan av Vancouverön" (ett berg). Andra gånger har jag tyckt det räcker med provinsen, eftersom det är mer exakt än både del av landet och avstånd till huvudstaden. Det förutsätter att läsaren har lite koll på provinserna, men det finns ju också en positionskarta i infoboxen. /F.d. 82.212.68.183 (diskussion) 30 november 2024 kl. 20.47 (CET)
- Först vill jag säga att jag är mycket tacksam för att detta arbete har gjorts för Kina. Nu när jag börjat en rejäl botstädning av Kina, så märker jag nyttan av att vi ändrat från avstånd från Peking till avstånd från provinshuvudstaden. Därför är jag glad att någon tar tag i det för Kanada. Vad gäller "xxx delen av landet" föreslår jag att det tas bort och ersätts av "i västra/centrala/östra Kanada" beroende på provins. Det är irrelevant att använda nord/syd i Kanada.
- Nu: Protection Island är en ö i Kanada. Den ligger i Regional District of Nanaimo och provinsen British Columbia, i den sydvästra delen av landet, 3 600 km väster om huvudstaden Ottawa.
- Förslag: Protection Island är en ö i västra Kanada. Den ligger i Regional District of Nanaimo och provinsen British Columbia, 90 km norr om provinshuvudstaden Victoria. Kitayama (diskussion) 1 december 2024 kl. 09.14 (CET)
- Ser nu att det finns regioner: Västra Kanada, Norra Kanada och Östra Kanada. Då bör vi användas av samma terminologi i botartiklarna. Kitayama (diskussion) 1 december 2024 kl. 09.22 (CET)
- Ja, "i den östra delen av landet" är i allmänhet en väldigt pratig formulering. Åtminstone för humangeografin (som i Kanada i stort sett uteslutande regleras av provinslagstiftning), men kanske även för naturgeografi, tycker jag att det är rimligt att lyfta fram provinsen lite mer i inledningen. När jag har botstädat Quebecs orter och kommuner har jag oftast använt "en kommun i provinsen Québec i Kanada" men "en kommun i Québec i Kanada" och "en kommun i den kanadensiska provinsen Québec" har också använts av mig och andra. Jag föreslår följande utformning av exemplet:
- Protection Island är en ö i provinsen British Columbia i västra Kanada. Den ligger i Regional District of Nanaimo, 90 km norr om provinshuvudstaden Victoria.
- Jag är inte säker på om "västra" bör vara länkat. Det är det mest kompakta sättet att få med både den nödvändiga länken Kanada och den kanske mindre nödvändiga Västra Kanada, men är kanske lätt att missförstå. //Essin (diskussion) 1 december 2024 kl. 12.18 (CET)
- Bra förslag. Vi kan nog skippa länk på ”västra”, med litet v är det ju inte namnet på en region utan ”bara” ett väderstreck. Kitayama (diskussion) 1 december 2024 kl. 12.39 (CET)
- Jag tycker också förslaget är bra. Provinsen bör stå i första meningen. Speciellt för kommuner, provinsparker och annat som beslutas på provinsnivå, men det blir bra även för andra typer av platser. Om väderstreck behövs så funkar östra, västra och norra Kanada enligt indelningen i 3 regioner. Det är en klar förbättring mot roboten som lägger delar av BC i södra och mycket av Manitoba i sydöstra delarna av landet. Ser egentligen inte att det är problem att länka "bara ett väderstreck" till regionnamnet vi baserat det på. Men är inte emot att skippa dem, det mesta är ganska självförklarande (att BC och Alberta är västra, territoriena norra och atlantprovinserna östra Kanada). Avstånd till provinshuvudstad/större stad kanske bör utelämnas för vattendrag och andra platser med större utsträckning. F.d. 82.212.68.183 (diskussion) 1 december 2024 kl. 21.18 (CET)
- Det verkar som att vi är överens om vad som bör göras, återstår att komma på hur det ska göras... Jag funderar på om det skulle gå att sno lite kod från en:Wikipedia:AutoWikiBrowser/Custom_Modules#Read_template_parameters_from_Infobox_and_write_to_text_file för att läsa in latitud och longitud från geoboxen, sen beräkna avståndet till den stad som den aktuella körningen gäller med en variant av Taxelsons kod, och slutligen lägga in output på rätt plats i texten... //Essin (diskussion) 4 december 2024 kl. 23.08 (CET)
- Håller förresten med om att vattendrag inte bör ha avstånd angivet alls. Att vattendrag "ligger i" någon administrativ enhet tycker jag låter konstigt, så jag brukar ändra det till "rinner genom". Det kanske kan ändras i en botkörning tillsammans med borttagning av avstånden? //Essin (diskussion) 4 december 2024 kl. 23.17 (CET)
- Det verkar som att vi är överens om vad som bör göras, återstår att komma på hur det ska göras... Jag funderar på om det skulle gå att sno lite kod från en:Wikipedia:AutoWikiBrowser/Custom_Modules#Read_template_parameters_from_Infobox_and_write_to_text_file för att läsa in latitud och longitud från geoboxen, sen beräkna avståndet till den stad som den aktuella körningen gäller med en variant av Taxelsons kod, och slutligen lägga in output på rätt plats i texten... //Essin (diskussion) 4 december 2024 kl. 23.08 (CET)
- Jag tycker också förslaget är bra. Provinsen bör stå i första meningen. Speciellt för kommuner, provinsparker och annat som beslutas på provinsnivå, men det blir bra även för andra typer av platser. Om väderstreck behövs så funkar östra, västra och norra Kanada enligt indelningen i 3 regioner. Det är en klar förbättring mot roboten som lägger delar av BC i södra och mycket av Manitoba i sydöstra delarna av landet. Ser egentligen inte att det är problem att länka "bara ett väderstreck" till regionnamnet vi baserat det på. Men är inte emot att skippa dem, det mesta är ganska självförklarande (att BC och Alberta är västra, territoriena norra och atlantprovinserna östra Kanada). Avstånd till provinshuvudstad/större stad kanske bör utelämnas för vattendrag och andra platser med större utsträckning. F.d. 82.212.68.183 (diskussion) 1 december 2024 kl. 21.18 (CET)
- Bra förslag. Vi kan nog skippa länk på ”västra”, med litet v är det ju inte namnet på en region utan ”bara” ett väderstreck. Kitayama (diskussion) 1 december 2024 kl. 12.39 (CET)
- Ser nu att det finns regioner: Västra Kanada, Norra Kanada och Östra Kanada. Då bör vi användas av samma terminologi i botartiklarna. Kitayama (diskussion) 1 december 2024 kl. 09.22 (CET)