Wikipedia:Potturinn
![]() |
Potturinn er almennur umræðuvettvangur um hina íslensku Wikipedíu.
Hægt er að ræða greinar á spjallsíðum þeirra, þú getur líka beðið um aðstoð á þinni eigin notanda-spjallsíðu. |
Hagstofan eða Þjóðskrá
[breyta frumkóða]Hvort er fylgt tölum Hagstofunnar eða Þjóðskrár? Sem dæmi vísar greinin Íbúar á Íslandi í bæði. Á ekki frekar að fara eftir Hagstofunni? Þetta stendur á síðunni þeirra. Fyxi (spjall) 11. desember 2024 kl. 02:39 (UTC)
- Hagstofutölurnar eru ótvírætt réttari. Þjóðskrártölurnar eru frekar gagnslausar þegar kemur að heildarfjölda en gefa kannski fyrr vísbendingu um breytingar. Bjarki (spjall) 11. desember 2024 kl. 11:26 (UTC)
- Gott að vita. Takk! --Fyxi (spjall) 12. desember 2024 kl. 09:44 (UTC)
Betrumbætt forsíða
[breyta frumkóða]Hef verið að fikta í forsíðunni örlítið. Ég tel mig hafa lagað og betrumbætt ýmislegt.
Endilega komið með uppástungur og athugasemdir. Logiston (spjall) 23. desember 2024 kl. 00:24 (UTC)
- Þannig að meginbreytingin er að styðja farsíma betur með flex. Virðist vera í lagi í grunnatriðum. Snævar (spjall) 23. desember 2024 kl. 00:47 (UTC)
- Er ég þá með leyfi möppudýra til að breyta og legga til breytinga? Logiston (spjall) 24. desember 2024 kl. 13:11 (UTC)
- Þið þurfið s.s. að afrita allan kóðann frá Notandi:Logiston/forsíða. Ég get breytt styles.css síðunni. Logiston (spjall) 24. desember 2024 kl. 13:14 (UTC)
- Gefum fólki tíma til kl 12 á laugardaginn 28. des til að taka eftir þessu. Það eru margir uppteknir núna, af augljósum ástæðum. Ef færri en tveir eru á móti getur þú þá breytt Snið:Forsíða/styles.css, Snið:Systurverkefni og fært css síðu þess (Snið:SysturverkefniB/styles.css). Ég gæti fært verndunarstigið á Forsíðunni niður um eitt stig í einn klukkutíma svo breytingin þín komist í gegn. Snævar (spjall) 24. desember 2024 kl. 14:44 (UTC)
- Nokkrir punktar um breytingar síðan síðast:
- Takkarnir ættu að vera minna áberandi, þ.e. "mw-ui-quiet". Þeir eru hannaðir til að vera notaðir fyrir aðgerðir innan sömu síðu (sjá https://doc.wikimedia.org/codex/main/components/demos/button.html) og eru notaðir þannig á hinum síðunum sem nota þá Wikipedia:Tillögur_að_gæðagreinum, Wikipedia:Tillögur_að_úrvalsgreinum og Snið:Potturinn.
- Við erum með dökkt þema á Wikipediu og í því þema er nýji hausinn hvítur með allt annað á síðunni svart (sjá mynd, gamla fyrir ofan, nýja fyrir neðan). Í þessu þema er textinn í hausnum líka ljós og því ólesanlegur. Hægt er að laga þetta með því að nota dökka stílinn úr Snið:Forsíða/Haus/styles.css, frá línu 128 niðrúr.
- Ekki viss um að nýju tenglarnir neðst í sumum kassana ættu að vera þar. Það eru tvö atriði hérna. Fyrsta atriðið eru fyrri mánuðir undir grein mánaðarins, sem er með mun minni umferð en greinarnar: https://pageviews.wmcloud.org/?project=is.wikipedia.org&platform=all-access&agent=user&redirects=0&range=last-month&pages=Mex%C3%ADk%C3%B3%7C%C3%9Eykjustustr%C3%AD%C3%B0i%C3%B0%7CSpaugstofan%7CAleksandra_Kollontaj%7CWikipedia:Grein_m%C3%A1na%C3%B0arins/2024
- Seinna atriðið eru dagetningatenglarnir, undir atburðir dagsins. Dagsetningarnar sem ég skoðaði eru með mjög litla umferð og fá meiri umferð þegar þeir eru á forsíðunni, en halda því ekki lengi. Það er ólíklegt að fólk noti dagsetningartengil í nokkra daga og því ætti bara að vera tengill á daginn í dag. https://pageviews.wmcloud.org/?project=is.wikipedia.org&platform=all-access&agent=user&redirects=0&start=2024-11-13&end=2024-11-30&pages=15._n%C3%B3vember%7C16._n%C3%B3vember%7C17._n%C3%B3vember%7C18._n%C3%B3vember
- Snævar (spjall) 26. desember 2024 kl. 03:52 (UTC)
- Gott og vel.
- Hef afgreitt hluta af þessu. Skil reyndar ekki tvennt. Annars vegar þetta með takkana og hins vegar þetta með dagatenglana.
- Það sést stóraukning á umferð til dagasíðnanna þegar tengillinn til þeirra er á forsíðunni. Um er að ræða 40+ PW þann dag, sem er meira en grein mánaðarins á góðum degi. Það má eyða þessu mín vegna en það mætti prufa þetta í 2-3 daga og sjá PW-niðurstöðurnar úr því.
- Hvort áttu við Snið:Forsíða/Tengill eða Snið:Forsíða/Takki? Annars var það meiningin að hafa takkana áberandi (einkum þann undir grein mánaðarins sem segir lesa ;) ) til þess að beina umferð þangað og skapa eftirspurn. En ef þér líst ekki á þá, þá væri sennilega einfaldara að fjarlægja þá og setja gömlu tenglana í staðinn.
- Síðan ætlaði ég að spyrja hvað þér findist um tengilinn í fyrirsögninni "Fréttum". Á nánast öllum öðrum Wikipedium eru til gáttir fyrir fréttir en vissulega eru gáttirnar gjörsamlega óvirkar hérna. Pæling að sleppa því að hafa tengil í þessari fyrirsögn. Síðan er málið um fyrirsögnina sjálfa, hvort ætti hún að vera "Fréttir" eða "Í fréttum"? Logiston (spjall) 26. desember 2024 kl. 20:31 (UTC)
- Ætla leyfa þér að breyta forsíðuhaus og snið:systurverkefni eins og ég sagði.
- Sáttur við takkana eins og þeir eru, var aðalega bara að búa til einhvert samningsatriði sem ég gæti gripið til ef hin atriðin væru ekki löguð. Það er að segja, ef að hin atriðin hefðu ekki verið löguð þá hefði ég sagt að næturstillingin skipti meira máli og notað takkana sem skiptimynt í samningum.
- Fyrst að þú nefnir Gátt:Fréttir þá gætum við tengt í Wikipedia:Í fréttum.... Nokkuð viss um að atriði þaðan enda á dagsetningagreinum (t.d. 28. desember og 2024), sem er eflaust ástæðan fyrir tenglinum á 2024.
- Nokkuð viss um að "Í fréttum" sé bara eldri talmáti á "Fréttir". Snævar (spjall) 28. desember 2024 kl. 15:01 (UTC)
- Gerði minniháttar lagfæringu á lesa-takkanum sem þarf að færa frá Notandi:Logiston/forsíða yfir á forsíðuna please <3 Logiston (spjall) 1. janúar 2025 kl. 17:02 (UTC)
- Í staðinn fyrir að búa til nýtt redirect í hverjum mánuði, væri ekki betra að nota strengja módulinn eða ehv slíkt? Sem dæmi gæti þetta virkað (eins og þetta er uppsett núna) til að sækja heitið á núverandi grein mánaðarins.
{{#invoke:Strengur|match|s= {{Wikipedia:Grein mánaðarins/{{CURRENTMONTH}}, {{CURRENTYEAR}}}} |pattern= %[%[(.-)%]%] }}
→ Nasistakveðja- Annað líka er að það vantar tengil á fyrri mánuði.
- Fyxi (spjall) 4. janúar 2025 kl. 02:20 (UTC)
- Skil ekki alveg. Hvar kemur þessi strengja módull inn?
- Held að þú sért að reyna að gera h2 fyrirsögnina á Wikipedia:Grein mánaðarins/01, 2025 sjálfvirka. Snævar (spjall) 4. janúar 2025 kl. 03:15 (UTC)
- Greinin er hard coded á forsíðunni eins og er (* {{Forsíða/Takki | Grikkland hið forna | Lesa }}) (lína 15). Þessi strengja module myndi þá koma inn í takkann svo að það sé sjálfvirkt.
- Myndi þá vera:
- {{Forsíða/Takki | {{#invoke:Strengur|match|s= {{Wikipedia:Grein mánaðarins/{{CURRENTMONTH}}, {{CURRENTYEAR}}}} |pattern= %[%[(.-)%]%] }} | Lesa }}
↓ - En þetta er bara hugmynd.
- Fyxi (spjall) 4. janúar 2025 kl. 03:29 (UTC)
- Mig grunar að þetta sé miklu betra. Sparar okkur óþarfa vinnu sem er verðmætt. Og losnum líka við redirect-quoteið efst á síðunni þegar ýtt er á takkann.
- Mín breyting er ekkert heilög. Hún átti bara að laga þetta vandamál og var í rauninni hugsuð sem tímabundin lausn. Logiston (spjall) 4. janúar 2025 kl. 12:38 (UTC)
- Gerði minniháttar lagfæringu á lesa-takkanum sem þarf að færa frá Notandi:Logiston/forsíða yfir á forsíðuna please <3 Logiston (spjall) 1. janúar 2025 kl. 17:02 (UTC)
- Nokkrir punktar um breytingar síðan síðast:
- Gefum fólki tíma til kl 12 á laugardaginn 28. des til að taka eftir þessu. Það eru margir uppteknir núna, af augljósum ástæðum. Ef færri en tveir eru á móti getur þú þá breytt Snið:Forsíða/styles.css, Snið:Systurverkefni og fært css síðu þess (Snið:SysturverkefniB/styles.css). Ég gæti fært verndunarstigið á Forsíðunni niður um eitt stig í einn klukkutíma svo breytingin þín komist í gegn. Snævar (spjall) 24. desember 2024 kl. 14:44 (UTC)
- Þið þurfið s.s. að afrita allan kóðann frá Notandi:Logiston/forsíða. Ég get breytt styles.css síðunni. Logiston (spjall) 24. desember 2024 kl. 13:14 (UTC)
- Er ég þá með leyfi möppudýra til að breyta og legga til breytinga? Logiston (spjall) 24. desember 2024 kl. 13:11 (UTC)
- Mjög flott :) Samt ein pæling þar sem efnisyfirlitið er horfið. Væri hægt að fá linka að „Verkefninu“ sem er í aðalvalmyndinni? Þ.e. Nýlegar breytingar, (Nýjustu greinar), Samfélagsgátt og (Potturinn) (eða þá uppfæra mobile viðmótið þar sem þeir koma ekki upp þar). Fyxi (spjall) 29. desember 2024 kl. 00:55 (UTC)
- Ef þú opnar https://is.m.wikipedia.org/w/index.php?title=Kerfissíða:MobileOptions og velur ítarlegri ham, þá færðu tengil á nýlegar breytingar, pottinn og samfélagsgátt undir hamborgaravalmyndinni (strikunum þremur hliðiná einkennismerkinu). Snævar (spjall) 29. desember 2024 kl. 07:38 (UTC)
- Ah svoleiðis, takk. Virðist bara koma þegar maður er innskráður. Fyxi (spjall) 4. janúar 2025 kl. 02:13 (UTC)
- Ef þú opnar https://is.m.wikipedia.org/w/index.php?title=Kerfissíða:MobileOptions og velur ítarlegri ham, þá færðu tengil á nýlegar breytingar, pottinn og samfélagsgátt undir hamborgaravalmyndinni (strikunum þremur hliðiná einkennismerkinu). Snævar (spjall) 29. desember 2024 kl. 07:38 (UTC)
- Mjög flott breyting. Samfélagsgáttin mætti líka við sambærilegri yfirhalningu. --Akigka (spjall) 29. desember 2024 kl. 14:27 (UTC)
Listi yfir Íslendinga með greinar á öðrum tungumálum
[breyta frumkóða]Mér dettur í hug hvort það gæti ekki verið sniðugt að halda uppi verkefnissíðu með lista af Íslendingum sem eru með greinar um sig á öðrum tungumálaútgáfum Wikipediu, en ekki enn á íslensku Wikipediu? Mér finnst það sjálfsagt markmið hjá íslensku Wikipediu að vera allavega með betri upplýsingar um Ísland og Íslendinga en hin enska, svo það væri gagnlegt sem vegvísir að greinum sem vanti sérstaklega. TKSnaevarr (spjall) 30. desember 2024 kl. 21:22 (UTC)
- Góð pæling. Það er kannski hægt að búa til einhverja fyrirspurn sem finnur sjálfvirkt greinar undir en:Category:Icelandic people sem er vantar tungumálatengil á íslensku. Bjarki (spjall) 30. desember 2024 kl. 21:31 (UTC)
- Bjó til tvo lista yfir íslendinga sem eru á ensku wikipediu en ekki þeirri íslensku: lifandi, látnir. en:Category:Biography articles needing translation from Icelandic Wikipedia er síðan listi yfir greinar sem eru taldar stærri á íslensku wikipediu en þeirri ensku. Snævar (spjall) 31. desember 2024 kl. 01:00 (UTC)
- Flott. Greinilega mikið af síðum sem hægt er að snara yfir á íslensku ef við viljum standa ensku Wikipediu framar um íslensk málefni. TKSnaevarr (spjall) 1. janúar 2025 kl. 21:52 (UTC)
Greinar um skyldmenni forseta
[breyta frumkóða]Ég setti eyðingartillögu á tvær greinar @Bjornkarateboy gerði um börn Höllu Tómasdóttur þar sem þau eru ekki sérlega þekkt fyrir neitt annað en móður sína, sem nægir að mínu mati augsýnilega ekki til að uppfylla markverðugleikaregluna. Hann benti hins vegar á að það eru til nokkrar greinar hér um börn og foreldra forseta sem hafa fengið að standa. Mér þykir vert að ræða þessar greinar líka og hvaða stefnu við viljum hafa um þær.
Nokkrar greinar (Björn Jónsson, Björn Sv. Björnsson, Þórarinn Eldjárn, Sigrún Eldjárn og Sigríður Eiríksdóttir) þarfnast vart umræðu þar sem fólkið sem fjallað er um er greinilega vel þekkt fyrir eitthvað annað en fjölskyldutengsl. En síðan eru nokkrar síður jaðartilvik:
- Þórarinn Kr. Eldjárn
- Sigrún Sigurhjartardóttir
- Grímur Kristgeirsson
- Svanhildur Ólafsdóttir Hjartar
- Jóhannes Sæmundsson
Þessar síður sýnast mér vera um fólk sem er ekki þekkt fyrir margt annað en að vera foreldrar forseta. Ég hugsa að Þórarinn og Grímur sleppi þar sem þeir gegndu opinberum störfum eða embættum, en ég er ekki viss um hin þrjú. Hvað finnst ykkur? TKSnaevarr (spjall) 7. janúar 2025 kl. 16:05 (UTC)
- Jóhannes Sæmundsson er klárlega markverður einstaklingur þar sem hann lét til sín taka í málefnum tengdum íþróttakennslu og íþróttaþjálfun með góðum árangri. Bjornkarateboy (spjall) 7. janúar 2025 kl. 16:14 (UTC)
- Svanhildur sleppur líka sem útgefinn höfundur (bréfritari). Jóhannes var talsvert þekktur sem frjálsíþróttamaður, íþróttakennari og þjálfari (m.a. fræðslufulltrúi ÍSÍ). Grímur var auðvitað vel þekktur, en aðallega sem rakari. Hann finnst mér að eigi fremur heima í kafla um fjölskyldu ÓRG en sem sérgrein. --Akigka (spjall) 7. janúar 2025 kl. 16:17 (UTC)
- En svo má líka athuga það sjónarmið að ef það er ekki augljóst hvernig hægt væri að auka við grein um viðkomandi einstakling, svo hún verði meira en ein málsgrein, þá ætti hún kannski fremur heima sem undirkafli í grein um frægari ættingja (sjá [1]) --Akigka (spjall) 7. janúar 2025 kl. 16:24 (UTC)
- Grímur Kristgeirsson var vel þekktur, þá sérstaklega fyrir vestan, löngu áður en Ólafur Ragnar varð það. Það er til nóg af efni um hann til að skrifa meira en eina málsgrein. Alvaldi (spjall) 7. janúar 2025 kl. 20:04 (UTC)
- Svanhildur er einnig vel þekkt í tengslum við veikindi sín og er Svanhildarstofa á Hælinu, setri um sögu berklanna, m.a. nefnd eftir henni. Alvaldi (spjall) 7. janúar 2025 kl. 20:27 (UTC)
- Já, eftir á að hyggja er ég sammála um að greinin um Svanhildi sleppi þar sem skrif hennar hafa verið gefin út og berklasetrið er nefnt eftir henni. Jóhannes mögulega líka, en greinin um hann þyrfti þá að gera betur grein fyrir því hver framlög hans í íþróttum voru, sem mér finnst hún ekki gera núna. Af þessum greinum finnst mér greinin um Sigrúnu síst eiga rétt á sér. Sú grein gefur ekki til kynna að hún hafi verið sérlega þekkt fyrir neitt annað en að eiga fræg börn. TKSnaevarr (spjall) 7. janúar 2025 kl. 21:14 (UTC)
- Svanhildur er einnig vel þekkt í tengslum við veikindi sín og er Svanhildarstofa á Hælinu, setri um sögu berklanna, m.a. nefnd eftir henni. Alvaldi (spjall) 7. janúar 2025 kl. 20:27 (UTC)
- Grímur Kristgeirsson var vel þekktur, þá sérstaklega fyrir vestan, löngu áður en Ólafur Ragnar varð það. Það er til nóg af efni um hann til að skrifa meira en eina málsgrein. Alvaldi (spjall) 7. janúar 2025 kl. 20:04 (UTC)
- En svo má líka athuga það sjónarmið að ef það er ekki augljóst hvernig hægt væri að auka við grein um viðkomandi einstakling, svo hún verði meira en ein málsgrein, þá ætti hún kannski fremur heima sem undirkafli í grein um frægari ættingja (sjá [1]) --Akigka (spjall) 7. janúar 2025 kl. 16:24 (UTC)
- Svanhildur sleppur líka sem útgefinn höfundur (bréfritari). Jóhannes var talsvert þekktur sem frjálsíþróttamaður, íþróttakennari og þjálfari (m.a. fræðslufulltrúi ÍSÍ). Grímur var auðvitað vel þekktur, en aðallega sem rakari. Hann finnst mér að eigi fremur heima í kafla um fjölskyldu ÓRG en sem sérgrein. --Akigka (spjall) 7. janúar 2025 kl. 16:17 (UTC)
Afstaða til vélþýðinga
[breyta frumkóða]Mig langar að stinga upp á stefnubreytingu varðandi vélþýðingar. Við höfum (oft) eytt umyrðalaust eða gert eyðingartillögur þar sem vélþýddur texti er settur inn lítt breyttur. Ástæðan er auðvitað að slíkur texti hefur hingað til verið "óforbetranlegur" og ekki þess virði að reyna að laga hann til. Þetta hefur hins vegar breyst síðustu 2 ár. Nú er vélþýddur texti frá sumum forritum oft bara bærilegur og hægt að setja inn með tiltölulega litlum lagfæringum. Það er enn augljóst þegar texti er settur inn óbreyttur frá vélþýðanda, en oft er hægt að gera hann góðan með litlum lagfæringum. Mér finnst það því ekki lengur eyðingarsök að texti sé frá vélþýðanda, heldur fremur tilefni til lagfæringar. Mér finnst við ættum því að nota hreingerningarsnið fremur en eyðingarsnið, nema vélþýðingin sé þeim mun verri. Hvað finnst ykkur? Akigka (spjall) 11. janúar 2025 kl. 19:34 (UTC)
- Góður punktur, tek það til greina. --Berserkur (spjall) 11. janúar 2025 kl. 20:31 (UTC)
- Hafnað. Líttu á rannsóknir um vélarþýðingar og þar sést mjög skýrt að vélarþýðingar eru enn slæmar. Íslenska ólíkt ensku er mun flóknari, beygingarlýsingar eru helsta dæmið hérna. Það er ekki boðlegt að koma með svona fullyrðingar án þess að fletta hlutunum upp.
- Rannsóknir á íslenskum vélarþýðingum nota oft WER - word error rate, sem felur í sér hvort rétt orð er valið, ekki hvort beygingarmyndin sé rétt eða orðið passi vel í setninguna. Þannig er vélarþýðing miðeindar samkvæmt þeim sjálfum með 20% WER, en það er ekki nóg fyrir góða íslensku. Það að taka tölur frá þeim sjálfum er líka ekki góð vísindi og talan líklega í raun mun verri. Það er ekki til rannsókn á WER á íslensku í vélarþýðingunni sem ContentTranslate notar. Ef Mói væri hérna ennþá þá myndi hann setja út á allar þessar vélarþýðingar.
- Til að skoða beygingarlýsingar, skoðaðu IceNLP og Greini. Báðir möguleikarnir geta ekki snúið setningu með orðum með greini úr ensku yfir í íslensku og aftur yfir á ensku án þess að missa úr orð.
- Hvað hreingerningasniðið varðar þá er bara fleiri og fleiri greinar sem bætast þar við og ekkert sjónmál á því að það minnki niður, hvað þá niður í núll. Meðal erlenda stofnenda síðu hefur aðeins einn náð að setja fram góða þýdda grein og það var Maxí. Hann var að læra íslensku og þrátt fyrir það tók það hann dágóðan tíma að fá þýðinguna rétta, eftir margar athugasemdir. Þær greinar sem eru helst merktar sem vélarþýðingar af mér eru eftir erlenda stofnendur sem geta ekki lagað greinarnar. Stundum hef ég bent á Wikipedia:Overview sem þeir geta ekki farið eftir heldur, þó það sé á ensku. Merkingar með hreingerningarsniði er bara merking til að slá vandamálinu á frest um ókominn tíma. Snævar (spjall) 11. janúar 2025 kl. 20:46 (UTC)
- Wikipedia er skrifuð af notendum ekki tölvuforritum. Eins og Snævar nefndi eru þessar vélþýðingar ekki nógu góðar fyrir íslensku sama hve mörg ár hafa liðið. Menn vilja skrifa og bæta greinar um áhugamál sín en ekki laga eitthvert gervigreindarsull. ChatGPT er nákvæmasta vélþýðing sem ég þekki en samt er hún langt frá því að vera fullkomin. Hún bullar ennþá stundum orðum, beygir ekki orð rétt (einkum í fleirtölu eða kyni) og notar skrýtin orðatiltæki. Einnig getur hún ekki alltaf flett up t.d. í orðabók til að leita að viðurkenndum þýðingum o.fl. Dæmigerður notandi sem er að stofna vélþýddar síður er ekki með aðgang að gögnunum sem gera henni kleift að skrifa passlega íslensku fyrir alfræðisíðu. Að leyfa vélþýðingu myndi leiða til fleiri lægri gæða síðna þar sem höfundurinn getur ekki borið ábyrgð á þýðingu hennar.
- Höfundar ættu að nýta sér vélþýðingu til þess að skrifa meira og betur, en ekki til þess að setja texta inn þegar maður er latur. Óskadddddd (spjall) 12. janúar 2025 kl. 12:36 (UTC)
- Ég er frekar efins um að það væri skynsamlegt skref. Ég hef frekar litið á það þannig að skánandi vélþýðingar eigi að verða til þess að við herðum frekar á kröfu um að greinar á íslensku Wikipediu séu á skiljanlegri íslensku frekar en að slaka á þeim. Þeir sem vilja lesa vélþýtt efni á íslensku geta nefnilega gert það með því að heimsækja WP á öðrum tungumálum og þýða efnið þar með hjálp þeirra tæknilausna sem eru í boði. Það er því óþarfi að búa sérstaklega til síður hér með hrátt vélþýddu efni, en auðvitað sjálfsagt að nota vélþýðingu sem hjálpartæki til að flýta fyrir þýðingum. Tilgangurinn með því að halda úti Wikipediu á íslensku hlýtur að vera að leyfa efnistökum og áherslum íslenskumælandi notenda að njóta sín. Svo tek ég líka undir með Snævari að það er ekki góð lausn að setja greinar á lélegri íslensku í viðhaldsflokka. Að hreinsa til eftir aðra er líklega óvinsælasta verkefnið á meðal notenda hér. Bjarki (spjall) 12. janúar 2025 kl. 16:08 (UTC)
- Takk fyrir góð svör. Vitið þið um einhver benchmarking-próf á íslenskuþýðingum frá þessum nýju þýðendum (ég á við LLM-þýðendur eins og m.is, velthyding.is, Google Translate, Gemini og ChatGPT)? Það eru auðvitað margar greinar hér með töluvert af villum, þótt þær komi ekki frá þýðingarvélum. Þetta er frekar spurning um hvernig á að merkja þær sem eru augljóslega vélþýddar. Akigka (spjall) 12. janúar 2025 kl. 17:12 (UTC)
- Hérna er samantekt á þýðingarvélum og einkunnum þeirra. Athugaðu að greynir er með hlutfall yfir rétt svör, á meðan hinar þýðingarvélarnar eru með hlutfall rangra svara. Einnig inniheldur greynir beygingar, en hinir ekki. Vegna þess setti ég inn rannsókn á beygingum greynis einnig.
- Google Translate 2018: https://docs.google.com/spreadsheets/d/1fJQLMj8O5z3Q7eKDxi1tNNrFipiEL0UDyaEF0fleZ54/edit?gid=0#gid=0 30% WER
- ContentTranslate NLLB-200: Ekki til
- Greynir (Miðeind): 66% rétt með beygingum, https://miðeind.is/is/greinar/gpt-4-fra-openai-nu-mun-betra-i-islensku-med-hjalp-mideindar
- 2011 Google Translate, Tungutorg, Apertium: https://en.ru.is/media/skjol-td/MSc_Thesis_MarthaDisBrandt.pdf Apertium 50% WER, Tungutorg 44%, GoogleTranslate 36%
- Greynir beygingar og orðflokkagreining: http://linguist.is/wp-content/uploads/2020/06/arnardottir2020neural.pdf 84
- ContentTranslate NLLB-200 og Greynir á Færeysku: https://skemman.is/bitstream/1946/46019/1/MasterThesis_Annika2023_040124.pdf NLLB-200 0,93% rétt, Greynir/GPT-4: 9,61% rétt
- Rannsóknin segir að færeyska sé þýdd út frá íslensku og að sum orð séu íslenskuð. Það er því ljóst að NLLB-200 á íslensku er betri en þessar tölur segja til um.
- Ég met þessar niðurstöður þannig að Greynir sé bestur, síðan GoogleTranslate í öðru sæti. Beygingarrannsóknin á greyni sýnir að greynir er veikari í þýðingum, en ekki beygingum. Sambærilegt skor á Greini við hinar vélarnar væri líklega á milli talnana tveggja, 75% rétt eða 25% WER, sem er betra en GoogleTranslate. Út frá færeysku NLLB-200 rannsókninni sést að NLLB-200 er verri en Greynir.
- Þýðingar með ContentTranslate á Wikipediu eru sendar aftur í þýðingarvélina til að bæta hana enn frekar. Sjá mw:Content_translation/Machine_Translation/NLLB-200#Wikimedia_Foundation’s_obligations. NLLB-200 og greynir eru gerfigreindar þýðingarvélar. Ef þú lætur þau fá gögn sem eru með minna en 20% leiðrétts texta, eins og með notandann JetLowly, þá lendir þú í en:Garbage in, garbage out aðstæðum. Þýðingarvélin fær skilaboð um að þýðingin sín sé að nær öllu leyti rétt og byggir aðrar þýðingar á því. Þýðingarnar verða verri með tímanum.
- Þetta að ekki eyða vélarþýðingum hefur verið reynt áður. Árið 2017, á milli júlí og september og aftur í desember bjó notandinn Japan Football til 893 greinar sem eru allar vélarþýddar. Hann stoppaði ekki fyrr en hann var bannaður á öllum verkefnum í september, fékk annað tækifæri í desember sem var brotið samstundis og var bannaður aftur.
- Hérna er samantekt á þýðingarvélum og einkunnum þeirra. Athugaðu að greynir er með hlutfall yfir rétt svör, á meðan hinar þýðingarvélarnar eru með hlutfall rangra svara. Einnig inniheldur greynir beygingar, en hinir ekki. Vegna þess setti ég inn rannsókn á beygingum greynis einnig.
- Takk fyrir góð svör. Vitið þið um einhver benchmarking-próf á íslenskuþýðingum frá þessum nýju þýðendum (ég á við LLM-þýðendur eins og m.is, velthyding.is, Google Translate, Gemini og ChatGPT)? Það eru auðvitað margar greinar hér með töluvert af villum, þótt þær komi ekki frá þýðingarvélum. Þetta er frekar spurning um hvernig á að merkja þær sem eru augljóslega vélþýddar. Akigka (spjall) 12. janúar 2025 kl. 17:12 (UTC)
- Það að vélarþýddar greinar séu í sama gæðaflokki og aðrar greinar er rangt. Á mw:Content_translation/Deletion_statistics_comparison í öðrum ársfjórðungi 2022 var 13% fleiri greinum eytt sem voru búnar til af ContentTranslate, heldur en öðrum greinum. Það sama gildir um aðra ársfjórðunga á þeirri síðu. Íslenska Wikipedia endar á þessum lista þegar hlutfall greina frá ContentTranslate sem hefur verið eytt er hátt. Það er enn eitt dæmið um að vélþýðingar séu ekki nógu góðar án leiðréttinga.
- Ég hef enga samúð með notendum sem að opna bara ContentTranslate, smella nokkrum sinnum án þess að leiðrétta nokkurn skapaðan hlut og gefa út grein þannig. Það að afrita og líma frá öðrum þýðingarvélum án leiðréttinga er alveg jafn slæmt.
- Ég mæli með þessum vinnubrögðum:
- Notist við ContentTranslate, vélþýðing.is (Greynir) eða GoogleTranslate. Tungutorg og Apertium eru annars flokks þýðingarvélar og ekki nothæfar.
- Notandi skal hafa kunnáttu á íslensku, minnst eitt ár í íslenskukennslu eða með íslensku sem móðurmál. Notendur með minni kunnáttu geta ekki breytt beygingamyndum vegna þekkingarleysis.
- Notandi skal alltaf leiðrétta vélarþýðingar. Síður sem hafa verið merktar af ContentTranslate í Flokkur:Síður með óathuguðum þýðingum hafa minna en 20% leiðréttan texta frá notenda. Notandi sem vistar slíka grein hefur verið varaður við af ContentTranslate og því er réttlætanlegt að eyða henni.
- Snævar (spjall) 13. janúar 2025 kl. 08:05 (UTC)
- Takk fyrir þetta. Ég vissi ekki af NLLB-200. Þetta eru verðmætar upplýsingar, en aðeins ein rannsókn (á Google Translate) inniheldur benchmarking upplýsingar fyrir tauganetsþýðanda á íslensku. GT hefur aðeins batnað síðan 2018, en (sýnist mér) ekki nógu mikið til að breyta þessum niðurstöðum verulega. Út frá minni eigin reynslu er GT versti tauganetsþýðandinn sem ég hef prófað. Ég er alveg sammála því að óbreyttur texti frá Content Translate hefur oftast verið ónothæfur. Ég hef oft reynt að nota CT en var kominn á það að það svaraði ekki kostnaði. Ég væri fljótari að þýða frá grunni. Ég kannski prófa það aftur. Ég er rétt að byrja að prófa m.is/thyding og Gemini Pro, en við fyrstu sýn virðast mér þessi tæki þýða mun betur en bæði GT og CT, nógu vel til að hægt væri að bera villufjölda saman við íslenskan Wikipedia-notanda með litla reynslu af textaskrifum, en ég get að vísu ekki vísað í nein alvöru próf til að staðfesta það. Akigka (spjall) 13. janúar 2025 kl. 11:45 (UTC)
- Fann loks próf sem sýnir hvað þýðandinn í ContentTranslate gerir. Hann er með skorið 25% rétt BLEU. Ef ég hefði ekki verið búinn að biðja WMF um að nota Greyni/GPT-4 þá hefði ég tekið ákvörðunina í Wikipedia:Potturinn/Safn 27#Reverting to Google as the default Machine Translation in Icelandic Wikipedia til endurskoðunar. Líka, prófin sem ég vísa til eru að prófa texta frá Íslensku Wikipediu, hún hefur verið hluti af þessum prófunum í nokkur ár.
- M.is hefur engin próf, þannig þetta lyktar af sömu vitleysunni og umræðan "Reverting to Google as the default Machine Translation in Icelandic Wikipedia". Beiðni hafnað. M.is er ekki með skráðan þýðanda eða tokanizer. Sú vefsíða skráir bara orðabækur og hugbúnað sem skrifar texta frá talmáli. Apertium bætti sig um 5% við það að taka upp tokanizerinn Ice-NLP. Sýnir bara að metnaðurinn að hafa bestu þýðingarvélina er ekki til staðar hjá m.is. Snævar (spjall) 28. janúar 2025 kl. 05:00 (UTC)
- Takk fyrir þetta. Ég vissi ekki af NLLB-200. Þetta eru verðmætar upplýsingar, en aðeins ein rannsókn (á Google Translate) inniheldur benchmarking upplýsingar fyrir tauganetsþýðanda á íslensku. GT hefur aðeins batnað síðan 2018, en (sýnist mér) ekki nógu mikið til að breyta þessum niðurstöðum verulega. Út frá minni eigin reynslu er GT versti tauganetsþýðandinn sem ég hef prófað. Ég er alveg sammála því að óbreyttur texti frá Content Translate hefur oftast verið ónothæfur. Ég hef oft reynt að nota CT en var kominn á það að það svaraði ekki kostnaði. Ég væri fljótari að þýða frá grunni. Ég kannski prófa það aftur. Ég er rétt að byrja að prófa m.is/thyding og Gemini Pro, en við fyrstu sýn virðast mér þessi tæki þýða mun betur en bæði GT og CT, nógu vel til að hægt væri að bera villufjölda saman við íslenskan Wikipedia-notanda með litla reynslu af textaskrifum, en ég get að vísu ekki vísað í nein alvöru próf til að staðfesta það. Akigka (spjall) 13. janúar 2025 kl. 11:45 (UTC)
Launching! Join Us for Wiki Loves Ramadan 2025!
[breyta frumkóða]Dear All,
We’re happy to announce the launch of Wiki Loves Ramadan 2025, an annual international campaign dedicated to celebrating and preserving Islamic cultures and history through the power of Wikipedia. As an active contributor to the Local Wikipedia, you are specially invited to participate in the launch.
This year’s campaign will be launched for you to join us write, edit, and improve articles that showcase the richness and diversity of Islamic traditions, history, and culture.
- Topic: Wiki Loves Ramadan 2025 Campaign Launch
- When: Jan 19, 2025
- Time: 16:00 Universal Time UTC and runs throughout Ramadan (starting February 25, 2025).
- Join Zoom Meeting: https://us02web.zoom.us/j/88420056597?pwd=NdrpqIhrwAVPeWB8FNb258n7qngqqo.1
- Zoom meeting hosted by Wikimedia Bangladesh
To get started, visit the campaign page for details, resources, and guidelines: Wiki Loves Ramadan 2025.
Add your community here, and organized Wiki Loves Ramadan 2025 in your local language.
Whether you’re a first-time editor or an experienced Wikipedian, your contributions matter. Together, we can ensure Islamic cultures and traditions are well-represented and accessible to all.
Feel free to invite your community and friends too. Kindly reach out if you have any questions or need support as you prepare to participate.
Let’s make Wiki Loves Ramadan 2025 a success!
For the International Team 16. janúar 2025 kl. 12:08 (UTC)
Tillaga að úrvalsgrein
[breyta frumkóða]Ég setti inn tillögu að úrvalsgrein fyrir bráðum þremur árum sem enginn tók afstöðu til. Gæti einhver sagt sína skoðun? Annars finnst mér að við mættum vera miklu duglegri að tilnefna úrvalsgreinar og gæðagreinar. Flestar greinarnar sem hafa þá stöðu voru samþykktar fyrir löngu, og það eru til fullt af nýrri greinum af sambærilegum gæðum. TKSnaevarr (spjall) 18. janúar 2025 kl. 22:04 (UTC)
- Fór framhjá mér. Skal taka afstöðu núna. --Akigka (spjall) 18. janúar 2025 kl. 22:23 (UTC)
- Það er líka ein tveggja ára gæðagreins tillaga. Sammála um að það séu til fleiri mögulegar gæðagreinar sem hefur aldei verið kosið um. Snævar (spjall) 18. janúar 2025 kl. 22:49 (UTC)
- Ég hef lengi ætlað mér að gera tillögur um breytingar, bæði á því hvernig greinar fá þessar gæðamerkingar og líka mögulega inntaki þeirra. Það er augljóst að þessar reglur um tilnefningar og kosningar gera ráð fyrir miklu stærra og virkara samfélagi notenda en nú er. Það er hreinlega ómögulegt að fá nýja úrvalsgrein samþykkta samkvæmt þessum reglum af því að það eru ekki einu sinni sex virkir notendur sem eru líklegir til að taka þátt í slíkri yfirferð. Svona stífar reglur um tiltekinn atkvæðafjölda og fleira ganga í raun gegn því hvernig ákvarðanir eru yfirleitt teknar á WP. Bjarki (spjall) 18. janúar 2025 kl. 23:02 (UTC)
- Í sannleika sagt finnst mér líka eins og gæðastaðallinn hafi færst eitthvað til frá því að flestar eldri greinarnar voru samþykktar. Margar greinarnar sem eru í flokknum Gæðagreinar eru styttri og með færri heimildir en greinar sem hefur verið hafnað í seinni tíð, eða hafa aldrei verið tilnefndar. TKSnaevarr (spjall) 19. janúar 2025 kl. 04:10 (UTC)
- Það er hægt að útskýra stóran hluta þessara felldna tillaga út frá hlutfalli ytri tengla og lengd greinarinnar (lengd greinar/fjöldi ytri tengla). Ég ætla ekki að reyna að telja heimildirnar sjálfar, það er gífurleg vinna. Það getur líka verið að greinin hafi breyst nægilega mikið frá því að tillagan var lögð fram. Það hefur áður verið gert allsherjar endurmat á úrvalsgreinum og það kemur til greina að gera það sama fyrir gæðagreinar. Meðalstærð gæðagreina er 32.043 bæti.
- Meðal felldra tillagna eru þessar greinar með hæsta hlutfallið af ytri tenglum á lengd greinar og takmarkað við greinar sem eru stærri en 32.000 bæti: Kanada, Bandaríkin, Íslenska þjóðkirkjan, Ítalía. Fyrir utan Íslensku þjóðkirkjuna voru þessar tillögur meðal fyrstu 11 tilnefningana og Íslenska þjóðkirkjan var tilnefnd 2007.
- Meðal samþykktra tillagna eru þessar greinar með lægsta hlutfallið af ytri tenglum á lengd greinar: Falklandseyjastríðið, Knattspyrnufélagið Fram, Íslensk sveitarfélög eftir mannfjölda, Massi, Jörundur hundadagakonungur, Vilmundur Gylfason.
- Kanski byrja á að leggja þessar felldu greinar aftur fram og fara fram á endurmat á þessum samþykktu tillögum? Snævar (spjall) 19. janúar 2025 kl. 09:01 (UTC)
- Í sannleika sagt finnst mér líka eins og gæðastaðallinn hafi færst eitthvað til frá því að flestar eldri greinarnar voru samþykktar. Margar greinarnar sem eru í flokknum Gæðagreinar eru styttri og með færri heimildir en greinar sem hefur verið hafnað í seinni tíð, eða hafa aldrei verið tilnefndar. TKSnaevarr (spjall) 19. janúar 2025 kl. 04:10 (UTC)
Tilllaga
[breyta frumkóða]Legg til að breyta atkvæðafjölda fyrir tillögur til gæðagreina úr 3 í 2 og atkvæðafjölda fyrir úrvalsgreina úr 6 í 4. Endurmats atvæðafjöldi verður áfram sá sami. Þar að auki, sá sem leggur fram tillögu, bæði endurmat og tillögu um nýja gæðagrein eða úrvalsgrein, telst sem atvæði með tillögunni, svo framalega sem hann stenst kosningarétt.
- Dæmi:
Eftir að tillaga hefur verið lögð fram um nýja gæðagrein, þarf bara eitt atkvæði með tillögunni í viðbót. Ef slík tillaga fær síðan eitt atkvæði á móti þá fellur hún, enda hlutfall mótmæla yfir 25%.--Snævar (spjall) 19. janúar 2025 kl. 00:41 (UTC)
- Ég setti inn nokkrar tillögur að gæðagreinum. Þetta eru ekki endilega gallalausar greinar (annars myndi ég tilnefna þær sem úrvalsgreinar), en þær eru að mínu mati ekkert síðri en margar eldri greinar sem hafa stöðu gæðagreina. TKSnaevarr (spjall) 19. janúar 2025 kl. 20:01 (UTC)
Samþykkt. Ég er með í huga tillögu að aðeins róttækari breytingu á þessum ferlum sem ég þarf að móta aðeins betur, en þetta er skref í rétta átt. Þar sem enginn hefur mótmælt þessu í þrjár vikur, þá lít ég svo á að það sé sátt um þetta. --Bjarki (spjall) 10. febrúar 2025 kl. 11:17 (UTC)
Universal Code of Conduct annual review: provide your comments on the UCoC and Enforcement Guidelines
[breyta frumkóða]My apologies for writing in English. Please help translate to your language.
I am writing to you to let you know the annual review period for the Universal Code of Conduct and Enforcement Guidelines is open now. You can make suggestions for changes through 3 February 2025. This is the first step of several to be taken for the annual review. Read more information and find a conversation to join on the UCoC page on Meta.
The Universal Code of Conduct Coordinating Committee (U4C) is a global group dedicated to providing an equitable and consistent implementation of the UCoC. This annual review was planned and implemented by the U4C. For more information and the responsibilities of the U4C, you may review the U4C Charter.
Please share this information with other members in your community wherever else might be appropriate.
-- In cooperation with the U4C, Keegan (WMF) (talk) 24. janúar 2025 kl. 01:11 (UTC)
Feminism and Folklore 2025 starts soon
[breyta frumkóða]
Dear Wiki Community,
You are humbly invited to organize the Feminism and Folklore 2025 writing competition from February 1, 2025, to March 31, 2025 on your local Wikipedia. This year, Feminism and Folklore will focus on feminism, women's issues, and gender-focused topics for the project, with a Wiki Loves Folklore gender gap focus and a folk culture theme on Wikipedia.
You can help Wikipedia's coverage of folklore from your area by writing or improving articles about things like folk festivals, folk dances, folk music, women and queer folklore figures, folk game athletes, women in mythology, women warriors in folklore, witches and witch hunting, fairy tales, and more. Users can help create new articles, expand or translate from a generated list of suggested articles.
Organisers are requested to work on the following action items to sign up their communities for the project:
- Create a page for the contest on the local wiki.
- Set up a campaign on CampWiz tool.
- Create the local list and mention the timeline and local and international prizes.
- Request local admins for site notice.
- Link the local page and the CampWiz link on the meta project page.
This year, the Wiki Loves Folklore Tech Team has introduced two new tools to enhance support for the campaign. These tools include the Article List Generator by Topic and CampWiz. The Article List Generator by Topic enables users to identify articles on the English Wikipedia that are not present in their native language Wikipedia. Users can customize their selection criteria, and the tool will present a table showcasing the missing articles along with suggested titles. Additionally, users have the option to download the list in both CSV and wikitable formats. Notably, the CampWiz tool will be employed for the project for the first time, empowering users to effectively host the project with a jury. Both tools are now available for use in the campaign. Click here to access these tools
Learn more about the contest and prizes on our project page. Feel free to contact us on our meta talk page or by email us if you need any assistance.
We look forward to your immense coordination.
Thank you and Best wishes,
--MediaWiki message delivery (spjall) 29. janúar 2025 kl. 02:35 (UTC)
Wiki Loves Folklore is back!
[breyta frumkóða]Please help translate to your language

Dear Wiki Community, You are humbly invited to participate in the Wiki Loves Folklore 2025 an international media contest organized on Wikimedia Commons to document folklore and intangible cultural heritage from different regions, including, folk creative activities and many more. It is held every year from the 1st till the 31st of March.
You can help in enriching the folklore documentation on Commons from your region by taking photos, audios, videos, and submitting them in this commons contest.
You can also organize a local contest in your country and support us in translating the project pages to help us spread the word in your native language.
Feel free to contact us on our project Talk page if you need any assistance.
Kind regards,
Wiki loves Folklore International Team --MediaWiki message delivery (spjall) 29. janúar 2025 kl. 02:35 (UTC)
Reminder: first part of the annual UCoC review closes soon
[breyta frumkóða]My apologies for writing in English. Please help translate to your language.
This is a reminder that the first phase of the annual review period for the Universal Code of Conduct and Enforcement Guidelines will be closing soon. You can make suggestions for changes through the end of day, 3 February 2025. This is the first step of several to be taken for the annual review. Read more information and find a conversation to join on the UCoC page on Meta. After review of the feedback, proposals for updated text will be published on Meta in March for another round of community review.
Please share this information with other members in your community wherever else might be appropriate.
-- In cooperation with the U4C, Keegan (WMF) (talk) 3. febrúar 2025 kl. 00:48 (UTC)
Tillaga: Stílviðmið
[breyta frumkóða]Ég tel ástæðu til þess að búa til reglur um hvernig síður á wikipediu séu settar upp. Flokkur:Wikipedia:Hreingerning_óskast er einn stærsti viðhaldsflokkurinn og það þarf skýringar á því hvernig á að laga síðurnar, sem þessar nýju reglur eiga að leysa. Í ljósi stærðar reglanna setti ég það á sérsíðu, Wikipedia:Potturinn/Stílviðmið. Athugasemdum skal bæta við á undirsíðuna. Snævar (spjall) 8. febrúar 2025 kl. 13:43 (UTC)
- Flott. Einnig gæti verið þægilegt að hafa fyrirmyndir. T.d. ef búa á til grein um hljómsveit má horfa til einhverrar ákveðinnar greinar eða greina um hljómsveit. Það myndi vonandi líka hjálpa til við samræmi milli greina. Cinquantecinq (spjall) 8. febrúar 2025 kl. 22:51 (UTC)
- Fyrirmyndirnar ættu að vera Wikipedia:Gæðagreinar og Wikipedia:Úrvalsgreinar. Þær gæða- og úrvalsgreinar sem ná ekki viðmiðunum laga ég bara. Snævar (spjall) 22. febrúar 2025 kl. 08:33 (UTC)
Upcoming Language Community Meeting (Feb 28th, 14:00 UTC) and Newsletter
[breyta frumkóða]Hello everyone!

We’re excited to announce that the next Language Community Meeting is happening soon, February 28th at 14:00 UTC! If you’d like to join, simply sign up on the wiki page.
This is a participant-driven meeting where we share updates on language-related projects, discuss technical challenges in language wikis, and collaborate on solutions. In our last meeting, we covered topics like developing language keyboards, creating the Moore Wikipedia, and updates from the language support track at Wiki Indaba.
Got a topic to share? Whether it’s a technical update from your project, a challenge you need help with, or a request for interpretation support, we’d love to hear from you! Feel free to reply to this message or add agenda items to the document here.
Also, we wanted to highlight that the sixth edition of the Language & Internationalization newsletter (January 2025) is available here: Wikimedia Language and Product Localization/Newsletter/2025/January. This newsletter provides updates from the October–December 2024 quarter on new feature development, improvements in various language-related technical projects and support efforts, details about community meetings, and ideas for contributing to projects. To stay updated, you can subscribe to the newsletter on its wiki page: Wikimedia Language and Product Localization/Newsletter.
We look forward to your ideas and participation at the language community meeting, see you there!