Wikipedia:Botcafé/Archief/2023-01

Uit Wikipedia, de vrije encyclopedie

Hoofdletters liedjes en albums[bewerken | brontekst bewerken]

Een tijdje terug was er een discussie in het Muziekcafé over hoofdletters in titels van Engelstalige nummers. Korte samenvatting; er zijn meerdere manieren om een Engelstalige titel te schrijven, met hoofdletters bij bepaalde woorden volgens de spellinggids, alle woorden in de titel met een hoofdletter en alleen het eerste woord met een hoofdletter (eigennaam en dergelijke daarvan uitgesloten).

Nu was er zeker geen consensus en lijkt het er op dat er geen geprefereerde manier van het opschrijven van titels was. Dus de verschillende schrijfwijzen blijven naast elkaar bestaan. Wat er wel duidelijk uit de discussie kwam, is dat het soms kan gebeuren dat er een artikel is met een van de schrijfwijze en dat er wordt gelinkt naar de andere schrijfwijze, waardoor het artikel wel bestaat maar er nog steeds een rode link in het andere artikel is. Dit werd als onwenselijk gezien en er werd opgemerkt dat een redirect van een verschillende manier van hoofdletternotatie naar het artikel handig/nodig is.

Nu vraag ik mijzelf af of het mogelijk is om met een bot alle lied en album titels langs te gaan, te kijken welke manier van hoofdletters er in het artikel wordt gebruikt en vervolgens een doorverwijzing aan te maken naar het artikel met de andere manier(en) van hoofdletters. Ik vraag het eerst hier voordat ik een verzoek indien bij de verzoekpagina, omdat ik geen idee heb of het mogelijk is.

Ik voorzie in ieder geval al een paar moeilijkheden.

  • In de discussie had ik al een paar voorbeelden gegeven waarbij er twee artikelen over verschillende nummers met dezelfde titel naar elkaar bestonden in verschillende hoofdletternotaties. Ik neem aan dat dit een moeilijkheid kan zijn voor de bot. (deze problemen moeten opgelost worden door een doorverwijspagina aan te maken en de titels van beide artikelen aan de passen met een toelichting tussen haakjes)
  • Als een bot de redirect aanmaakt, zal er ook gecontroleerd moeten worden of er niet andere dingen onder dezelfde titel naar de redirect verwijzen.
  • De meeste albums staan wel gecategoriseerd onder de subcategorieën van Categorie:Muziekalbum naar jaar, maar niet alle liedjes onder Categorie:Single naar jaar, aangezien niet alle liedjes als single zijn uitgebracht. De meeste zijn dan wel gecategoriseerd onder de subcategorieën van Categorie:Nummer naar artiest, maar sommigen staan zelf (als er niet meer dan een nummer is van de artiest en dus de categorie "nummer van desbetreffende artiest" is aangemaakt) onder categorieën als de subcategorieën van Categorie:Muziek naar jaar en misschien wel op andere plekken.
  • Ik neem aan dat een bot niet kan filteren tussen Engelstalige nummers. Het probleem geldt juist enkel bij deze taal, bij het Nederlands is het immers niet gewenst.

Ik ben benieuwd of jullie denken dat het mogelijk is en indien jullie dit denken, zal ik een verzoek indienen bij de verzoekpagina. Ik zeg het wel nogmaals, ik heb geen idee hoe ik een bot zou moeten besturen of programmeren, dus ik heb ook geen idee of het een veel te moeilijk iets is om te doen voor een bot. Dus als het niet kan is het ook logisch.

Ik kijk uit naar jullie antwoorden!

Met vriendelijke groet, S9H (overleg) 5 jan 2023 14:13 (CET)[reageren]

Zoiets is wel mogelijk met Pywikibot. De bot moet dan voor elke titel een lijst van titels maken met alle mogelijke hoofdletternotaties (= alle woorden wel of niet laten beginnen met een hoofdletter) en deze pagina's aanmaken als redirect naar de juiste titel. Merk op dat het aantal mogelijke hoofdletternotaties verdubbelt voor elk woord: voor 10 woorden zijn dat 512 mogelijkheden (de eerste letter mag zowel een hoofd- als kleine letter zijn)! Bij het aanmaken zouden we daarom eventueel alleen redirects kunnen aanmaken die inkomende links hebben vanuit de artikelnaamruimte. Over de moeilijkheden:
  • Als er minstens een andere hoofdletternotatie al bestaat als artikel, dan kan de bot een melding geven of plaatsen in een logpagina, en voorlopig geen redirects aanmaken.
  • Een bot kan niet zien of inkomende links op een aan te maken redirect betrekking hebben op het artikel in kwestie. Dit probleem speelt met elke link op heel Wikipedia.
  • Als we er enkele missen, dan is in ieder geval het grootste deel van het probleem opgelost.
  • Het filteren op Engels kan inderdaad niet. Maar is dat erg? Een redirect als De Waarheid is gewoon zinvol: zie bijv. De waarheid (nummer) en De Waarheid (album) ...
Wikiwerner (overleg) 5 jan 2023 21:56 (CET)[reageren]
Dus het is mogelijk, al moet je dan wel een logboek langslopen voor links die al dubbel bestaan en alle redirects langslopen voor mogelijk foute inkomende links?
En voor de duidelijkheid bedoel je met "De bot moet dan voor elke titel een lijst van titels maken met alle mogelijke hoofdletternotaties (= alle woorden wel of niet laten beginnen met een hoofdletter) en deze pagina's aanmaken als redirect naar de juiste titel" dus ook dat bijvoorbeeld een titel als "We will rock you", de redirects "We Will rock you", "We will Rock you", "We will rock You", "We Will Rock you", "We Will rock You", "We will Rock You" en "We Will Rock You" worden aangemaakt? Is dat de enige manier dat een bot dat zou kunnen doen?
Het filteren op het Engels is dan maar zo, en misschien dan niet heel erg, zeker gezien moderne artiesten ook anderstalige titels dan het Engels willen styleren met hoofdletters en mensen mogelijk het in die vorm in artikelen zetten. S9H (overleg) 6 jan 2023 08:45 (CET)[reageren]
Het eerste punt klopt. Een doorverwijspagina maken zul je zelf moeten doen, evenals de hernoemingen (welk achtervoegsel?).
Het tweede had ik inderdaad zo bedoeld. Misschien kunnen we dit nog voorkomen door een groep woorden op te stellen die klein geschreven worden in de title case, zoals lidwoorden. Als deze woorden aanwezig zijn, dan zijn er 3 mogelijkheden: alleen die groep klein, alles klein, of alles met een beginhoofdletter. Je ziet echter hoe ingewikkeld dat is in de link naar onze Spellinggids, bovenaan dit topic. Ook ontstaan er dan problemen bij eigennamen: de bot zou dan de huidige spelling van We're going to Ibiza! missen als de spelling anders was en deze link nog rood zou zijn. Wikiwerner (overleg) 6 jan 2023 20:51 (CET)[reageren]
Duidelijk, bedankt! Dan wacht ik even met het indienen van het verzoek tot een moment dat ik zelf wat meer tijd heb; er zit toch wat meer werkt in dan ik van te voren had gehoopt. Ben wel blij om te weten dat het in ieder geval mogelijk is. S9H (overleg) 7 jan 2023 07:51 (CET)[reageren]
Of het mogelijk is is een, maar of het wenselijk is is een tweede. Redirects voor woorden met diacrieten maken we niet aan, dus waarom deze wel? Dat er geen consensus is over de aanpak baart me ook zorgen.
Ook over de onderhoudbaarheid op langere termijn van dit soort (in de praktijk) one-offs maak ik me wat druk. Dit is iets dat voor alle muzieknummers en albums moet blijven gebeuren tot in het einde der tijden, niet alleen maar nu een keertje. Niet al te lichtzinnig zo maar even doen dus. –Frank Geerlings (overleg) 8 jan 2023 16:07 (CET)[reageren]
Redirects voor diakrieten maken wel normaal gesproken toch juist wel aan?
Over de onderhoudbaarheid: voor nieuwe artikelen kan men de nodige redirects aanmaken als men het artikel markeert als gecontroleerd. En anders draaien we het script later nogmaals. Wikiwerner (overleg) 8 jan 2023 17:11 (CET)[reageren]
Redirect voor diakrieten zijn zeker gewenst, gezien deze peiling. Ik zie dat ook voor hoofdletter redirects, aangezien er gewoon meerdere naast elkaar bestaan en mogelijk zijn.
Wat betreft onderhoudbaarheid, is het niet mogelijk om na de eerste botrun het eens per halfjaar (of vaker/minder vaak). Ik vraag mij af of men zelf de redirects gaat aanleggen namelijk. S9H (overleg) 8 jan 2023 20:17 (CET)[reageren]
Ik moet het me verkeerd hebben herinnerd, mijn eerste bezwaar is dan sowieso geschrapt. Wat onderhoud betreft wilde ik vooral even stilstaan bij de toenemende hoeveelheid taken waarvan het niet meteen opvalt als ze niet meer gebeuren. Meer een observatie dan nu meteen een probleem. –Frank Geerlings (overleg) 9 jan 2023 18:24 (CET)[reageren]

Alfabetische volgorde herstellen[bewerken | brontekst bewerken]

In Categorie:Rivier in Norrbottens län is om onduidelijke redenen de alfabetische volgorde verstoord door de overgrote meerderheid van de maar liefst 644 artikelen onder het getal 1 te rangschikken. Kan dit botmatig hersteld worden? LeeGer 20 jan 2023 19:52 (CET)[reageren]

Opmerking Opmerking Zie ook Wikipedia:De kroeg#Rivieren in Zweden en Overleg categorie:Rivier in Norrbottens län. Wikiwerner (overleg) 20 jan 2023 20:32 (CET)[reageren]
Categorie:Meer in Norrbottens län ook ChristiaanPR (overleg) 20 jan 2023 22:22 (CET)[reageren]
Categorie:Berg in Norrbottens län ChristiaanPR (overleg) 21 jan 2023 14:02 (CET)[reageren]
Uitgevoerd Uitgevoerd De meren had je zelf al gedaan. Wikiwerner (overleg) 29 jan 2023 19:17 (CET)[reageren]