Naar inhoud springen

Wikipedia:Wikidata-café/Archief/mei 2020

Uit Wikipedia, de vrije encyclopedie

Gewijzigde Module:Authority control[bewerken | brontekst bewerken]


Om het onderdeel Autority control wat duidelijker te maken ben ik wat gaan testen met een gewijzigde module (Module:Authority control/test). De afkortingen heb ik verwijderd zodat de volledige naam van de databank afgebeeld wordt. Ieder item op een nieuwe regel, daardoor wordt het overzicht wat langer, maar omdat het standaard ingeklapt wordt is dat geen probleem. Het Nederlandse label en beschrijving bovenaan worden uit d:Q36524 gehaald als dat aanwezig is. Omdat het sjabloon hier niet in een artikel staat heb ik om het te testen het wikidata-item van het artikel Marie Curie in de module opgenomen. Behanzane (overleg) 17 apr 2020 12:49 (CEST)[reageren]

Ziet er keurig uit! Dat is een hele verbetering. Saschaporsche (overleg) 17 apr 2020 13:55 (CEST)[reageren]
Dat is inderdaad weer een verbetering! Dank je wel! In de titel staat 'geautoriseerde terminologie'. Die term is ietwat onduidelijk en daarmee verwarrend. Daarna staat er 'unieke identificatie' wat voor mij niet van dusdanig belang is om dat te melden. Is het iets om ervan te maken 'overzicht bibliografische informatie'? HT (overleg) 17 apr 2020 14:56 (CEST)[reageren]
Dat is door iedereen eenvoudig aan te passen in het Wikidata item d:Q36524 zonder de module te wijzigen, VJVEGJG. Er zit nog een spelfout in de beschrijving, er ontbreekt een letter e. Behanzane (overleg) 17 apr 2020 15:14 (CEST)[reageren]
Ik vind het zeker een verbetering, maar ik vind hem nu eigenlijk wel wat wit. Is het een idee om er twee kolommen van te maken? Akoopal overleg. 17 apr 2020 22:38 (CEST)[reageren]
Het wordt nu in twee kolommen afgebeeld, en het ziet er zo inderdaad wat beter uit zo. Behanzane (overleg) 19 apr 2020 21:54 (CEST)[reageren]
Zojuist het aantal kolommen afhankelijk gemaakt van de schermbreedte, meestal zie je twee kolommen, op kleine schermen maar één kolom en op heel brede schermen drie kolommen. Behanzane (overleg) 19 apr 2020 23:13 (CEST)[reageren]

Na nog wat kleine aanpassingen heb ik de wijzigingen doorgevoerd in Module:Authority control. Behanzane (overleg) 22 apr 2020 20:02 (CEST)[reageren]

Ziet er inderdaad gaaf uit Behanzane! Dank voor alle verbeteringen die je hebt aangebracht. Ik zag bij het plaatsen van dit sjabloon dat een aantal databases hier op nl:wiki nog geen artikel hebben waardoor er rode linken op staan. Ik zal me er de komende tijd voor inzetten om die rode links blauw te maken.
Vraag aan iedereen hier: Zou het nog een verbetering zijn om de titel van de uitklapbare box kortweg Overzicht bibliografische informatie te noemen. Volgens mij is dat het meest veelzeggend en dekt het in begrijpelijk taal de lading. (Nu staat er ook nog 'Geautoriseerde terminologie:' voor: iets wat mij an persoonlijk weer weinig zegt. Wat vinden jullie? Ecritures (overleg) 24 apr 2020 18:23 (CEST)[reageren]
Het lijkt mij dat de hoofdletter aan het begin weg kan. HT (overleg) 24 apr 2020 18:28 (CEST)[reageren]
Ik ben voorstander van de korte titel "Overzicht bibliografische informatie " Saschaporsche (overleg) 24 apr 2020 19:46 (CEST)[reageren]
Ha HT, is dat omdat de titel van een sjabloon normalerwijs niet met een hoofdletter begint? Ik heb geen problemen om het zonder een hoofdletter te schrijven. Ecritures (overleg) 24 apr 2020 20:14 (CEST)[reageren]
Eh, nee. Ik vind het zonder hoofdletter gewoon mooier. HT (overleg) 24 apr 2020 20:18 (CEST)[reageren]
Okay ;) Ik met, maar zoals gezegd is het (voor mij) geen halszaak. Ik zal het dit weekend aanpassen (zonder hoofdletter). Groet, Ecritures (overleg) 24 apr 2020 21:21 (CEST)[reageren]
Voor de naam en beschrijving van de box wordt nu het label en beschrijving van d:Q36524 gebruikt waarbij van de eerste letter van het label een hoofdletter wordt gemaakt. Maar dat kan ook een kleine letter worden als dat beter is en de naam van de box opnemen in de module zodat die niet uit Wikidata overgenomen wordt. Ik zat er ook aan te denken een Nederlandse versie te maken van en:Help:Authority control en die net zoals bij de Engelse versie te linken vanuit de naam van de box zodat de lezer wat meer duidelijkheid krijgt over de functie ervan. Behanzane (overleg) 24 apr 2020 23:45 (CEST)[reageren]
Dank voor je suggestie Behanzane, maar die Q zou ik dan weer laten staan, omdat die even hoog is als de cijfers erachter. Die kleine d mag van mij ook blijven staan, zodat er voor slechtzienden een iets betere afscheiding duidelijk is met het label. Die kleine d zorgt ook dat de dubbelepunt erachter iets duidelijker uitkomt, denk ik dan. Ik ga er ook geen halszaak van maken, maar zoals het nu is, lijkt het mij het duidelijkst. HT (overleg) 25 apr 2020 07:42 (CEST)[reageren]
Q36524 is alleen maar het itemnummer waar het label en beschrijving vandaan worden gehaald, met die hoofdletter bedoel ik de eerste letter van het label van dat item. Jij stelde voor: "Het lijkt mij dat de hoofdletter aan het begin weg kan", bedoel je daarmee misschien iets anders? Behanzane (overleg) 25 apr 2020 11:22 (CEST)[reageren]
Dat betrof de vraag van Ecritures hierboven over het overnemen van de omschrijving 'Overzicht bibliografische informatie'. mvg. HT (overleg) 25 apr 2020 11:25 (CEST)[reageren]
Daar wordt wat ik er uit begrijp de hele naam van de box mee bedoeld, zonder een dubbele punt en beschrijving er achter. Behanzane (overleg) 25 apr 2020 11:37 (CEST)[reageren]
Volgens mij zijn we een beetje langs elkaar heen aan het werken op Wikidata. Bij een leeg description-veld werd het Engelse veld gebruikt (unique headings used for bibliographic information), dus ik heb zojuist het Nederlandse veld weer ingevuld. Om alleen het label weer te geven lijkt het me dat de module aangepast moeten worden. (Is 'externe databases' trouwens een benaming die alle koppelingen dekt?) Encycloon (overleg) 5 mei 2020 15:43 (CEST)[reageren]
Volgens mij is het handiger als gewoon in de gebruikte module een titel wordt meegegeven aan de box die wordt getoond bij een artikel zodat die informatie niet van wikidata gehaald hoeft te worden. Dan hebben we de naamgeving van het onderdeel dat op wikipedia wordt getoond gewoon in eigen hand zonder dat het label en de description van Wikidata geforceerd veranderd hoeven te worden. Ecritures (overleg) 5 mei 2020 16:17 (CEST)[reageren]
Dat kan, maar dan gaat weer een andere pipo klagen dat hij/zij niet kan programmeren en het daardoor niet kan aanpassen. Het is typisch Wikipedia, wat je ook doet, het is nooit goed. Volgens mij was die naam-kwestie op zich goed opgelost twee weken geleden, en om nu heel de wereldbol de andere kant op te laten draaien omdat JosQ het op zijn heupen heeft, vind ik teveel eer voor hem. Edoderoo (overleg) 5 mei 2020 17:19 (CEST)[reageren]
Volgens mij was en is de titel nog steeds niet alleen Overzicht bibliografische informatie. Doordat het momenteel zowel het label + omschrijving van Wikidata gebruikt is de titel altijd complexer dan we idealerwijs. De naam van een navigatiebox kan toch wel *in* het sjabloon (hard) vermeld worden? Dan is het ook *op wikipedia* aan te passen. Ecritures (overleg) 5 mei 2020 17:23 (CEST)[reageren]
Ja, daar heb je gelijk in, de module staat op nl-wiki. Ik heb het aangepast, want dit soort aanpassingen vereisen geen Lua-kennis ;-) Edoderoo (overleg) 5 mei 2020 17:30 (CEST)[reageren]
Perfect super: ik kon het niet vinden :) En zat alleen maar (niet intentioneel) tegen te werken door een mislukte poging op Wikidata te wagen (dank aan Encycloon om dat weer te verbeteren). Ziet er goed uit zoals bovenstaande overlegdeelnemers ook voorstelden. Ecritures (overleg) 5 mei 2020 17:36 (CEST)[reageren]
Bovenin staan allemaal functies, om een property op te halen, zoals bij veel programmeertalen staat het begin van de code helemaal aan het eind, en daar wordt ook de kop van de tabel gemaakt. Daar stond eerst iets met ..Label..':'..Description.. en die puntjes blijken een string-concatenate te zijn. Nu hebben jij en ik beiden onze eerste les Lua gehad ;-) Edoderoo (overleg) 5 mei 2020 17:44 (CEST)[reageren]
Veel dank voor de snelle aanpassing! Hans Erren (overleg) 5 mei 2020 19:56 (CEST)[reageren]
Op de sjabloonpagina heb ik uitleg geplaatst over hoe het sjabloon gebruikt dient te worden en meer. Eveneens denk ik dat het belangrijk is om het principe van bibliografische informatie uit leggen zodat ook gebruikers die minder ervaring hebben met catalogi en databases kunnen begrijpen waarvoor het dient en hoe het gebruikt kan worden. Ik heb daarom Wikipedia:Bibliografische informatie aangemaakt met uitleg. Romaine (overleg) 5 mei 2020 21:26 (CEST)[reageren]
Dank je wel Romaine voor deze inspanningen. Dat helpt zeker bij het begrip day gebruikers hebben of krijgen van het gebruik van dit sjabloon. Vriendelijke groet, Ecritures (overleg) 5 mei 2020 23:05 (CEST)[reageren]

Heb aan het begin van de module twee variabelen gedefinieerd met de naam van de infobox en het artikel met uitleg, en van de naam een link gemaakt naar dat artikel. Behanzane (overleg) 6 mei 2020 00:33 (CEST)[reageren]

Voor de liefhebber[bewerken | brontekst bewerken]

Kvrdegeus heeft de afgelopen dagen weer honderden en honderden taxa geupload, maar vergeet steeds die aan Wikidata te koppelen. De meesten staan in Gebruiker:Edoderoo/last-xxx-no-wikidata en omdat PetScan al dagen (weken?) niet werkt, is dit ook de enige plek die ik weet om ze terug te vinden. Edoderoo (overleg) 2 mei 2020 10:20 (CEST)[reageren]

Als we met z'n allen een beetje doen komen we er denk ik wel. Is dan denk ik wel handig als we op een of andere manier kunnen markeren wat de ander al gedaan heeft, zodat we geen dubbel werk doen. Of gewoon uit de lijst weghalen? Romaine (overleg) 2 mei 2020 10:38 (CEST)[reageren]
1-43 gedaan. Romaine (overleg) 2 mei 2020 10:51 (CEST)[reageren]
De pagina staat op mijn volglijst, dus ik zie de wijzigingen wel, doorgaans van mijn bot (ong. elke drie uur). Ik zal 'm met de hand nog wat vaker laten lopen. Edoderoo (overleg) 2 mei 2020 11:00 (CEST)[reageren]
Wat is precies de situatie? Moeten er nieuwe wikidata entries aangemaakt worden, of zijn er meestal al lemma's in andere wiki's (en verwacht ik dan), en moet er gekoppeld worden? Het eerste lijkt me botwerk, het tweede toch meer handwerk. Akoopal overleg. 2 mei 2020 18:25 (CEST)[reageren]
Vooral het tweede, zeker al die taxa bestaan al, en als we niks doen, worden ze na vier weken aan een nieuw item gekoppeld, en komen ze nooit meer goed terecht. Dat geldt ook voor veel internationale personen, bandjes, films, etc die allang een item hebben. Nieuwe items aanmaken kan prima met een bot, maar dat moeten we nu juist voor zijn. Edoderoo (overleg) 2 mei 2020 20:53 (CEST)[reageren]
Durftevragen. Is het mogelijk een bot te maken, die deze automatisch koppelt?. De namen van taxons lijken mij uniek Ldhank (overleg) 3 mei 2020 13:49 (CEST)[reageren]
Ik heb er een paar gedaan, en er zijn er zeker ook een paar waar er meer mogelijkheden zijn en je even goed moet kijken. Het is dus niet zomaar een op een te doen. Akoopal overleg. 3 mei 2020 18:46 (CEST)[reageren]
Ik heb vorig jaar een script geschreven die dat goeddeels wel automagisch kan doen, maar er zit ook nog heel veel nawerk aan. Als het 100 items koppelt, zijn er zeker twee faliekant fout en nog eens 2 dubieus. Die error-rate is precies te hoog om het geheel ongezien te laten draaien, en omdat mijn botscript tussen de 50.000-100.000 edits per dag doet, krijg ik de edits er eigenlijk niet meer tussenuit gefilterd om ze na te lopen. Maar morgen is een vrije dag, wellicht kijk ik er toch nog even naar. Edoderoo (overleg) 4 mei 2020 08:28 (CEST)[reageren]
Het script lijkt taxons onder bepaalde voorwaarden wel te kunnen herkenen en linken aan reeds bestaande items. Daarmee kan ik het proces iets meer automatiseren, en hoeven we die lange lijsten niet per se met de hand te linken. Ik ga het resultaat wel handmatig nakijken, maar wellicht ook verder uitwerken voor andersoortige items. De bruggen van Amsterdam kunnen bijv. ook heel aardig worden aangemaakt. Edoderoo (overleg) 7 mei 2020 12:01 (CEST)[reageren]

Property van ander artikel[bewerken | brontekst bewerken]

Beste collega's, op mijn gebruikerspagina heb ik een infobox met wat informatie over mezelf waaronder mijn "werkplek". Ik heb nu handmatig de logo's ingevuld van het besturingssysteem dat, en de browser die ik gebruik tijdens het bewerken van Wikipedia. Hoe kan ik de logo's uit Wikidata opvragen? Ik weet dat ik property P154 moet hebben. Maar {{#property:P154}} is natuurlijk niet genoeg, ik zal moeten meegeven uit welk item de property gehaald moet worden. Hoe doe ik dat? maarten|overleg 9 mei 2020 12:59 (CEST)[reageren]

Is {{#invoke:Wikidata|claim|P154|id=Qxxx}} wat je zoekt? Ecritures (overleg) 9 mei 2020 13:11 (CEST)[reageren]
Yes, precies wat ik zoek. Dank je wel. maarten|overleg 9 mei 2020 13:14 (CEST)[reageren]
De waarde uit Wikidata wordt opgehaald met een Lua-module. #property is een vrij simpele manier, om van het gekoppelde artikel een property op te halen, want in 99.99% van de gevallen is dat toch wat je wilt. Maar met Module:Wikidata kun je veel meer, o.a. opgeven uit welk item het moet worden opgehaald. Edoderoo (overleg) 9 mei 2020 13:29 (CEST)[reageren]
Ik heb hier ergens een boek over Lua liggen. Daar wilde ik mee aan de slag vanwege Conky maar is stof gaan happen. Wikidata lijkt me een leukere reden om Lua te leren. maarten|overleg 9 mei 2020 13:34 (CEST)[reageren]
Ik gebruik ook altijd de info uit de Module:Wikidata die Edoderoo hierboven linkt. Ecritures (overleg) 9 mei 2020 14:00 (CEST)[reageren]
Online boek in het Engels om te beginnen met Lua. Als je programmeerervaring hebt, is het een relatief simpele taal om te leren. De modules op Wikipedia zijn dan een mooi stapeltje voorbeelden van wat je er zoal mee kan. Edoderoo (overleg) 9 mei 2020 14:31 (CEST)[reageren]
Juist, dat boek. Ik had "digitaal stof happen" kunnen zeggen. Rond de eeuwwisseling ben ik opgeleid tot wat toen nog gewoon programmeur heette (nu ga ik me oud voelen) waarna ik voornamelijk met VBA aan de slag ben gegaan. Ik ga Lua er toch maar weer eens bij pakken. Dank voor de tips en links. maarten|overleg 9 mei 2020 14:38 (CEST)[reageren]
Lua is vooral handig om data op te bouwen, o.a. vanuit Wikidata. Op fr-wiki gebruiken ze het om de uitslagen van wielerwedstrijden uit Wikidata te halen. Dat werkt grandioos. De module geeft voornamelijk "een string tekst terug". Als je data wilt gaan verwerken vind ik pywikibot (met PAWS goed te gebruiken) vaak handiger. Edoderoo (overleg) 9 mei 2020 14:46 (CEST)[reageren]

Bibliografische informatie fors uitgebreid[bewerken | brontekst bewerken]

In de voorbije week tijd zijn meer dan 75.000 auteurs op Wikidata gekoppeld aan hun equivalente pagina in de Nationale Thesaurus voor Auteurs (NTA) van de Nederlandse Koninklijke Bibliotheek. Dit werk is uitgevoerd door de bot van Multichill, waarvoor dank! Deze koppeling was mogelijk doordat in zowel Wikidata als de NTA er de VIAF-code was toegevoegd. Hierdoor is (automatisch) de bibliografische informatie (authority control) op veel Wikipedia-artikelen uitgebreid. Romaine (overleg) 21 mei 2020 17:52 (CEST)[reageren]

Meer uitbreiding gewenst[bewerken | brontekst bewerken]

De bovenstaande koppeling was mogelijk doordat er reeds een identificatiecode van VIAF aan het item op Wikidata was toegevoegd. Op een heleboel artikelen over Nederlandstalige schrijvers en illustratoren ontbreekt echter die VIAF-code en de NTA-code van de Koninklijke Bibliotheek, zodat die ook niet in het sjabloon op nl-wiki getoond wordt. Uitbreiding is dus nodig, dit koppelen dient handmatig te gebeuren en jouw hulp is daarbij van harte welkom!

Toevoegen is eenvoudig via de volgende stappen:

  • Stap 1: Ga naar deze pagina, klik links op Play-icoontje, en kies een willekeurige auteur.
    • Merk op: in de lijst staan ook journalisten en scenarioschrijvers, deze auteurs hebben waarschijnlijk geen boek geschreven/geïllustreerd en staan daarom wellicht niet in de NTA. (kies dan een ander)
    • Voorbeeld: Ik koos voor Vrouwke Klapwijk.
  • Stap 2: Ga naar http://opc4.kb.nl/ (of https://www.kb.nl/ ) en zoek via het zoekvenster op de uitgekozen naam. Er verschijnen dan titels van boeken die mogelijk door de door jouw uitgekozen auteur geschreven of geïllustreerd zijn. Kies een boek waarvan je zeker bent dat die door deze persoon geschreven/geïllustreerd is. (Kijk eventueel op het Wikipedia-artikel hiervoor of de website van de auteur.)
    • Voorbeeld: Zoekende op Vrouwke Klapwijk kom ik op deze pagina en ik weet zeker dat het bovenste boek (Op reis met Abraham) van haar hand is.
  • Stap 3: Op de pagina van het boek staat als auteur/illustrator een of meerdere namen, klik op de naam van wie je zocht. (Staat de gezochte naam er niet bij: zoek dan een ander boek.) De url die je dan krijgt eindigt op REL?PPN=... met op de plaats van de puntjes de NTA-code. Kopieer die code.
  • Stap 4: Ga naar de Wikidata-pagina over de uitgekozen persoon. Voeg daar onderaan het kopje Verklaringen of Identificatiecodes de NTA-code toe.
    • Uitgebreidere uitleg voor toevoegen op Wikidata: Klik op verklaring toevoegen, type daar NTA, selecteer NTA-identificatiecode, voeg daarachter de code in en klik publiceren.
  • Stap 5: Open de link van de NTA-code en je komt zo uit op de pagina van de Koninklijke Bibliotheek over deze auteur. Op deze geopende pagina staat ergens een link <http://viaf.org/viaf/...> met op de puntjes de VIAF-code. Kopieer die VIAF-code en voeg die toe op Wikidata.

Nu kun je op het artikel over deze persoon op Wikipedia onderaan de pagina (maar boven de eventuele defaultsort en categorieën) {{Authority control}} toevoegen. Romaine (overleg) 21 mei 2020 17:52 (CEST)[reageren]

  • {{Authority control}} kun je sowieso wel toevoegen. Als er geen gegevens te tonen zijn, toont het sjabloon ook niets. Mocht iets, of iemand anders, wel iets op WikiData toevoegen, dan wordt dat gelijk getoond. Eventueel kunnen we overwegen Authority control standaard op te nemen in het {{Appendix}}-sjabloon, maar daar moeten we dan eerst even over nadenken. Edoderoo (overleg) 21 mei 2020 18:17 (CEST)[reageren]
  • Misschien mis ik iets, maar de voorgestelde methode lijkt mij wat omslachtig. Vanaf stap 2 maak ik altijd een andere keuze. De schrijver is te vinden via VIAF voorbeeld. Daar staat het VIAF nummer, en indien bekend ook het NTA nummer, en ook de titels zijn te controleren (Wikidata voorbeeld). Tweede opmerking. misschien is het goed erbij te vermelden, dat een koppeling niet altijd mogelijk is. Ik vermoed, dat de trigger in wikidata is beroep='schrijver', maar dit klopt niet altijd. Lucky Fonz III, Ron Boszhard en Peter Pannekoek waren in wikidata als schrijver opgevoerd, maar zijn dat niet. Ook komt het voor, dat schrijvers niet bekend zijn bij NTA. Het zou prettig zijn dit ergens af te vinken, zodat niet meerderen deze actie doen Marijke Amado of Marcus Schenkenberg bijvoorbeeld. Ldhank (overleg) 22 mei 2020 15:17 (CEST)[reageren]
    • Ja, het is ook mogelijk om eerst de VIAF op te zoeken en via VIAF de NTA-code. Dat was hoe ik eerder op allerlei namen gezocht heb, maar dat verliep veel minder goed. Via de NTA zoeken werkt in mijn ervaring beter.
    • Er zitten inderdaad personen tussen die niet echt een literair werk geproduceerd hebben, het auteurschap is immers erg breed. Wellicht is het beter om het beroep op Wikidata specifieker te maken, dan verdwijnen de niet-literaire personen uit de lijst. Romaine (overleg) 22 mei 2020 23:27 (CEST)[reageren]
  • Dit klinkt als een langzaam proces. Een tool als openrefine is hier waarschijnlijk handig. De output van de query kan je als csv saven, en daarmee een openrefine project beginnen. VIAF heeft reconcile services waarmee je in basis op naam zoekt, bijv deze. Daarmee zoek je effectief de viaf database door op alle namen die je daar hebt. Dat moet je dan wel controleren, en voor sommige kiezen wat de goede is, maar dan kan je de viaf-code uiteindelijk automatisch toevoegen. Daarna zou Multichill een tweede run kunnen doen voor de NTA codes. Akoopal overleg. 22 mei 2020 22:09 (CEST)[reageren]
    • Automatiseren klinkt leuk, maar ik ben reeds meerdere keren gestuit op personen met dezelfde naam. Er kan dus niet simpel toegevoegd worden op basis van puur alleen dezelfde naam. Romaine (overleg) 22 mei 2020 23:27 (CEST)[reageren]
      • Het leuke van openrefine is dat het een tool is. Hij geeft de matches, maar vervolgens is het uiteraard zaak om te controleren of de match klopt. Je kan dan doorklikken naar viaf en verder kijken, en hetzelfde voor wikidata. Zijn er meer mogelijkheden laat hij die zien. Maar het saaie werk word je dan uit handen genomen. Ik zag later dat de tool die ik gelinkt had ook de NTA code kan ophalen via de proxyfunctie, dus je kan het hele proces doen als je weet dat de match klopt. Akoopal overleg. 22 mei 2020 23:40 (CEST)[reageren]
        • Ik ken openrefine, al zal ik vast niet alle functies kennen. De essentie van wat ik bedoelde te zeggen is dat er een mensenoog moet vast stellen of het over dezelfde persoon gaat. Niks automatisch dus, maar handmatig. Op de website van de kb zoeken levert publicaties op met de gezochte woorden, die vergelijken met de titels in het Wikipedia-artikel levert snel een match op. In het afgelopen uur heb ik 20 items op Wikidata gematched met NTA en VIAF. Twee dagen geleden stond het aantal in de query op 640, dat zijn er nu nog 454. Dat is het resultaat wat ik beoog. Dus wie met een tool sneller matches weet de vinden waarvan diegene zeker is dat die kloppen, ga vooral je gang! Het bericht hierboven onder dit kopje heeft als doel om gebruikers eenvoudig stappen te laten zien hoe ze zelf de NTA-code en VIAF-code kunnen vinden. Niet alleen nu, maar ook in de toekomst wanneer er nieuwe artikelen worden geschreven. En vooral, dat er dus werk verzet wordt. Romaine (overleg) 23 mei 2020 00:48 (CEST)[reageren]
          • De essentie van wat ik bedoelde te zeggen is dat er een mensenoog moet vast stellen of het over dezelfde persoon gaat.: dat kan dus met OpenRefine. Ecritures (overleg) 23 mei 2020 00:55 (CEST)[reageren]
            • Testrondje van 50 gedaan. Daarvan heb ik er uiteindelijk 15 van kunnen matchen, daarnaast van 7 was al een VIAF bekend en was er geen NTA. Dit koste me iets van 1.5 uur. Romaine's truuk om naar de werken van de auteur te schrijven is de handigste manier om te controleren, die laat VIAF goed zien. De query aanpassen dat de records met al een VIAF in wikidata er niet uit komen zou helpen, en ook wat strenger filteren op liedjesschrijvers en scenarioschrijvers die ik meestal niet terug vond. Akoopal overleg. 24 mei 2020 00:38 (CEST)[reageren]
              • De liedjesschrijvers zijn een erfenis van GerardM uit lang vervlogen tijden. Het beste vul je bij beroep iets als singer-songwriter in en haal je schrijver weg, want dat is dan veel te algemeen. Heel soms hebben ze een boek geschreven, zoals bij Anne van Veen, maar dat zijn de uitzonderingen. Edoderoo (overleg) 24 mei 2020 11:36 (CEST)[reageren]
                • Nou ik wil die query van Romaine dus aanpassen om liedjesschrijvers en scenarioschrijvers er uit weg te laten, maar die query syntax ken ik niet goed genoeg. Daarna wil ik geen schrijvers waar al een VIAF voor is ingevult, en ook dat lukte niet. Moet je meerdere aparte MINUS blokken maken? Akoopal overleg. 24 mei 2020 11:53 (CEST)[reageren]

────────────────────────────────────────────────────────────────────────────────────────────────────

  • Ik ben het eens met Akoopal: een project via OpenRefine en reconciliëren met VIAF om op die manier de VIAF-code (+NTA code) te achterhalen en toe te voegen is waarschijnlijk sneller en effectiever. @OlafJanssen:, heb jij dit overleg gezien? Danielle (KB) (overleg) 22 mei 2020 23:12 (CEST)[reageren]
    • De methode van Romaine kan wel een groot voordeel hebben. Ik heb er een paar met de hand gedaan, het valt op dat aan de artikelen vaak ook nog wat onderhoud nodig is. Geen infobox, geen authority control, half ingevulde wikidata-items, etc. Daar kan OpenRefine natuurlijk niets mee. Prima als OpenRefine snel even die lijst naar nul kan terugbrengen, weer een lijstje leeg. Maar tot die tijd moeten we wellicht even "de kersen van de taart" plukken, en die paar met de hand exra oppoetsen. Edoderoo (overleg) 24 mei 2020 09:15 (CEST)[reageren]
      • Openrefine is natuurlijk ook geen doel maar een andere oplossing, en daarom wou ik toch maar een testje doen. 6 minuten voor een resultaat is ook niet snel. Maar de methode van Romaine zitten een paar stappen in die mensen niet makkelijk zullen vinden. Het zou leuk zijn als iemand een tooltje wil schrijven die je een Q-nummer en een titel geeft, en je dan helpt met de rest van de stappen.
      • Wat ik deed: het wikidata item openklikken, van daaruit het wikipedia artikel, hopen op een lijstje met werken, dan de gevonden viaf entries openklikken en bij werken kijken, eventueel even op een werk zoeken. Eventueel liet ik me nog leiden door een geboortedatum als viaf die in de naam erbij had staan, maar nooit alleen. Een wat betere query zoals ik hierboven al suggereer zal helpen ook al omdat de liedjes en scenarieschrijvers steeds meer overblijven. Als iemand daarmee kan helpen? Akoopal overleg. 24 mei 2020 11:32 (CEST)[reageren]
    • Dit is ook zoiets, wat ik geregeld tegenkom. Wikidata is gekoppeld aan een ander viafnummer van een dezelfde persoon. Ldhank (overleg) 24 mei 2020 10:42 (CEST)[reageren]
      • Dat betekent dat bij een persoon meerdere VIAF-nummers kunnen behoren. Houdt Wikidata daar rekening mee? Quistnix (overleg) 24 mei 2020 10:45 (CEST)[reageren]
        • Dat is een doublure in de VIAF-database. Ik heb net een mailtje gestuurd naar de VIAF, omdat ik bij Mirjam vd Broeke zo'n doublure tegenkwam. Wikidata geeft wel een waarschuwing dat er een enkele waarde wordt verwacht, maar als je zeker weet dat de fout bij VIAF zit, en niet bij Wikidata, kun je die waarschuwing negeren. Ik ben benieuwd of de VIAF er nog iets mee gaat doen. Edoderoo (overleg) 24 mei 2020 10:59 (CEST)[reageren]

──────────────────────────────────────────────────────────────────────────────────────────────────── Toen dit een paar dagen geleden werd aangekondigd, waren er nog meer dan 500 items op de lijst. Het zijn er nu nog 333. Dat betekent dat we er flink veel van hebben opgezocht en verbetert! Keep up the good work. Edoderoo (overleg) 25 mei 2020 08:19 (CEST)[reageren]

Uiteindelijk komen we er wel, maar de query hoeft toch ook niet met stoom en kokend water afgewerkt te worden. Ik mis eigenlijk een mogelijkheid om aan te geven, dat een match niet gemaakt kan worden, maar dat de naam wel terecht op de lijst staat. Bijvoorbeeld in het lemma staat een boek en isbn nummer, maar auteur is onbekend bij viaf. Ander voorbeeld een schrijver heeft wel een viaf, maar geen NTA, aangezien het boek alleen in Duitsland (Marijke Amado of Marcus Schenkenberg) gepubliceerd is. Het zou prettig zijn, om dit ergens aan te geven, want nu worden deze namen meerdere keren overbodig beoordeeld. Ldhank (overleg) 25 mei 2020 11:43 (CEST)[reageren]
Is VIAF-identificatiecode (P214):no value en NTA-identificatiecode voor persoon (P1006):no value een oplossing voor wat je hierboven aandraagt? Dan zou er bijvoorbeeld aan de hand van een query gekeken kunnen worden welke auteurs bv niet in de NTA voorkomen. (Of dat er sprake is van een fout oid) Groet, Danielle (KB) (overleg) 25 mei 2020 12:03 (CEST)[reageren]
Dank voor snel antwoord. ik ga het testen Ldhank (overleg) 25 mei 2020 12:09 (CEST)[reageren]
Wat moet ik doen wanneer de KB naar een ander (achterhaald) VIAF ID (met incorrecte geboortedatum) linkt, zoals hier? Quistnix (overleg) 25 mei 2020 15:17 (CEST)[reageren]
Ha goede vraag: op dit moment is een berichtje op mijn OP een oplossing. Ik zal uitzoeken hoe dit in de KB data aangepast kan worden (en navragen wat een handige 'procedure' is). (Natuurlijk hoef je deze melding over Peter Andriesse niet nogmaals te melden :) Ik heb hem genoteerd) Groet, Danielle (KB) (overleg) 25 mei 2020 15:33 (CEST)[reageren]
Dank je voor je antwoord, Danielle. Groet, Quistnix (overleg) 25 mei 2020 16:20 (CEST)[reageren]
Na de eerste openrefine run had ik gister een tweede testrun gedaan met 50 schrijvers en wat meer gefilterd. Daar kwamen 20 matches uit, maar viel het mij ook op dat ik deels dezelfde had als de eerste run. Daarom vandaag de overige 155 genomen, daar in een twee uurtjes doorheen gegaan, dat leverde 83 matches op, en uiteindelijk 79 edits, waarschijnlijk doordat anderen me voor waren. Ik heb weggelaten: liedschrijver, scenarioschrijver, columnist, acteur. Ik denk dat ik met deze run de mogelijkheden van openrefine wel uitgeput hebt. Akoopal overleg. 26 mei 2020 00:25 (CEST)[reageren]
Er was gisteren 1 replication-server die 1,5 dag achterliep. Vannacht om vier uur was die weer helemaal bij, maar het kan zijn dat jij daar nou net last van had gehad. Edoderoo (overleg) 26 mei 2020 07:41 (CEST)[reageren]

──────────────────────────────────────────────────────────────────────────────────────────────────── Ik kwam onderweg nog een ISNI-ID tegen dat ik heb toegevoegd, maar dat stond zonder spaties vermeld. Is het mogelijk dat dergelijke IDs in wikidata worden voorzien van spaties op de juiste plekken? Als het script syntaxfouten kan detecteren, kan het die dan ook verbeteren? N u was het even een gezoek waar die spaties moesten komen. Quistnix (overleg) 26 mei 2020 08:57 (CEST)[reageren]

Voorheen voegde ik spaties handmatig toe, maar uit gemakzucht is het bij mij nu een copypaste van het isni nummer. Een botje voorziet het isni nummer van spaties op de juiste plaats binnen het uur ofzo. Ldhank (overleg) 26 mei 2020 09:15 (CEST)[reageren]
Dus het isni nodig om dat met de hand te doen? Mooi! Misschien kan dat ook bij de toelichting van de foutmelding vermeld worden, want het isni makkelijk om die cijfertjes te tellen en er handmatig spaties tussen te zetten. Quistnix (overleg) 26 mei 2020 09:55 (CEST)[reageren]
Nog beter zou het zijn die hele foutmelding/waarschuwing weg te halen, als de spaties er niet toe doen. Prima als een bot er wat in standaardiseerd, maar ook zonder spaties kom je op de juiste ISNI-pagina uit, dan hoef je daar geen meldingen over te krijgen. Maar dat is eigenlijk iets dat op de eigenschap-pagina op WikiData moet worden besproken. Edoderoo (overleg) 26 mei 2020 10:29 (CEST)[reageren]

Query op "foutvlaggen" in Wikidata[bewerken | brontekst bewerken]

Bovenstaande discussie over de dubbele VIAF id's brengt me trouwens bij een andere vraag die ik heb. Bij verschillend statements kan je op Wikidata zo'n specifieke "foutvlag"(je-weet-wel dat uitroeptekentje) krijgen. Zi is er bijvoorbeeld een foutvlag wanneer je bij beschreven op URL (P973) een url zonder qualifier taal van werk of naam (P407) gebruikt. Hoe maak je een query: 'Geef me alle beschreven op URL (P973) waarbij geen taal van werk of naam (P407) als qualifier is gebruikt'? Groet, Ecritures (overleg) 24 mei 2020 12:23 (CEST)[reageren]

Op de talkpage van een property staan links naar de gefilterde fouten, en ook een link naar deze query. Edoderoo (overleg) 24 mei 2020 12:29 (CEST)[reageren]
Oh super, dat wist ik helemaal niet. Ik zal die talk pages van properties eens beter in de gaten houden. Ecritures (overleg) 24 mei 2020 12:49 (CEST)[reageren]