Naar inhoud springen

Gebruiker:InleidingINF/Kladblok

Uit Wikipedia, de vrije encyclopedie

In Natural Language Processing is Entity Linking het proces van het herkennen en het verwijderen van de ambiguïteit van benoemde entiteiten. Het is ook bekend als 'Named Entity Recognition and Disambiguation'[1]. Entity Linking moet niet verward worden met Named Entity Recognition (NER) en Entity Resolution (ER). NER en ER zijn soortgelijke maar andere technieken die vaak door elkaar gehaald worden.

Proces[bewerken | brontekst bewerken]

Entity Linking kent een unieke identiteit toe aan entiteiten die in een tekst worden genoemd. Entity Linking is dus de taak om entiteitsvermeldingen in een tekst te koppelen aan hun overeenkomstige entiteiten in een kennisbank [1]. De beoogde kennisbank hangt af van de toepassing, maar voor open-domein teksten is het bijvoorbeeld mogelijk om van Wikipedia afgeleide kennisbanken te gebruiken. Een voorbeeld hiervan is DBpedia, een gestructureerde kennisbank afkomstig van Wikipedia. Dit proces van het koppelen van entiteiten aan Wikipedia wordt ook wel Wikification genoemd[2].

Benaderingen[bewerken | brontekst bewerken]

Entity Linking kan worden opgesplitst in twee soorten benaderingen:

End-to-End: het verwerken van teksten om de entiteiten te extraheren (bijv. Named Entity Recognition) en vervolgens de ambiguïteit van deze geëxtraheerde entiteiten te verwijderen.

Alleen ambiguïteit verwijderen: in tegenstelling tot de eerste benadering neemt deze benadering rechtstreeks entiteiten als invoer en maakt deze alleen ondubbelzinnig voor de juiste invoer in een bepaalde kennisbank.

Referenties[bewerken | brontekst bewerken]

  1. (en) Entity Linking. NLP-progress. Geraadpleegd op 3 oktober 2022.
  2. (en) Sundar V, Entity Linking: A primary NLP task for Information Extraction. Analytics Vidhya (17 september 2019). Geraadpleegd op 3 oktober 2022.