Universiteit Leiden

nl en

PhD defence

Digging in Documents - Using Text Mining to Access the Hidden Knowledge in Dutch Archaeological Excavation Reports

  • A. Brandsen
Date
Tuesday 15 February 2022
Time
Address
Academy Building
Rapenburg 73
2311 GJ Leiden

Supervisor(s)

  • Dr. K. Lambers
  • Prof.dr. J.C.A. Kolen
  • Dr. S. Verberne

Archeologen produceren grote hoeveelheden teksten, te veel om effectief te kunnen lezen of handmatig te doorzoeken voor onderzoek. Om dit probleem op te lossen hebben we een zoeksysteem ontwikkeld (AGNES), dat zoeken in de volledige tekst van de docmenten combineert met zoeken op entiteiten en zoeken op een kaart.

We hebben eerst een handmatig gelabelde dataset gemaakt om een Named Entity Recognition model te trainen, dat gebruikt wordt om entiteiten uit tekst te extraheren. We hebben ook een studie gedaan naar de gebruikerseisen en een evaluatie van de usability van het systeem, om er zeker van te zijn dat het geschikt is voor archeologisch onderzoek.

In een case studie over Vroeg-Middeleeuwse crematies, laten we zien dat het gebruik van AGNES leidt tot een toename van kennis in vergelijking met de kennis van experts, verzameld met behulp van eerder beschikbare zoekmachines. Dit toont aan dat dit soort intelligente zoeksystemen kunnen helpen bij literatuuronderzoek, meer relevante gegevens kunnen vinden, en uiteindelijk kunnen leiden tot een beter beeld van het verleden.

PhD dissertations

Approximately one week after the defence, PhD dissertations by Leiden PhD students are available digitally through the Leiden Repository, that offers free access to these PhD dissertations. Please note that in some cases a dissertation may be under embargo temporarily and access to its full-text version will only be granted later.

Press enquiries (journalists only)

Marieke Epping
Scientific communication adviser
m.epping@bb.leidenuniv.nl
071 527 1521

General information

Beadle's Office
pedel@bb.leidenuniv.nl
+31 71 527 7211

This website uses cookies.  More information.