Tilburg verzamelt woorden voor parafrases
De ontwikkelingen rond WikiLeaks hebben de afgelopen weken weer eens duidelijk gemaakt dat het ontzettend handig is als een computer heel specifiek naar informatie kan zoeken. Nog handiger is het als de computer uit zichzelf informatie herkent die hetzelfde is, maar anders geformuleerd, zogenoemde parafrases.
Taalprogramma
Het Instituut voor Cognitie en Communicatie (TICC) van de Universiteit van Tilburg heeft ruim twee miljoen woorden verzameld om digitaal parafrases te kunnen herkennen. De dataset is voor professionals beschikbaar via de Nederlandse Taalunie. Het verzamelen van de Nederlandse woorden en woordconstructies maakt deel uit van een internationaal taalprogramma, aldus de universiteit.
Plaats als eerste een reactie
U moet ingelogd zijn om een reactie te kunnen plaatsen.