CLARIN-DK-infrastrukturen
CLARIN-DK består pt. af et datacenter med bl.a. tekstkorpora og leksika, en sprogteknologisk værktøjskasse med fx tokeniser, POS-tagger og lemmatiser, en datasamling af TEI-opmærkede tekster (det gamle DK-CLARIN), et korpusværktøj Korp og et visualiseringsværktøj Voyant der bruges til ”distant reading”. Desuden har CLARIN-DK et videncenter (DANSK) for dansk sprog, sprogresurser og sprogteknologi.
Alle forskere som har WAYF-adgang kan deponere deres sprogbaserede data i CLARIN-DK, downloade de data der ligger i CLARIN-DK, og bruge værktøjerne.