Spørgsmål og svar

Hvorfor arkivere data I CLARIN?

Hvordan kan CLARIN arkivere og opbevare mine data?

Hvordan kan jeg finde data i CLARIN?

Hvilke webservices kan jeg bruge i CLARIN?

Hvordan kan jeg integrere mine sprogværktøjer i CLARIN?

Hvordan kan jeg bruge CLARIN i min forskning?









































Hvorfor arkivere data I CLARIN?

Ved at arkivere dine sproglige data i CLARIN-DK sikrer du at dine data

  • bliver bevaret for eftertiden
  • bliver søgbare
  • kan deles med andre forskere i Danmak og resten af Europa

Metadata for dine data kan findes og ses af andre forskere i Europa gennem den paneuropæiske forskningsinfrastruktur CLARIN ERIC http://www.clarin.eu/

Hvordan kan CLARIN arkivere og opbevare mine data?

Danmark har gennem sit medlemskab af CLARIN ERIC forpligtet sig til at indgå i det europæiske CLARIN-samarbejde med bl.a. oprettelse af et datacenter og til at stille metadata for data til rådighed for det den europæiske forskningsinfrastruktur CLARIN ERIC. Hvert sæt af data der arkiveres i CLARIN-DK, forsynes med en unik identifikator (Persistent Identifier: pid) og med metadata. Disse vil sammen med data blive opbevaret for eftertiden.

For at kunne deponere dine data skal de overholde forskellige krav som du kan læse om på: https://info.clarin.dk/kom-godt-i-gang/deponer-resurser/vejledning/.

Du kan også kontakte denne helpdesk for hjælp og vejledning til deponering, - overvej evt. at sætte penge af i dit forskningsprojekts budget til professionel hjælp til arbejdet med dine data.

Hvordan kan jeg finde data i CLARIN?

Fra siden https://clarin.dk/clarindk/find.jsp kan du søge efter dine egne eller andres data i CLARIN-DK. Du kan søge efter bestemte resursetyper vha. metadata så som titel, sprog, årstal, emne og meget andet.

Du kan få et overblik over de resurser der ligger i CLARIN-DK gennem https://info.clarin.dk/overblik/resurser/ hvor data er organiseret efter type.

På siden https://info.clarin.dk/kom-godt-i-gang/soeg-resurser/ kan du få yderligere hjælp til søgningen.

Hvis du ønske at finde data fra resten af Danmark eller fra de andre CLARIN-partnere, kan du søge gennem CLARINs europæiske side Virtual Language Observatory http://catalog.clarin.eu/vlo/search?1

De fremsøgte data kan inspiceres på platformen; men de kan også downloades, se https://info.clarin.dk/kom-godt-i-gang/download-resurser/

Hvilke webservices kan jeg bruge i CLARIN?

Infrastrukturen CLARIN-DK er ikke kun et arkiv til opbevaring af data. Med de integrerede services kan du lave lingvistisk opmærkning af dine eller andres data, vel at mærke hvis data er deponeret i TEIP5DKCLARIN-format (se: https://info.clarin.dk/kom-godt-i-gang/valideringskrav/).

Du kan læse om brug af de lingvistiske værktøjer her: https://info.clarin.dk/kom-godt-i-gang/brug-vaerktoejer/

Hvordan kan jeg integrere mine sprogværktøjer i CLARIN?

CLARIN indeholder allerede nogle integrerede lingvistiske værktøjer, men du kan også få integreret det sprogværktøj du selv bruger. Hvis du er interesseret, så kontakt os for de tekniske detaljer i processen. Normalt vil et værktøj kunne fungere som en REST web-service for at blive integreret i CLARIN. Og normalt vil vi bede om at du, hvis du vil afvikle værktøjet på din egen server, indgår en aftale med os om oppetid på serveren; alternativt at du er behjælpelig med at installere værktøjet på en CLARIN-server.

Hvis du har et værktøj du gerne vil bidrage med, så lad os høre fra dig.

Hvordan kan jeg bruge CLARIN i min forskning?

Gennem CLARIN har du adgang til store mængder af data fra forskellige genrer, emner og tidsperioder, ikke bare fra Danmark, men fra hele Europa. Ligeledes kan du synliggøre og dele dine data med andre forskere.

De lingvistiske værktøjer på platformen giver mulighed for at opmærke dine data med lingvistisk information som ordklasse og lemma. Du kan også anvende den lingvistiske opmærkning der findes på allerede eksisterende data i arkivet. Desuden har du mulighed for at finde teksteksempler gennem en korpussøgeflade (CQP).

Du kan få mere information om dansk sprogteknologi på: DANSK videncenter: https://info.clarin.dk/danskvidencenter/