Tidligere resursetyper i CLARIN-DK
Der er 9 overordnede resursetyper i CLARIN-DK, nogle af dem er inddelt i undertyper. Fx er der for mediaannoteringer tre resursetyper, som giver mulighed for at skelne mellem formatet for mediaannoteringen.
For alle resursetyper sker der en validering ved deponering, mere information om validering kan læses her.
Liste over resursetyperne
- Tekstresurser i TEIP5DKCLARIN-format, evt. med billeder
- Tekstresurser i TEI-format
- Tekstannoteringer
- Lydresurser
- Videoresurser
- Mediaannoteringsresurser i IMDI-SESSION-XML-format
- Mediaannoteringsresurser i IMDI-SESSION-PRAT-format
- Mediaannoteringsresurser i IMDI-SESSION-CHAT-format
- Leksikonresurser
- Værktøjsresurser
- Dataresurser og tekstaligneringer
NB:
- Billeder er på nuværende tidspunkt ikke en selvstændig resursetype, men deponeres som en tekst med billeder tilknyttet.
- Aligneringer er på nuværende tidspunkt ikke en selvstændig resursetype, men deponeres som data.
Tekstresurser i TEIP5DKCLARIN-format, evt. med billeder
Tekstresurser i TEIP5DKCLARIN-formatet kan have tilknyttet billeder. Hvis der er tilknyttet billeder, kan de ses når man vælger fanebladet "Vis indholdsdata" for resursen. Metadataformatet er beskrevet her, og formatet for teksten er beskrevet her.
Tekstresurser i TEI-format
Tekstresurser i TEI-format har færre metadatainformationer og kan ikke benyttes i samme omfang i infrastrukturen som tekster i TEIP5DKCLARIN-format. Vi anbefaler derfor at man så vidt muligt benytter TEIP5DKCLARIN-formatet. Se evt. rng-skemaet: https://clarin.dk/schemas/tei/TEIDKCLARIN-plain-tei.rng for flere detaljer.
Tekstannoteringer
Formatet for annoteringerne er beskrevet her. Headeren er mere simpel end tekst-headeren, dog gælder dokumentationen derfra for <appInfo>.
Lydresurser
Findes i formaterne: avi, mp3.
Video-resurser
Findes i formaterne: mov, avi.
Mediaannoteringsresurser i IMDI-SESSION-XML-format
Der er de samme muligheder for metadata-informationer i alle tre typer af IMDI-sessioner. Forskellen mellem de tre IMDI-sessioner er alene annoteringsformatet. Denne type benytte xml-format for annoteringerne. Dette format benyttes bl.a. af Anvil (Generic Annotation Tool for Multimodal Dialogue), se evt. mere her.
Mediaannoteringsresurser i IMDI-SESSION-PRAT-format
Der er de samme muligheder for metadata-informationer i alle tre typer af IMDI-sessioner. Forskellen mellem de tre IMDI-sessioner er alene annoteringsformatet. Denne type benytter Praat TextGrid, se evt. her.
Mediaannoteringsresurser i IMDI-SESSION-CHAT-format
Der er de samme muligheder for metadata-informationer i alle tre typer af IMDI-sessioner. Forskellen mellem de tre IMDI-sessioner er alene annoteringsformatet. Denne type benytter Childes' CLAN-format, se evt. her.
Leksikon-resurser
Leksikon-resurser ligger som en pakket fil. Der kan også deponeres en README-fil, hvor man kan få yderligere oplysninger.
Data-resurser og tekstaligneringer
Alle andre typer af resurser kan deponeres som data. Tekstaligneringer deponeres som data, da de endnu ikke er oprettet som en selvstændig resursetype. Der kan også deponeres en README-fil, hvor man kan få yderligere oplysninger.
Værktøjsresurser
Der er mulighed for at deponere værktøjer i Clarin.dk. Nogle værktøjer er integrerede, disse vises også ved en søgning, men du har yderligere mulighed for at afvikle integrerede værktøjer ved at lægge nogle resurser i Kurven og dernæst vælge "Værktøjer".