Resursetyper i CLARIN-DK – Københavns Universitet

Videresend til en ven Resize Print Bookmark and Share

Forside > CLARIN-DK-platformen > Brug CLARIN-DK-platformen > Resursetyper i CLARIN-DK

Resursetyper i CLARIN-DK-platformen

Der er 9 overordnede resursetyper i CLARIN-DK-platformen, nogle af dem er inddelt i undertyper. Fx er der for mediaannoteringer tre resursetyper, som giver mulighed for at skelne mellem formatet for mediaannoteringen.

For alle resursetyper sker der en validering ved deponering, mere information om validering kan læses  her.

Liste over resursetyperne

  1. Tekstresurser i TEIP5DKCLARIN-format, evt. med billeder
  2. Tekstresurser i TEI-format
  3. Tekstannoteringer
  4. Lydresurser
  5. Videoresurser
  6. Mediaannoteringsresurser i IMDI-SESSION-XML-format
  7. Mediaannoteringsresurser i IMDI-SESSION-PRAT-format
  8. Mediaannoteringsresurser i IMDI-SESSION-CHAT-format
  9. Leksikonresurser
  10. Værktøjsresurser
  11. Dataresurser og tekstaligneringer

NB:

  • Billeder er på nuværende tidspunkt ikke en selvstændig resursetype, men deponeres som en tekst med billeder tilknyttet.
  • Aligneringer er på nuværende tidspunkt ikke en selvstændig resursetype, men deponeres som data.

Tekstresurser i TEIP5DKCLARIN-format, evt. med billeder

Tekstresurser i TEIP5DKCLARIN-formatet kan have tilknyttet billeder. Hvis der er tilknyttet billeder, kan de ses når man vælger fanebladet "Vis indholdsdata" for resursen. Metadataformatet er beskrevet her, og formatet for teksten er beskrevet her.

Tekstresurser i TEI-format

Tekstresurser i TEI-format har færre metadatainformationer og kan ikke benyttes i samme omfang i infrastrukturen som tekster i TEIP5DKCLARIN-format. Vi anbefaler derfor at man så vidt muligt benytter TEIP5DKCLARIN-formatet. Se evt. rng-skemaet: http://clarin.dk/schemas/tei/TEIDKCLARIN-plain-tei.rng for flere detaljer.

Tekstannoteringer

Formatet for annoteringerne er beskrevet her. Headeren er mere simpel end tekst-headeren, dog gælder dokumentationen derfra for <appInfo>.

Lydresurser

Findes i formaterne: avi, mp3.

Video-resurser

Findes i formaterne: mov, avi.

Mediaannoteringsresurser i IMDI-SESSION-XML-format

Der er de samme muligheder for metadata-informationer i alle tre typer af IMDI-sessioner. Forskellen mellem de tre IMDI-sessioner er alene annoteringsformatet. Denne type benytte xml-format for annoteringerne. Dette format benyttes bl.a. af Anvil (Generic Annotation Tool for Multimodal Dialogue), se evt. mere  her.

Mediaannoteringsresurser i IMDI-SESSION-PRAT-format

Der er de samme muligheder for metadata-informationer i alle tre typer af IMDI-sessioner. Forskellen mellem de tre IMDI-sessioner er alene annoteringsformatet. Denne type benytter Praat TextGrid, se evt.  her.

Mediaannoteringsresurser i IMDI-SESSION-CHAT-format

Der er de samme muligheder for metadata-informationer i alle tre typer af IMDI-sessioner. Forskellen mellem de tre IMDI-sessioner er alene annoteringsformatet. Denne type benytter Childes' CLAN-format, se evt. her.

Leksikon-resurser

Leksikon-resurser ligger som en pakket fil. Der kan også deponeres en README-fil, hvor man kan få yderligere oplysninger.

Data-resurser og tekstaligneringer

Alle andre typer af resurser kan deponeres som data. Tekstaligneringer deponeres som data, da de endnu ikke er oprettet som en selvstændig resursetype. Der kan også deponeres en README-fil, hvor man kan få yderligere oplysninger.

Værktøjsresurser

Der er mulighed for at deponere værktøjer i Clarin.dk. Nogle værktøjer er integrerede, disse vises også ved en søgning, men du har yderligere mulighed for at afvikle integrerede værktøjer ved at lægge nogle resurser i Kurven og dernæst vælge "Værktøjer".



Hostet af Københavns Universitet