Språkbanken Clarin- nationell infrastruktur för e-vetenskap

Infrastruktur

    Information

    Akronym

    Språkbanken Clarin

    Namn på nationell/internationell infrastruktur som denna infrastruktur tillhör

    Språkbanken Clarin är en nod i det europeiska konsortiet CLARIN ERIC (Common Language Resources and Technology Infrastructure) som utvecklar och tillhandahåller nationell och europeisk infrastruktur för tal- och textbaserad e-vetenskap, omfattande digitaliserade material och avancerade språkteknologiska verktyg, användarstöd, workshoppar och samarbete kring forskningsansökningar.

    Det svenska konsortiet Språkbanken Clarin, är finansierat Vetenskapsrådet och leds av Göteborgs universitet, koordinerat av Språkbanken text. Språkbanken Clarin är organiserat som ett konsortium med tolv noder:
    •Språkbanken Speech, KTH
    •Språkbanken Sam, Isof
    •Centre for digital humanities, GU
    •Computational Linguistics, UU
    •Department of Linguistics, SU
    •LU Humanities Lab
    •Humlab, UmU
    •National Library of Sweden
    •NLPLab, LiU
    •Swedish National Archive).

    Dessa erbjuder bland annat expertis, utveckling och underhåll av språkteknologiska verktyg, och digitala samlingar.


    Beskrivning

    Humanistlaboratoriet är en lokal nod i Språkbanken Clarin och också ett certifierat CLARIN Knowledge Centre (K-centre), CLARIN-MULTISENS, med särskilt fokus på multimodala och sensorbaserade metoder. Utöver detta är Humanistlaboratoriet även ett CLARIN C-centre, vilket innebär att våra datamängder är integrerade med CLARINs Virtual Language Observatory.

    Utrustning och resurser

    Expertis inom språkteknologi och metoder (inklusive NLP).

    Digitala och fysiska samlingar

    Arkivserver:
    Humanistlaboratoriet erbjuder säker lagring av strukturerad forskningsdata i form av ett digitalt arkiv. Arkivservern kan även fungera som en samarbetsyta där forskargrupper kan ladda ner, berika och ladda upp data och metadata.
    Metadatan är synlig och sökbar för alla via korpus-browsern, medan datans tillgänglighet varierar. På så sätt kan andra forskare fortfarande leta efter relevant data utan att känslig data riskerar spridning. Användaren kan sedan behöva fråga specifikt om access beroende av om eventuella begränsingar satts.

    Arkivservern tillhandahåller CMDI metadata externt och är sökbar i CLARINs meta-arkiv Virtual Langauge Observatory (VLO). Arkivservern är även sökbar i Open Language Archives Community (OLAC).

    Erbjudna tjänster

    * Lagring av forskningsdata i ett långtidsperspektiv, samt tillgängliggörande av data
    * Expertis inom frågor som rör metod och teknologi samt guidning i de resurser som finns och samarbete kring forskningsansökningar.
    * Konsultation, träning och expertis inom digitala verktyg för att analysera text eller språkmaterial.


    Styrning av infrastrukturen

    Språkbanken Clarin leds på nationell nivå av Språkbanken Text (GU). Den lokala noden i Lund leds av prof Marianne Gullberg och koordinator Johan Frid med stöd från Humanistlaboratoriet.

    Ämnesklassifikation (UKÄ)

    • Humaniora och konst

    Infrastrukturkategori

    • European Research Infrastructure Consortium (ERIC)
    • Infrastruktur av nationellt intresse (Vetenskapsrådet)