Date:September 11, 2014

Korpus govorjene slovenščine GOS

Posnetki govorjene slovenščine v različnih vsakodnevnih situacijah. Posnetki so transkribirani in umeščeni v zmogljiv vmesnik, s katerim lahko primere govora iščemo, poslušamo in preučujemo. Povezava na korpus: http://www.korpus-gos.net.

Posnetek na desni na kratko predstavlja osnovne značilnosti korpusa GOS. Specifični primeri iskanja po korpusu so na voljo v posnetkih spodaj, skupaj z nekaterimi dodatnimi informacijami o projektu in seznamom avtorjev. Priporočamo, da si pred gledanjem posnetkov v nastavitvah predvajalnika vklopite najvišjo razpoložljivo kakovost prikaza (1080p), na voljo pa so tudi slovenski podnapisi.

 

  • Namen korpusa, sestava, specifikacije zbiranja gradiva, načela transkribiranja in označevanja posnetkov, navodila za standardizacijo zapisa govora in transkribiranje pogovorov: http://www.korpus-gos.net/Support/About.

    Navodila za delo s korpusom: http://www.korpus-gos.net/Support/Manual.

    Korpus GOS je nastal v sklopu projekta Sporazumevanje v slovenskem jeziku, ki sta ga med leti 2008 in 2013 financirala Evropski socialni sklad in Ministrstvo za izobraževanje, znanost in šport RS. Korpus je brezplačno na voljo za rabo na spletu, pod licenco Creative Commons Priznanje avtorstva-Nekomercialno-Deljenje pod enakimi pogoji pa je mogoče na računalnik prenesti korpus Gos v formatu XML in stisnjeno datoteko z Document Type Definition (DTD), W3C schema (XSD) in RelaxNG (RNG), ki definirajo formalno strukturo korpusa Gos v formatu XML.

  • Na spletni strani projekta so našteti naslednji avtorji in sodelavci:

    Korpus Gos kot podatkovna zbirka: Ana Zwitter Vitez, Jana Zemljarič Miklavčič, Simon Krek, Marko Stabej, Tomaž Erjavec
    Konkordančnik za korpus Gos (projekt Spletni konkordančnik za nacionalni govorni korpus slovenskega jezika): Darinka Verdonik, Ana Zwitter Vitez, Rok Rejc, Simon Rigač, Špela Arhar Holdt, Iztok Kosem, Simon Krek

    SODELAVCI (po nalogah)
    Specifikacije korpusa Gos: Simon Krek, Agnes Pisanski Peterlin, Marko Stabej, Tina Verovnik, Jana Zemljarič Miklavčič, Ana Zwitter Vitez
    Snemanje: Ana Zwitter Vitez, Brigita Bec, Mojca Bizjak, Rebeka Dragič, Aja Barbo Gruden, Jernej Golobič, Andreja Gregorič, Pija Kapitanovič, Ana Kočevar, Katja Krapež, Jaruška Majovski, Iztok Mikulan, Alenka Mirkac, Dusán Mukics, Barbara Omahen, Neža Pahovnik, Tomaž Potočnik, Lucija Ramovš, Lucija Rap, Erika M. Roblek, Mateja Strmšek, Ivana Šlaus, Maja Štefančič, Jure Tompa, Andrej Tomše, Slavka Vesenjak, Pija Vrezner
    Urejanje posnetkov: Rebeka Dragič
    Transkribiranje – pogovorni zapis: Aja Barbo Gruden, Mariša Bizjak, Mojca Bizjak, Jernej Golobič, Ana Gorinšek, Katja Krapež, Jaruška Majovski, Iztok Mikulan, Alenka Mirkac, Barbara Omahen, Neža Pahovnik, Tomaž Potočnik, Erika M. Roblek, Mateja Strmšek, Maja Štefančič, Maja Šučur, Andrej Tomše, Bojana Zevnik
    Kontrola transkripcij – pogovorni zapis: Mariša Bizjak, Alenka Mirkac, Tomaž Potočnik, Andrej Tomše
    Validacija transkripcij – pogovorni zapis: Ana Zwitter Vitez
    Transkribiranje – standardizirani zapis: Ana Zwitter Vitez
    Izdelava XML-sheme za tekstovni del korpusa: Tomaž Erjavec
    Vodja projekta Spletni konkordančnik za nacionalni govorni korpus slovenskega jezika: Darinka Verdonik
    Procesiranje datotek: Amebis, d. o. o., Kamnik, Fakulteta za elektrotehniko, računalništvo in informatiko, Univerza v Mariboru
    Izdelava konkordančnika GOS: Rok Rejc, Simon Rigač

  • Korpus Gos smo na Portalu jezikovnih virov spoznavali tudi v izobraževalno-promocijski aktivnosti Vir meseca, v kateri smo predstavljali različne zanimivosti v zvezi z jezikovnimi viri za slovenščino. Povzetek objav o korpusu Gos si lahko ogledate na spletni strani http://eepurl.com/bA7UXj.