Ta strona wykorzystuje ciasteczka ("cookies") w celu zapewnienia maksymalnej wygody w korzystaniu z naszego serwisu. Czy wyrażasz na to zgodę?

Czytaj więcej

Czwartkowe spotkania lingwistyczne

Zapraszamy serdecznie na kolejne spotkanie z cyklu Czwartkowe spotkania lingwistyczne, które się odbędzie na platformie Zoom 22 lutego 2024 r. w godz. 13.15-14.45.

Link do spotkania: https://uw-edu-pl.zoom.us/j/97989661345

Na spotkaniu referat pt. Korpus przekleństw i wulgaryzmów – geneza, akwizycja i anotacja tekstów, możliwe zastosowania wygłosi dr Sebastian Żurowski (UMK).

Streszczenie

Minęły już ponad trzy dekady od pierwszego wydania „Słownika polskich przekleństw i wulgaryzmów” Macieja Grochowskiego. Do tej pory to jedyny możliwie całościowy opis tego wycinka polskiej leksyki. Pierwszym krokiem na drodze do aktualizacji tego opisu jest zebranie reprezentatywnego korpusu – reprezentatywność w tym wypadku oznacza coś innego niż w wypadku korpusów ogólnych, ponieważ w gruncie rzeczy chodzi o zgromadzenie tekstów, które (i) w ogóle zawierają przekleństwa i wulgaryzmy, (ii) wskazane wyrażenia są w tych tekstach nadreprezentowane.

W prezentacji przestawię syntetycznie genezę powstania korpusu przekleństw i wulgaryzmów CLARIN-PL, zasady akwizycji i anotacji tekstów oraz poddam pod dyskusję możliwe zastosowania takiego zbioru tekstów. Zasób jeszcze jest w trakcie przygotowywania do udostępnienia, ale możliwe jest już jego przybliżenie, a także przedstawienie wstępnych statystyk.

Prace referowane w prezentacji zostały sfinansowane w ramach Programu Operacyjnego Inteligentny Rozwój 2014–2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki, nr POIR.04.02.00-00C002/19, „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna”.