Czwartkowe spotkania lingwistyczne
06 02 2024
Zapraszamy serdecznie na kolejne spotkanie z cyklu Czwartkowe spotkania lingwistyczne, które się odbędzie na platformie Zoom 22 lutego 2024 r. w godz. 13.15-14.45.
Link do spotkania: https://uw-edu-pl.zoom.us/j/97989661345
Na spotkaniu referat pt. Korpus przekleństw i wulgaryzmów – geneza, akwizycja i anotacja tekstów, możliwe zastosowania wygłosi dr Sebastian Żurowski (UMK).
Streszczenie
Minęły już ponad trzy dekady od pierwszego wydania „Słownika polskich przekleństw i wulgaryzmów” Macieja Grochowskiego. Do tej pory to jedyny możliwie całościowy opis tego wycinka polskiej leksyki. Pierwszym krokiem na drodze do aktualizacji tego opisu jest zebranie reprezentatywnego korpusu – reprezentatywność w tym wypadku oznacza coś innego niż w wypadku korpusów ogólnych, ponieważ w gruncie rzeczy chodzi o zgromadzenie tekstów, które (i) w ogóle zawierają przekleństwa i wulgaryzmy, (ii) wskazane wyrażenia są w tych tekstach nadreprezentowane.
W prezentacji przestawię syntetycznie genezę powstania korpusu przekleństw i wulgaryzmów CLARIN-PL, zasady akwizycji i anotacji tekstów oraz poddam pod dyskusję możliwe zastosowania takiego zbioru tekstów. Zasób jeszcze jest w trakcie przygotowywania do udostępnienia, ale możliwe jest już jego przybliżenie, a także przedstawienie wstępnych statystyk.
Prace referowane w prezentacji zostały sfinansowane w ramach Programu Operacyjnego Inteligentny Rozwój 2014–2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki, nr POIR.04.02.00-00C002/19, „CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna”.