Przeszukiwanie korpusów tekstowych

Corpus Query Language (CQP) jest rozpowszechnionym językiem zapytań stosowanych w przeszukiwaniu korpusów tekstowych. Na nim opiera się przeszukiwanie m.in. Narodowego Korpusu Języka Polskiego (wyszukiwarka Poliqarp), Brytyjskiego Korpusu Narodowego (BNCweb), Czeskiego Korpusu Narodowego, korpusów równoległych (ParaSol).

Celem kursu jest dogłębne zapoznanie uczestników z tym językiem na przykładzie wyszukiwarki Poliqarp i korpusów języka polskiego. Przejdziemy po kolei przykłady wyszukiwania zjawisk fonologicznych (oczywiście w takim przybliżeniu na jakie pozwala zapis ortograficzny, a nie fonetyczny tekstów), morfologicznych, składniowych i frazeologicznych. Poszczególne ćwiczenia będą nakierowane na poszukiwanie odpowiedzi na konkretny problem językoznawczy, niemniej nacisk położymy raczej na właściwe sformułowanie zapytania (czy szerzej na operacjonalizację problemu badawczego), niż na szczegółową analizę danych.

Warsztaty poprowadzi prof. Rafał L. Górski.