Od tekstu do korpusu

W czasie kursu przeprowadzimy uczestników przez wszystkie etapy obróbki tekstów na potrzeby badań z zakresu humanistyki cyfrowej. Podczas dwudniowego szkolenia filolodzy, językoznawcy, edytorzy oraz wszyscy pracujący z tekstami naukowcy będą mieli okazję poznać m.in.:
– formaty i kodowanie plików stosowanych w humanistyce cyfrowej;
– wybrane narzędzia do obróbki tekstu;
– metody i narzędzia do wyszukiwania i korekty za pomocą wyrażeń regularnych;
– cele i metody tworzenia ustrukturyzowanych plików XML i ich konwersji do HTML i innych formatów;
– standardy danych na potrzeby badań humanistycznych;
– podstawy prezentacji danych tekstowych za pomocą arkuszy CSS i baz danych XML.

Trzeci dzień kursu będzie poświęcony pracy nad wybranymi projektami jego uczestników i przedstawi pełną drogę od tekstu do wyszukiwarki korpusowej.

Kurs ma charakter wprowadzający, od uczestników wymaga się jedynie sprawnej obsługi komputera.

Zajęcia poprowadzą: Krzysztof Nowak i Michał Woźniak.