Od 21 stycznia 2022 r. powracamy z cyklem seminariów wprowadzających do używanych przez nas metod humanistyki cyfrowej, elektronicznych narzędzi oraz podstaw pracy z korpusem. Spotykać się będziemy co dwa tygodnie w piątki w godz. 17-19. Tym razem więcej uwagi poświęcimy zaproponowanym przez Państwa zagadnieniom, tj. semantyce dystrybucyjnej, badaniom zależności tekstów oraz przygotowaniu edycji cyfrowej.
Ramowy program
Od obrazu do tekstu
- anotacja rękopisów i starodruków z programem Transkribus
- automatyczne rozpoznawanie tekstu rękopisów i starodruków z programem Transkribus
Od tekstu do edycji
- wprowadzenie do paleografii
- anotacja XML edycji krytycznej
- prezentacja i przeszukiwanie edycji
Od edycji do korpusu
- anotacja manualna i trenowanie taggera
- metadane: rekoncyliacja danych biograficznych i geograficznych z Linked Open Data
Pożytki z korpusu
- statystyka leksykalna
- kolokacje, n-gramy, MWE
- wykrywanie zapożyczeń z R / Pythonem
Korpus a znaczenie
- co to jest i gdzie się kryje?
- co korpus mówi nam o znaczeniu?
- metody semantyki dystrybucyjnej