Od 21 stycznia 2022 r. powracamy z cyklem seminariów wprowadzających do używanych przez nas metod humanistyki cyfrowej, elektronicznych narzędzi oraz podstaw pracy z korpusem. Spotykać się będziemy co dwa tygodnie w piątki w godz. 17-19. Tym razem więcej uwagi poświęcimy zaproponowanym przez Państwa zagadnieniom, tj. semantyce dystrybucyjnej, badaniom zależności tekstów oraz przygotowaniu edycji cyfrowej.

Ramowy program

Od obrazu do tekstu

  • anotacja rękopisów i starodruków z programem Transkribus
  • automatyczne rozpoznawanie tekstu rękopisów i starodruków z programem Transkribus

Od tekstu do edycji

  • wprowadzenie do paleografii
  • anotacja XML edycji krytycznej
  • prezentacja i przeszukiwanie edycji

Od edycji do korpusu

  • anotacja manualna i trenowanie taggera
  • metadane: rekoncyliacja danych biograficznych i geograficznych z Linked Open Data

Pożytki z korpusu

  • statystyka leksykalna
  • kolokacje, n-gramy, MWE
  • wykrywanie zapożyczeń z R / Pythonem

Korpus a znaczenie

  • co to jest i gdzie się kryje?
  • co korpus mówi nam o znaczeniu?
  • metody semantyki dystrybucyjnej