I Transkribathon łacińskich dokumentów polskiego średniowiecza

O projekcie

Zapraszamy do udziału w eksperymentalnym, krótkoterminowym projekcie transkrypcyjno-edycyjnym poświęconym łacińskim tekstom polskiego średniowiecza. Projekt oparty jest na zasadach tzw. crowdsourcingu. Mogą wziąć w nim udział osoby zaznajomione z łaciną oraz podstawami paleografii łacińskiej, zarówno chcące dzielić się swoją wiedzą, jak i pragnące zdobyć doświadczenie i/lub podnieść poziom swoich umiejętności w tej dziedzinie.

Projekt zakłada przygotowanie transkrypcji wybranych dokumentów (m.in. metryk królewskich) dostępnych w wersji rękopiśmiennej. Transkrybowane teksty zasilą korpus polskiej łaciny średniowiecznej, przygotowywany i rozbudowywany w ramach projektu eFontes. Elektroniczny korpus polskiej łaciny średniowiecznej https://scriptores.pl/efontes/

Zadaniem osób uczestniczących w projekcie będzie przygotowanie transkrypcji zgodnie z przekazanymi wytycznymi oraz udział w korekcie przepisanego tekstu. Organizatorki projektu zapewnią wsparcie dla uczestników na poszczególnych etapach pracy. Transkrypcja (wraz z informacją o jej autorstwie) opublikowana zostanie na stronie https://editiones.scriptores.pl/exist/apps/editiones/index.html.

Serdecznie zapraszamy do nadsyłania zgłoszeń i udziału w projekcie!

Organizacja i ważne daty

Prace transkrypcyjne prowadzone będą na platformie Transkribus https://readcoop.eu/transkribus/. Jej znajomość nie jest niezbędna do zgłoszenia się do projektu. Organizatorki planują krótkie szkolenie dotyczące obsługi Transkribusa i podstaw paleografii łacińskiej. Uczestnikom udostępnione zostaną również materiały instruktażowe oraz niezbędne do pracy narzędzia cyfrowe.

Projekt realizowany będzie w całości online. Podczas jego trwania podstawowym kanałem kontaktu będzie komunikator Slack. Będzie on stanowił forum wymiany informacji oraz pole integracji uczestników reprezentujących różne środowiska badaczy.

Projekt rozpocznie się 15 września i realizowany będzie przez trzy kolejne tygodnie. Do udziału w projekcie można zgłaszać się do 5 września za pomocą formularza (poniżej).

Zgłoszenie udziału

Rękopisy

Przedmiotem transkrypcji będą wybrane dokumenty z Ksiąg Wpisów (tom 10) wchodzących w skład Metryki Koronnej (Metrica Regni). Księgi Wpisów (Libri Inscriptionum) zawierają, jak nazwa wskazuje, wpisy dokumentów wystawianych przez kancelarię koronną. „Są to wpisy nadań królewskich wszelkiego rodzaju lub ich potwierdzeń, nominacji na urzędy, potwierdzeń transakcji dokonanych pomiędzy szlachtą (sprzedaż i zamiana dóbr, zabezpieczenie posagu, zobowiązania dłużne). Mniej liczne z natury rzeczy są wpisy o charakterze ogólnopaństwowym (zwołania sejmów i sejmików, uchwały sejmowe, ogłoszenia wici)” (za: Inwentarz Metryki Koronnej, AGAD, MK, opr. I. Sułkowska-Kurasiowa i M. Woźniakowa).

Wybrane dokumenty pochodzą z czasów panowania Kazimierza Jagiellończyka (lata 1447-1454). Oryginały rękopisów przechowywane są w Archiwum Głównym Akt Dawnych w Warszawie, w postaci cyfrowej można je oglądać tutaj.

Raport z realizacji projektu

Do udziału w projekcie zgłosiły się 22 osoby z kilku krajów Europy, tj. z Polski, Ukrainy, Wielkiej Brytanii i Mołdawii. Projekt rozpoczął się 15.09.2022 i zakończył 6.10.2022. W tym czasie grupa wolontariuszy miała opracować transkrypcję jedenastu dokumentów pochodzących z Metryki Koronnej (ze źródeł AGAD).

Prace podzielone zostały na trzy etapy. W pierwszej fazie projektu uczestnicy wyzwania przepisywali tekst z użyciem znaków Unicode podawanych w specyfikacji MUFI, by jak najwierniej oddać grafię rękopisu, w tym zapis średniowiecznych abrewiatur. Na drugi etap składała się korekta transliteracji dokonanej przez współuczestników projektu oraz transkrypcja z rozwinięciem skrótów i częściowa normalizacja pisowni. W obu częściach do zadań uczestników należało także sprawdzenie i poprawa struktury dokumentu. Trzeci etap obejmował korektę obu rodzajów zapisu przez organizatorki projektu.

Wszystkie prace prowadzono na platformie Transkribus. Podstawowa struktura dokumentów wyznaczona została automatycznie. W wyniku eksperymentu udało się przepisać 10 z 11 zaplanowanych tekstów. Obie warstwy przygotowanej transkrypcji wykorzystane zostaną jako próbka do wytrenowania modelu do automatycznego rozpoznawania tekstu (HTR) dla polskiej łaciny średniowiecznej. Pełna transkrypcja dokumentów zostanie wkrótce opublikowana na stronie projektu Editiones Latinitatis Polonorum.

Wszystkie materiały dotyczące organizacji pracy, obsługi programu Transkribus oraz przyjętych zasad transkrypcji udostępnione zostały uczestnikom projektu w sieci, na dysku Google. Część instrukcji miała charakter otwarty, uzupełniany wraz z postępem prac edytorskich.

Komunikacja w trakcie trwania projektu odbywała się za pośrednictwem platformy Zoom (spotkanie organizacyjne, dwa spotkania szkoleniowe i zebranie końcowe), poczty elektronicznej i komunikatora Slack.

Projekt został już zaprezentowany na tegorocznej Konferencji Użytkowników Transkribusa (29-30.09.22, Innsbruck, Austria). Informacje o nim pojawiały się systematycznie w mediach społecznościowych (Twitter). Projekt wzbudził spore zainteresowanie badaczy, zaciekawionych zarówno przygotowaniem, jak i przebiegiem eksperymentu

Szczegółowy opis projektu (w języku angielskim) wraz z dokumentacją (w języku polskim) jest dostępny na stronach repozytoriów cyfrowych BodoArxiv i Zenodo.


Uczestnicy projektu

1. Grzegorz Bartusik

2. Michał Kulisz

3. Mariusz Leńczuk

4. Agnieszka Maciąg – Fiedler

5. Bartosz Małecki

6. Ewa Orłowska

7. Kacper Pielat

8. Anna Poray-Wilczyńska

9. Fryderyk Rozen

10. Michał Słomski

11. Adam Talarowski

12. Orysia Vira

13. Tomasz Walczak

14. Jakub Zbądzki

15. Mateusz Zimny

 

Organizatorki

Kontakt

iwona.krawczyk@ijp.pan.pl

jagoda.marszalek@ijp.pan.pl