System obsługi historycznych dokumentów źródłowych, dedykowany do budowania zaawansowanych baz i narzędzi dla projektów badawczych.

Internetowy system MANUS służy do opracowywania i udostępniania dokumentów źródłowych w standardzie TEI P5 XML (http://www.tei-c.org/). Jest to standard umożliwiający zawarcie bardzo bogatych metadanych dokumentów, ich struktury oraz reprezentacji tekstu w bogatych warstwach wielorakich znaczników (zobacz podręcznik). Standard ten zdobywa coraz większą popularność wśród naukowców humanistów różnych dziedzin do prezentowania tekstów do badań on–line. Ustrukturyzowana i ustandaryzowana forma plików XML sprawia, że są one łatwe do przetwarzania maszynowego co system MANUS wykorzystuje na wielu etapach.

System definiuje kilka schematów metadanych dokumentów TEI P5 dla różnego typu dokumentów: od skomplikowanych opisów rękopisów i starodruków (z bogatym nagłówkiem opisu fizycznego, stanu zachowania i zawartości), poprzez książki i rozdziały, czasopisma, numery i artykuły do pojedynczych dokumentów niepowiązanych żadną strukturą. System można tak skonfigurować, aby wyświetlał każdy z tych typów w oddzielnych (kilku) kolekcjach. Dla każdego z typów system udostępnia dedykowane, przyjazne użytkownikowi, formularze edycji jego metadanych TEI P5. Dzięki temu nie ma konieczności bezpośredniej edycji pliku XML, którego struktura jest bardzo złożona. Rozwiązanie takie nie tylko ułatwia wprowadzanie danych poprzez zastosowanie odpowiednich komponentów, ale także pozwala na sprawne korygowanie ewentualnych błędów. Dla zaawansowanych użytkowników istnieje możliwość podłączenia webowego edytora XML ze stowarzyszonej z systemem bazy danych eXistdb (http://www.exist-db.org/), lub wgrywanie do systemu plików XML edytowanych poza systemem. Redaktorzy mają także możliwość wgrywania do systemu skanów powiązanych z danym dokumentem TEI P5, a system automatycznie zrobi referencje na te skany w dokumencie.

System definiuje także schemat TEI P5 dla biogramów osób, które są autorami, redaktorami, tłumaczami, itp. dokumentów przechowywanych w bazie. Udostępnia strony grupujące dokumenty powiązane tymi relacjami z daną osobą, niezależnie od tego jakim pseudonimem/apelacją podpisały się w danym dokumencie.

System zintegrowany jest z silnikiem wyszukiwawczym Solr (http://lucene.apache.org/solr/), dając użytkownikowi zaawansowane możliwości wyszukiwania facetowego, w różnych warstwach tekstu i z uwzględnieniem lematyzacji języka polskiego (lub innego dostępnego w Solr). System można łatwo dostosować, by indeksował tylko wybrane węzły XML oraz wybrane warstwy tekstu, a także w ramach warstwy wybrane języki. Wyniki wyszukiwania można ograniczać do danej warstwy i języka oraz eksportować do plików tsv (text/tab-separated-values).

Przejrzysty interfejs graficzny portalu pozwala nie tylko na przeszukiwanie i przeglądanie zawartości plików XML, ale także na sprawne nawigowanie po powiązanych ze sobą danych, oraz na oglądanie stowarzyszonych skanów wraz z ich warstwami tekstu. Wszystko to dzięki rozbudowanemu podsystemowi zapytań XQuery, za pomocą którego MANUS łączy się ze stowarzyszoną bazą danych XML. Dodatkowe funkcje pracy z dokumentami implementowane są na potrzeby konkretnych projektów badawczych.

Kontynuując przeglądanie e-jazyszłar zgadzasz się na korzystanie z plików cookies.
Proszę przeczytaj nasz regulamin plików cookie.