MENU
plakat 1

plakat 2

plakat 3

plakat 4

Wywiad z pracownikiem pracowni digitalizacji zbiorów Biblioteki Głównej ASzWoj

 

Tak jak zapowiadaliśmy w lipcu, został przeprowadzony wywiad z jednym ze skanerzystów pracowni digitalizacji zbiorów Biblioteki Głównej Akademii Sztuki Wojennej.

 

Pytanie 1. Jakie są obowiązki skanerzystów w Projekcie „Portal Bezpieczeństwa i Obronności ASzWoj”?

Skanerzystka: Najistotniejszym etapem naszej pracy jest sam proces skanowania. Korzystamy
z profesjonalnego sprzętu - skanera szalkowego, który pozwala na skanowanie zarówno książek, czasopism, podręczników, jak i materiałów wielkoformatowych, takich jak mapy, plany itp.
Po zeskanowaniu przystępujemy do formatowania i OCRowania powstałych plików (TIF) w programie ABBY.

Pytanie 2. Na czym polega proces formatowania i OCRowania plików?

Skanerzystka: Proces formatowania polega na wybielaniu, przycinaniu do zbliżonej wielkości stron materiału oraz prostowaniu stron i tekstu. Są to czynności, które mają na celu stworzenie estetycznie poprawnego pliku PDF, z którego  wykonuje się plik OCR. OCRowanie jest istotne z punktu widzenia czytelnika, ponieważ daje możliwość wyszukiwania wybranych fraz czy wyrazów w tekście.
Warto dodać, że proces OCRowania odbywa się za pośrednictwem programu ABBY, który ma pewne ograniczenia, jeżeli chodzi o odczytywanie tekstu. Dlatego często wykonujemy korektę znacznej części tekstu książki, czy innego skanowanego materiału.

Pytanie 3. Czy każdy materiał, który trafia do Pracowni Digitalizacji wymaga wskazanych wyżej czynności formatowania i OCRowania?

Skanerzystka: Nie każdy. OCR faktycznie wykonywany jest na każdym materiale. Natomiast nie wykonujemy pełnego formatowania na książkach o dużej wartości historycznej. Jeżeli dany materiał ma oryginalnie żółte strony, to nie wybielamy ich.

Pytanie 4. Rozumiem. A  jakiego rodzaju materiał jest skanowany i kto go selekcjonuje i dostarcza?

Skanerzystka: Nasza praca skupia się głównie na skanowaniu najnowszych materiałów, zeszytów naukowych, czasopism, podręczników z lat 2017 – 2018, doktoratów, prac naukowo – badawczych
i programów kształcenia. Jednak obecnie mamy możliwość pracy na materiale z okresu książek z okresu międzywojennego oraz I i II wojny światowej. Książki dostarczane są przez Planistę,
który odpowiedzialny jest także za wybór materiału do skanowania.

Pytanie 5. Co dzieje się z OCRowanymi plikami PDF, które rozumiem są końcowym produktem pracy?

Skanerzystka: Tak. OCRowane pliki to efekt naszej pracy. Zapisujemy je na komputerze na dysku wewnętrznym oraz na dysku zewnętrznym, który dedykowany jest głównie do gromadzenia zeskanowanego materiału, czyli TIF-ów. TIFy traktowane są jako „materiał źródłowy”, na którym pracujemy w dalszych etapach digitalizacji, można do nich zawsze powrócić i zmodyfikować, poprawić na przykład formatowanie, natomiast PDF’y przekazywane są Planiście na nośniku pamięci.

 

Dziękuję serdecznie za rozmowę!


wróć