Jak wyciąć tekst z djvu
Książki w formacie djvu znajdują się w e-bibliotekach dość często. Zwykle zajmują one niewielką ilość, w nich zapisane czcionki i ilustracje oryginału. Główną wadą tego formatu jest to, że tekst strony jest kopiowany do schowka jako obraz. Aby go edytować, należy korzystać z innych aplikacji.
Trzeba
- – komputer z programami Djvu OCR, Djvu Solo, Djvu Viewer;
- – ABBYY FineReader:
- – Adobe Photoshop.
Instrukcja
1
Skopiować osobną stronę z książki w formacie djvu pozwala praktycznie każdy program, który czyta pliki tego typu. Wszystkie one mają podobny interfejs i podobne funkcje. Przejdź do górnego menu i znajdź kartę Selection. Tam można zobaczyć pozycję Select Region. Wybierz ją.
2
Znajdź stronę, którą chcesz, możesz To zrobić w oknie górnego menu. Jeśli strona znajduje się w pobliżu początku lub końca książki, można użyć strzałek. Zaznacz na niej odpowiedni fragment z pomocą ramki, który pojawił się przed tobą. Kliknij prawym przyciskiem myszy. Przed tobą pojawi się rozwijane menu, które oferuje albo zapisz stronę, albo skopiować. Wybierz drugie.
3
Otwórz Adobe Photoshop lub, na przykład, przeglądarka zdjęć, który ma funkcję tworzenia nowego pliku. Utwórz plik i wklej do niego to, co masz w buforze. Zapisz obraz jako jpg lub tiff. W razie potrzeby obrobić go. W formacie djvu często zachowują bardzo stare książki, z niezwykłymi i nie zawsze wyraźnych czcionek. Poza tym, tam są zapisane wszystkie notatki, które były w oryginale. Mogą one wpływać na распознанию tekstu. Usuń nadmiar śmieci. Ustaw obraz na czarno-białe i ustaw balans jasności i kontrastu. W niektórych przypadkach konieczne może zwiększyć rozdzielczość jednocześnie z wymiarami.
4
Otwórz obraz w programie ABBYY FineReader. Im nowsza wersja tego programu u was kosztuje – tym lepiej. Znajdź funkcję „Rozpoznać”. Gdy program to zrobi, zapisz plik w wybranym przez ciebie formacie, na przykład, w doc.
5
Program Djvu OCR pozwala na podział na strony raz całą książkę. Otwórz program i wybierz w menu opcję Djvu Decoder. Pojawi się okno. Znajdź funkcję Djvu File List. Kliknij przycisk Add (dodaj). Określ, gdzie znajduje się książka w tym formacie, który chcesz przekonwertować. Wybierz opcję Output Directory. Znajdź przycisk Browse. Wybierz folder, do zapisanych stron. Nazwa folderu napisz w języku łacińskim. Kliknij Process.
6
Uruchom program ABBYY FineReader. Można otworzyć jak jedną stronę, jak i wszystkie na raz – to znacznie skróci czas. Kliknij przycisk „Rozpoznać”. Zapisz strony poszczególnymi plikami lub zaznacz wszystko i zrobić z nich jeden dokument.