Zaawansowane ustawienia
W niektórych dokumentach struktury tabel mogą być złożone - rozciągają się na kilka linii, zawierają zgrupowane informacje lub obejmują niepotrzebne dodatkowe wiersze. Zaawansowane ustawienia w trybie szkoleniowym pozwalają dostroić ekstrakcję tabel do takich przypadków, poprawiając dokładność i spójność.
Aby uzyskać dostęp do tych ustawień, aktywuj Tryb Szkoleniowy i kliknij ikonę zębatki Ustawienia na górnym pasku akcji:
Liczba Wierszy Nagłówka
Użyj tej opcji, aby zdefiniować, ile wierszy stanowi nagłówek tabeli.
Niektóre tabele mają nagłówki wieloliniowe. Na przykład nagłówek tej tabeli obejmuje dwie linie:
Ustaw Liczba wierszy nagłówka, aby dopasować:
Dlaczego to jest ważne?
Jeśli tego nie ustawisz, DocBits może traktować drugą linię jako dane, a nie jako część nagłówka, co prowadzi do błędów ekstrakcji:
Przed:
Po:
Przenieś Dodatkowe Wiersze do Kosza
Użyj tego, aby usunąć niechciane wpisy wieloliniowe, takie jak opisy przekraczające miejsce.
W tym przykładzie opis rozlewa się na kilka wierszy, ale istotna jest tylko pierwsza linia:
Włącz Przenieś Dodatkowe Wiersze do Kosza, aby usunąć nadmiar:
Wynik po mapowaniu:
Minimalna Liczba Zgrupowanych Wierszy
Użyj tego, gdy wiersze muszą być zgrupowane pod jednym głównym wierszem (np. pozycje z wieloma podwierszami).
Tutaj tylko trzy z sześciu wierszy są istotne. Dwa kluczowe kolumny są mapowane (np. Pozycja, Opis), podczas gdy inne traktowane są jako pola niestandardowe.
Zacznij od ustawienia Liczba wierszy nagłówka i Minimalna liczba zgrupowanych wierszy:
Włącz również Przenieś Dodatkowe Wiersze do Kosza, aby posprzątać zbędne dane:

Następnie zdefiniuj kolumnę klucza grupowania, np. Pozycja:
Wynik:
Odwrócone Grupowanie
Użyj tego, gdy wiersz grupujący pojawia się po wierszach, które powinien zgrupować.
Jeśli wiersz, który powinien być zgrupowany z innymi danymi, pojawia się powyżej klucza grupowania, włącz tę opcję:
Włącz Odwrócone grupowanie, zgrupuj według głównej kolumny (np. Kwota netto) i użyj Przenieś Dodatkowe Wiersze do Kosza, jeśli jest to konieczne:
Ostateczny wynik:
Podsumowanie
Użyj Zaawansowanych Ustawień, aby nauczyć DocBits, jak dokładnie obsługiwać bardziej złożone lub niekonsekwentne struktury tabel. Te ustawienia poprawiają precyzję ekstrakcji, uwzględniając:
Nagłówki wieloliniowe
Opisy wielowierszowe
Zgrupowane pozycje
Odwrócony porządek danych zgrupowanych
Włączenie tych opcji podczas szkolenia zapewnia, że DocBits zapamiętuje poprawny układ do przyszłych dokumentów od tego samego dostawcy.
Last updated