Spojrzenie na inteligentne przetwarzanie dokumentów i fakturowanie elektroniczne

W “minionej epoce” faktury były tradycyjnie wysyłane w formie papierowej i żmudnie przepisywane do komputera odbiorcy. System ERP ułatwiając późniejsze przetwarzanie danych. Jak wskazuje m.in. Brendan Foley, znaczna część – około 80 do 90 procent – danych z dokumentów takich jak faktury i wiadomości e-mail jest nadal wyodrębniana ręcznie (2019). W ostatnich latach nastąpiła jednak zauważalna zmiana w kierunku wyłącznie cyfrowej transmisji dokumentów, takich jak faktury biznesowe, której towarzyszą zautomatyzowane procesy ekstrakcji danych.

Dlaczego firma (lub jej menedżerowie) powinni przyjąć tę zmianę? Uzasadnienie jest jasne: aby oszczędzać zasoby (np. zmniejszając zużycie papieru) i usprawnienie przepływu pracy (np. wyeliminowanie ręcznego wprowadzania danych).

Co więcej, bycie na bieżąco z rozwojem sytuacji w tym sektorze ma kluczowe znaczenie dla firm zaangażowanych w kontrakty z sektorem publicznym. W Unii Europejskiej od dawna dąży się do standaryzacji fakturowania i zwiększenia możliwości odczytu maszynowego (dyrektywa UE 2014/15/UE). Inicjatywa ta ma na celu ułatwienie automatycznego przetwarzania faktur biznesowych. Podobnie w Niemczech, w sektorze publicznym następuje zauważalna zmiana w kierunku cyfrowego przechwytywania i zautomatyzowanego przetwarzania, z dala od tradycyjnej obsługi dokumentów papierowych.

W konsekwencji tej transformacji organy ustawodawcze w Niemczech, na przykład, nakazały, aby do około 2025 r. tylko faktury biznesowe spełniające określone formaty odczytu maszynowego mogły być przedkładane w formie cyfrowej. W związku z tym presja na firmy zaangażowane w kontrakty z sektorem publicznym będzie się nasilać w nadchodzących latach, oznaczając stopniową eskalację e-fakturowania do kluczowej fazy.

Wracając do głównego punktu, inteligentne przetwarzanie faktur biznesowych ma kluczowe znaczenie w ramach kompleksowego procesu przetwarzania faktur, stanowiąc prawdopodobnie najbardziej krytyczny aspekt procedury. Przykładowo, błędne rozpoznanie IBAN (Międzynarodowego Numeru Rachunku Bankowego) może doprowadzić do nieumyślnej płatności na rzecz niewłaściwego dostawcy, a tym samym spowodować znaczne późniejsze koszty dla firmy.

Badanie dwóch podejść do identyfikacji pól danych na fakturach biznesowych: Integracja AI i znormalizowane formaty

W następnej sekcji zostaną określone dwie potencjalne metodologie identyfikacji pól danych z faktur biznesowych.

W początkowym scenariuszu rozpoznawanie danych jest ułatwione dzięki wykorzystaniu sztucznej inteligencji (AI). Obecnie różni dostawcy – tacy jak Microsoft (wykorzystujące model LayoutLM), ABBYY, SAP i EagleDoc – oferują kompleksowe rozwiązania do ekstrakcji danych z wykorzystaniem technologii AI. Na przykład SAP wykorzystuje czytnik dokumentów do analizowania wyodrębnionych dokumentów faktur, tym samym rozróżniając i kategoryzując odpowiednie dane. OCR oparty na sztucznej inteligencji (Optyczne rozpoznawanie znaków) oprogramowanie sprawnie identyfikuje i przechwytuje dane z faktur, porównując je z danymi podstawowymi dostawcy. Wykorzystując istniejące wcześniej dane podstawowe, fakturę można szybko przypisać do odpowiedniego dostawcy i wyznaczonego pracownika. Co więcej, oprogramowanie do klasyfikacji sprawnie interpretuje pozycje faktury i powiązane wartości, ułatwiając natychmiastowe dostosowanie do odpowiednich danych zamówienia. Niemniej jednak, wspólną cechą wszystkich dostawców jest iteracyjny charakter przetwarzania faktur – ciągły proces udoskonalania.

W alternatywnym podejściu pola danych z faktur są wyodrębniane i określane przy użyciu europejskich lub krajowych standardów faktur. Na poziomie europejskim jedną z godnych uwagi inicjatyw jest PEPPOL (Pan-European Public Procurement Online). Inicjatywa ta ustanawia powszechnie akceptowany standard faktur (format PEPPOL) w celu usprawnienia handlu między państwami członkowskimi. Format ten jest powszechnie uznawany i zatwierdzany przez władze w wielu państwach członkowskich.

Ponadto, aby ułatwić handel krajowy i przestrzegać dyrektyw UE na szczeblu krajowym, poszczególne kraje ustanowiły własne krajowe standardy faktur wraz z uznanymi standardami europejskimi, takimi jak format PEPPOL. Na przykład Austria wdrożyła standard “ebInterface”, podczas gdy Niemcy przyjęły “ZUGFeRD” (Zentraler User Guide des Forums elektronische Rechnung Deutschland), służący jako krajowy standard faktur.

Następnie zagłębimy się w techniczne zawiłości tych standardów faktur, badając dostępne formaty i ich wykorzystanie do wyodrębniania i identyfikacji danych z faktur biznesowych.

Konwencjonalna europejska metoda elektronicznego fakturowania opiera się na formacie XML. Wiąże się to z tworzeniem każdej faktury w formacie XML, a następnie przesyłaniem jej do odbiorcy w celu płynnego zautomatyzowanego przetwarzania. Krajowy standard faktur określa konkretny format XML wymagany dla takich faktur.

Ten ustrukturyzowany format danych ułatwia automatyczne przetwarzanie faktur. Norma RNorm 16931 standaryzuje dwa formaty XML dla faktur elektronicznych:

UN/CEFACT XML CII (Cross Industry Invoice)
UBL ISO/IEC 19845 (znany również jako UBL 2.1 Invoice, Universal Business Language)

Unlocking Data Extraction in Business Invoices With “ZUGFeRD”: Spostrzeżenia z inicjatywy Mustang

Proszę wziąć pod uwagę “ZUGFeRD” jako główną ilustrację do wyodrębniania pól danych z faktur biznesowych. Zgodnie z wynikami inicjatywy open-source “Mustang”, około 43% firm w Niemczech przesyła obecnie faktury elektroniczne, z czego 45% wykorzystuje format ZUGFeRD/Factur-X.

Przedsięwzięcie “Mustang” składa się z open-source Java (Jar lub Maven) i .NET, oferujący zestaw narzędzi obejmujących odczyt, edycję i walidację faktur ZUGFeRD.

Załóżmy, że posiadamy fakturę w formacie PDF zgodną ze standardem “ZUGFeRD”. Poniżej znajduje się fragment kodu Java ilustrujący sposób wyodrębniania poszczególnych pól danych z faktury:

public class ZUGFeRDReader {

    public static void main(String[] args) {
         
        ZUGFeRDImporter zi = new ZUGFeRDImporter("./MustangGnuaccountingBeispielRE-20201121_508.pdf");
   
        //"ZUGFeRD" validation
        if (zi.canParse()) {   
            System.out.println("Total Amount: " + zi.getAmount());
            System.out.println("BIC: " + zi.getBIC());
            System.out.println("IBAN: " + zi.getIBAN());
            System.out.println("Holder Name: " + zi.getHolder());
            System.out.println("Invoice Number: " + zi.getForeignReference());
            System.out.println("Invoice Date: " + zi.getInvoiceDate());
            System.out.println("Invoice Due Date: " + zi.getDueDate());
            System.out.println("Currency: " + zi.getCurrency());
            System.out.println("Tax ID: " + zi.getTaxID());
            System.out.println("Customer Reference: " + zi.getCustomerReference());
       
        } else {
            System.out.println("Invoice is not in the ZUGFeRD format");
        }
    }
}

Wnioski

Podsumowując, wraz z eskalacją inteligentnego przetwarzania dokumentów w codziennych operacjach biznesowych, dyskurs na temat e-fakturowania staje się coraz bardziej nieunikniony. Zauważyliśmy, że dokładne rozpoznawanie pól danych na fakturze ma kluczowe znaczenie dla elektronicznego przetwarzania, przy czym w grę wchodzą dwie różne metodologie: AI i e-fakturowanie.

Podejście oparte na sztucznej inteligencji okazuje się skuteczne w obsłudze nieustrukturyzowanych formatów danych takich jak TIF, JPEG, dokumenty Word lub teksty e-mail, podczas gdy strategia e-faktury wyróżnia się w zarządzaniu hybrydowymi formatami faktur, takimi jak “ZUGFeRD” i ustrukturyzowanymi danymi dostępnymi w plikach XML.

Jak zaobserwowano, istnieje rosnąca presja publiczna na przyjęcie znormalizowanych e-faktur. Ponadto proces gromadzenia danych oparty na sztucznej inteligencji jest iteracyjny, początkowo obarczony znacznym marginesem błędu, co wymaga znacznego czasu i zasobów na udoskonalenie poprzez szkolenie. Z kolei podejście oparte na e-fakturach umożliwia bezpośrednią i niemal bezbłędną ekstrakcję danych, co prawdopodobnie przekłada się na niższe koszty przetwarzania.

Aby pozostać przyszłościowymi, firmy oferujące cyfrowe rozwiązania do automatycznego przetwarzania faktur biznesowych muszą zdywersyfikować swoją ofertę, aby uwzględnić zarówno podejście oparte na sztucznej inteligencji, jak i e-fakturze.