L’attività di segmentazione è progettata per suddividere il testo nei documenti non strutturati in paragrafi. Questo consente al programma di restringere le aree di ricerca per i field che devono essere estratti da altre attività. L’attività può anche essere utilizzata per estrarre interi paragrafi in field di testo (ad esempio, se si desidera estrarre clausole e condizioni legali da un contratto).Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Immagine di esempio di un tipico paragrafo
Immagine di esempio di un tipico paragrafo

Casi d’uso
- Quando sai che le entità denominate che vuoi estrarre dai documenti si trovano sempre nello stesso paragrafo. Ad esempio, se sai che i nomi delle organizzazioni e gli indirizzi da estrarre si trovano nel primo paragrafo di ogni contratto, puoi estrarre il primo paragrafo utilizzando un’attività di Segmentation, quindi estrarre da quel paragrafo i nomi delle aziende e gli indirizzi utilizzando un’attività Named Entities (NER). Questo approccio è più affidabile rispetto all’estrazione di entità denominate dall’intero documento, poiché puoi controllare l’area specifica da cui vengono estratte.
- Quando un paragrafo deve essere estratto nella sua interezza perché tutto il suo contenuto è rilevante, ad esempio un paragrafo che contiene i termini di pagamento di un contratto.
Come funziona
- Per documenti ad alta variabilità, sono necessari almeno 100 documenti di esempio.
- Per documenti a bassa variabilità, sono necessari almeno 20 documenti di esempio.
