L’attività Named Entities (NER) è progettata per utilizzare il Natural Language Processing (NLP) per estrarre entità denominate da documenti non strutturati, come contratti, lettere, ordini, comunicati stampa e altri documenti privi di una struttura specifica descrivibile tramite regole. Per elaborare questi documenti con un’attività Named Entities (NER), è necessario mappare le entità denominate ai field dello skill nei quali verranno estratti i relativi valori. Questa attività analizzerà quindi il documento ed estrarrà le entità denominate nei rispettivi field. È inoltre possibile configurare l’estrazione di entità denominate per i field estratti da altre attività. Supponiamo di sapere che i nomi delle organizzazioni e gli indirizzi da estrarre si trovano nel primo paragrafo di ciascun contratto. È possibile estrarre il primo paragrafo utilizzando un’attività di Segmentazione, quindi estrarre da questo paragrafo i nomi delle aziende e gli indirizzi con un’attività Named Entities (NER). Questo approccio è più affidabile rispetto all’estrazione di entità denominate dall’intero documento, poiché consente di controllare l’area specifica da cui vengono estratte tali entità.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
L’attività supporta solo i field di tipo Testo con tipo di dati impostato su Testo, Data o Valuta.
Configurazione di un’attività Named Entities (NER)
- Nella scheda Activities, aggiungere un’attività Named Entities (NER) al flusso di elaborazione dei documenti.
- Nel riquadro Activity Properties, utilizzare l’elenco a discesa Source per selezionare l’origine che l’attività utilizzerà per estrarre le entità denominate: l’intero documento oppure un singolo field estratto da un’altra attività.
- In Output field, selezionare i field in cui verranno estratte le entità denominate. I field di output devono trovarsi allo stesso livello di annidamento del field di origine o a un livello inferiore.
- Fare clic su Create Mapping. Nella finestra di dialogo che si aprirà, selezionare quali entità denominate verranno estratte in ciascun field nell’elenco Entity to extract. Fare clic su Save. È possibile modificare il mapping in qualsiasi momento facendo clic su Edit Mapping.
- Fare clic su Test Skill per testare la skill e analizzare i risultati dell’estrazione delle entità denominate nella scheda Results.
Entità denominate supportate
| Nome entità | Descrizione | Esempio | Tipi di dati supportati | Lingue supportate |
|---|---|---|---|---|
| Person | Nomi di persone | John Doe, Jane Smith | Testo | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Location | Nomi di località | Anytown, Corporate Place | Testo | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Organization | Nomi di organizzazioni | ABBYY, Acme Corp. | Testo | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Address | Indirizzi | 123 Main St., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USA | Testo | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Money | Importi di denaro | $2670.00, 199 dollars 99 cents | Testo, Amount of money | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Date | Date | November 14, 2009, 11/14/2009 | Testo, Date | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
| Duration | Durate | Twelve (12) months, 4 days | Testo | English, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch |
