PetaMem Scripting Environment (PMSE)

Suite software per l'elaborazione avanzata dei corpora

 

Diagramma Testo PMSE

icona SPECIFICHE TECNICHE

Suite software generica e middleware per SNLP. Filosofia UNIX: un kit di piccole unità che possono essere combinate in una nuova toolchain. Indipendente dal linguaggio. Scritto in Perl, suite di test automatizzata con alta copertura del codice, supporto UTF-8. Basato su CLI, elaborazione efficiente e parallela. Documentazione completa. Modalità interattiva disponibile.

Istogramma PMSE

Categorizzazione del Testo

icona Caso di Studio

È stata eseguita una categorizzazione di 250 testi paralleli (provenienti dall'Agenzia Europea dei Medicinali - EMA) in 20 lingue europee. I grafici risultanti (alberi) mostrano somiglianze nella loro struttura.

 

 

Divisorio di Sezione

INFORMAZIONI GENERALI

Il compito generale dell'applicazione di Categorizzazione del Testo è categorizzare vari documenti in qualsiasi lingua. È stata prestata grande attenzione alle seguenti caratteristiche: Alta modularità. Alte prestazioni. Supporto per l'elaborazione parallela. La modularità del codice sorgente consente all'utente di modificare il comportamento di tutti i passaggi procedurali. L'intera applicazione è estensibile tramite semplici plugin. Aree di possibile applicazione: identificazione della lingua, ordinamento dei corpora, linguistica forense e altro.

DESCRIZIONE TECNICA

Il processo di categorizzazione consiste in diverse fasi: Estrazione del testo da tutti i documenti forniti. Filtraggio dei documenti indesiderati secondo criteri specificati (completamente modulare). Calcolo di un vettore per qualsiasi documento (completamente modulare). Calcolo delle distanze (completamente modulare). Clustering gerarchico agglomerativo. Il metodo finale dipende dal modulo implementato. Visualizzazione di un albero binario che rappresenta le relazioni tra i testi (dendrogramma).

VETTORI E CALCOLO DELLE DISTANZE

Logo PetamemVettore: un elenco di valori che caratterizzano le differenze tra i testi. Esempio di vettore a 4 elementi:

1. frequenze delle occorrenze delle parole
2. conteggio medio delle parole per frase
3. lunghezza media delle parole
4. rapporto tipo-token
Ciò richiederà 4 semplici plugin, ciascuno che calcola uno dei vettori. Ogni vettore può avere un peso diverso nel calcolo della distanza. Il clustering inizia dopo la misurazione delle distanze.

Acquista PMSE

email: sales@petamem.com
telefono: +49 911 894 6455
fax: +420 284 680 110

Costo della Licenza

Ora viene la parte migliore. PMSE è un prodotto commerciale per il settore accademico e PetaMem vuole offrirvi un pacchetto "tutto incluso, senza problemi, senza preoccupazioni". Vogliamo anche che questa suite software sia accessibile a tutti. Ci sono due semplici modelli di licenza: Per utente per workstation, che costa 49,- EUR al mese o per tutto il dipartimento, che costa 499,- EUR al mese senza limiti sul numero di utenti o workstation (inclusi gli studenti). Tutti i prezzi sono + 19% IVA, che non si applica se siete fuori dalla Germania e avete un VAT-Id.

Condizioni di Licenza

Promettiamo una licenza "senza problemi, senza preoccupazioni". Con il costo della licenza ottenete non solo il diritto di utilizzare il software, ma anche aggiornamenti software gratuiti e supporto gratuito. Eventuali aggiornamenti/downgrade della licenza sono intuitivi e fanno-quello-che-intendo. Avevate cinque licenze singole e vorreste una licenza per il dipartimento o viceversa? Nessun problema! Basta informarci via email e adegueremo le condizioni di licenza lo stesso giorno lavorativo.

Ma c'è di meglio: la nostra azienda è impegnata nell'open source e quando si fa affidamento su software commerciale, ci sono poche cose che vogliamo evitare più di un vendor lock-in. Potreste avere preoccupazioni simili quando fate affidamento su un prodotto commerciale e lo comprendiamo pienamente. Se decidete di terminare l'abbonamento alla licenza di PMSE - bene - mantenete PMSE e siete autorizzati a continuare a usarlo. Perdete gli aggiornamenti gratuiti e il supporto gratuito, ma continuate a usare il software. Gratuitamente.

Se avete ulteriori domande riguardo alla licenza o vorreste ordinare il prodotto, non esitate a contattare sales@petamem.com.

Se avete ulteriori domande tecniche dettagliate, contattate support@petamem.com

chiudi