Suite logicielle pour le traitement avance de corpus
Suite logicielle generique et middleware pour le SNLP. Philosophie UNIX : un kit de construction de petites unites qui peuvent etre combinees pour creer une nouvelle chaine d'outils. Independant du langage. Ecrit en Perl, suite de tests automatisee avec une couverture de code elevee, compatible UTF-8. Base sur CLI, traitement efficace et parallele. Documentation approfondie. Mode interactif disponible.
Une categorisation de 250 textes paralleles (provenant de l'Agence europeenne des medicaments - EMA) en 20 langues europeennes a ete realisee. Les graphiques resultants (arbres) montrent des similitudes dans leur structure.
La tache generale de l'application de categorisation de texte est de categoriser divers documents dans n'importe quelle langue. Un grand soin a ete apporte aux caracteristiques suivantes : haute modularite. Haute performance. Support du traitement parallele. La modularite du code source permet a l'utilisateur de modifier le comportement de toutes les etapes procedurales. L'application entiere est extensible par de simples plugins. Domaines d'application possibles : identification de langue, tri de corpus, linguistique forensique et autres.
Le processus de categorisation se compose de plusieurs etapes : extraction de texte de tous les documents donnes. Filtrage des documents non desires selon des criteres donnes (completement modulaire). Calcul d'un vecteur pour chaque document (completement modulaire). Calcul des distances (completement modulaire). Clustering hierarchique agglomeratif. La methode finale depend du module deploye. Visualisation d'un arbre binaire representant les relations entre les textes (dendrogramme).
Vecteur : une liste de valeurs qui caracterisent les differences entre les textes. Exemple de vecteur a 4 elements :
1. frequences d'occurrences de mots
2. nombre moyen de mots par phrase
3. longueur moyenne des mots
4. ratio type-token
Cela necessitera 4 plugins simples, chacun calculant un des vecteurs. Chaque vecteur peut avoir un poids different dans le calcul de la distance. Le clustering commence apres la mesure des distances.
email : sales@petamem.com
telephone : +49 911 894 6455
fax : +420 284 680 110
Maintenant vient la bonne partie. PMSE est un produit commercial pour le secteur academique et PetaMem souhaite vous offrir un forfait "tout compris, sans tracas, sans souci". Nous voulons egalement que cette suite logicielle soit abordable pour tous. Il existe deux modeles de licence simples : par utilisateur par poste de travail, soit 49,- EUR par mois ou a l'echelle du departement, soit 499,- EUR par mois sans limite de nombre d'utilisateurs ou de postes de travail (etudiants compris). Tous les prix sont + 19% de TVA, qui ne s'applique pas si vous etes en dehors de l'Allemagne et avez un numero de TVA.
Nous promettons une licence "sans tracas, sans souci". Avec le cout de licence, vous obtenez non seulement le droit d'utiliser le logiciel, mais aussi les mises a niveau gratuites et le support gratuit. Toute mise a niveau/retrogradation de licence est intuitive et fait ce que vous voulez. Vous aviez cinq licences individuelles et souhaitez une licence departementale ou vice-versa ? Aucun probleme ! Il suffit de nous en informer par email et nous ajustons les conditions de licence le jour ouvrable meme.
C'est encore mieux : notre entreprise est engagee dans l'open source et lorsqu'elle s'appuie sur des logiciels commerciaux, il y a peu de choses que nous voulons eviter plus qu'un verrouillage fournisseur. Vous pourriez avoir des preoccupations similaires lorsque vous comptez sur un produit commercial et nous le comprenons parfaitement. Si vous decidez de mettre fin a l'abonnement de licence PMSE - eh bien - vous conservez PMSE et etes autorise a continuer a l'utiliser. Vous perdez les mises a niveau gratuites et le support gratuit, mais vous continuez a utiliser le logiciel. Gratuitement.
Si vous avez d'autres questions concernant les licences ou si vous souhaitez commander le produit, n'hesitez pas a contacter sales@petamem.com.
Si vous avez d'autres questions techniques detaillees, veuillez contacter support@petamem.com
fermer