Πακέτο λογισμικού για προηγμένη επεξεργασία σωμάτων κειμένων
Γενικό πακέτο λογισμικού και middle-ware για SNLP. Φιλοσοφία UNIX: ένα κιτ κατασκευής μικρών μονάδων που μπορούν να συνδυαστούν σε μια νέα αλυσίδα εργαλείων. Ανεξάρτητο γλώσσας. Γραμμένο σε Perl, αυτοματοποιημένη σειρά δοκιμών υψηλής κάλυψης κώδικα, υποστήριξη UTF-8. Βασισμένο σε CLI, Αποδοτική & παράλληλη επεξεργασία. Διεξοδική τεκμηρίωση. Διαθέσιμη διαδραστική λειτουργία.
Πραγματοποιήθηκε κατηγοριοποίηση 250 παράλληλων κειμένων (πηγή από τον Ευρωπαϊκό Οργανισμό Φαρμάκων - EMA) σε 20 ευρωπαϊκές γλώσσες. Τα γραφήματα που προέκυψαν (δέντρα) δείχνουν ομοιότητες στη δομή τους.
Ο γενικός στόχος της εφαρμογής Κατηγοριοποίησης Κειμένου είναι η κατηγοριοποίηση διαφόρων εγγράφων σε οποιαδήποτε γλώσσα. Δόθηκε ιδιαίτερη προσοχή στα ακόλουθα χαρακτηριστικά: Υψηλή αρθρωτότητα. Υψηλή απόδοση. Υποστήριξη παράλληλης επεξεργασίας. Η αρθρωτότητα του πηγαίου κώδικα επιτρέπει στον χρήστη να αλλάξει τη συμπεριφορά όλων των διαδικαστικών βημάτων. Ολόκληρη η εφαρμογή είναι επεκτάσιμη με απλά plugins. Τομείς πιθανής εφαρμογής: αναγνώριση γλώσσας, ταξινόμηση σωμάτων κειμένων, δικανική γλωσσολογία και άλλοι.
Η διαδικασία κατηγοριοποίησης αποτελείται από διάφορα βήματα: Εξαγωγή κειμένου από όλα τα δεδομένα έγγραφα. Φιλτράρισμα ανεπιθύμητων εγγράφων σύμφωνα με δεδομένα κριτήρια (πλήρως αρθρωτό). Υπολογισμός διανύσματος για οποιοδήποτε έγγραφο (πλήρως αρθρωτό). Υπολογισμός των αποστάσεων (πλήρως αρθρωτό). Ιεραρχική συγκεντρωτική ομαδοποίηση. Η τελική μέθοδος εξαρτάται από την εγκατεστημένη μονάδα. Απεικόνιση ενός δυαδικού δέντρου που αντιπροσωπεύει σχέσεις μεταξύ των κειμένων (δενδρόγραμμα).
Διάνυσμα: μια λίστα τιμών που χαρακτηρίζουν διαφορές μεταξύ κειμένων. Παράδειγμα διανύσματος 4 στοιχείων:
1. συχνότητες εμφανίσεων λέξεων
2. μέσος αριθμός λέξεων σε πρόταση
3. μέσο μήκος λέξεων
4. αναλογία τύπου - μάρκας
Αυτό θα χρειαστεί 4 απλά plugins, καθένα να υπολογίζει ένα από τα διανύσματα. Κάθε διάνυσμα μπορεί να έχει διαφορετικό βάρος στον υπολογισμό της απόστασης. Η ομαδοποίηση ξεκινά μετά τη μέτρηση των αποστάσεων.
email: sales@petamem.com
phone: +49 911 894 6455
fax: +420 284 680 110
Τώρα έρχεται το καλό μέρος. Το PMSE είναι ένα εμπορικό προϊόν για τον ακαδημαϊκό τομέα και η PetaMem θέλει να σας προσφέρει ένα πακέτο "όλα περιλαμβάνονται, χωρίς ταλαιπωρία, χωρίς άγχος". Θέλουμε επίσης αυτό το πακέτο λογισμικού να είναι προσιτό σε όλους. Υπάρχουν δύο απλά μοντέλα αδειοδότησης: Ανά χρήστη ανά σταθμό εργασίας, που είναι 49,- EUR ανά μήνα ή σε επίπεδο τμήματος, που είναι 499,- EUR ανά μήνα χωρίς όρια στον αριθμό χρηστών ή σταθμών εργασίας (συμπεριλαμβανομένων φοιτητών). Όλες οι τιμές είναι + 19% ΦΠΑ, που δεν ισχύει αν βρίσκεστε εκτός Γερμανίας και έχετε VAT-Id.
Υποσχόμαστε αδειοδότηση "χωρίς ταλαιπωρία, χωρίς άγχος". Με το κόστος αδειοδότησης αποκτάτε όχι μόνο το δικαίωμα χρήσης του λογισμικού, αλλά και δωρεάν αναβαθμίσεις λογισμικού και δωρεάν υποστήριξη. Οποιεσδήποτε αναβαθμίσεις/υποβαθμίσεις αδείας είναι διαισθητικές και κάνουν-αυτό-που-εννοώ. Είχατε πέντε μεμονωμένες άδειες και θα θέλατε άδεια τμήματος ή το αντίστροφο; Κανένα πρόβλημα! Απλά ενημερώστε μας μέσω email και θα προσαρμόσουμε τους όρους αδειοδότησης την ίδια εργάσιμη ημέρα.
Γίνεται ακόμη καλύτερα: η εταιρεία μας είναι αφοσιωμένη στο ανοιχτό κώδικα και όταν βασιζόμαστε σε εμπορικό λογισμικό, υπάρχουν λίγα πράγματα που θέλουμε να αποφύγουμε περισσότερο από ένα vendor lock-in. Μπορεί να έχετε παρόμοιες ανησυχίες όταν βασίζεστε σε ένα εμπορικό προϊόν και το καταλαβαίνουμε απόλυτα. Αν αποφασίσετε να τερματίσετε τη συνδρομή αδειοδότησης του PMSE - λοιπόν - κρατάτε το PMSE και επιτρέπεται να συνεχίσετε να το χρησιμοποιείτε. Χάνετε τις δωρεάν αναβαθμίσεις και τη δωρεάν υποστήριξη, αλλά συνεχίζετε να χρησιμοποιείτε το λογισμικό. Δωρεάν.
Αν έχετε οποιεσδήποτε περαιτέρω ερωτήσεις σχετικά με την αδειοδότηση ή θα θέλατε να παραγγείλετε το προϊόν, παρακαλούμε μη διστάσετε να επικοινωνήσετε με sales@petamem.com.
Αν έχετε περαιτέρω λεπτομερείς τεχνικές ερωτήσεις, παρακαλούμε επικοινωνήστε με support@petamem.com
κλείσιμο