Szoftvercsomag speciális korpuszfeldolgozáshoz
Általános szoftvercsomag és köztes szoftver SNLP-hez. UNIX filozófia: kis egységek építőkészlete, amelyek új eszközlánchoz kombinálhatók. Nyelvfüggetlen. Perl-ben írva, automatizált tesztkészlet magas kódlefedettséggel, UTF-8 tudatos. CLI alapú, hatékony és párhuzamos feldolgozás. Alapos dokumentáció. Interaktív mód elérhető.
250 párhuzamos szöveg (Európai Gyógyszerügynökség - EMA forrásból) kategorizálását végeztük 20 európai nyelven. Az eredményül kapott gráfok (fák) hasonlóságokat mutatnak szerkezetükben.
A szövegkategorizálási alkalmazás általános feladata a különböző dokumentumok kategorizálása bármely nyelven. Nagy gondot fordítottunk a következő jellemzőkre: Magas modularitás. Magas teljesítmény. Párhuzamos feldolgozás támogatása. A forráskód modularitása lehetővé teszi a felhasználó számára az összes eljárási lépés viselkedésének megváltoztatását. Az egész alkalmazás egyszerű bővítményekkel bővíthető. Lehetséges alkalmazási területek: nyelvfelismerés, korpuszrendezés, igazságügyi nyelvészet és mások.
A kategorizálási folyamat több lépésből áll: Szöveg kinyerése az összes megadott dokumentumból. Nem kívánt dokumentumok szűrése megadott kritériumok szerint (teljesen moduláris). Vektor számítása bármely dokumentumhoz (teljesen moduláris). Távolságok számítása (teljesen moduláris). Hierarchikus agglomeratív klaszterezés. A végső módszer a telepített modulon múlik. Bináris fa vizualizálása, amely a szövegek közötti kapcsolatokat ábrázolja (dendrogram).
Vektor: értékek listája, amely jellemzi
a szövegek közötti különbségeket. Példa 4-elemű vektorra:
1. szóelőfordulások gyakorisága
2. átlagos szószám mondatonként
3. átlagos szóhossz
4. típus-token arány
Ehhez 4 egyszerű bővítményre lesz szükség, amelyek mindegyike a
vektorok egyikét számítja ki. Minden vektornak különböző súlya lehet a
távolság számításában. A klaszterezés a
távolságok mérése után kezdődik.
email: sales@petamem.com
telefon: +49 911 894 6455
fax: +420 284 680 110
Most jön a jó rész. A PMSE egy kereskedelmi termék az akadémiai szektor számára, és a PetaMem egy "mindent magában foglaló, problémamentes, gond nélküli" csomagot kíván felajánlani. Azt is szeretnénk, hogy ez a szoftvercsomag mindenki számára elérhető legyen. Két egyszerű licencmodell létezik: Felhasználónként munkaállomásonként, amely 49,- EUR havonta vagy részlegszinten, amely 499,- EUR havonta, felhasználók vagy munkaállomások számának korlátozása nélkül (beleértve a hallgatókat is). Minden ár + 19% ÁFA, amely nem alkalmazandó, ha Németországon kívül van és ÁFA-azonosítóval rendelkezik.
"Problémamentes, gond nélküli" licencelést ígérünk. A licencdíjjal nemcsak a szoftver használatának jogát szerzi meg, hanem ingyenes szoftverfrissítéseket és ingyenes támogatást is. Minden licencfrissítés/visszaminősítés intuitív és "tedd-amit-gondolok". Öt egyedi licence volt és szeretne egy részleglicencet vagy fordítva? Egyáltalán nem probléma! Egyszerűen értesítsen minket e-mailben, és ugyanazon a munkanapon módosítjuk a licencfeltételeket.
Még jobb: cégünk elkötelezett a nyílt forráskód mellett, és amikor kereskedelmi szoftvert használunk, kevés olyan dolog van, amit jobban szeretnénk elkerülni, mint a beszállítói függőséget. Hasonló aggályai lehetnek, amikor kereskedelmi termékre támaszkodik, és ezt teljes mértékben megértjük. Ha úgy dönt, hogy befejezi a PMSE licencszerződését - nos - megtartja a PMSE-t és használhatja tovább. Elveszíti az ingyenes frissítéseket és az ingyenes támogatást, de továbbra is használhatja a szoftvert. Ingyen.
Ha további kérdései vannak a licenceléssel kapcsolatban vagy szeretné megrendelni a terméket, ne habozzon kapcsolatba lépni a sales@petamem.com címen.
Ha további részletes technikai kérdései vannak, kérjük, lépjen kapcsolatba a support@petamem.com címen
bezár