Programinės įrangos rinkinys pažangiam korpusų apdorojimui
Universali programinės įrangos paketas ir tarpinė programinė įranga SNLP. UNIX filosofija: mažų vienetų rinkinio, kurie gali būti sujungti į naują įrankių grandinę. Nepriklausoma nuo kalbos. Parašyta Perl kalba, automatizuotas testų rinkinys su aukštu kodo aprėptimi, UTF-8 suvokianti. Pagrįsta komandinė eilute, efektyvus ir lygiagretusis apdorojimas. Išsami dokumentacija. Galimas interaktyvus režimas.
Buvo atlikta 250 lygiagretaus tekstų (šaltiniai iš Europos vaistų agentūros - EMA) kategorizacija 20 europos kalbų. Gauti grafikai (medžiai) rodo panašumus jų struktūroje.
Bendra tekstų kategorizavimo programos užduotis yra kategorizuoti įvairius dokumentus bet kuria kalba. Didžiulis dėmesys buvo skirtas šiems bruožams: Aukštas moduliškumas. Aukštas našumas. Lygiagrečiojo apdorojimo palaikymas. Šaltinio kodo moduliškumas leidžia vartotojui keisti visų procedūrų etapų elgesį. Visa programa yra išplečiama paprastais įskiepiais. Galimo pritaikymo sritys: kalbos identifikacija, korpusų rūšiavimas, teismo lingvistika ir kitos.
Kategorizavimo procesas susideda iš kelių žingsnių: Teksto išgavimas iš visų pateiktų dokumentų. Nepageidaujamų dokumentų filtravimas pagal nurodytus kriterijus (visiškai moduliarus). Vektoriaus skaičiavimas bet kuriam dokumentui (visiškai moduliarus). Atstumų skaičiavimas (visiškai moduliarus). Hierarchinis aglomeratyvusis grupavimas. Galutinis metodas priklauso nuo naudojamo modulio. Dvejetainio medžio, atspindinčio santykius tarp tekstų, vizualizacija (dendrograma).
Vektorius: verčių sąrašas, kuris apibūdina
skirtumus tarp tekstų. 4 elementų vektoriaus pavyzdys:
1. žodžių pasikartojimų dažnumas
2. vidutinis žodžių skaičius sakinyje
3. vidutinis žodžių ilgis
4. tipo ir žetono santykis
Tam reikės 4 paprastų įskiepių, kiekvienas skaičiuojantis vieną iš
vektorių. Kiekvienas vektorius gali turėti skirtingą svorį
atstumo skaičiavime. Grupavimas prasideda po
atstumų matavimo.
el. paštas: sales@petamem.com
telefonas: +49 911 894 6455
faksas: +420 284 680 110
Dabar ateina gera dalis. PMSE yra komercinis produktas akademiniam sektoriui ir PetaMem nori pasiūlyti jums „viskas įskaičiuota, be rūpesčių, be problemų" paketą. Taip pat norime, kad ši programinė įranga būtų prieinama visiems. Yra du paprasti licencijavimo modeliai: vienam vartotojui vienai darbo vietai, kuris yra 49,- EUR per mėnesį arba visam departamentui, kuris yra 499,- EUR per mėnesį be apribojimų vartotojų ar darbo vietų skaičiui (įskaitant studentus). Visos kainos yra + 19% PVM, kuris nėra taikomas, jei esate už Vokietijos ribų ir turite PVM mokėtojo kodą.
Pažadame „be rūpesčių, be problemų" licencijavimą. Su licencijos kaina jūs gaunate ne tik teisę naudoti programinę įrangą, bet ir nemokamus programinės įrangos atnaujinimus bei palaikymą. Bet kokie licencijos pakeitimai į viršų/žemyn yra intuityvūs ir atitinka tai, ką norite. Turėjote penkias individualias licencijas ir norėtumėte departamento licenciją ar atvirkščiai? Jokių problemų! Tiesiog praneškite mums el. paštu ir mes pataisysime licencijavimo sąlygas tą pačią darbo dieną.
Dar geriau: mūsų įmonė yra įsipareigojusi atviro kodo principams, o kai pasikliauname komercine programine įranga, yra tik keli dalykai, kurių norime išvengti labiau nei tiekėjo priklausomybės. Galite turėti panašių susirūpinimų, kai pasikliausite komerciniu produktu, ir mes visiškai tai suprantame. Jei nuspręsite nutraukti PMSE licencijos prenumeratą - na - pasilaikote PMSE ir galite jį toliau naudoti. Prarandate nemokamus atnaujinimus ir nemokamą palaikymą, bet toliau naudojate programinę įrangą. Nemokamai.
Jei turite daugiau klausimų apie licencijavimą ar norėtumėte užsisakyti produktą, nedvejodami susisiekite sales@petamem.com.
Jei turite daugiau išsamių techninių klausimų, prašome susisiekti support@petamem.com
uždaryti