Programmatūras komplekts progresīvai korpusu apstrādei
Universāls programmatūras komplekts un starpprogrammatūra statistiskajai dabiskās valodas apstrādei. UNIX filozofija: mazas vienības, kas var tikt apvienotas jaunā rīku ķēdē. Neatkarīga no valodas. Rakstīta Perl, automatizēts testu komplekts ar augstu koda pārklājumu, UTF-8 atbalsts. Balstīta uz komandrindas saskarni, efektīva un paralēla apstrāde. Rūpīga dokumentācija. Pieejams interaktīvs režīms.
Tika veikta 250 paralēlu tekstu (avots: Eiropas Zāļu aģentūra - EMA) kategorizācija 20 Eiropas valodās. Iegūtie grafi (koki) parāda līdzības to struktūrā.
Vispārīgais uzdevums teksta kategorizācijas aplikācijai ir kategorizēt dažādus dokumentus jebkurā valodā. Liela uzmanība tika pievērsta šādām funkcijām: augsta modularitāte, augsta veiktspēja, paralēlās apstrādes atbalsts. Pirmkoda modularitāte ļauj lietotājam mainīt visu procedūru soļu uzvedību. Visa aplikācija ir paplašināma ar vienkāršiem spraudņiem. Iespējamās pielietojuma jomas: valodas identificēšana, korpusu šķirošana, forensiskā lingvistika un citas.
Kategorizācijas process sastāv no vairākiem soļiem: teksta izvilkšana no visiem dotajiem dokumentiem, nevēlamo dokumentu filtrēšana saskaņā ar dotajiem kritērijiem (pilnībā modulāra), vektora aprēķināšana katram dokumentam (pilnībā modulāra), attālumu aprēķināšana (pilnībā modulāra), hierarhiskā aglomeratīvā klasterizācija. Galīgā metode ir atkarīga no izvietotā moduļa. Bināra koka vizualizācija, kas attēlo attiecības starp tekstiem (dendrogramma).
Vektors: vērtību saraksts, kas raksturo atšķirības starp tekstiem. 4 elementu vektora piemērs:
1. vārdu sastopamības biežumi
2. vidējais vārdu skaits teikumā
3. vidējais vārdu garums
4. tipu-leksēmu attiecība
Šim būs nepieciešami 4 vienkārši spraudņi, katrs aprēķinot vienu no vektoriem. Katram vektoram var būt atšķirīgs svars attāluma aprēķinā. Klasterizācija sākas pēc attālumu izmērīšanas.
e-pasts: sales@petamem.com
tālrunis: +49 911 894 6455
fakss: +420 284 680 110
Tagad nāk labākā daļa. PMSE ir komerciāls produkts akadēmiskajam sektoram, un PetaMem vēlas piedāvāt jums "visu iekļaujošu, bez raizēm, bez problēmām" paketi. Mēs arī vēlamies, lai šis programmatūras komplekts būtu pieejams ikvienam. Ir divi vienkārši licencēšanas modeļi: vienam lietotājam vienā darbstacijā, kas ir 49,- EUR mēnesī, vai visai nodaļai, kas ir 499,- EUR mēnesī bez ierobežojumiem lietotāju vai darbstaciju skaitam (ieskaitot studentus). Visas cenas ir + 19% PVN, kas neattiecas, ja atrodaties ārpus Vācijas un jums ir PVN identifikācijas numurs.
Mēs solām "bez raizēm, bez problēmām" licencēšanu. Ar licences izmaksām jūs iegūstat ne tikai tiesības izmantot programmatūru, bet arī bezmaksas programmatūras jauninājumus un bezmaksas atbalstu. Jebkādi licences uzlabojumi/pazeminājumi ir intuitīvi un dara-to-ko-es-domāju. Jums bija piecas individuālās licences un jūs vēlētos nodaļas licenci vai otrādi? Nav nekādu problēmu! Vienkārši paziņojiet mums pa e-pastu, un mēs pielāgosim licencēšanas nosacījumus tajā pašā darba dienā.
Tas kļūst vēl labāk: mūsu uzņēmums ir apņēmies atbalstīt atvērtā pirmkoda programmatūru, un, paļaujoties uz komerciālu programmatūru, ir tikai dažas lietas, ko mēs vēlamies izvairīties vairāk nekā piegādātāja bloķēšanu. Jums var būt līdzīgas bažas, paļaujoties uz komerciālu produktu, un mēs to pilnībā saprotam. Ja jūs noliemsit izbeigt PMSE licencēšanas abonementu - nu - jūs paturēsiet PMSE un drīkstēsiet turpināt to izmantot. Jūs zaudēsiet bezmaksas jauninājumus un bezmaksas atbalstu, bet jūs turpināsiet izmantot programmatūru. Bez maksas.
Ja jums ir kādi papildu jautājumi par licencēšanu vai vēlētos pasūtīt produktu, lūdzu, nevilcinieties sazināties ar sales@petamem.com.
Ja jums ir papildu detalizēti tehniskie jautājumi, lūdzu, sazinieties ar support@petamem.com
aizvērt