Ohjelmistopaketti edistyneeseen korpuskäsittelyyn
Yleinen ohjelmistopaketti ja väliohjelmisto SNLP:lle. UNIX-filosofia: rakennuspakki pienistä yksiköistä, jotka voidaan yhdistää uudeksi työkaluketjuksi. Kieliriippumaton. Kirjoitettu Perlillä, automaattinen testipaketti korkealla koodikattavuudella, UTF-8-tietoinen. Komentorivi-pohjainen, tehokas ja rinnakkainen käsittely. Perusteellinen dokumentaatio. Interaktiivinen tila saatavilla.
Suoritettiin 250 rinnakkaisen tekstin (lähde: Euroopan lääkevirasto - EMA) luokittelu 20 eurooppalaisella kielellä. Tuloksena syntyneet graafit (puut) osoittavat samankaltaisuuksia niiden rakenteessa.
Tekstin luokittelusovelluksen yleinen tehtävä on luokitella erilaisia asiakirjoja millä tahansa kielellä. Erityistä huomiota kiinnitettiin seuraaviin ominaisuuksiin: Korkea modulaarisuus. Korkea suorituskyky. Rinnakkaiskäsittelyn tuki. Lähdekoodin modulaarisuus mahdollistaa käyttäjän muuttaa kaikkien menettelyllisten vaiheiden käyttäytymistä. Koko sovellus on laajennettavissa yksinkertaisilla liitännäisillä. Mahdollisia sovellusalueita: kielen tunnistus, korpuslajittelu, oikeuslinguistiikka ja muut.
Luokitteluprosessi koostuu useista vaiheista: Tekstin erottaminen kaikista annetuista asiakirjoista. Ei-toivottujen asiakirjojen suodatus annettujen kriteerien mukaan (täysin modulaarinen). Vektorin laskeminen mille tahansa asiakirjalle (täysin modulaarinen). Etäisyyksien laskeminen (täysin modulaarinen). Hierarkkinen agglomeratiivinen klusterointi. Lopullinen menetelmä riippuu käytetystä moduulista. Binääripuun visualisointi, joka edustaa tekstien välisiä suhteita (dendrogrammi).
Vektori: luettelo arvoista, jotka kuvaavat eroja tekstien välillä. Esimerkki 4-elementtisestä vektorista:
1. sanojen esiintymien frekvenssit
2. keskimääräinen sanojen määrä lauseessa
3. keskimääräinen sanojen pituus
4. type-token-suhde
Tämä vaatii 4 yksinkertaista liitännäistä, joista jokainen laskee yhden vektorin. Jokaisella vektorilla voi olla eri paino etäisyyden laskennassa. Klusterointi alkaa etäisyyksien mittaamisen jälkeen.
sähköposti: sales@petamem.com
puhelin: +49 911 894 6455
faksi: +420 284 680 110
Nyt tulee hyvä osa. PMSE on kaupallinen tuote akateemiselle sektorille ja PetaMem haluaa tarjota sinulle "kaikki sisältyy hintaan, ei vaivaa, ei huolia" -paketin. Haluamme myös, että tämä ohjelmistopaketti on kohtuuhintainen kaikille. Tarjolla on kaksi yksinkertaista lisensointimallia: Per käyttäjä per työasema, joka on 49,- EUR kuukaudessa tai osastokohtainen, joka on 499,- EUR kuukaudessa ilman rajoituksia käyttäjien tai työasemien määrässä (mukaan lukien opiskelijat). Kaikki hinnat ovat + 19% ALV, jota ei sovelleta, jos olet Saksan ulkopuolella ja sinulla on ALV-tunnus.
Lupaamme "ei vaivaa, ei huolia" -lisenssin. Lisenssikustannusten myötä saat paitsi oikeuden käyttää ohjelmistoa, myös ilmaiset ohjelmistopäivitykset ja ilmaisen tuen. Kaikki lisenssipäivitykset/-alennukset ovat intuitiivisia ja tekevät mitä tarkoitan. Sinulla oli viisi yksittäistä lisenssiä ja haluaisit osastolisenssin tai päinvastoin? Ei ongelmaa! Ilmoita meille yksinkertaisesti sähköpostilla, niin muutamme lisensointiehdot samana työpäivänä.
Vielä parempaa: yrityksemme on sitoutunut avoimen lähdekoodin periaatteisiin ja kun luotamme kaupalliseen ohjelmistoon, on vain vähän asioita, joita haluamme välttää enemmän kuin toimittajasidonnaisuutta. Sinulla saattaa olla samanlaisia huolenaiheita, kun luotat kaupalliseen tuotteeseen, ja ymmärrämme sen täysin. Jos päätät lopettaa PMSE:n lisenssitilauksen - no - säilytät PMSE:n ja sinulla on lupa jatkaa sen käyttöä. Menetät ilmaiset päivitykset ja ilmaisen tuen, mutta saat jatkaa ohjelmiston käyttöä. Ilmaiseksi.
Jos sinulla on kysyttävää lisensioinnista tai haluaisit tilata tuotteen, älä epäröi ottaa yhteyttä sales@petamem.com.
Jos sinulla on tarkempia teknisiä kysymyksiä, ota yhteyttä support@petamem.com
sulje