PetaMem Scripting Environment (PMSE)

Софтверски пакет за напредну обраду корпуса

 

PMSE дијаграм текста

икона ТЕХНИЧКА СПЕЦИФИКАЦИЈА

Генерички софтверски пакет и посредник за SNLP. UNIX филозофија: компонентни комплет малих јединица које се могу комбиновати у нови низ алата. Језички-независан. Написан у Perl-у, аутоматизовани тест пакет високе покривености кода, UTF-8 подршка. Базиран на CLI, ефикасна и паралелна обрада. Детаљна документација. Доступан интерактивни режим.

PMSE хистограм

Категоризација текста

икона Студија случаја

Извршена је категоризација 250 паралелних текстова (из Европске агенције за лекове - EMA) на 20 европских језика. Резултујући графикони (стабла) показују сличности у њиховој структури.

 

 

PMSE бинарно стабло Естонија

ОПШТЕ ИНФОРМАЦИЈЕ

Општи задатак апликације за категоризацију текста је да категорише различите документе на било ком језику. Велика пажња је посвећена следећим карактеристикама: висока модуларност, висока перформанса, подршка за паралелну обраду. Модуларност изворног кода омогућава кориснику да промени понашање свих процедуралних корака. Цела апликација је проширива помоћу једноставних додатака. Области могуће примене: идентификација језика, сортирање корпуса, форензичка лингвистика и друге.

ТЕХНИЧКИ ОПИС

Процес категоризације се састоји од неколико корака: екстракција текста из свих датих докумената. Филтрирање нежељених докумената према датим критеријумима (потпуно модуларно). Израчунавање вектора за сваки документ (потпуно модуларно). Израчунавање удаљености (потпуно модуларно). Хијерархијско агломеративно груписање. Крајњи метод зависи од примењеног модула. Визуализација бинарног стабла које представља односе између текстова (дендрограм).

ВЕКТОРИ И ИЗРАЧУНАВАЊЕ УДАЉЕНОСТИ

Petamem
                 логоВектор: листа вредности које карактеришу разлике између текстова. Пример вектора од 4 елемента:

1. фреквенције појављивања речи
2. просечан број речи у реченици
3. просечна дужина речи
4. однос тип-токен
Ово ће захтевати 4 једноставна додатка, сваки израчунава једну од вредности вектора. Сваки вектор може имати различиту тежину у израчунавању удаљености. Груписање почиње након мерења удаљености.

Купите PMSE

имејл: sales@petamem.com
телефон: +49 911 894 6455
факс: +420 284 680 110

Цена лиценце

Сада долази добар део. PMSE је комерцијални производ за академски сектор и PetaMem жели да вам понуди "све укључено, без компликација, без брига" пакет. Такође желимо да овај софтверски пакет буде приступачан свима. Постоје два једноставна модела лиценцирања: по кориснику по радној станици, што је 49,- EUR месечно или за цео одсек, што је 499,- EUR месечно без ограничења броја корисника или радних станица (укључујући студенте). Све цене су + 19% ПДВ, што се не примењује ако сте ван Немачке и имате ПДВ-ИД.

Услови лиценцирања

Обећавамо "без компликација, без брига" лиценцирање. Са ценом лиценце добијате не само право коришћења софтвера, већ и бесплатна надоградње софтвера и бесплатну подршку. Било које надоградње/деградације лиценце су интуитивне и раде-оно-што-мислим. Имали сте пет појединачних лиценци и желели бисте лиценцу за одсек или обрнуто? Нема проблема! Једноставно обавестите нас путем имејла и прилагодићемо услове лиценцирања истог радног дана.

Још боље: наша компанија је посвећена отвореном софтверу и када се ослањамо на комерцијални софтвер, постоји мало ствари које желимо да избегнемо више од везивања за добављача. Можда имате сличне бриге када се ослањате на комерцијални производ и потпуно разумемо то. Ако одлучите да прекинете претплату на лиценцу за PMSE - па - задржавате PMSE и дозвољено вам је да наставите да га користите. Губите бесплатне надоградње и бесплатну подршку, али настављате да користите софтвер. Бесплатно.

Ако имате било каква додатна питања у вези са лиценцирањем или желите да наручите производ, не оклевајте да контактирате sales@petamem.com.

Ако имате додатна детаљна техничка питања, контактирајте support@petamem.com

затвори