Среда сценариев PetaMem (PMSE)

Программный пакет для расширенной обработки корпусов

 

Текстовая диаграмма PMSE

иконка ТЕХНИЧЕСКАЯ СПЕЦИФИКАЦИЯ

Универсальный программный пакет и промежуточное ПО для SNLP. Философия UNIX: набор из небольших модулей, которые могут быть объединены в новую цепочку инструментов. Языково-независимый. Написан на Perl, автоматизированный набор тестов с высоким покрытием кода, поддержка UTF-8. На основе CLI, эффективная и параллельная обработка. Подробная документация. Доступен интерактивный режим.

Гистограмма PMSE

Категоризация текста

иконка Практический пример

Была выполнена категоризация 250 параллельных текстов (источник - Европейское агентство по лекарственным средствам - EMA) на 20 европейских языках. Полученные графы (деревья) показывают сходство в их структуре.

 

 

Бинарное дерево PMSE Эстония

ОБЩАЯ ИНФОРМАЦИЯ

Общая задача приложения для категоризации текста - это категоризация различных документов на любом языке. Особое внимание было уделено следующим характеристикам: Высокая модульность. Высокая производительность. Поддержка параллельной обработки. Модульность исходного кода позволяет пользователю изменять поведение всех процедурных шагов. Все приложение расширяемо с помощью простых плагинов. Области возможного применения: идентификация языка, сортировка корпуса, судебная лингвистика и другие.

ТЕХНИЧЕСКОЕ ОПИСАНИЕ

Процесс категоризации состоит из нескольких этапов: Извлечение текста из всех данных документов. Фильтрация нежелательных документов по заданным критериям (полностью модульная). Вычисление вектора для любого документа (полностью модульное). Вычисление расстояний (полностью модульное). Иерархическая агломеративная кластеризация. Конечный метод зависит от развернутого модуля. Визуализация бинарного дерева, представляющего отношения между текстами (дендрограмма).

ВЕКТОРЫ И ВЫЧИСЛЕНИЕ РАССТОЯНИЙ

Логотип
                 PetamemВектор: список значений, которые характеризуют различия между текстами. Пример 4-элементного вектора:

1. частоты встречаемости слов
2. среднее количество слов в предложении
3. средняя длина слов
4. соотношение типов и токенов
Это потребует 4 простых плагина, каждый вычисляет один из векторов. Каждый вектор может иметь разный вес в вычислении расстояния. Кластеризация начинается после измерения расстояний.

Купить PMSE

email: sales@petamem.com
phone: +49 911 894 6455
fax: +420 284 680 110

Стоимость лицензии

Теперь самое приятное. PMSE - это коммерческий продукт для академического сектора, и PetaMem хочет предложить вам пакет "все включено, без хлопот, без забот". Мы также хотим, чтобы этот программный пакет был доступен для всех. Существует две простые лицензионные модели: На пользователя на рабочую станцию, что составляет 49 EUR в месяц, или на весь отдел, что составляет 499 EUR в месяц без ограничений на количество пользователей или рабочих станций (включая студентов). Вся цена + 19% НДС, который не применяется, если вы находитесь за пределами Германии и имеете НДС-Id.

Условия лицензирования

Мы обещаем лицензирование "без хлопот, без забот". С лицензионной стоимостью вы получаете не только право на использование программного обеспечения, но также бесплатные обновления и бесплатную поддержку. Любые обновления/понижения лицензии интуитивны и делают то, что вы имеете в виду. У вас было пять отдельных лицензий и вы хотите лицензию на отдел или наоборот? Нет проблем! Просто сообщите нам по электронной почте, и мы скорректируем условия лицензирования в тот же рабочий день.

И это еще не все: наша компания привержена открытому исходному коду, и когда мы полагаемся на коммерческое программное обеспечение, есть лишь несколько вещей, которых мы хотим избежать больше, чем привязки к поставщику. У вас могут быть подобные опасения при использовании коммерческого продукта, и мы полностью это понимаем. Если вы решите прекратить лицензионную подписку на PMSE - что ж - вы сохраняете PMSE и можете продолжать его использовать. Вы теряете бесплатные обновления и бесплатную поддержку, но продолжаете использовать программное обеспечение. Бесплатно.

Если у вас есть какие-либо дополнительные вопросы относительно лицензирования или вы хотите заказать продукт, пожалуйста, не стесняйтесь обращаться по адресу sales@petamem.com.

Если у вас есть дополнительные подробные технические вопросы, пожалуйста, обращайтесь по адресу support@petamem.com

закрыть