PetaMem Scripting Environment (PMSE)

Suíte de software para processamento avançado de corpus

 

PMSE Text Diagram

icon ESPECIFICAÇÃO TÉCNICA

Suíte de software genérica e middleware para SNLP. Filosofia UNIX: um kit de construção de pequenas unidades que podem ser combinadas para criar uma nova cadeia de ferramentas. Agnóstico em relação a idiomas. Escrito em Perl, conjunto de testes automatizado com alta cobertura de código, compatível com UTF-8. Baseado em CLI, processamento eficiente e paralelo. Documentação completa. Modo interativo disponível.

PMSE Hisotgram

Categorização de Texto

icon Estudo de Caso

Foi realizada uma categorização de 250 textos paralelos (fonte: Agência Europeia de Medicamentos - EMA) em 20 línguas europeias. Os gráficos resultantes (árvores) mostram semelhanças em sua estrutura.

 

 

PMSE Binary Tree Estonia

INFORMAÇÕES GERAIS

A tarefa geral do aplicativo de Categorização de Texto é categorizar vários documentos em qualquer idioma. Um grande cuidado foi tomado nas seguintes características: Alta modularidade. Alto desempenho. Suporte para processamento paralelo. A modularidade do código-fonte permite ao usuário alterar o comportamento de todas as etapas procedurais. Todo o aplicativo é extensível por meio de plugins simples. Áreas de possível aplicação: identificação de idioma, classificação de corpus, linguística forense e outras.

DESCRIÇÃO TÉCNICA

O processo de categorização consiste em várias etapas: Extração de texto de todos os documentos fornecidos. Filtragem de documentos indesejados de acordo com critérios fornecidos (completamente modular). Cálculo de um vetor para qualquer documento (completamente modular). Cálculo das distâncias (completamente modular). Agrupamento hierárquico aglomerativo. O método final depende do módulo implementado. Visualização de uma árvore binária representando relações entre os textos (dendrograma).

VETORES E CÁLCULO DE DISTÂNCIA

Petamem
                 LogoVetor: uma lista de valores que caracterizam diferenças entre textos. Exemplo de vetor de 4 elementos:

1. frequências de ocorrências de palavras
2. contagem média de palavras na frase
3. comprimento médio das palavras
4. razão tipo-token
Isso precisará de 4 plugins simples, cada um calculando um dos vetores. Cada vetor pode ter peso diferente no cálculo da distância. O agrupamento começa após a medição das distâncias.

Comprar PMSE

email: sales@petamem.com
phone: +49 911 894 6455
fax: +420 284 680 110

Custo de Licenciamento

Agora vem a melhor parte. PMSE é um produto comercial para o setor acadêmico e a PetaMem quer oferecer a você um pacote "tudo incluído, sem complicações, sem preocupações". Também queremos que esta suíte de software seja acessível para todos. Existem dois modelos de licenciamento simples: Por usuário por estação de trabalho, que é 49,- EUR por mês ou para todo o departamento, que é 499,- EUR por mês sem limites no número de usuários ou estações de trabalho (incluindo estudantes). Todos os preços são + 19% de IVA, que não se aplica se você estiver fora da Alemanha e tiver um VAT-Id.

Condições de Licenciamento

Prometemos licenciamento "sem complicações, sem preocupações". Com o custo de licenciamento, você obtém não apenas o direito de usar o software, mas também atualizações gratuitas de software e suporte gratuito. Quaisquer upgrades/downgrades de licença são intuitivos e fazem o que você quer. Você tinha cinco licenças individuais e gostaria de uma licença departamental ou vice-versa? Sem problema! Simplesmente nos informe por e-mail e ajustaremos as condições de licenciamento no mesmo dia útil.

E melhora ainda mais: nossa empresa está comprometida com o código aberto e, ao depender de software comercial, há poucas coisas que queremos evitar mais do que o aprisionamento a fornecedores. Você pode ter preocupações semelhantes ao depender de um produto comercial e entendemos completamente isso. Se você decidir encerrar a assinatura de licenciamento do PMSE - bem - você fica com o PMSE e tem permissão para continuar usando-o. Você perde as atualizações gratuitas e o suporte gratuito, mas continua usando o software. De graça.

Se você tiver mais perguntas sobre licenciamento ou se quiser fazer um pedido do produto, não hesite em entrar em contato com sales@petamem.com.

Se você tiver mais questões técnicas detalhadas, entre em contato com support@petamem.com

fechar