Entorno de Scripting de PetaMem (PMSE)

Suite de software para procesamiento avanzado de corpus

 

Diagrama de Texto de PMSE

icono ESPECIFICACIÓN TÉCNICA

Suite de software genérica y middleware para SNLP. Filosofía UNIX: un kit de construcción de pequeñas unidades que pueden combinarse para formar una nueva cadena de herramientas. Independiente del idioma. Escrito en Perl, suite de pruebas automatizada de alta cobertura de código, compatible con UTF-8. Basado en CLI, procesamiento eficiente y paralelo. Documentación exhaustiva. Modo interactivo disponible.

Histograma de PMSE

Categorización de Textos

icono Estudio de Caso

Se realizó una categorización de 250 textos paralelos (obtenidos de la Agencia Europea de Medicamentos - EMA) en 20 idiomas europeos. Los gráficos resultantes (árboles) muestran similitudes en su estructura.

 

 

Separación de Sección de PMSE

INFORMACIÓN GENERAL

La tarea general de la aplicación de Categorización de Textos es categorizar varios documentos en cualquier idioma. Se prestó especial atención a las siguientes características: Alta modularidad. Alto rendimiento. Soporte para procesamiento paralelo. La modularidad del código fuente permite al usuario cambiar el comportamiento de todos los pasos procedimentales. Toda la aplicación es extensible mediante simples plugins. Áreas de posible aplicación: identificación de idiomas, ordenación de corpus, lingüística forense y otras.

DESCRIPCIÓN TÉCNICA

El proceso de categorización consiste en varios pasos: Extracción de texto de todos los documentos dados. Filtrado de documentos no deseados según criterios dados (completamente modular). Cálculo de un vector para cualquier documento (completamente modular). Cálculo de las distancias (completamente modular). Agrupamiento aglomerativo jerárquico. El método final depende del módulo implementado. Visualización de un árbol binario que representa las relaciones entre los textos (dendrograma).

CÁLCULO DE VECTORES Y DISTANCIAS

Logo de PetamemVector: una lista de valores que caracterizan las diferencias entre textos. Ejemplo de vector de 4 elementos:

1. frecuencias de apariciones de palabras
2. promedio de cantidad de palabras en la oración
3. longitud promedio de palabras
4. proporción tipo - token
Esto requerirá 4 plugins simples, cada uno calculando uno de los vectores. Cada vector puede tener un peso diferente en el cálculo de la distancia. El agrupamiento comienza después de medir las distancias.

Comprar PMSE

correo electrónico: sales@petamem.com
teléfono: +49 911 894 6455
fax: +420 284 680 110

Costo de Licenciamiento

Ahora viene la mejor parte. PMSE es un producto comercial para el sector académico y PetaMem quiere ofrecerle un paquete "todo incluido, sin complicaciones, sin preocupaciones". También queremos que esta suite de software sea asequible para todos. Hay dos modelos de licencia simples: Por usuario por estación de trabajo, que es de 49,- EUR por mes o para todo el departamento, que es de 499,- EUR por mes sin límites en el número de usuarios o estaciones de trabajo (incluidos estudiantes). Todos los precios son + 19% IVA, que no se aplica si se encuentra fuera de Alemania y tiene un VAT-Id.

Condiciones de Licenciamiento

Prometemos licenciamiento "sin complicaciones, sin preocupaciones". Con el costo de licenciamiento obtiene no solo el derecho a usar el software, sino también actualizaciones gratuitas del software y soporte gratuito. Cualquier actualización/degradación de licencia es intuitiva y hace lo que quiero decir. ¿Tenía cinco licencias individuales y le gustaría una licencia de departamento o viceversa? ¡No hay problema! Simplemente infórmenos por correo electrónico y ajustaremos las condiciones de licenciamiento el mismo día hábil.

Mejora aún más: nuestra empresa está comprometida con el código abierto y cuando dependemos de software comercial, hay pocas cosas que queramos evitar más que un bloqueo de proveedor. Es posible que tenga preocupaciones similares al depender de un producto comercial y lo entendemos completamente. Si decide finalizar la suscripción de licenciamiento de PMSE - bueno - conserva PMSE y puede seguir usándolo. Pierde las actualizaciones gratuitas y el soporte gratuito, pero continúa usando el software. Gratis.

Si tiene más preguntas sobre licenciamiento o desea ordenar el producto, no dude en contactar a sales@petamem.com.

Si tiene más preguntas técnicas detalladas, comuníquese con support@petamem.com

cerrar