miércoles, 17 de octubre de 2018

SegmentaNet y R

En breve será presentado SegmentaNet, el nuevo proyecto en el que ando metido en los últimos seis meses. Un proyecto que con el respaldo y la aportación de todos los miembros del equipo de TESI a los que agradezco su apoyo. A Vicent Rosell y a Elsa Sebastià por su aportación día a día escribiendo código; al resto de programadores de TESI, Carles Climent, Carlos Anduj, Vicent Baixauli, Amalia Curiel, Eduardo Moreno, Enric Sanchis y también a Raúl Piera, reciente incorporación al equipo de soporte: sin que asumiérais una gran parte de nuestro trabajo, esto no hubiera sido posible. Del mismo modo, gracias a Josep, Raquel, Ángel y Yolanda por liberarnos de mucha carga de trabajo y de contactos con usuarios de nuestro software.

Acabados los agradecimientos, debo decir que SegmentaNet,será una plataforma de reporting para usuarios con necesidades de análisis de datos básico (descriptivos, tablas, gráficos) y de presentación de resultados, organizados en dashboards o con acceso individual.

Pero fundamentalmente, y es por lo que escribo este post en mi blog, quiero hablaros de la integración que hemos habilitado en SegmentaNet,con el software R. Además de las grandes prestaciones que pueda ofrecer SegmentaNet,de forma básica, se ofrece la posibilidad de poder editar y ejecutar scripts de R en los planes más altos y sólo ejecutarlos en los planes inferiores.

R se está convirtiendo en la herramienta de referencia alternativa a SPSS  en el análisis de datos y ahora junto con SegmentaNet, también en el reporting. En las próximas semanas iré posteando experiencias y casos de uso que estamos planteando para que veas que R es también para ti. Sí, hay que escribir las instrucciones de ejecución, pero es lo que nos va a permitir ser muy flexibles y adaptarnos a las necesidades que tiene cada cliente final, que todos hemos "sufrido en nuestras carnes".

Por ahora, os recomiendo dos paquetes de R que me han impresionado: expss y highcharter. Ambos paquetes me han ayudado a poder atender las necesidades que en la fase de desarrollo hemos ido acometiendo. No se usan de forma directa en SegmentaNet,, pero sí los podemos usar en nuestros scripts. Te recomiendo visites los sitios "comerciales" de ambos paquetes para que veas con tus ojos lo que se puede hacer, sobre todo HighCharts (utilizado por SegmentaNet), y la documentación de Joshua Kunst, desarrollador de highcharter.

jueves, 26 de julio de 2018

Barbwin2R, o como pasar datos de BarbWin a R

Son muchas las veces que ya me han preguntado por cómo manipular los datos (transformaciones, cálculos, reediciones, etc) para luego llevarlos a R. Está claro que desde EXCEL o CSV (texto), es directo, y también con SPSS, siendo este último el preferido, pues conserva las etquetas de variable y de los valores.

Dado que mi conocimiento sobre R, aunque mayor día a día, está a años luz de lo que podría considerarse un óptimo para trabajar única y exclusivamente con R, sigo utilizando mi BarbWin de siempre, aunque cada vez más haya procesos que hago con R. Para mí ha sido un descubrimiento esta aplicación, y no dejo de hablar de sus bondades y su potencial de integración con otras herramientas de análisis y publicación a todos los que me quieran escuchar y sean habituales del análisis de datos. Está claro que con otros usuarios, es mejor ni mentar R y sus infinitas bondades.

Así que la pregunta que plantea esta entrada tiene una respuesta que sembrará más confusión: SPSS.

Así es, guardando el archivo desde BarbWin como SPSS (extensión *,SAV) conservaremos todas nuestras etiquetas de variable y etiquetas de valor serán conservadas. Además, lo que es más importante, las múltiples. En la configuración del estudio, BarbWin te da la posibilidad de que las múltiples se guarden como variables que se corresponden con las menciones o como binarias (0/1). 

Imaginemos una variable denominada P1. En esa variable, el respondente que más menciones ha dado han sido tres. Pues bien si elegimos la opción de exportar por menciones, al exportar a SPSS, BarbWin creará 3 variables derivadas de esa múltiple, donde en cada una de ellas, estará, la primera, segunda y tercera mención respectivamente. Cuando no haya segunda o tercera mención, quedarán en blanco.

La misma variable P1, pero exportada en binario, crearía tantas variables como posibles opciones de respuesta tuviera la variable, y en cada de ellas pondría un 0 o un 1 según se hubiera respondo en la múltiple esa opción de respuesta.

Sea como fuere, las variables derivadas de la múltiple tendrían también sus correspondientes etiquetas de variable y de valores.

Una vez tuviéramos el archivo *.sav, restaría leerlo desde R. Muchos son los paquetes que nos permiten esta lectura, haven, foreign, Hmisc, y también expss. Yo personalmente prefiero este último, porque está orientado hacia la explotación de los datos usando los label que nos creará al leer el *.sav.

Para ello, procede de la siguiente forma:
install.packages("expss")
library(expss)
read_spss(file="nombre.archivo.sav")
Estaría listo y como decimos conservando todo el material trabajado en BarbWin.