Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


El fenómeno del análisis de datos: Yonoosedeanalysisdatosismo - Prof. Manzano, Apuntes de Psicología

Vicente manzano-arrondo describe el fenómeno observado en la docencia de análisis de datos, donde estudiantes tienen una actitud defensiva ante lo que perciben como matemáticas, a pesar de que mucho de su contenido es potencialmente fácil de comprender. El autor bautiza a este fenómenio como 'yonoosedeanalysisdatosismo' y explica cómo se activa cuando se enfrentamos a situaciones que resolveríamos con facilidad en la vida cotidiana, pero que se vuelven difíciles en un entorno académico. El texto también aborda conceptos relacionados con la media aritmética, la varianza y las distancias estandarizadas.

Tipo: Apuntes

2015/2016

Subido el 03/06/2016

julycubero
julycubero 🇪🇸

4.4

(5)

7 documentos

1 / 10

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Acerca del sentido común
y del extendido fenómeno
yonosedeanalisisdedatosismo1
Vicente Manzano-Arrondo, 2014
Motivación
Tras años de experiencia en la docencia de análisis de datos, he observado que los
estudiantes tienden a generar algo así como una actitud de defensa ante cualquier cosa que
parezca matemáticas. Esa actitud de autoprotección frente a contenidos asociados a lo más
desagradable de la existencia humana, resulta contraproducente. Impide comprender el sentido
de lo que se hace y, por tanto, aplicar los conceptos en situaciones nuevas.
El análisis de los datos es mucho sentido común, mucha comprensión y ... un momento que
haga memoria ... ¿qué cosa más? ... ya casi lo tengo ... ¡Ah! ¡Sí! ... Algo de cálculo. Pero esto último
es la parte más técnica, ante la que se puede contar con chuletas, formularios, guías breves y otras
ayudas. Lo curioso es que buena parte del contenido del análisis de datos es potencialmente fácil
de comprender pero prácticamente incomprendido.
He bautizado jocosa y malintencionadamente con yonosedeanalisisdedatosismo al
siguiente fenómeno: al encontrarse ante una situación que resolveríamos con soltura, naturalidad
y sin error en la vida cotidiana, pero inserta en una clase de estadística, se activa algo así como “yo
no sé de esto, he de buscar un recurso que me permita memorizar o automatizar el proceso para
llegar al resultado correcto”. Este fenómeno se complementa con el siguiente matiz: “¿Qué querrá
el profesor que yo haga? Es decir ¿qué es un resultado correcto?”
Este documento pretende ser ilustrativo. No es un tema oficial que, como es hábito, llegue
a ser materia de preguntas en un examen. Por ello me tomo algunas licencias, como es acudir a un
lenguaje más literario (aficionado) que académico (ídem). He escogido un asunto que me persigue
en las clases: el significado de la frecuencia absoluta en las fórmulas de cálculo, con independencia
de que sean sencillas o densas. Es una buena concreción de lo que estoy describiendo.
No sé si alguna vez has escuchado o visto el famoso chiste de la magdalena. Varios
humoristas lo han llevado a escena. Un hombre entra en un bar. El camarero se acerca. El cliente le
pide un café y una magdalena2. El camarero le responde azorado que puede ponerle otro dulce o
acompañante, incluyendo tostadas con todo tipo de ungüento, pero que no quedan madalenas. El
cliente piensa unos instantes y le dice “entonces deme un zumo de naranja... y una madalena”. El
1 Aviso: este documento cuenta con diversas notas a pie de página. Todas son absolutamente prescindibles. El autor
no se hace responsable de las consecuencias psicopatológicas que la lectura de tales notas puedan causar en quien
las lea. Ante la duda y como es habitual en la firma de contratos, no lea usted la letra pequeña.
2 Una magdalena, también conocida como madalena, es una especie de bizcocho de menores dimensiones, cubierto
parcialmente por un papel semi-hidrófobo al que se obstina en permanecer adherida. Apreciada por gentes de
toda procedencia social, se la ve habitualmente en desayunos.
1
¿Qué hacer con las frecuencias?
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga El fenómeno del análisis de datos: Yonoosedeanalysisdatosismo - Prof. Manzano y más Apuntes en PDF de Psicología solo en Docsity!

Acerca del sentido común

y del extendido fenómeno

yonosedeanalisisdedatosismo

Vicente Manzano-Arrondo, 201 4

Motivación

Tras años de experiencia en la docencia de análisis de datos, he observado que los

estudiantes tienden a generar algo así como una actitud de defensa ante cualquier cosa que

parezca matemáticas. Esa actitud de autoprotección frente a contenidos asociados a lo más

desagradable de la existencia humana, resulta contraproducente. Impide comprender el sentido

de lo que se hace y, por tanto, aplicar los conceptos en situaciones nuevas.

El análisis de los datos es mucho sentido común, mucha comprensión y ... un momento que

haga memoria ... ¿qué cosa más? ... ya casi lo tengo ... ¡Ah! ¡Sí! ... Algo de cálculo. Pero esto último

es la parte más técnica, ante la que se puede contar con chuletas, formularios, guías breves y otras

ayudas. Lo curioso es que buena parte del contenido del análisis de datos es potencialmente fácil

de comprender pero prácticamente incomprendido.

He bautizado jocosa y malintencionadamente con yonosedeanalisisdedatosismo al

siguiente fenómeno: al encontrarse ante una situación que resolveríamos con soltura, naturalidad

y sin error en la vida cotidiana, pero inserta en una clase de estadística, se activa algo así como “yo

no sé de esto, he de buscar un recurso que me permita memorizar o automatizar el proceso para

llegar al resultado correcto”. Este fenómeno se complementa con el siguiente matiz: “¿Qué querrá

el profesor que yo haga? Es decir ¿qué es un resultado correcto?”

Este documento pretende ser ilustrativo. No es un tema oficial que, como es hábito, llegue

a ser materia de preguntas en un examen. Por ello me tomo algunas licencias, como es acudir a un

lenguaje más literario (aficionado) que académico (ídem). He escogido un asunto que me persigue

en las clases: el significado de la frecuencia absoluta en las fórmulas de cálculo, con independencia

de que sean sencillas o densas. Es una buena concreción de lo que estoy describiendo.

No sé si alguna vez has escuchado o visto el famoso chiste de la magdalena. Varios

humoristas lo han llevado a escena. Un hombre entra en un bar. El camarero se acerca. El cliente le

pide un café y una magdalena

2

. El camarero le responde azorado que puede ponerle otro dulce o

acompañante, incluyendo tostadas con todo tipo de ungüento, pero que no quedan madalenas. El

cliente piensa unos instantes y le dice “entonces deme un zumo de naranja... y una madalena”. El

1 Aviso: este documento cuenta con diversas notas a pie de página. Todas son absolutamente prescindibles. El autor

no se hace responsable de las consecuencias psicopatológicas que la lectura de tales notas puedan causar en quien

las lea. Ante la duda y como es habitual en la firma de contratos, no lea usted la letra pequeña.

2 Una magdalena, también conocida como madalena, es una especie de bizcocho de menores dimensiones, cubierto

parcialmente por un papel semi-hidrófobo al que se obstina en permanecer adherida. Apreciada por gentes de

toda procedencia social, se la ve habitualmente en desayunos.

¿Qué hacer con las frecuencias?

camarero vuelve a expresarle, con otro discurso, esta vez más extenso, el problema de la

inexistencia. La reacción del cliente es volver a pensar y volver a pedir un líquido (pongamos por

caso la habitual infusión de salvia fresca con jengibre) igualmente acompañado por una madalena.

Así transcurre una y otra vez. La desesperación del camarero va en aumento. Acude a todo tipo de

recursos creativos, a sugerencias, a peticiones desesperadas, todo ello teniendo como respuesta la

invariable inmutabilidad del cliente. El chiste tiene diversos finales, incluyendo el asesinato, el

suicidio y el paro cardíaco. Es, sin lugar a dudas, humor negro. Nos reímos porque el que se muere

es otro. Aunque la situación estimula la carcajada, es pertinente reconocer la tragedia en la

historia; una tragedia que no se comprende hasta que no se vive.

En pocas palabras, yo soy el camarero y algunos estudiantes son los clientes. La madalena

es el significado de la frecuencia en una fórmula de cálculo. Hasta el momento no ha tenido lugar

asesinato ni suicidio. Pero no puedo garantizar nada.

Tal vez tú no tengas problemas con esto. Pero si conoces a alguien que lo sufra, pásale el

texto y probemos suerte. El fenómeno no es un indicador de algún déficit de inteligencia o

intelectual. Lo hemos aprendido. Tal vez seamos víctimas de nuestra propia historia, de malas

docencias previas, de imaginarios colectivos, de lo que sea. Cuando digo que observo que esto no

se entiende, no estoy afirmando que la gente sea tonta. No lo es más que yo. Ahí no reside la

explicación. La gente es, sencillamente, torpe. Y no pasa nada. Tomado al azar un individuo del

planeta, comprobaremos que ignora más de lo que sabe y que es torpe en mayor número de

tareas que aquellas que realiza con maestría. Así que bienvenidos y bienvenidas a la dimensión

mortal de la gente normal

3

, donde también resido yo. Este documento es para esa gente, sin

complejos, como decía un anuncio.

Sumando espero

Un buen día llego al aula sin ganas de dar clase. No sé en qué entretener al estudiantado.

¡Bien! ¡Se me ocurrió una idea! Voy a hacer que suméis hasta que pueda freírse un huevo en la

coronilla

4

. Vais a sumar mil números. Ahí va:

Suma 800 veces el valor 3 y 200 veces el valor 5

Lo suelto. Me siento. Acaricio la idea del asueto. Enciendo el smartphone, dispuesto a

practicar el deporte de evadirme del cerebro. Se me ocurre levantar la vista

5

y os veo con cara de

“Vale. Ya lo he hecho. Y ahora qué”. ¡Habéis sumado mil datos en menos de un minuto! Pregunto

por el resultado... Alguien dice con desgana “tres mil cuatrocientos”. Así que rápido y correcto.

Asombroso. Como dice la pertinente chirigota Las verdades del banquero , “no doy crédito”.

3 Si te has habituado a ver la típica película de Disney donde la normalidad es odiosa y el/la protagonista se

comporta como si lo único que tuviera sentido en la vida es el éxito clamoroso, la admiración externa, el aplauso

multitudinario y, en definitiva, la ausencia sobresaliente de anonimato, entonces la bienvenida con que te he

recibido te resultará similar a una ofensa. Créeme, no era mi intención, en absoluto. Pero ya sabes, aquí en Cádiz...

(y Sevilla está cerca). Y si no lo sabes, pregunta, que se adquiere cultura.

4 Coronilla es la zona de la cabeza donde podría mantenerse en equilibrio una corona de pequeñas dimensiones

cuando la barbilla se encuentra aproximadamente a cinco centímetros del esternón y el individuo propietario del

cuerpo se encuentra en posición vertical.(Nota del editor). Barbilla es la zona del rostro en donde podría colgar una

barba de pequeñas dimensiones, caso de existir. Si existe, los cinco centímetros de distancia entre la barbilla y el

esternón necesarios para que la coronilla se encuentre en la cota más alta de la estructura, desaparecen. Utilícese

como criterio cuando los pelos de la barbilla hacen cosquillas.

5 Obvia decirlo, pero por si estás navegando mientras lees esto y por tanto tu nivel de atención está dividido, si he

levantado la vista es que todavía no terminó de encenderse el smartphone.

X

i

f i

Pues allá vamos. ¿Cuál es la media?

La media aritmética se obtiene dividiendo la suma de datos entre el número de datos. No

vamos a disertar aquí acerca de su significado

7

. Vayamos únicamente a su cálculo. Hemos dicho

suma de los datos. Pues bien, no sé si te pasará a ti, pero algunos estudiantes hacen lo siguiente:

Eso no es la suma de los datos, sino la suma de algunos datos, los diferentes entre sí.

Contamos con 50, no con 5. Hay 9 datos con el valor 2, 11 con el valor 4, etc. Los hemos

despreciado a casi todos. Esa operación, consistente en sumar solo los datos con valores

diferentes, deja fuera a 45 de los 50. Aunque sea una tabla de frecuencias, la lógica sigue siendo la

misma del ejemplo de los mil datos. Vamos a ver extendidos a estos 50, sin estar dispuestos en una

tabla de frecuencias. Y los ordeno según su cuantía, para facilitar la conclusión:

Si te digo que sumes esos datos, no creo que hagas esto:

Más bien, para ahorrar esfuerzo, dirás: el 2 está 9 veces, así que 2 x 9 = 18, a lo que he de

sumar los once 4, es decir 18 + (4 x 11) = 18 + 44 = 62, a lo que he de sumar los doce 6, es decir... Si

en lugar de tener el listado continuo de los 50 datos los disponemos en la tabla de frecuencias para

facilitar los cálculos, lo que ocurre es precisamente que los cálculos se facilitan, no que se evitan:

X

i

f

i

X

i

f

i

Dado que la media es la suma de datos entre el número de datos, el resultado es:

7 Como ya has observado, este documento no tiene absolutamente nada irrelevante. Todo el texto es importante

para descubrir el significado de la existencia humana a través de las estrategias de análisis de datos. Kevin Costner,

creo recordar que en Tin Cup , afirma que el béisbol es la esencia del misterio de la vida en el universo. Si él lo dice,

¿por qué no ser el análisis de los datos o cualquier otra cosa parecida?

X =

i = 1

50

X

i

n

X

i

n

Como observarás, en el tercer elemento de la igualdad múltiple, he eliminado las

especificaciones del sumatorio. En lugar de indicar “Sumatorio desde i=1 a 50”, sencillamente pone

“Sumatorio”. Esto es un convenio para simplificar la expresión. Pero hemos de saber qué estamos

haciendo. En la práctica, yo sé que no voy a hacer literalmente lo que dice la fórmula, es decir, no

voy a sumar 50 datos directamente, sino que utilizo un atajo, el que ya conocemos, multiplicando

los valores por sus frecuencias. Para que la fórmula exprese literalmente el aprovechamiento de las

frecuencias, deberíamos hacerle alguna modificación:

X =

i = 1

5

X

i

f

i

n

X

i

f

i

n

Esto de andar con diferentes subíndices y de estar escribiéndolos continuamente es todo

un trabajo. Nos lo podemos ahorrar. Las expresiones de cálculo pueden ser muy sencillas. Pero

para simplificarlas es necesario que no perdamos el norte, es decir, que no se nos olvide qué es lo

que estamos haciendo. En otras palabras y si el número total de datos se representa por n

mientras que el número de valores diferentes es k :

Sé que

X

i

expresa “suma de los n datos”, bien sea

literalmente (

i = 1

n

X

i

) o mediante un atajo (

i = 1

k

X

i

f

i

Varianciando

8

Muchas personas en clase no hacen nunca eso de sumar solo los valores diferentes cuando

lo que necesitan es sumar todos y cada uno de los datos

9

. Calculan perfectamente la media

aritmética, sea con el listado original o a partir de una tabla de frecuencias. También es cierto que

buena parte de ellos no sigue con esa lógica cuando la fórmula resulta menos familiar. Vamos a

verlo con el cálculo de la varianza, tanto en su expresión original como en la de cálculo

simplificado.

El problema que abordamos ahora es calcular la varianza de los datos del ejemplo anterior.

Sabemos que la varianza es una media de distancias cuadráticas. Repetimos, más despacio:

8 Permítaseme seguir neologizando sinvergonzosamente, pues dado que este asunto no será objeto de pregunta en

examen alguno, bien vale la licencia de operar con el lenguaje al antojo. Este pie de página tiene igualmente el

interés de retar al traductor.

9 Dejo libre la interpretación cuantitativa del término “muchas”. Lo he utilizado especialmente para facilitar que si le

pasa a alguien, pueda sentirse partícipe de un grupo numeroso. Gracias a la propensión que parece tenemos para

concebirnos parte de la mayoría (desde una estética de la minoría), los anuncios venden que da miedo. Pero ya

conoces el dicho: dos son compañía y tres, multitud. De hecho, cuando alguien se excede, se le reprocha con “te

has pasado tres pueblos”. Así pues, “muchas”, como muchos otros muchos, es algo mucho relativo. Vale, lo dejo,

por si ya te parece mucho. Yo he conseguido mi objetivo: que la tabla pase a la siguiente página.

o bien:

S

2

i = 1

5

(

X

i

X

)

2

f

i

n

∑ (

X

i

X

)

2

f

i

n

Como en el caso de la media aritmética, es indiferente que yo utilice la primera expresión

para la fórmula y que calcule según la segunda. El numerador no varía. En otras palabras:

Sé que

∑ (

X

i

X

)

2

expresa “suma de las n distancias cuadráticas”, bien sea

literalmente ( ∑

i = 1

n

(

X

i

X

)

2

) o mediante un atajo ( ∑

i = 1

k

(

X

i

X

)

2

f

i

Simplivariando

11

El cálculo del índice de variación que conocemos asombrosamente como varianza puede

ser simplificado. La fórmula anterior es la que se ajusta literalmente a la idea, es decir, a expresarse

como media de distancias cuadráticas. No obstante, andar restando continuamente y elevando el

resultado al cuadrado, especialmente cuando la media aritmética te obliga a arrastrar decimales,

es un fastidio digno de mención. Hay una estrategia más sencilla, que tal vez ya conozcas y que

surge de resolver el paréntesis de la distancia cuadrática. El resultado es:

S

2

∑ (

X

i

X

)

2

n

X

i

2

n

X

2

Leyendo casi con estilo poético: la media de las distancias cuadráticas es lo mismo que la

media de los cuadrados menos el cuadrado de la media. Observa que volvemos a tener una suma.

No hay forma de librarse de ella. Si hay suma, hay confusión en potencia, pues una vez más ¿qué

hacer con las frecuencias? La respuesta es sencilla: lo mismo de siempre. Pero no nos vale con algo

tan general ¿verdad? Vamos a ello. Comenzamos con la tabla, donde he añadido el cuadrado de

cada valor (X2):

X f X

Ya sabes la historia: la suma de todos los cuadrados de los números es la suma de los 50

cuadrados, no la de los 5 diferentes. No es esto:

11 Ya te queda na. Quién sabe si cuando superes esta asignatura recordarás más el chiste de la madalena o los

neologismos que el cálculo de MAD. Se admiten apuestas.

Si no esto:

Luego

S

2

X

i

2

n

X

2

2

2

Y, en definitiva:

Sé que ∑

X

i

2

expresa “suma de los n cuadrados”, bien sea

literalmente (

i = 1

n

X

i

2

) o mediante un atajo (

i = 1

k

X

i

2

f

i

Madificinger Z

12

Si se me ocurre relatar todo lo anterior en clase, sea en la misma sesión o troceada por

entregas semanales en vivo, un efecto frecuente es la profusión de indicadores de hastío, con caras

de “ya estamos otra vez con la misma canción”.

Una de mis piezas favoritas es Variaciones y fuga sobre un tema de Purcell Op. 34 de

Benjamín Britten

13

. Doy clases de análisis de datos, donde el concepto de variabilidad es

fundamental. Así que cuando varío explicaciones sobre un mismo tema me viene a la cabeza una

tontería: efecto opus 34. En ningún momento el efecto op34 es más evidente que en el asunto de

las frecuencias, muy especialmente aplicado al epígrafe de las distancias estandarizadas.

Como sabes, una distancia estandarizada es precisamente eso: una distancia que se ha

estandarizado, usualmente simbolizada con la letra Z. Más despacio:

  • Distancia: X

i

X

  • Distancia estandarizada:

X

i

X

S

He indicado ya en otro lugar la inestimada utilidad de medir el precio de las cosas mediante

un objeto de consumo con significado. En mis tiempos de estudiante medía todo lo mensurable

cuantitativamente con bocadillos de chorizo pamplonica. Gracias a ser especialmente asequible,

12 Mi hermano Carlos es una de estas personas que te comen la moral. Para quien no entienda la expresión, me

refiero a un fenómeno positivo que te hace sentir una mosca insignificante. Es sordo casi por completo. Sin

embargo y entre otras habilidades, toca el piano de oído y lo hace con una maestría sorprendente. En la misma

línea, a los seis años realizó una pintura a trazo de lápiz sobre Mazinger Z, los dibujos animados que arrasaban por

aquel entonces. El dibujo dejó alucinados a todos los miembros de la familia y a parte del extranjero. Ahora tiene

41 años y se dedica al diseño a mano y por ordenador de todo tipo de escenarios. Eso significa que han pasado 35

primaveras desde la época en que Mazinger Z era el referente de miles de niños. Hemos mejorado sensiblemente.

En lugar de un robot gigante que hace justicia destrozando edificios mientras lucha con robots enemigos, ahora

contamos con Los Simpsons.

13 Por la razón que sea, cuando alguien habla de que le gusta una obra de música clásica (llamada genéricamente así

aunque sea barroca, renacentista o romántica, por ejemplo), es tachada de pedante. No ocurre lo mismo si pongo

como ejemplo otras piezas que me encantan, como la versión de Elvis Presley de Blue Suede Shoes , Rasputín de

Boney M, Como el agua de Camarón, What's my name de Rihanna o el impresionante El Garrotín de Smash.

las distancias, como en todos los casos anteriores, se refiere a todas ellas y no solo a una élite,

seleccionada por el criterio disneyano

15

de parecer diferente destacando del resto.

Lo correcto no es:

Para encontrar la suma, va a resultar muy útil añadir a la tabla una nueva columna (Zf) que

expresa el resultado de sumar el valor Z un total de f veces:

X f Z Zf

Dado que hemos redondeado en el cálculo de la desviación tipo y de las distancias

estandarizadas, el resultado tiene un error de 5 centésimas, que a los efectos de lo que estamos

abordando, no es relevante. De hecho, utilizando tres cifras decimales, la distancia estandarizada

que se corresponde con el valor X=2 es Z=-0,554. En tal caso, la suma de las 10 distancias con valor

Z=-0,554 será -5,54, con lo que el resultado final tiene únicamente un error de una centésima. Para

caminar con más seguridad, sería recomendable que los elementos de cálculo cuenten con no

menos precisión que el resultado final. Si la Z se ha calculado con dos cifras decimales, al

multiplicarlas por las frecuencias, que rondan el valor 10, el resultado transforma en precaria a la

segunda cifra decimal resultante y solo habría que considerar una. Pero esto es ya otra historia.

En definitiva, en cualquier fórmula y para terminar:

Sé que

Z

i

expresa “suma de las n distancias estandarizadas”,

bien sea literalmente ( ∑

i = 1

n

Z

i

) o mediante un atajo ( ∑

i = 1

k

Z

i

f

i

Y con esto terminamos. Sé feliz

16

15 Para evitar confusiones, aclaro que no me refiero al lugar del dorso del cuerpo situado entre espalda y muslos en

referencia al genial cineasta estadounidense. Vuelve a ser un neologismo que afecta de nuevo a la tendencia a

destacar, expresada magistralmente por María Isabel López en Antes muerta que sencilla , dentro del álbum No me

toques las palmas que me conozco.

16 Obviamente es una sugerencia y la expresión de un deseo. No te imagino un día visiblemente alegre ante alguien

que te pregunta “Oye ¿y tú por qué eres tan feliz?”, respondiéndole “Nunca se me había ocurrido. Pero me lo dijo

mi profe de análisis de datos”. Ahora que lo pienso, no está mal para iniciar el guión de una película.