- Población: conjunto de individuos del mismo tipo, tienen características en común. No es válido extender las conclusiones más allá de los límites de una población definida en espacio y tiempo, ni trasladarlas a otra.
- Es importante definir la población de interés al momento de llevar a cabo una investigación, ya que las conclusiones que obtengamos estarán referidas a toda esa población. Al ser por lo general muy numerosas, por razones prácticas y económicas se trabaja con muestras que es una parte de una población. Con la información que obtenemos con ella podremos hacer inferencias sobre la población total, por eso es necesario que la muestra sea representativa.
- Parámetro: Propiedad descriptiva de una población.
Es cualquier valor característico de la población. Ejemplo: la media de la población, la desviación típica de la población.
- Individuos: elementos que conforman el conjunto, la población. Pueden ser seres humanos, familias, escuelas, tiempos de reacción, animales, etc. A veces se los llama con el nombre de unidad.
- Muestra: parte de la población. Debe ser representativa: reproducir con una cantidad menor de unidades a la población. Puede ser:
- De individuos: parte de la población de individuos. De ellos obtenemos la información para el trabajo estadístico.
- De observaciones: parte de la población de observaciones. Es el agrupamiento de los valores que toma una variable estadística sobre una muestra de individuos.
- Variable: característica de los individuos de una población que puede tomar diferentes valores. Pueden ser:
- Cualitativa: es aquella que representa atributos, condiciones o cualidades de los individuos (por ejemplo sexo, profesión).
Están representadas por los niveles de medición Nominal y Ordinal.
- Cuantitativa: variable de valores numéricos. Es aquella característica de la población o de la muestra que es posible representar numéricamente.
Asociadas a niveles de medición Intervalar y De Razón.
Pueden ser:
- Discreta: son valores aislados. Valores consecutivos, no hay valores intermedios.
Por ejemplo: número de hijos, número de aciertos en un test, etc.
- Continua: es un intervalo real.
Aquella en la que entre dos valores cualquiera siempre pueden encontrarse valores intermedios.
Por ejemplo: tiempo medido en segundos.
- Variabilidad: la posibilidad de que una variable tome diferentes valores. Es la condición que se requiere para la aplicación de la estadística. Los individuos aportan variabilidad.
- Definición operacional: es una serie de instrucciones necesaria para objetivar y tratar un concepto.
Indica detalladamente los procedimientos a usar para obtener el valor de la variable que le corresponde a cada individuo.
Debe permitir que diferentes personas obtengan para el mismo individuo igual valor de la variable.
Ejemplo: así podemos definir operacionalmente “memoria” como la cantidad de palabras recordadas de una serie presentada.
- Medir: proceso de asignar elementos de un conjunto a cosas con un sentido determinado.
La acción de medir requiere una Escala.
- Escala: conjunto cuyos elementos son asignados a las cosas a medir, en general es numérica y con una estructura determinada.
Según sea esa estructura puede ser:
- Nominal: conjunto de nombres que se le dan a las distintas clases de cosas a medir. Sus elementos son símbolos diferentes.
Sus valores son nombres que designan a las distintas clases de cosas que se miden. Discrimina y coloca los elementos que son iguales en un mismo conjunto pero sin ningún orden jerárquico.
Por ejemplo: colores, lugar de nacimiento, profesión.
Los números asignados son simples códigos o etiquetas para distinguirlas y diferenciarlas.
Por ejemplo, en el género podría asignare “1” si es mujer y “2” si es varón, aunque cualquier otra asignación sería aceptable (letras o símbolos).
- Ordinal: como la escala Nominal pero con orden jerárquico.
Ejemplo: leve, moderado, fuerte. No es necesario que el intervalo entre mediciones sea uniforme.
Se puede definir el intervalo entre “a” y “b” como el conjunto de todos los elementos de la escala ubicados entre ellos.
Si además es posibles definir la longitud de los intervalos, la escala Ordinal pasa a ser Intervalar.
- Intervalar: conjunto de relaciones y operaciones que permiten definir el intervalo entre dos elementos y su longitud. Sus elementos tienen tres propiedades: son símbolos diferentes, están ordenados y tiene sentido comparar las longitudes de los intervalos determinados por pares de ellos.
El cero es arbitrario, no indica la ausencia de atributo.
Como ejemplo puede servir la escala de tiempo que utilizamos: el cero es arbitrario, puesto en el nacimiento de Cristo, o la escala para medir la temperatura en grados centígrados, en la que el cero es también relativo.
- De Razón: escala intervalar que tiene un cero absoluto, es decir, que corresponde con una cantidad nula de la medición. Tienen las mismas propiedades que la anterior. La razón entre dos elementos tiene un significado preciso que expresa la relación entre las cosas a las que se asignan . Ej: peso, edad de una persona, tiempos de reacción.
- Variaciones previsibles: la información que se conoce: la situación, el momento o la persona. Procuran un conocimiento general útil. Asociadas al conjunto de fuentes sistemáticas de variación, las variantes previstas. Por ejemplo: la edad.
- Variaciones imprevisibles: la información que se escapa de lo que dispone el observador. Se atribuyen a un conjunto de fuentes fortuitas de variación. No están asociadas a ninguna fuente de variación sistemática. Estas variaciones poseen estas características en un cierto momento de la encuesta o experiencia, pero pueden perderlas si se aportan nuevos conocimientos o medios de observación.
- Cuando el experimentador o encuestador hace la hipótesis de que varias fuentes sistemáticas de variación producen efectos sobre sus observaciones, comienza en general por verificar si cada una de ellas tiene efectivamente un efecto no nulo y significativo. Es necesario emplear métodos de análisis estadísticos para evaluar de manera más segura y precisa el “peso” de una fuentes de variación.
La comparación entre las amplitudes de ambas variaciones permite interpretar los resultados de la experiencia o encuesta e identificar algunas fuentes sistemáticas de variación.
Si las variaciones previstas NO son mayores que las variaciones imprevisibles, el psicólogo comprobará que No se confirma su hipótesis sobre el efecto de las fuentes sistemáticas de variación que había creído introducir en la experiencia o en la encuesta.
- Significativo Estadístico: se aplica a una comprobación efectuada sobre datos.
Ejemplo: la diferencia entre dos medias es demasiado grande para poder explicarse con verosimilitud mediante las fuentes de variación que dispersan los resultados alrededor de cada media.
- Significado Psicológico: El psicólogo es capaz de añadir un sentido, dar una interpretación, al hecho de que la diferencia entre dos medias (por ejemplo) se haya revelado estadísticamente significativa (variación importante a la que el psicólogo debe buscar causa) o estadísticamente no significativa (Variación esperable. Este resultado negativo también constituye un elemento de información).
- Frecuencia: número de veces que un valor de una variable se repite en una muestra.
- Distribución de Frecuencias: una forma de organización útil para interpretar la información recogida y facilitación de un tratamiento estadístico.
Es la organización de observaciones recopiladas, asocia a cada valor de la variable su correspondiente frecuencia, y resalta características importantes. Se puede presentar en forma de gráfico o tabla de frecuencias.
Tabla de frecuencias: que consta de dos columnas, en la primera colocamos los valores de la variable (ejemplo, cant de hijos: 1,2,3) y en la segunda la frecuencias absolutas correspondiente a cada valor, que son la cantidad de veces que se observa cada valores de la variable en la muestra.
- Frecuencia Absoluta: (definición de Frecuencia). La suma de todas las frecuencias absolutas tiene que ser igual al total de la población o de la muestra.
- Frecuencia Relativa: la frecuencia absoluta dividida por el tamaño de la muestra.
- Frecuencia Porcentual: la frecuencia relativa multiplicada por cien.
- Las frecuencias absolutas indican la cantidad de veces que los valores de las variables se repiten en la muestra y es utilizada cuando las muestras de observaciones son del mismo tamaño. Pero para poder comparar dos variables el tamaño de la muestra debe ser el mismo, y en caso de no ser así, deberemos transformar las frecuencias absolutas en frecuencias relativas o en frecuencias porcentuales.
- Así la suma de las frecuencias relativas de todos los valores de la variable es igual a uno y al comparar más de una variable ahora sí compartirán el mismo total. Y refleja el peso de cada valor de la variable en el conjunto de observaciones.
- Las tablas de frecuencia al tener pocas líneas resulta de fácil lectura e interpretación de la información que contienen.
- Generalmente las variables cualitativas y las discretas con una cantidad chica de valores posibles, permiten construir tablas de pocas líneas.
- En una variable continua, si la cantidad de valores y el tamaño de la muestra es grande, posiblemente tendrá muchas líneas.
También pasaría con una discreta.
En situaciones como ésta conviene usar la Agrupación, en determinar Intervalos de clase.
- Intervalos de clase: su unión cubre el segmento en que yacen las observaciones y cada una de ellas pertenece sólo a uno.
A cada uno de estos intervalos se les asocia una frecuencia igual al número de observaciones que contiene, y se opta por intervalos de igual longitud.
- Diagrama de Tallos y Hojas: Requiere que cada valor observado sea partido en dos. La primera parte, llamada tallo, es la de los dígitos principales, la segunda, llamada hoja, la de los otros dígitos (en general se opta por tomar solo uno, el primero).
La posición indica el lugar que la hoja ocupa en el número representado (generalmente son decimales).
La cantidad de hojas iguales de un tallo indica un mismo valor que se repite varias veces en la variable.
- Diagrama Circular (“Torta”): Para representar gráficamente la distribución de frecuencias de una variable CUALITATIVA.
A los valores de la variable cualitativa también se los denomina Categorías o Clases.
Se divide el círculo en tantos sectores circulares como categorías observadas haya.
El ángulo de cada sector se obtiene multiplicando la frecuencia relativa, de cada categoría, por 360º.
- Diagrama de Barras: Para representar variables CUALITATIVAS (Nominal y Ordinal).
Cada barra representa a una categoría, su altura es proporcional a la frecuencia relativa o porcentual.
Bajo la Base se coloca el nombre de cada categoría, y en el eje vertical se indican las frecuencias.
- Diagrama de Bastones: Variable DISCRETA. Los bastones son barras delgadas que deben estar apoyadas sobre los puntos del eje horizontal que corresponden a los valores numéricos de la variable.
- Diagrama de Puntos: Variable CUANTITATIVA. Da una imagen gráfica cabal de la distribución cuando el tamaño de la muestra es pequeño.
- Histograma: Distribución de frecuencias agrupadas en intervalos de clase (CUANTITATIVAS CONTINUAS). Los valores de la variable quedan representados en el eje horizontal, mientras que las frecuencias se indican en el eje vertical.
Todos los intervalos de igual longitud. Sobre ellos se levanta un rectángulo de altura correspondiente a su frecuencia.
- Poligonal de Frecuencias Acumuladas: se traza una línea uniendo los puntos de cada intervalo (puntos ubicados en la altura máx. de cada columna de un Histograma) desde el primero hasta el último.
Para determinar los intervalos de clase tenemos que elegir su número, es razonable que una distribución de frecuencia tenga entre 5 y 14 intervalos.
Se obtienen buenos resultados si se calcula la raíz cuadrada del número de la muestra.
Es recomendable que todos los intervalos tengan la misma longitud para facilitar la percepción visual, aunque en algunos casos no es la mejor opción. Si decidimos usar este método los pasos son los siguientes:
Encontrar el mayor y el menor valor observados designados con Xmax y Xmin.
Ejemplo: Xmax = 427 y Xmin = 197
- Calcular la amplitud de la muestra definida como la diferencia entre el mayor y el menor de los valores observados.
Amplitud = Xmax – Xmin.
Ejemplo: Amplitud = 427 - 197 = 230
- Establecer la longitud de los intervalos de clase dividiendo la amplitud por el número de intervalos.
Longitud = 230 / 7 = 32,857142
- Ajustar la longitud redondeando hacia arriba para evitar el uso de muchas cifras decimales.
Ejemplo: 33
Luego hay que determinar los extremos de los intervalos.
- Las medidas de tendencia central: son aquellas puntuaciones que ‘representan’ a la totalidad de las observaciones.
Se refiere a la concentración de una determinada escala numérica en un grupo. Son la Moda, Mediana y Media.
- Moda: Es el valor de la variable que se repite con mayor frecuencia. Es la más fácil de ubicar. Aplicable a nivel nominal. Representa el valor de la variable más probable para una extracción al azar. Dependiendo del tamaño del grupo, puede ser muy estable o poco estable.
- Mediana: Es un valor de la variable que ocupa una posición central determinando dos subconjuntos de valores de la variable, el de los valores mayores que ella y el de los menores. Se aplica desde el nivel ordinal, donde puede no existir.
La tendencia de grupos de puntuaciones extremas se mide probablemente mejor por la mediana.
Está colocada entre la moda y la media.
- Media aritmética (Promedio): Suma de todas las observaciones dividida por el total de ellas. Se utiliza en variables cuantitativas.
Se afecta por puntuaciones más alejadas del centro. Es sensible a modificaciones en sus puntuaciones.
Puede no representar al conjunto. No recomendable si hay valores extremos.
- Consideraciones frente a la elección de una media de tendencia central:
- - Si el tamaño de la muestra es pequeño la moda puede ser completamente inestable, poco representativa, debido a que si varían los valores de la muestra, también varía la moda.
- - La mediana no se afecta por el mayor o el menor tamaño de las puntuaciones situadas por encima o por debajo de ella.
Los valores extremos no influyen en la determinación de la mediana porque al calcularla nos basamos en el orden de los valores de la variable y no en la magnitud de ellos.
- -La media se influencia por el tamaño de cada puntuación en el grupo. Si una puntuación cualquiera se cambia por “n” unidades, X se cambiará en la misma dirección por cantidad de unidades.
- -Algunos grupos de puntualizaciones simplemente no manifiestan tendencia central alguna en forma significativa, siendo a menudo engañoso calcular una medida de tendencia central. Eso es particularmente cierto para grupos de puntuaciones con más de una moda.
- -La tendencia central de grupos de puntuaciones con valores extremos se mide probablemente mejor por la mediana, si las puntuaciones son unimodales.
- -En grupos unimodales de puntuaciones simétricas la media, la mediana y la moda son iguales.
- -Cuando el grupo de puntuaciones se considera como una muestra de un grupo simétrico mucho mayor, la media de la muestra está probablemente próxima al centro de la mayor agrupación de puntuaciones, a diferencia de la mediana o la moda.
- La moda es la medida de tendencia central más fácilmente obtenida y puede ser utilizada en todos los niveles de medición (nivel nominal, ordinal, intervalar y de razón) dado que es el valor, dentro del recorrido de la variable, que se repite con mayor frecuencia.
- La mediana puede ser usada a partir del nivel ordinal ya que para obtenerla debe haber una relación de orden definida entre los valores de una variable. En los niveles intervalar y de razón, también es usada porque es la puntuación que divide las posiciones en partes iguales (50% y 50% solo si son cuantitativas continuas), de tal forma que la mitad de las puntuaciones son mayores que la mdn y a otra es menor que ella.
- La media se aplica a cualquier cuantitativa (niveles intervalar y de razón) porque se halla sumando todas las puntuaciones y dividiendo por el número de puntuaciones sumadas. En los niveles nominal y ordinal no puede usarse porque no es posible sacar un promedio entre los valores que se encuentran en una variable.
- En las variables cuantitativas, las medidas de variabilidad o dispersión están asociadas al alejamiento de los datos a la media. Cuanto más cerca estén los datos de la media, más representativa será ésta. Y cuando más se aleje, habrá mayor variabilidad.
- Rango: Medida de la distancia total en la escala numérica a lo largo de la cual varían los puntajes.
Puede ser INCLUYENTE o EXCLUYENTE. El primero, se define como la diferencia entre el límite superior real del intervalo que abarca la mayor puntuación, y el límite inferior real del intervalo que abarca la puntuación menor. Es Excluyente cuando representa la diferencia entre la mayor y la menor puntuación de un grupo.
- Varianza: Se utiliza para determinar cuándo las distribuciones son más o menos dispersas respecto de la media.
Es sólo válida para variables cuantitativas.
Si el resultado de su cálculo, ofrece un puntaje alto, hay gran heterogeneidad, y cuando sea bajo, hay homogeneidad.
-Opera con cada puntuación individual, al igual que la media.
-Es una cantidad no negativa, es decir s2 ≥ 0. Es nula cuando no existe variabilidad.
- Desviación típica o estándar: Es una medida de desviación íntimamente relacionada con la varianza.
Es la raíz cuadrada de la varianza.
- Para comparar la variabilidad de dos o más grupos, si la variable es la misma y las medias coinciden o son muy similares, se concluye según la varianza o el desvío.
- Desviación media: Indica la desviación de cada puntuación, respecto de la media del grupo. Estas desviaciones describen hasta qué punto varían las puntuaciones originales.
- El coeficiente de variación: es el cociente entre el desvío estándar y la media. Expresa la variabilidad relativa a la media. Se usa en variables medidas con escala de cocientes o de razón.
- Cuanto más lejos del cero la media es menos representativa y hay mayor variabilidad.
- Se utiliza cuando se presentan dos grupos o dos variables diferentes y estas no son comparables
Por ejemplo; peso y altura, una se mide en metros y la otra en kilogramos
que sean cuantitativas, discretas o continuas de nivel de razón.
- Cuando se compara la variabilidad de dos o más grupos de observaciones, puede afirmarse que el grupo con menor CV es quien presenta observaciones más parecidas a su media y por tanto, el grupo es más homogéneo en cuanto a la variable en cuestión.
- Puede considerarse como una medida de representatividad de la media. La media es más representativa cuando las observaciones son más parecidas entre sí, esto es, cuando el CV es menor.
- Asimetría: El grado de asimetría de la distribución de frecuencias constituye uno de sus caracteres de mayor importancia. Ésta es una medida práctica para denotar la distancia directa a la cual se halla una puntuación de la media del grupo en términos de unidades de desviación típica.
- Medidas de posición: Dividen la muestra en partes iguales.
-Cuartiles: Dividen a la muestra en cuatro partes iguales.
-Quintiles: Centiles, Deciles…