UNIDAD 1
Experimento/encuesta: observación planeada de un fenómeno con un objetivo de conocer su comportamiento, describirlo y/o tomar una decisión.
Unidad experimental: entes que son observados en el experimento, queda determinada cuando se fijan los objetivos del trabajo.
Medición: asignación de valores a cada una de las características que poseen las UE.
Escala de medición: regla preestablecida o instrumento de medición, conjunto de valores que se asignaran a una característica específica que poseen las UE. Hay 4 tipos:
- Nominal: clasificar entes en diferentes categorías. Clasificar es separar a las unidades experimentales desde el punto de vista de ciertas características, diciendo cuales pertenecen a una misma clase y cuales a distintas. Datos cualitativos. Valores son categorías y etiquetas. Relación lógica es la de equivalencia y tiene propiedades de simetría y transitividad.
- Ordinal: para clasificar a entes en distintas categorías, de acuerdo a su rango. Datos cualitativos, se ordenan de acuerdo a una jerarquía preestablecida de valores según el grado que poseen. Relaciones lógicas son de equivalencia y de orden. Propiedades de simetría, para dos valores de la misma categoría; asimetría, para dos valores de distinta categoría y transitividad.
- Intervalo o distancia: para clasificar entes en distintas categorías y clasificarlos de acuerdo a su rango, poder establecer distancia entre dos cualquiera de ellos. Datos cuantitativos, valores son números. Punto de origen se le asigna valor cero arbitrario, que no indica ausencia de la característica medida.
- Razón o Proporción: clasificar entes de distintas categorías, clasificarlos de acuerdo a su rango, establecer una distancia entre dos cualquier de ellos y una proporcionalidad. Datos cuantitativos, valores son números. Punto de origen es cero real, indica ausencia de la característica medida.
Dato estadístico: valor asignado a una de las características de una unidad experimental, conforme a la escala de medición empleada; valor que resulta de una medición. Dos tipos: cualitativos (atributos o propiedades categóricas para identificar y describir a una unidad experimental) y cuantitativos (establecen diferencias posibles entre valores en cantidad y grado).
Información: resultado de la evolución de los datos estadísticos cuando se los compara con una adecuada referencia. Asociada a una decisión.
Estadística: disciplina científica que crea, desarrolla y aplica métodos de recopilación de datos, y su evolución para transformarlos en información para describir la situación investigada, analizar el comportamiento de determinadas características, que poseen las UE, y tomar decisiones en condición de incertidumbre.
Universo: conjunto de UE que poseen características comunes observables, para obtener información sobre un hecho particular. Pueden ser finitos o infinitos según la cantidad de UE que los integren.
Variable: característica observable que tienen las UE. Pueden ser cualitativas o cuantitativas.
Recorrida de la variable: conjunto de posibles valores que ella puede asumir. Puede ser recorrido infinito no numerable, recorrido infinito numerable, recorrido finito.
Variable cualitativa: valores que asumen no constituyen un Espacio Métrico. No hay distancia entre ellas. Se miden en escala nominal u ordinal.
Variable cuantitativa: valores que asumen si constituyen un Espacio Métrico. Hay distancia entre ellas. Se miden en escala de intervalo o de razón. Se clasifican en:
- Continua: dado un intervalo de números reales, cualquier número que pertenece a ese intervalo es un valor de la variable. Característica a medir es una magnitud y no hay restricciones. Recorrido infinito no numerable.
- Discreta: dado un intervalo de números reales, solo algunos números pertenecen a ese intervalo. Se dan en conteos, o cuando se establecen restricciones al medir magnitudes. Recorrido finito o infinito numerable.
Población: variables particulares que se estudian en un Universo. En cada universo hay tantas poblaciones como variables se estudien.
Muestra: parte de una Población sobre la base de la cual se puede hacer un juicio acerca de ésta.
Etapas de la tarea estadística: pasos que se deben cumplir a efectos de obtener información para la realización de un trabajo de investigación, que permitirá una buena planificación, organización y administración de los recursos. Las etapas son:
- Enunciación del problema, definición del universo e identificación de variables: por estadístico y especialista en la disciplina que se estudia.
- Formulación de instrumentos de medición: se diseñan los cuestionarios, encontrar la cantidad óptima de preguntas y no pueden presentar ambigüedades y respuestas tienen que ser claras y precisas.
- Recopilación de datos: hay dos fuentes:
- Internas: tres formas:
- Registro: recopilación sistemática de datos en el momento que se producen los hechos. Método dinámico.
- Censo: observación del universo y medición de variables relevantes para la investigación. Método estático.
- Muestreo: conjunto de métodos que se utilizar para tomar una muestra, se ve parte del universo en un instante. Método estático.
- Externas: publicaciones, pueden ser primarias o secundarias.
- Primaria: datos recopilados por responsables del medio que los reproduce.
- Secundaria: datos no recopilados por responsables del medio que los reproduce.
- Presentación de datos: tres formas complementarias.
- Escrita: poner datos en un párrafo combinando cifras y texto. Tienen que ser datos con pocos ítems.
- Cuadro estadístico: arreglo de filas y columnas donde se clasifican datos según características que se les estudien a las UE. Dos tipos:
- De referencia: se usan para publicar datos y son fuentes de otros trabajos.
- De análisis: presentan datos de modo que facilite realización de cálculos matemáticos necesarios para el análisis de datos.
- Grafico estadístico: realización de dibujos adecuados que permitan visualizar trayectoria o variabilidad de datos. Está dibujado en forma sencilla y atractiva, permite una rápida comprensión de su contenido.
- Análisis estadístico de datos: tres tipos:
- Descriptivo: describir comportamiento de variables, mediante cálculo de medidas capaces de resumir información que contienen datos. Construcción de cuadros y gráficos que visualicen modelos teóricos para usar en otro análisis.
- Inferencial: permite tener información de una población con datos obtenidos con una muestra.
- Probabilístico: cuantifica la incertidumbre que provoca resultados de experimentos que no se los predice con exactitud, también medir el error que se comete tomando decisiones con el interferencial.
- Interpretación de resultados: traducir resultados al lenguaje de la disciplina que se estudia y compatibilizarlos.
Regularidad estadística: información del comportamiento de una variable que proporciona el registro ordenado de sus valores observados.
Cantidades absolutas y relativas: datos cuantitativos que se obtienen con la recopilación de datos se expresen de dos maneras: absoluta (muestra cuantía de magnitud) y relativa (cuantía de magnitud se la relaciona con otro valor de la misma magnitud).
Cantidades absolutas: datos cuantitativos que están expresados en unidades de medida correspondientes a magnitud que se mide.
Cantidades relativas: datos cuantitativos que surgen del cociente entre dos cantidades absolutas de la misma magnitud y unidad de medida. Números puros y se expresen en porcentaje
Proporción estadística: cantidad relativa que se obtienen haciendo el cociente entre una parte y su total.
UNIDAD 2
Cuadro estadístico: arreglo de filas y columnas dispuestas para que se presente y organice los datos para clasificarlos. Tienen las siguientes partes:
- Título: describe concisamente el contenido del cuadro.
- Nota de encabezado: explica puntos relacionados con la tabla completa que no fueron están en el título, aclara elementos importantes y la unidad de medida de la magnitud. Va debajo del título y entre paréntesis.
- Columna matriz: establece que variable es más importante, sus valores van en la primera columna del cuadro.
- Encabezado de columnas: valores de variables que son presentados junto a variables más significativas, se ponen en columnas.
- Cuerpo: conjunto de celdas que se forman con la intersección de filas y columnas. Son la unidad básica de presentación del cuadro y en ellas se registran los datos correspondientes.
- Nota al pie: para clarificar algún dato o elemento en particular.
- Fuente: último ítem que se presenta y en ella se consigna el origen y forma de relevamiento de datos.
Gráfico: dibujo realizado para presentar datos y expresarlos en forma plástica. Sus partes son:
- Título, nota de encabezado, nota al pie y fuente: igual que en cuadro estadístico.
- Diagrama: formado por distintos trazos que se usan para realizar dibujos.
Tipos de gráficos:
- Lineal: representa valores de dos variables cuantitativas presentadas conjuntamente. Muestra evolución de una variable cuantitativa a través del tiempo. Sistema de coordenadas cartesianas ortogonales.
- De barras: variables cualitativas. Rectángulos (barras) en sistema de coordenadas cartesianas ortogonales. Si se muestra la incidencia de cada parte que forma el total representado, se parten proporcionalmente el grafico dando Barras Segmentadas. Si se resalta comparación entre partes, se usan barras adyacentes que muestren cada parte, se llama Barras Agrupadas.
- Circulares: compara partes de un total y su evolución en el tiempo/espacio, un gráfico para cada situación a comparar. Circulo dividido en tanto sectores como partes hay.
- De bastones: para presentar en forma gráfica la distribución de fi de una variable discreta.
- Escalonado: para presentar en forma gráfica una distribución de Fi de una variable discreta.
- Histograma: para presentar en forma gráfica una distribución de fi de una variable continua.
- Ojiva: para presentar en forma gráfica una distribución de Fi de una variable continua.
UNIDAD 3
Medidas que resumen información: para describir situaciones empíricas, hay 4 tipos:
- Medidas de concentración: establece porcentaje de datos que está concentrado en un intervalo. Hay dos tipos:
- Rango percentilar: porcentaje que se acumula desde el minimo valor del recorrido hasta el valor dado de la variable.
F(Xs)=F(s-1)+Xs-Lis/a * fs (Variable continua)
Gráficamente, se representa con una ojiva.
- Percentil: valor hasta donde se acumula el k% de los datos y desde donde se acumula el 100-k%. OAP: Fi correspondiente al valor k, k.n/100.
Variable continua: Si el OAP no coincide con algún valor de la Fi se buca el primer valor que lo supere y se hace Xk = Lis + OAP – F(s-1)/fi * a
Si el OAP coincide con algún valor de la Fi, el percentil es la semi suma de la variable y el siguiente.
Variable discreta: Si el OAP no coincide con algún valor de la Fi, el primer valor que supera al OAP, su valor de la variable es el percentil.
Si el OAP coincide con algún valor de la Fi, el percentil es la semi suma entre el valor de la variable y el siguiente: Xk= Xb + X(b+1)/2
Se interpreta como “solo el k% de los datos no supero el valor Xn; o solo el (100-k)% de los datos supero el valor Xn”.
Gráficamente se presenta con una ojiva.
- Percentiles especiales:
- Deciles: 10, 20, 30, 40, …, 100.
- Quintiles: 20, 40, 60, 80, 100.
- Cuartiles: 25, 50, 75, 100.
- Medidas de tendencia central: valores destacados con los cuales se puede representar la totalidad de los valores observados de la variable.
- Modo: valor de la variable que se presenta con mayor frecuencia. Así con variable discreta. Variable continua: buscar el intervalo con más frecuencia y hacer: Mo= Li+d1/d1+d2 * a
Gráficamente, discreta con grafico de bastones y continua con histograma.
- Mediana: valor que supera y es superado por igual cantidad de observaciones. Orden mediano (OM) es la ubicación de la mediana dentro del recorrido de la variable. OM=n-1/2 datos no agrupados, OAM (orden absoluto de la mediana)=n/2 datos agrupados en una tabla.
- Variable discreta: Si el OAM no coincide con algún valor de la Fi, se busca el primer valor que lo supere. El valor de la variable que lo supera es la Me. Si el OAM coincide con algún valor de la Fi, la Me es la semi suma entre el valor de la variable que le corresponde y el siguiente.
- Variable continua: Si el OAM coincide con alguna valor de la Fi, el valor del límite superior del intervalo es la Me. Si el OAM no coincide con algún valor de la Fi, se busca el primer valor que lo supero e Me = Lip + OAM – F(m-1)/fm * a
Se puede interpretar como “Solo el 50% de los datos (no) supero el valor de la Mediana”.
- Promedios simples: valores que se obtienen mediante la aplicación de operadores matemáticos a la totalidad de valores observados de dicha variable.
- Media Aritmética (X con raya encima): número resultante de sumar valores observados de la variable y dividir esa suma por la cantidad de UE que se tienen. Datos sin agrupar: X = EXi/n. Datos agrupados. X=EXifi/n
- Propiedades: x(variable) + c (constante) = X (media) + C; x */: c = X */: c
- Medidas de variabilidad: permiten estudiar valores de una variable con respecto a alguna Medida de Tendencia Central
- Desvío Medio: surge del promedio aritmético del módulo las desviaciones de los valores observados de una variable con respecto a una medida de tendencia central.
- Con respecto a la media aritmética: datos agrupados en una distribución de frecuencias: DM(X)=E|Xi –X(media)|/n . Frecuencia relativa: DM(X)= E|Xi – X(media)|.fri
- Con respecto a la mediana: datos agrupados en una distribución de frecuencias: DMe(X)=E|Xi – Me(x)|.fi . Frecuencia relativa: DMe(x)=E|Xi-Me(x)|.fri
- Suma de cuadrados: mide la variabilidad total de valores observados de una variable con respecto a su media aritmética. Valores sin agrupar: SC(X)=E(Xi-X media)2. Valores agrupados en una distribución de fi: SC(X)=E(Xi-X media)2fi y formula de trabajo SC(X)=EXi2fi-nx media2
- Varianza: mide el promedio aritmético del cuadrado de los desvíos que se producen entre cada valor de la variable y la media aritmética. V(x)=E(xi-X media)2/n . Propiedades:
- V de una constante es nula
- Y(variable)=X + - C /// V(Y)=V(X) /// Varianza no se modifica
- Y = x */: C /// V(Y)= C2*V(X) / V(Y)=V(X)/C2
- Y=a+bX /// V(Y)=b2V(X)
- Desvío estándar: raíz cuadrada positiva de la varianza.
- Coeficiente de variación: cociente entre el Desvío estándar y la media aritmética de dicha variable. Si es menor a 0.1 (10%) se considera que la variable en estudio es homogénea y la media aritmética es representativa.
- Momentos empíricos: operadores matemáticos que se obtienen a partir de los valores observados de la variable. Pueden ser absolutos (promedios de potencia de la variable) o centrados (promedio de potencias de desviaciones de la variable con respecto a la media).
- Medidas de forma: dos forms:
- Coeficiente de asimetría: cociente entre Momento centrado de orden 3 y la potencia y el desvió estándar elevado a la 3. Si es igual a cero, o está entre -0.05 y 0.05 la distribución es simétrica. Si es mayor a cero, la distribución es asimétrica hacia la derecha. Si es menor a cero, la distribución es asimétrica hacia la izquierda.
- Coeficiente de curtosis: sirve para establecer la relación que existe entre la máxima ordenada que tiene la distribución y la amplitud que tiene la distribución. Cociente entre momento centrado de orden 4 y desvío estándar elevado a la 4 menos 3. Si es igual a cero, distribución mesocúrtica. Si es mayor a cero, distribución leptocúrtica. Si es menor a cero, distribución platicúrtica.