Altillo.com > Exámenes > UBA - Económicas > Estadística
Estadística: Definiciones básicas
Experimento o Encuesta: Se llama así a la observación planeada de un fenómeno de cualquier índole con el objetivo de conocer su comportamiento, poder describirlo y/o tomar una decisión.
Se llama Unidad experimental a cada uno de los entes que son observados en el experimento.
Se llama Medición a la asignación, conforme a reglas preestablecidas, de valores (símbolos, numerales o números), a cada una de las características que poseen las Unidades Experimentales.
Se llama Escala de medición a una regla preestablecida o instrumento de medición, que consiste en un conjunto de valores que se asignaran a una característica especifica que poseen las Unidades de Experimentales.
Se llama Dato estadístico al valor asignado a una de las características de una Unidad Experimental, conforme a la Escala de Medición empleada.
Un dato estadístico es el valor que resulta de una medición. Se pueden clasificar en:
Datos estadísticos cualitativos: Son aquellos valores correspondientes a los atributos o propiedades categóricas que solo se pueden usar para identificar y describir a una Unidad Experimental.
Datos estadísticos cuantitativos: Son aquellos valores que, además de identificar y describir a una Unidad Experimental, establecen las diferencias posibles entre los valores en cantidad y grado.
Escalas de medición
Escala nominal : Se usa únicamente para clasificar a los entes en distintas categorías. La operación básica y más sencilla en todo proceso de investigación, es la clasificación, esto significa separar las unidades experimentales desde el punto de vista de determinadas características, decidiendo cuales son las que pertenecen a una misma clase y cuales pertenecen a distintas clases. Esta escala se utiliza cuando los datos son cualitativos, constituyendo el nivel más bajo de medición. Los valores correspondientes a esta escala reciben el nombre de categorías y son simples etiquetas. Si algún numero se asocia a una categoría, este estaría cumpliendo una función de código, de ninguna manera se pueden utilizar para operaciones matemáticas. La relación lógica de la Escala Nominal es la relación de equivalencia y posee las propiedades de simetría y transitividad.
Ej.: Provincia de origen del personal de una empresa: Los empleados de una empresa pueden ser clasificados en las distintas provincias, pero no es posible establecer una jerarquía entre ellas.
Escala Ordinal: Se usa para, además de clasificar a los entes en distintas categorías, clasificarlos de acuerdo a su rango. Esta escala se utiliza cuando los datos son cualitativos, y es posible ordenarlo de acuerdo a una jerarquía preestablecida de sus valores según el grado que poseen. La escala Ordinal constituye un nivel de medición superior al de la Escala Nominal. Cuando a las categorías se las representan con números, se hace la misma salvedad que la realizada para la Escala Nominal. Las relaciones lógicas propias de esta escala son, Relación de Equivalencia y la Relación de Origen y posee las propiedades de simetría, para dos valores de la misma categoría; asimetría, para dos valores de distinta categoría, y transitividad.
A<B<C<D
B tiene mayor jerarquía que A, C tiene mayor jerarquía B, D tiene mayor jerarquía que C, se puede decir que la mayor diferencia jerárquica entre A y D es igual al agregado de las diferencias jerárquicas entreA y B, y la diferencia jerárquica entre B y C, la diferencia jerárquica entre C y D, pero no se puede establecer cuál de las diferencia jerárquicas parciales es mayor.
Ej.: Grado de acuerdo con una determinada política del gobierno si las posibilidades son: muy de acuerdo, de acuerdo y desacuerdo: Se puede establecer una relación de orden o jerarquía entre las respuestas.
Escala de Intervalo o Distancia: Se usa para, además de clasificar a los entes en distintas categorías y clasificarlos de acuerdo a su rango, poder establecer una distancia entre dos cualquiera de ellos. Esta escala se utiliza cuando los datos son cuantitativos, por lo tanto los valores de cada categoría necesariamente deben ser números.
A<B<C
A B C
Se puede decir que la distancia entre a y b es mayor que la distancia entre b y c, pero no se pude establecer la proporcionalidad entre ellos. Al punto de origen de esta escala se le asigna arbitrariamente el valor cero, llamado cero arbitrario, que no necesariamente indica ausencia de la característica medida.
Ej.: Temperatura ambiente: Temperatura cero grados no indica ausencia de temperatura
Escala de Razón o proporción: Se usa para, además de clasificar a los entes en distintas categorías, clasificarlos de acuerdo a su rango, y poder establecer una distancia entre dos cualquiera de ellos, poder establecer una proporcionalidad entre dos cualquiera de ellos, poder establecer una proporcionalidad entre dos cualquiera de ellos.
A<B<C
A B C
Se puede decir que la distancia entre a y b es mayor que la distancia entre b y c, como así también se puede establecer la proporcionalidad entre ellos. El punto de origen de esta escala es realmente cero, llamado cero real, que indica ausencia de la característica medida. Esta escala constituye el nivel más alto de medición.
Ej.: Peso de una persona (en kg): Peso cero indica ausencia de peso.
Información: Al resultado de la evaluación de los datos estadísticos cuando se los compara con una adecuada referencia.
Ej.: La edad mínima requerida para ver una determinada película en el cine es 16 años. Llega una persona para ver la película y el empleado de la entrada le consulta la edad. Ella le contesta que tiene 18 años y el empleado le permite entrar.
Referencia: Es la edad mínima, 16 años.
Dato estadístico: Es la edad de la persona, 18 años.
Información: Surge cuando se comparan las edades, la persona es apta.
Decisión: Es la acción del empleado, le permite la entrada.
Estadística
Es la disciplina científica que crea, desarrolla y aplica los adecuados métodos de recopilación de datos, y su evaluación, para transformarlos en informaciones con las cuales se describan objetivamente las distintas situaciones investigadas, se analice el comportamiento de determinadas características que poseen las unidades experimentales, y se tomen decisiones en condición de incertidumbre. Para que un evento sea objeto de análisis estadístico, debe ser susceptible de presentar distintos resultados, aun cuando se lo repita bajo condiciones similares. La tarea Estadística está presente cuando se necesita estudiar aquellas situaciones que requieran ser medidas en similares condiciones y los resultados de estas puedan presentar variabilidad.
Universo
Es el conjunto de Unidades Experimentales que poseen características comunes observables para obtener información sobre un hecho particular. Puede ser finito o infinito. Se va a determinar cuándo se establezca el objetivo del trabajo a realizar.
Se llama variable a cualquier característica observable que tienen las unidades experimentales. Se llama recorrido de una variable al conjunto de los posibles valores que ella puede asumir. De acuerdo al tipo de datos que original la variable, estas se clasifican en:
Variable cualitativa: Cuando los valores que puede asumir no constituyen un espacio métrico. Esto quiere decir que no es posible establecer una distancia entre dos valores cualesquiera, como así tampoco realizar operaciones algebraicas con los valores de una variable cualitativa. Se miden en escala nominal o en escala ordinal.
Variable cuantitativa: Cuando los valores que puede asumir si constituyen un espacio métrico. Esto quiere decir que es posible establecer la distancia entre dos valores cualesquiera como así también realizar operaciones algebraicas con los valores de una variable cuantitativa. Se miden en escala de Intervalo o de razón y los valores pueden ser únicamente números.
Variable cuantitativa continua: Dado un intervalo [a; b] de números reales, si cualquier número real que pertenece a dicho intervalo puede ser un valor de la variable, entonces la variable es continua. Se originan cuando la característica a medir es una magnitud (longitud, superficie, volumen) y no se establecen restricciones. El recorrido de una continua es siempre infinito no numerable.
Variable cuantitativa discreta: Dado un intervalo [a; b] de números reales, si solo alguno números reales que pertenecen a dicho intervalo pueden ser un valor de la variable, entonces la variable es discreta. Se originan en los conteos, cuando se establecen restricciones al medir magnitudes. El recorrido de una discreta es siempre finito o infinito numerable.
Se llama Población a cada una de las variables particulares que se estudian en un universo. Se llama Muestra a un subconjunto o parte de una población sobre la base de la cual se puede hacer un juicio acerca de esta.
Etapas de la tarea estadística
1. Enunciación del problema, definición del Universo e identificación de las variables.
2. Formulación de los instrumentos de medición: son aquellos con los cuales se obtienen y/o registran los datos a medida que se los conoce o ellos se producen.
3. Recopilación de los datos: Forman la materia prima del proceso estadístico para la obtención de información.
Fuentes internas o propias: Si el estadístico y el especialista deciden recopilar los datos por cuenta propia lo pueden realizar de 3 formas clásicas:
· Registro: Es la recopilación sistemática de los datos en el momento que se producen. Ej. El registro nacional de las personal o dentro de una empresa el registro de proveedores.
· Censo: Es la observación del universo y la medición, a la totalidad de las unidades experimentales que lo conforman, de todas las variables que previamente hayan sido declaradas relevantes para la investigación a llevar a cabo, en un instante dado. Es un método estático de recopilación de datos.
· Muestreo: Es un conjunto de métodos que se utilizan para tomar una muestra, por lo tanto se observa una parte del universo en un instante dado. Es un método estático de recopilación de los datos.
Fuentes externas: Son las publicaciones. Si se utiliza este tipo de fuente para la obtención de los datos hay que verificar la calidad y responsabilidad de la publicación tratando que, en lo posible sea un material especializado.
· Fuente externa primaria: Cuando los datos publicados fueron recopilados directamente por los responsables del medio que los reproduce, mediante alguno de los métodos descriptos para las Fuentes Propias. Generalmente se recurre, como fuente externa primaria, a las publicaciones de organismos oficiales, como el Instituto Nacional de Estadísticas y Censos.
· Fuente externa secundaria: Cuando los datos publicados no fueron recopilados directamente por los responsables del medio que los reproduce. Generalmente las fuentes externas secundarias son publicaciones periodísticas que reproducen datos recopilados y presentados por otros organismos.
4. Presentación de los datos
Una vez que los datos se han recopilado es necesario que sean presentados en forma efectiva, de modo tal que puedan ser comunicados y que, a la vez, permitan tanto, obtener alguna información primaria, como así también, organizarlos para proceder al análisis.
Presentación escrita: Consiste en incorporar los datos en un párrafo combinando cifras y textos. No es muy eficaz cuando hay gran cantidad de datos.
Cuadro estadístico : también llamado tabla estadística, es una técnica de presentación de datos basada en un arreglo de filas y columnas donde se pueden clasificar los datos de acuerdo a las características que se le estudian a las unidades experimentales, permitiendo organizarlos adecuadamente.
· Cuadro estadístico de referencia: Son aquellos que se usan solo para publicar los datos y son utilizados como fuente para otros trabajos.
· Cuadro estadístico de Análisis: Son aquellos que se utilizan para presentar los datos de modo tal que facilite la realización de los cálculos matemáticos necesarios para el análisis de los datos.
La diferencia entre ambos está en la forma en que se los utiliza y no en su estructura.
5. Análisis de los datos
Análisis estadístico descriptivo: Permite describir, en forma apropiada, el comportamiento empírico de las variables, mediante el cálculo de algunas medidas capaces de resumir la información que contienen los datos.
Análisis estadísticos inferencial: El análisis inferencial permite tener información acerca de una población o tomar decisiones concernientes a ella, mediante los datos obtenidos con una muestra.
Análisis probabilístico: Con la utilización de modelos teóricos, permite cuantificar la incertidumbre que provocan los resultados de ciertos experimentos, cuando a estos no se los puede predecir con exactitud, como así también, medir el “error” que pudiera cometerse en las decisiones tomadas mediante el Análisis inferencial.
6. Interpretación de los resultados
Los resultados que se obtienen mediante el análisis de los datos están expresados en un lenguaje estadístico. En esta etapa, el Estadístico y el Especialista deben “traducir” estos resultados al lenguaje de la disciplina objeto de la investigación y entre ambos poder compatibilizarlos, dado que toda conclusión estadística tiene asociada una conclusión especifica donde se tomaras las decisiones.
Se llama regularidad estadística a la información del comportamiento de una variable, que proporciona el registro ordenado de sus valores observados. El conocimiento de la regularidad estadística permitirá la construcción de modelos teóricos con los cuales realizar predicciones confiables sobre los eventos que son investigados.
Cantidades absolutas y relativas
Los Datos Cuantitativos que se obtienen mediante la recopilación de los datos para realizar un determinado trabajo, según el tipo de información que se quiera proporcionar, se pueden expresar de dos maneras:
· En forma absoluta, si solamente se quiere mostrar la cuantía de la magnitud
· En forma relativa, si a la cuantía de la magnitud medida, se la quiere relacionar con otro valor de la misma magnitud.
Esto da origen a los dos tipos de cantidades:
Cantidades absolutas: Son aquellos datos cuantitativos que, cuando son presentados y/o analizados, están expresados en las unidades de medida correspondientes a la magnitud que se está midiendo.
Cantidades relativas: Son aquellos datos cuantitativos que surgen del cociente entre dos cantidades absolutas correspondientes a la misma magnitud y unidad de medida.
Se llama Proporción estadística a la cantidad relativa que se obtiene haciendo el cociente entre una parte y su correspondiente total.
Cuadro estadístico
Es un arreglo de filas y columnas dispuestas metódicamente de modo tal que se puedan presentar y organizar los datos para clasificarlos adecuadamente. Deben estar estructurados teniendo en cuenta las siguientes partes componentes:
1. Titulo: Debe describir concisamente el contenido del cuadro Ej.: que son los datos, donde fueron recopilados, como están clasificados, cuando ocurrieron los eventos que dieron origen a los datos.
2. Nota de encabezado: Se incorpora al cuadro para explicar ciertos puntos relacionados con la tabla completa que no han sido incluidos en el titulo o cuando se quiere hacer una ampliación de éste, ya sea detallando algún elemento importante o aclarando la unidad de medida de la magnitud que corresponde a los datos.
3. Columna Matriz: Teniendo en cuenta la naturaleza fundamental de los datos estadístico que se quieren presentar, se debe establecer cuál de las variables se considera más significativa o más importante. Los valores correspondientes a esta se disponen en la primera columna del cuadro.
4. Encabezado de las columnas: Los valores de las otras variables que quieran ser presentadas junto a la variable más significativa, o algunas características especiales de esta, generalmente se disponen en columnas, cuyos títulos constituyen el Encabezado de las columnas.
5. Cuerpo: Es el conjunto de celdas que se forman con la intersección de filas y columnas. Estas se llama unidad básica de presentación del cuadro, y en cada una de ellas se registran los datos correspondientes.
6. Nota al pie: Cuando es necesario clarificar o explicitar algún dato o elemento en particular, se realiza una nota específica a pie del cuadro.
7. Fuente: La fuente es el ultimo ítem que se presenta en todo cuadro, y en ella se consigna el origen y la forma de relevamiento de los datos.
Gráficos
Es un dibujo metódicamente realizado para presentar los datos y expresarlos en forma plástica. Debe estar estructurado
1. Titulo: Debe describir concisamente el contenido del cuadro Ej.: que son los datos, donde fueron recopilados, como están clasificados, cuando ocurrieron los eventos que dieron origen a los datos.
2. Nota de encabezado: Se incorpora al grafico cuando se quiere hacer una ampliación del título, ya sea detallando algún elemento importante o aclarando la unidad de medida de la magnitud que corresponde a los datos.(debajo del título y entre paréntesis)
3. Diagrama: Está formado por los distintos trazos que se utilizan para realizar los dibujos. Estos trazos pueden ser líneas, rectángulos, etc.
4. Nota al pie: Cuando es necesario clarificar o explicitar algún dato o elemento en particular.
5. Fuente: es el ultimo ítem que se presenta en todo grafico, y en él se consigna el origen y la forma de relevamiento de los datos.
Tipos de gráficos estadísticos
Según el tipo de diagrama que se utiliza para realizar los gráficos, estos reciben distintas denominaciones:
Grafico estadístico lineal: Se utiliza para representar valores de 2 variables cuantitativas presentadas conjuntamente, o mostrar la evolución de una variable cuantitativa a través del tiempo, usando para ello un sistema de coordenadas. El diagrama está formado por líneas rectas que unen los puntos del plano que representan valores de las variables.
Es posible que se quisiera mostrar la evolución de un Total conjuntamente con las Partes que lo componen. En este caso se llama lineal de partes componentes, y en él se realizan diagramas simultáneos.
Grafico estadístico de barras: Se utilizan, fundamentalmente, cuando una de las variables es cualitativa. Consiste en rectángulos dibujados en un sistema de coordenadas cartesianas ortogonales y la base de ellos puede estar, indistintamente, sobre el eje de abscisas o sobre el eje de ordenadas según sea el eje que este representando a la variable cualitativa. Cada rectángulo recibe el nombre de barra.
Si se quiere mostrar la incidencia que tienen cada una de las partes que forman los totales representados en cada una de las barras, a estas se las particiona proporcionalmente dando origen a un grafico de barras llamado de barras segmentadas.
Si se quiere resaltar la comparación entre las barras, se dibujan barras adyacentes que muestren cada parte, dando origen a un grafico de barras llamado Barras Agrupadas.
Gráficos circulares: Se utiliza para comparar partes de un total y su evolución en el tiempo o en el espacio por tal motivo se presenta un grafico para cada situación a comparar. Consiste en un círculo dividido en tanto sectores circulares como partes componen los totales que se quieren comparar. El ángulo correspondiente a cada uno de los sectores se determina de modo tal que mantenga la misma proporción con el ángulo de la circunferencia de cada parte con el total.
Análisis descriptivo
Distribución de las frecuencias: Al conjunto de datos dispuesto tal como se presentan, se lo denomina Datos no agrupados. Si la cantidad de ellos es grande, la experiencia indica veinte o más, y no están agrupados, es muy difícil poner en evidencia la regularidad estadística. En los casos de contar con una gran cantidad de datos o valores de cada una de las variables, el primer paso a realizar es ordenarlos agrupándolos en clases de equivalencia, para que puedan ser estudiados convenientemente, logrando que se manifieste la regularidad estadística, como así también, obtener otras informaciones que pueden resultar de interés. Hay que proceder a una clasificación.
Se llama Frecuencia absoluta a la cantidad de datos, o valores observados de una variable, que pertenecen a una misma clase de equivalencia.
Se llama Frecuencia relativa al cociente entre la frecuencia absoluta y la cantidad total de observaciones.
Distribución de frecuencias: Relación de clasificación de los datos que asigna a cada valor, o grupo de valores que formen una misma clase de equivalencia, de una o más variables, su correspondiente frecuencia. Se utilizan para tener los datos estadísticos organizados, clasificados y distribuidos en las distintas clases. Al conjunto de estos datos se lo denomina datos agrupados en una distribución de frecuencias. Según la cantidad de variables que se quiera clasificar las distribuciones pueden ser univariadas o polivariadas.
Frecuencia absoluta simple para variables discreta: Cantidad de veces que se repite un valor de la variable. Para representarla se utiliza el grafico de bastones. En el eje de abscisas se representa la variable en estudio y en el eje de ordenadas, la frecuencia simple.
Frecuencia absoluta acumulada para variable discreta: La cantidad de unidades experimentales con un valor de la variable menor o igual a un valor dado. Se presenta en forma tabular y acompañada de la frecuencia absoluta simple.
q de hijos |
q de mujeres |
Frecuencia acumulada |
Xi |
fi |
Fi |
1 |
3 |
3 |
2 |
4 |
7 |
3 |
7 |
14 |
4 |
4 |
18 |
5 |
2 |
20 |
Se utiliza el grafico escalonado o en escalera. En el eje de abscisas se representa la variable en estudio, y en el eje de ordenadas, los valores de la frecuencia absoluta acumulada.
Frecuencia relativa simple: Cociente entre la frecuencia absoluta simple y la cantidad de observaciones.
Frecuencia relativa acumulada: Al cociente entre la frecuencia absoluta acumulada y la cantidad de observaciones.
Frecuencia absoluta simple para variable continua: La cantidad de unidades experimentales cuyos valores observados de la variable pertenecen a un mismo intervalo de clase.
Frecuencia absoluta acumulada para variable continua: La cantidad de unidades experimentales que tienen un valor observado de la variable menor al límite superior de un intervalo.
Gráficos que se utilizan:
Variables discretas
Frecuencia relativa simple: bastones
Frecuencia relativa acumulada: escalones
Variables continuas
Frecuencia relativa simple: Histograma
Frecuencia relativa absoluta: Ojiva
Medidas de concentración: Son aquellas medidas con las cuales se puede establecer el porcentaje de datos que está concentrado dentro de un determinado intervalo que contenga una determinada concentración porcentual de datos. Tiene sentido cuando los datos están agrupados en una distribución de frecuencias.
Rango percentilar: Es la frecuencia relativa porcentual que se acumula desde el mínimo valor del recorrido hasta un valor dado de la variable. Se mide para un valor específico de la variable y brinda el porcentaje de datos que se acumula entre el menor valor de la variable y el valor dado. La diferencia entre los rangos percentilares de 2 valores de la variable X mide la concentración de datos que hay en el intervalo formado por ellos.
Variables discretas: El rango percentilar para un valor dado queda determinado directamente por la frecuencia relativa acumulada hasta dicho valor. No se requieren formulas especiales.
Variables continuas: Hay que diferenciar 2 situaciones:
a) Cuando el valor dado coincide con el límite superior de un intervalo, el rango percentilar queda determinado directamente por la frecuencia relativa acumulada hasta dicho valor. No se requieren formulas especiales.
b) Cuando el valor dado no coincide con el límite superior de un intervalo, para la determinación del rango percentilar se requiere una formula de interpolación lineal.
Percentiles: Calcula hasta que valor se acumula una determinada frecuencia relativa. El percentil de orden K es aquel valor hasta donde se acumula, a lo sumo, el K% de los datos, y desde donde se acumula a lo sumo el 100-k%. El orden absoluto del percentil es la frecuencia absoluta acumulada correspondiente al valor K, y se obtiene calculando el K% del total de observaciones N.
Medidas de posición o de tendencia central
Son aquellos valores destacados con los cuales es posible representar a la totalidad de los valores observados de la variable. No necesariamente son valores de la variable pero si están expresadas en la misma magnitud. Las medidas son:
Modo : Es el valor de la variable que se presenta con mayor frecuencia.
Variables discretas: Se puede determinar mediante la sola inspección de la columna de las frecuencias simples, absolutas o relativas.
Variables continuas: Con la inspección de los datos solo se puede obtener el intervalo de mayor frecuencia. El intervalo de mayor frecuencia se llama Intervalo modal. El modo es un valor que pertenece a dicho intervalo y para localizarlo hay que utilizar una formula de interpolación
Mediana: Es el valor que supera y es superado por igual cantidad de observaciones.
Promedios simples: Ciertos valores que se obtienen mediante la aplicación de operadores matemáticas, a la totalidad de los valores observados de dicha variable, bajo el supuesto de que todas las unidades experimentales medidas tienen la misma importancia relativa.
El promedio o media aritmética de una variable X, es el número que resulta de sumar todos los valores observados de la variable y dividir esta suma por la cantidad de unidades experimentales que se tienen. Debe interpretarse como cuando le correspondería a cada uno, si todos fuesen iguales.
Método de cálculo:
Valores de una variable sin agrupar
Valores de una variable discreta agrupada en una distribución de frecuencias simples
Valores de una variable continúa agrupados en una distribución de frecuencias absolutas simples
Valores de una variables, discreta o continua, agrupados en una distribución de frecuencias relativas simples
Se llama Desviación con respecto a la media aritmética, a la diferencia entre un valor individual de la variable y su media aritmética.
Promedios ponderados
Se llama Ponderación a aquella cantidad que permite asignar a cada unidad experimental que proporciona un valor de la variable en estudio, una determinada importancia o peso relativo.
El promedio aritmético ponderado surge de hacer el cociente entre, la suma del producto de cada valor de la variable y su correspondiente ponderación, y la suma de ponderaciones.
Medidas de variabilidad
Las medidas de tendencia central se las puede considerar como “representantes” de la totalidad de los valores observados de una variable. Estas medidas serán buenas representantes si los valores observados son homogéneos; esto quiere decir que si no hay demasiada diferencia o desviación entre cada uno de ellos y alguna medida en particular, entonces la medida en cuestión es representativa.
Las medidas de variabilidad son aquellas que permiten estudiar, como se desvían, en su conjunto, los valores observados de una variable, con respecto a alguna Medida de Tendencia Central.
La Varianza es una medida de variabilidad que mide el promedio aritmético del cuadrado de los desvíos que se producen entre cada valor de la variable y la media
Propiedades de la varianza
· Es necesariamente un numero real no negativo
· La varianza de la suma de una variable más, o menos, una constante, es igual a la varianza de la variable.
Desvío estándar
Es la raíz cuadrada positiva de la varianza. Esta medida es la adecuada para establecer la variabilidad que presentan los valores observados de la variable, en su conjunto, con respecto a la Media aritmética.
Coeficiente de variación
Para poder establecer si la variabilidad alrededor de la Media Aritmética que presenta una variable es baja o no, es necesario que el valor numérico del desvió estándar sea comparado o relacionado con ella (la media). El Coeficiente de variación de una variable es el cociente entre el desvío estándar y la media aritmética. Es un número puro, desprovisto de magnitud. Su valor numérico permite establecer criterios generales acerca de la homogeneidad de los datos, de la representatividad de la media y la comparación con la variabilidad de otras variables aunque las unidades de medida o las magnitudes sean distintas.
Si el CV es menor o igual a 0,10 se puede considerar que la variable en estudio es homogénea, y consecuentemente, la Media Aritmética es representativa.
Momentos empíricos
Son operadores matemáticos que se obtienen a partir de los valores observados de la variable. Se clasifican en:
Momento empírico absoluto
Momento empírico centrado
Medidas de forma
Otra característica importante a tener en cuenta al analizar los valores observados de una variable es la forma que presenta la distribución de frecuencias correspondiente ya que ello permite visualizar aproximadamente cual podría ser el Modelo Matemático que mejor se ajusta para describir el comportamiento de una variable.
La Simetría y la Curtosis son dos de los aspectos que permiten establecer dicha forma.
Una distribución de frecuencias es simétrica cuando:
Si la variable es discreta, las frecuencias simples correspondientes a valores de la variable que equidistan de la media aritmética son igual.
Si la variable es continua, las frecuencias simples de los intervalos cuyos puntos medios equidisten de la Media aritmética, son iguales.
Se llama Curtosis o apuntamiento, a una determinada relación entre la amplitud total y la máxima frecuencia que presenta una distribución de frecuencia.
Probabilidad
Modelo deterministico: Es aquel modelo matemático que describe el comportamiento de las variables cuyos valores quedan inequívocamente determinados a partir de las condiciones en que se llevara a cabo el experimento que las origina.
Modelo no deterministico o estadístico: Aquel modelo matemático que describe el comportamiento de las variables cuyos valores no quedan inequívocamente determinados a partir de las condiciones en que se llevara a cabo el experimento que las origina.
Se llama Experimento aleatorio o estocástico a aquel fenómeno empírico que admite dos o más resultados posibles y no se tienen elementos de juicio suficientes como para poder predecir con exactitud cuál o cuáles de ellos ocurrirán, aunque se los repita bajo las mismas condiciones.
Se llama Espacio muestral correspondiente a un experimento aleatorio, al conjunto de todos los resultados posibles que puede presentar dicho experimento.
Ej.: Se espera, al azar, el nacimiento de una persona. El experimento consiste en observar el color de ojos que tiene la persona recién nacida. El espacio muestral es azul, gris, verde, marrón.
Se llama Suceso aleatorio, S, a cualquier subconjunto del espacio muestral U, correspondiente a un experimento aleatorio E.
Suceso complementario: Aquel suceso que ocurre si, y solo si no se presenta el suceso S.
Suceso intersección o Conjunto: Aquel suceso que ocurre si, y solo si se presentan conjuntamente dos o más de los sucesos que forman el espacio muestral.
Suceso unión incluyente: Aquel suceso que ocurre si, y solo si ocurre alguno de los sucesos que forma el espacio muestral.
Suceso unión excluyente: Aquel suceso que ocurre si, y solo si ocurre solo uno de los suceso que forman el espacio muestral.
Cuando en un mismo espacio muestral se definen dos o mas sucesos, estos, por la propia naturaleza del experimento aleatorio que se lleva cabo, algunas veces podrían presentarse en forma simultanea. Pero hay sucesos que nunca, bajo ninguna circunstancia, se presentaran jutnos en la misma realización del Experimento Aleatorio.
Sucesos compatibles: Dos o mas sucesos son compatibles si y solo si es posible que se presenten en forma conjunta.
Sucesos mutuamente excluyentes o incompatibles: Si y solo si la presentación de unos de ellos impide, excluye, la presentación del o de los otros.
Se llama frecuencia relativa correspondiente al Suceso Aleatorio S, al cociente entre la cantidad de veces que ocurrió el Suceso, y la cantidad de veces que se repitió el Experimento E.
Fr (S)= K/N
Principio de estabilidad de la frecuencia relativa
Establece que la frecuencia relativa correspondiente a un suceso aleatorio, oscila, con una cnvergencia asintótica, alrededor de un numero fijo, cuando la cantidad de observaciones del Experimento Aleatorio crece indefinidamente.
En ocasiones, las personas deben decidir llevar a cabo acciones cuyo resultado no puede predecirse con exactitud. Bajo ciertas condiciones, estas acciones se consideran Experimentos Aleatorios. El desconocimiento del, o de los posibles resultados que se obtendrán, genera cierto grado de incertidumre. Por tal motivo, al tomar la decisión, y para que esta sea objetiva, debe contarse con un cuantificador, un numero capaz de proporcionar una medida del estado de duda o vacilación en que se encuentre el “decididor”. El calculo de la probabilidad permite cuantificar la incertidumbre que provoca el resultado de un Experimento Aleatorio y medir la propensión a ocurrir que tiene cada uno de los resultados posibles.
Axiomas y teoremas básicos para el calculo de la probabilidad
Axiomas
1. La probabilidad de ocurrencia de un suceso aleatorio es un numero real no negativo.
2. Si el suceso aleatorio es el espacio muestra, a la probabilidad de ocurrencia del suceso se le asigna el valor 1.
3. Sean S1 y S2 dos suceso mutuamente excluyentes perteneciente a un mismo espacio muestral, la probabilidad de que se presente alguno de los dos, suceso unión, es igual a la probabilidad de que se presente el suceso S1, mas la probabilidad de que se presente el suceso S2.
4. Sean S1; S2;…;Sk K sucesos mutuamente excluyentes de A pares, pertenecientes a un mismo espacio muestral, la probabilidad de que se presente alguno de ellos, suceso unión, es igual a la probabilidad de que se presente el suceso S1 mas la probabilidad de que se presente el suceso S2 mas, etc, mas la probabilidad de que se presente el suceso Sk.
Teoremas
1. Si el suceso aleatorio es el conjunto vacio, la probabilidad de ocurrencia del suceso aleatorio es 0.
2. La probabilidad de ocurrencia de un suceso mas la probabilidad de ocurrencia de su complemento es igual a 1.
3. Si S1 y S2 son sucesos de un mismo espacio muestral, la probabilidad de que se presente alguno de los dos, suceso unión incluyente, es igual a la probabilidad de que se presente el suceso S1 mas la probabilidad d eque se presente el suceso S2, menos la probabilidad de que se presenten conjuntamente.
4. Si S1 y S2 son sucesos de un mismo espacio muestral, la probabilidad de que se presente solo uno de los dos, suceso unión excluyente, es igual a la probabilidad de que se presente el suceso S1 mas la probabilidad de que se presente el suceso S2 menos el duplo de la probabilidad de que se presenten conjuntamente.
5. La probabilidad de ocurrencia de un suceso es un numero real comprendido entre 0 y 1.
Probabilidad Marginal
Es la probabilidad de que se presente un suceso aleatorio S1 incluido en el espacio muestral U asociado a un Experimento Aleatorio E.
Probabilidad conjunta (para 2 sucesos)
Es la probabilidad de que se presenten en el mismo experimento aleatorio dos sucesos aleatorios S1 Y S2 incluido en el espacio muestral U, asociado a dicho experimento E.
Se llama Probabilidad condicional del suceso S1 tal que se haya presentado el suceso S2, a la probabilidad de que se presente el suceso S1 con la condición de que previamente se presente el suceso S2.
P(S1/S2)= Probabilidad condicional de S1 dado S2.
P(S1/S2)= P(S1S2)/P(S2)
La Probabilidad conjunta de presentacion del suceso S1 Y S2 se calcula multiplicando la probabilidad marginal de uno de ellos y la probabilidad condicional del otro, dado el primero. La operación matemática que se utiliza es la multiplicación, por tal motival la regla a utilizar para el calculo de llama regla del producto.
Preguntas y Respuestas entre Usuarios: