Altillo.com
> Exámenes >
UBA
- Cs. Sociales - Ciencias Políticas >
Metodología de la Investigación en Ciencias
Sociales II
Resumen de Toda la Materia | Metodología de la
Investigación en Ciencias Sociales II (Cátedra: Rotman - 2024) | Cs.
Sociales | UBA
Para llevar a cabo una investigación, el primer paso es elegir un 1) tema de
investigación (seleccionar una cuestión que se considere relevante para ser
indagada, pero generalmente demasiado amplia como para ser examinada
directamente). Este primer paso es subjetivo, y depende del investigador a
cargo.
En segundo lugar, hay que extraer un 2) problema de investigación. La
formulación del problema de investigación implica la enunciación de una o varias
preguntas sobre qué es lo que se quiere saber y acerca de quién; explicita algo
de alguien que se quiere conocer, y el cuándo y dónde de este interrogante.
- Puntualizar el quién es especificar las unidades de análisis. Éstas pueden ser
individuales (en el caso que se trate de personas) o colectivas (por ejemplo
países, partidos políticos).
- El cuándo y dónde se utilizan para realizar un corte temporal y otro espacial.
Población: Es el conjunto de todos los casos que concuerdan con una serie de
especificaciones.
Muestra: Subgrupo de la población.
Hipótesis: Relación entre dos o más variables, las cuales deben ser testeables
por los métodos de las ciencias sociales.
Simetría: Hay hipótesis en donde no se puede identificar la variable dependiente
o la independiente.
Variable: Algo que asume diferentes estados (categorías) Es un
atributo/propiedad de mis objetos de estudio.
- Variables independientes: son aquellas que actúan como factor causal de la
relación establecida.
- Variables dependientes: son modificadas a raíz de los cambios en las variables
independientes, y generalmente son las que interesa estudiar.
Además, existen otro tipo de variables:
- Variables categóricas: son aquellas cuyas categorías puedan asumir una
cantidad finita de posibilidades (puede ser solo algunas posibilidades)
nominales, ordinales y algunas intervalares.
- Variables continuas: son aquellas que pueden tener cantidades infinitas de
categorías (siempre son numéricas e intervalares).
• Por ejemplo: la edad (23 años, 4 meses, 12 días, 8hs, 30 min, 5 segs…)
Categorías: son los distintos estados que puede asumir la propiedad de un
concepto (variable).
Deben respetar 3 principios:
Mismo criterio: Todas las categorías deben responder con el mismo criterio.
o Por ejemplo Muy justo, justo, poco justo, nada justo.
Mutua exclusión: Cada objeto sólo deberá estar en 1 categoría.
Exhaustividad: Todos los objetos deben poder ser incluidos en alguna
categoría.
La autonomía semántica es la última cuestión a tener en cuenta para categorizar
una propiedad. Es la definición automática de la categoría. Si usamos valores en
números como categorías, es importante aclarar si son cantidad de habitantes,
cantidad de elementos, etc.
o Por ejemplo, si la variable es tipo de gobierno, las categorías
“presidencial”, “semipresidencial” y “parlamentario” cuentan con plena autonomía
semántica y no hace falta acudir a una aclaración.
Tipos de categorías:
Nominales: no se detalla ningún orden o gradación
o Por ejemplo: Tipo de gobierno.
Ordinales: se ordenan por rangos, pero no es posible saber la distancia exacta
entre una unidad colocada en una categoría y otra dispuesta en la categoría
siguiente-
o Por ejemplo: Muy de acuerdo, de acuerdo, ni de acuerdo ni en desacuerdo, en
desacuerdo, muy en desacuerdo.
Intervalares: Permite conocer la distancia exacta entre las categorías y hacer
operaciones matemáticas. Suele tratarse de categorías numéricas.
o Por ejemplo: Porcentaje de proyectos votados con disciplina partidaria (todos
los % posibles).
Índice: es una herramienta que nos permite combinar distintos indicadores.
Indicador: es una variable; un aspecto de la unidad de análisis que quiero
conocer y quiero asumir sus estados (en el libro se lo denomina “propiedades”)
pero hay que decir variable! Es aquello que me permite construir información
empírica (de forma directa y confiable, es decir, no requiero otro indicador
para explicarlo).
o Un ejemplo de creación de indicadores: Variable Pobreza (ausencia de
condiciones mínimas para poder desarrollarse y poder vivir). Tiene una
definición operativa directo, pero no es confiable (no sé qué concepto tiene
cada uno sobre la pobreza). Es por esto, que siempre se mide a través de
indicadores:
Dos dimensiones: Coyuntural/Estructural.
Indicador: Ingresos. Categorías: Cubre la canasta básica total, cubre
parcialmente la canasta básica total, no cubre la canasta básica tota.
Canasta básica universal
o Encuesta de consumos
o Encuesta permanente de hogares (se le pregunta a cada hogar encuestado,
cuántas personas viven y de qué edad, y cuantos son los ingresos del hogar).
o Unidades de referencia kilocalóricas (tabla de cantidad de calorías según su
edad y su género, necesita para subsistir).
o Índice de Precio al consumidor (IPC) variación de precio.
Se suman todos estos índices y se transmiten a pesos. Se calcula la cantidad de
integrantes, las edades y sus las calorías requeridas, y se suma el índice de
precios al consumidor, lo cual determina un monto total en pesos de la Canasta.
Si los ingresos de la familia no alcanzan a cubrir el valor de la canasta básica
universal se consideran indigentes.
Luego se suma el resultado de cada familia y luego, se divide por todas las
familias encuestadas. Allí se determinan los pobres e indigentes.
Con la inflación mensual, aumenta el Índice de Precio al Consumidor. Si esa
familia no incrementa sus ingresos, podrá pasar a ser indigente.
Segundo indicador: Necesidades básicas Insatisfechas (NBI). Es un indicador que
contiene 5 indicadores.
o Hacinamiento (cuantas personas viven y cuantas habitaciones tiene la casa,
además de la cocina y el baño). Si hay más de 3 personas por ambiente, se
considera que esa persona durmió hacinada.
o Tipo de vivienda (Categorías: Vivienda en barrio de emergencia?)
o Sistema de eliminación de excrementos
o Si hay algún niño/niña de 6 años que no ocurre a la escuela (Si/No).
o Capacidad económica (Si hay al menos 4 personas adultas en el hogar que no
tengan trabajo).
Si cualquiera de estos indicadores da de manera positiva, se considera que ese
hogar se considera NBI (es decir, no se cumplen las necesidades básicas).
Ejemplo de elección de indicadores:
Variable: Estatus socioeconómico (no se puede preguntar directamente a una
persona de la calle cuál es su estatus socioeconómico porque muchos no
entenderían la pregunta, y otros le darían significados muy diferentes de los
que se le dan en sociología.
1) Aspectos relativos a la educación:
a. Título de estudio del sujeto,
b. Título de estudio del padre del sujeto,
c. Título de estudio de la madre del sujeto.
2) Aspectos relativos a la ocupación:
a. Ocupación principal del sujeto o última ocupación del sujeto desempleado o
jubilado,
b. Ocupación principal del jefe o jefa de la familia.
3) Aspectos económicos:
a. Ingreso anual medio del sujeto en los últimos 5 años,
b. Ingreso anual medio de su familia en los últimos 5 años/número de individuos
convivientes,
c. Metros cuadraros de espacio habitable a disposición de la familia / número de
individuos convivientes,
d. Tipo al cual pertenece la viviendo principal de la familia.
4) Bienes duraderos poseídos por la familia:
a. Número de coches poseídos por la familia / número de adultos convivientes,
b. Número de equipos de TV / número de adultos convivientes,
c. Costo del coche más caro poseído por la familia.
5) Costumbres del tiempo libre:
a. Gasto mensual medio (en el último año) para comidas de la familia en
restaurantes / número de adultos convivientes,
b. Gasto medio anual en vacaciones de miembros de la familia / número de adultos
convivientes.
El dividir una cifra por una base relevante para neutralizar aspectos de un
fenómeno que no interesan se llama NORMALIZACIÓN y se aplica habitualmente solo
en la creación de indicadores, sino en el análisis estadístico de los datos.
Ejemplo: dividir la cantidad de coches que tiene una familia por la cantidad de
adultos mayores de edad de esa familia.
Para variables de nivel de dinamismo económicos-demográficos:
Para los aspectos económicos en general se podrían elegir indicadores como:
La variación en el ingreso per cápita,
La variación en los depósitos bancarios per cápita,
La variación en el gasto en obras públicas.
Para los aspectos relativos a empresas se podrían elegir indicadores como:
El saldo demográfico de las empresas (total de nuevas empresas menos total de
empresas quebradas) en el intervalo considerado,
La variación del monto anual de inversiones per cápita,
La variación en la proporción de suelo ocupado por establecimientos
industriales y comerciales.
Para los aspectos relativos a la ocupación se podrían elegir indicadores como:
La variación en la tasa de empleados sobre la población en edad laborable,
La variación en la cuota de empleados procedentes de otras provincias o
Estados.
Para los aspectos demográficos se podrían elegir indicadores como:
El saldo demográfico natural (total de nacidos menos total de fallecidos) en
el intervalo considerado,
El saldo demográfico debido a transferencias de otras provincias o Estados
menos transferencias a otras provincias o Estados.
UCA: Observatorio de la deuda social Argentina fuente de datos de medición de
la pobreza.
Relación de indicación: Es la relación semántica, entre el indicador y el
concepto principal, y debe ser cercana.
En determinado contexto de Investigación, a algunas variables el investigador le
puede asignar el rol de indicador. Es importante identificar en qué contexto.
Los indicadores son construidos por ende por el investigador.
Los indicadores son necesarios cuando el contexto es muy abstracto (es algo
arbitrario). Por ello, en la materia vamos a establecer indicadores cuando
tenemos una dificultad con la definición operativa.
Todas las variables, además de las categorías, tienen una definición operativa.
Definición operativa: Debe ser directa y confiable, sino me veo obligado a
construir indicadores. Es el conjunto de procedimientos y reglas que tengo que
llevar adelante para poder construir la información empírica con esa variable
(por ejemplo detallar la fuente: Informe de PBI per cápita CEPAL 2023).
Me veo obligado a construir indicadores cuando la definición operativa:
No es directa (cuando trabajo con unidades de análisis colectivas no les
puedo preguntar, y no tengo una fuente confiable a la cual recurrir).
No es confiable (cuando trabajo con unidades de análisis individuales no son
confiables)
Casos en los cuales tengo una definición operativa directa pero no es confiable:
Tengo respuestas socialmente esperables (por ejemplo temas relacionados
discriminación)
Cuando estoy trabajando con algún concepto que es familiar al investigador,
pero ajeno a las unidades de análisis (por ejemplo alienación en el trabajo).
¿Qué entiende cada persona de la palabra “Alienación”?
Cuando trabajo con situaciones controversiales con la moral dominante (por
ejemplos encuestas sobre prácticas de aborto) forma de preguntas mediante
indicador: Ustedes conoce alguna persona que se haya realizado un aborto?
EJEMPLO 1:
Variable: Desarrollo económico en América Latina.
Categorías: bajo, medio bajo, medio y alto (Como no puedo preguntarles a los
países y no coincido/confío con ninguna fuente, construyo indicadores).
Indicadores: Deben ser categorías directas y confiables, y tener una relación
semántica cercana con mi concepto principal... ósea debe indicarme algo del
desarrollo económico.
PBI/PC: también tiene categorías. Por ejemplo, de 0 a 1000 = bajo; 10001 a
2000 =medio bajo; 20001 a 3000 = medio; 30001 a 4000 =alto. Por ende, suponemos
que a mayor PBI per cápita, el desarrollo económico se inclina a la categoría
alto).
EJEMPLO 2:
Variable: Polarización ideológica
Indicador: Hay personas que dicen que el Estado debe intervenir en la economía,
y hay otras que dicen que no debe intervenir. Siendo 1 nada y 10 mucho, que cree
ustedes que el Estado deba intervenir en la Economía? En base al resultado, el
investigador ubica en las categorías “Izquierda”, “Centro” o “Derecha”.
Diseño de investigación: es la planificación de las tareas a realizar fijando
las estrategias metodológicas que configuran “un particular modo de transitar el
proceso de investigación”. Se toma la decisión de cómo avanzar con la
investigación.
En un primer lugar, es posible determinar dos tipos de diseños de investigación.
Diseños cualitativos (exploración de la realidad con una orientación
ideográfica, es decir, sin intenciones de generalizar y extrapolar los
resultados a un universo más amplio). El objetivo es comprender las motivaciones
de los actores para realizar las acciones sociales investigadas.
Diseños cuantitativos (trabajo con gran cantidad de casos). El objetivo es
obtener generalizaciones que prediquen sobre los objetos de análisis.
Elección de los casos: Una de las primeras tareas de los investigadores es
escoger en qué unidades de análisis se rastreará la evidencia empírica.
Si el objeto de estudio es uno o unos pocos, se puede analizarlos a todos. En
otros casos, se deberán escoger muestras.
Marco muestral: Es un marco de referencia que nos permite identificar los
elementos de la población, así como la posibilidad de enumerarlos y seleccionar
los elementos muestrales.
Muestras cuantitativas:
Cuando se trabaja con un gran número de unidades de análisis, se utilizan
técnicas de estadísticas de muestreo, definiendo una muestra para luego
generalizar los resultados al conjunto del universo.
Las muestras en las que se trabaja con grandes números (más de 100 casos) se
dividen en dos grandes categorías:
Probabilísticas: partiendo de las teorías de la probabilidad, cada elemento
del universo tiene una posibilidad, conocida y distinta de cero, de formar parte
de la muestra. Para ello, se respeta la aleatoriedad en todo el proceso de
selección de los casos, y como resultado se puede conocer el error muestral o
margen de error. (TIP: Siempre que sea posible, se recomienda utilizar una
muestra probabilística tanto por la medición del error de estimación como por la
elección puntual de cada unidad de análisis de la muestra).
¿Cómo se lleva a cabo el procedimiento de selección de la muestra
probabilística?
Tómbola procedimiento muy simple pero no muy rápido. Consiste en numerar
todos los elementos muestrales del 1 al número n. Hay fichas o papeles, uno por
cada elemento. Revolverlos en una caja e ir sacando n número de fichas, según el
tamaño de la muestra. Los números elegidos al azar conformarán la muestra.
o Ejemplo: Tenemos una población N=53 empresas extractivas y siderúrgicas, se
necesita una muestra n=13 directivos generales de tales empresas. En una lista
se numeran cada una de las empresas. En fichas aparte se sortea cada uno de los
53 números, hasta obtener los 13 necesarios (pueden ser las 13 primeras fichas
que se extraigan). Los números obtenidos se verifican con los nombres y
direcciones de nuestra lista, para precisar los que serán participantes del
estudio.
Números random o al azar utilización de una tabla de números que implica un
mecanismo de probabilidad muy bien diseñado (no significa la selección azarosa
de números). Los números random fueron generados con una ruleta electrónica, y
existe una tabla de un millón de dígitos, cuyas partes se encuentran en los
apéndices de muchos libros de estadística.
Margen de error estándar: menor de 0.01. (es decir que, de 100 casos, 99 veces
mi predicción sea correcta).
Las muestras probabilísticas requieren dos procedimientos básicos:
1) La determinación del tamaño de la muestra y,
2) La selección aleatoria de los elementos muestrales.
o Muestreo aleatorio simple: Si se tiene un listado de todas las unidades de
análisis del universo, se las numerará y se sortearán unidades tanta cantidad de
veces como casos tendrá la muestra.
Ejemplo: Muestreo al azar por marcado telefónico
o Muestreo aleatorio sistemático: Se obtienen los casos a relevar mediante el
coeficiente de elevación N/n, donde N constituye el número de unidades del
universo y n el total de elementos de la muestra. Se comienza por elegir al azar
un número menor al coeficiente de elevación para que oficie de punto de partida,
y luego se le suma sucesivamente el coeficiente, de modo de ir obteniendo todos
los elementos que formarán parte de la muestra. (TIP: Al usar esta muestra se
debe desordenar el listado antes de numerarlo, para evitar posibles sesgos).
o Muestreo aleatorio estratificado: Subgrupo en el que la población se divide en
segmentos y se selecciona una muestra para cada segmento. Cada estrato es un
conjunto de unidades homogéneo a su interior y heterogéneo respecto del resto,
cuya existencia permite tratarlos diferenciadamente tanto en el mecanismo de
selección de las unidades últimas de muestreo como en el número de unidades,
escogiendo menos estratos más homogéneos. (TIP: Para llevar a cabo un muestreo
de este tipo se deben elegir los criterios de estratificación entre las
propiedades de las que se conoce su distribución del universo, que se denominan
parámetros).
o Muestra por racimos, conglomerados o cluster: Subgrupo en el que las unidades
de análisis se encuentran encapsuladas en determinados lugares físicos. Implica
diferenciar entre la unidad de análisis y la unidad muestral. (Se reducen los
costos, tiempo y energía, al considerar que muchas veces las unidades de
análisis se encuentran encapsuladas o encerradas en determinados lugares físicos
o geográficos).
TIP (Comparación entre el muestreo aleatorio estratificado y el muestreo por
racimos, conglomerados o cluster): Los dos segmentan a la población, los
estratificados tienen la característica de que son homogéneos al interior
(comparten características todas las unidades que componen ese estrato) y
heterogéneos en su exterior. Por ejemplo, en estudiantes universitarios. Cada
facultad puede ser un estrato (tienen características e interés diferentes entre
las facultas pero las mismas dentro de cada universidad). Lo que seleccionamos
en el estratificado son unidades.
Con relación a los conglomerados, investigamos conglomerados (cada conglomera es
heterogéneo al interior – cada conglomerado contiene la diversidad de factores
que uno podría encontrarse, y homogéneos entre sí). Se supone que cada
conglomerado es similar. Por ejemplo, puede elegir un conglomerado u otro, si
total a su interior se supone que son similares. Seleccionas aleatoriamente los
conglomerados. Los alistas, se pueden censar todas las unidades de análisis o un
muestreo en dos etapas, haciendo un marco muestral y ahí comenzar con un
muestreo aleatorio simple (u otro!).
Paso a paso para el muestreo por conglomerados (Ejemplo municipios):
1) Tomo 70 municipios,
2) Los enlisto,
3) Selecciono al azar una x cantidad de municipios,
4) A partir de acá, comienza la segunda etapa del análisis
a. En caso de no tener el listado de cada unidad de análisis puedo realizar
cuotas.
b. En caso de tener la información de cada una de las unidades de análisis
dentro de cada municipio, puedo avanzar con un muestreo aleatorio simple.
No probabilísticas o dirigidas: Subgrupo de la población en la que la elección
de los elementos no depende de la probabilidad sino de las características de la
investigación. No se respeta el principio de aleatoriedad en la selección de los
casos, por lo tanto, no es posible luego aplicar el principio de la
representatividad. Sin embargo, lo positivo de esta muestra es que realiza una
cuidadosa y controlada elección de sujetos con ciertas características
específicas.
o Muestra por cuotas: se reproducen las distribuciones de algunos parámetros del
universo (Por ejemplo: si el universo cuenta con un 60% de hombres y 40% de
mujeres, en la muestra se buscará la misma proporción por género). TIP
Importante: Este tipo de muestreo al no basarse en los principios de la
aleatoriedad puede tener errores de estimación, ya que se trabaja a ciegas.
Muestras cualitativas:
Se busca seleccionar en el momento del diseño algunos contextos y fechas
relevantes para la investigación, pero sabiendo que en el transcurso de esta se
irán descubriendo nuevos contextos, y en ellos, sujetos que harán las veces de
informantes. Por ende, parte del objeto de estudio se desconoce.
o Muestra según propósitos o selección basada en criterios: se buscan
intencionadamente escenarios, personas o eventos particulares en función de la
información que se cree que pueden ofrecer. Los criterios varían incluso dentro
de un mismo trabajo de campo, siendo la tipicidad o la heterogeneidad uno de los
más utilizados.
o Muestreo teórico: la selección se realiza únicamente teniendo en cuenta la
contribución que se pueda hacer a la teoría que se está construyendo en el
proceso de investigación.
Estrategias muy utilizadas: Bola de nieve y saturación teórica.
Recolección de datos:
Datos primarios: son datos que genera el mismo investigador.
Datos secundarios: se obtienen de otros estudios o instituciones públicas o
privadas.
Tipos de encuestas:
“Cara a cara”: se caracterizan porque la entrevista reúne al entrevistado y al
entrevistador en un mismo tiempo y espacio.
Telefónicas: hay coincidencia temporal pero no espacial.
Por correo: se acentúa la distancia entre el entrevistado y el entrevistador,
no habiendo concurrencia ni en el momento ni en el lugar.
El cuestionario es el instrumento de recolección de datos de las encuestas. Un
cuestionario es un conjunto de preguntas fijas estructuradas intencionalmente
para extraer información que interesa de cierto tipo de unidades de análisis,
acompañadas de categorías de respuestas, instrucciones y aclaraciones dirigidas
al entrevistador o al entrevistado, y espacio para la codificación de las
respuestas.
El cuestionario se irá estructurando de acuerdo con las definiciones operativas
e indicadores con los que cuente. Cada definición operativa o indicador puede
requerir la formulación de una o varias preguntas.
1. Introducción: Párrafo breve que presenta el estudio. Objetivo: que las
personas accedan a responder la encuesta. En entrevistas cara a cara o
telefónicas, la realiza el mismo entrevistador. Aquí se indica la duración
aproximada de la encuesta.
2. Cuerpo/estructura:
- Fluidez
- Orden: Puede haber preguntas que influyan otras preguntas. Deben ir al final.
- Longitud: Debe ser lo más corto posible.
- Implementación: puede ser por encuestadores, IVR o CATI.
3. Clasificación: Es con fines teóricos y prácticos, ya que también define como
se hará la redacción y el tipo de información que se recibirá al final del
estudio.
-Según su función: Filtro, De pase, Observación y Clasificación.
- Según su estructura: Abiertas, Cerradas, Dicotómicas, Alternativas múltiples,
Respuesta simple, Respuesta Múltiple.
- Según su procedimiento: Espontánea, Guiada
- Según lo que pretende medir: Factual, Actitudinal, Evaluativa, De opinión,
Ranking.
Existen diferentes clases de preguntas que permiten obtener distinto tipo de
información:
Preguntas abiertas: se caracterizan por no poseer categorías entre las cuales
el encuestado tiene que optar, pudiendo explayarse libremente. Esto hace más
rica la respuesta, pero se corre el riesgo de perder el eje del tema.
Preguntas cerradas:
o Cerradas simples: se caracterizan por tener dos o tres categorías nominales.
o Cerradas de alternativas múltiples: se solicita al entrevistado que elija solo
1 respuesta entre más de 3 opciones posibles
o Cerradas de respuestas múltiples: el encuestado elige más de una opción entre
las distintas categorías.
o Cerradas con escala: poseen categorías ordenadas que pueden ser palabras o
números
o Cerradas con frases: permiten abordar temas espinosos sin requerir una opinión
directa del entrevistado.
Diseños Experimentales
Existen métodos y técnicas. Los diseños experimentales pertenecen a los métodos
de Investigación. Los métodos son pasos o procedimientos para responder nuestros
objetivos de investigación. Esos métodos se alinean desde sus sustentos teóricos
y epistemológicos con ciertas metodologías. La metodología usada acá es
cualitativa.
Los instrumentos son las herramientas que usan los diferentes métodos para
relevar la información. Dentro de la metodología cuanto podemos pensar la
encuesta, método experimental o el uso de datos secundarios. Pensamos los
experimentos como un “método”.
Los diseños experimentas son prácticamente los únicos que nos permiten generar
relaciones causales (causa-efecto). Los otros diseños de investigación
cuantitativos, no nos permiten hablar de causalidad ya que no hay una medición.
Que es un experimento?
Construcción del conocimiento, mediante las adaptaciones de otras disciplinas.
Hay un investigador que selecciona, o elige ciertas variables que va a manipular
en un entorno controlado (que podría ser en un laboratorio), donde aparece un
estímulo-respuesta, y eso, lo hacemos para probar una hipótesis.
Una hipótesis es la relacionen entre dos o más variables. Una variable
dependiente, y la otra es independiente. Una variable genera una modificación
sobre la otra variable.
Tomar un sujeto y ver cuál es el comportamiento de ese sujeto si antes a ese
sujeto le dimos un estímulo. Le damos 100 pesos antes de entrar y le ofrecemos
comprar caramelos. Luego con otro sujeto realizamos el mismo experimento sin
darle el estímulo (los 100 pesos) y analizamos cuantos caramelos compra.
Debido a que a la misma persona no se le puede simular ambas situaciones, es que
trabajamos con dos grupos. Cada grupo va a estar compuesto por personas que van
a compartir mismos factores o características. A un grupo se le va a aplicar el
estímulo, y al otro no. Al que si se le aplica, lo llamamos “grupo de
tratamiento”. Al grupo que no le asignamos un estímulo, lo denominamos “grupo de
control”. El estímulo es la variable independiente, y se utiliza para poder
adjudicarle al estímulo la causalidad de obediencia de uno de los dos grupos. El
estímulo puede ser positivo o negativo, en caso de hacer efecto o no.
Como vamos a medir esa homogeneidad entre ambos grupos? Se hace de forma
estadística, tratando de asegurarnos que todos tengan en promedio las mismas
características.
Características principales de los diseños experimentales:
Trabajamos a partir de 2 grupos (experimental/tratamiento o de
control/comprobación)
Hay un estímulo (variable independiente que busca modificar el valor en la
variable dependiente)
La asignación aleatoria (para evitar sesgos) de las unidades a cada uno de los
grupos (debería poder definir de manera aleatoria que unidad va a cada uno de
los grupos sin que afecte el experimento, por eso es importante la homogeneidad
de las unidades de análisis)
Una mitad va a ser asignada aleatoriamente al grupo de tratamiento (grupo al
cual se le aplica el estímulo), y la otra mitad es asignada al grupo de control
(no tiene estímulo).
TIP: Es la mayoría de los experimentos es muy difícil que la selección inicial
sea aleatoria (ya que las personas deben inscribirse a acceder a ser analizado,
por ende no son seleccionadas de forma aleatoria). Sin embargo, una vez tenidas
todas las personas, se las enlista y divide en dos grupos de forma aleatoria.
Momento 1: Aparece el estímulo o el placebo
Momento 2: Volvemos a replicar esa medición original pero esperamos ver las
diferencias entre el grupo de control y el grupo de tratamiento. El objetivo es
poder explicar que esas diferencias obtenidas son causales del estímulo.
Validez interna: Significa que el impacto estimado del programa es el impacto
libre de todos los demás factores de confusión potenciales.
Validez externa: Quiere decir que la muestra de la evaluación representa con
precisión a la población de unidades elegibles. Los resultados de la evaluación
se pueden entonces generalizar a la población de unidades elegibles.
Tipos de diseños experimentales o experimentos:
Experimentos puros
o Experimentos de laboratorio:
Ámbito: espacios creados y controlados por el investigador. Hay un fuerte
control del ambiente. Entorno y variables controladas.
Estímulo: fuertemente controlado por el investigador.
Validez interna/externa: Hay un alto grado de control (validez interna). Pero
hay un bajo grado de validez externa.
Resumen: Los sujetos son reclutados en un lugar específico (ajeno y externo)
donde se realiza el experimento y el investigador controla casi todos los
aspectos del entorno. Las personas son reclutadas y forman parte de un estudio.
Esas personas se van a dividir en 2 grupos. Algunas recibirán el tratamiento,
otros no.
Ventaja: Son estos los experimentos en Ciencias Sociales donde contamos con un
mayor nivel de control sobre el proceso de producción de la información (permite
dejar constantes las demás variables que pueden afectar un resultado y aislar el
efecto de la variable de interés).
Desventaja: Son experimentos demasiado artificiales, ficticios (y puede
suceder que los actores actúes de manera distinta frente a un escenario
hipotético en un laboratorio que frente a un escenario real fuera de este).
o Experimentos de campo:
Ambiente: no se controla. Se da en el mundo real.
Estímulo: no siempre podemos controlar la aleatoriedad de quienes reciben el
estímulo y quienes no.
Validez interna/externa: La validez interna es menor, se pierde la asignación
del estímulo, pero puede que su validez sea mejor, ya que es más natural el
ambiente en el que se da. Además, si hay aleatoriedad en la elección de los
casos, mejor.
Resumen: Son aquellos experimentos que tiene lugar en un entorno natural,
donde, más allá de la intervención puntual, tenemos un control limitado del
entorno.
Cuatro cuestiones básicas a tener en cuenta:
2) Los participantes se encuentran a un problema real.
3) El diseño debe ser lo suficientemente limpio y claro para poder sacar
conclusiones útiles
4) Se deben evitar efectos no controlados en la medida de lo posible,
5) Especialmente en aquellos de carácter económico, se deben proporcionar
incentivos apropiados.
Resumen: se desarrollan en un ambiente no controlado, es positivo ya que es el
entorno natural de los sujetos, pero se restringe la posibilidad de analizar las
variables por separado. Se dan en el ambiente habitual donde los sujetos
transcurren sus vidas. Perdés la posibilidad de determinar si el estímulo
utilizado es el único que afecta (no hay una exclusiva causalidad).
o Experimentos de encuesta:
Ambiente: se da a través de un muestreo/cuestionario en un ámbito controlado y
ficticio.
Estímulo: el propio estímulo está dentro del diseño de la encuesta.
Validez interna/externa: tienen un alto grado de validez interna (diseño muy
cuidadoso de las variables y los estímulos), y podría tener una validez externa
alta si se garantiza una selección aleatoria.
Resumen: se desarrolla un formulario, y al grupo de tratamiento se le agrega
un estímulo. Puede ser una pregunta adicional, un distinto orden de las
preguntas, etc. Se direccionan ciertas preguntas para intentar generar una
orientación. Luego se analiza si causan o no el efecto esperado. La ventaja de
la encuesta es que es más fácil de llegar a un muestreo probabilístico en ambas
etapas, eso le da una muestra de validez externa. La encuesta en sí es un
instrumento artificial (no es lo mismo que ir a un laboratorio, pero tampoco
suelen ser preguntas que mantengan al usuario en su total zona de confort). Es
un punto medio entre el experimento de campo y el de laboratorio. Hay un alto
grado de control de las variables.
Cuasi experimentales
o Se utilizan datos de carácter observacional, es decir, aquellos en cuya
producción no interviene quien investiga.
o Ejemplo: un terremoto. Puedo analizar un país y una sociedad, y revisar sus
conductas sociales, y luego un país y su sociedad que atravesó un terremoto, y
ver las conductas. Luego puedo compararlas y encontrar diferencias. No es
posible controlar el entorno, ni tampoco las variables. No podemos concluir una
causalidad. Este diseño se caracteriza más con lo observacional, ya que las
variables no se manipulan.
Experimental vs observacional (observa y no manipula).
Medidas de tendencia central y medidas de dispersión
1) Medidas de tendencia central 2) Medidas de dispersión
Escala de medición Moda Mediana Media Rango Varianza Desvío Estándar
Nominal X NO NO NO NO NO
Ordinal X X NO NO NO NO
Intervalar X X X x X X
1) Medidas de tendencia central:
Moda: La categoría que más veces aparece (=MODA).
Mediana: Divide la muestra en dos (=MEDIANA).
- Ordenar los números de mayor a menor.
- Dividirlos a la mitad.
- El número que cae al medio es la mediana.
- Si el total es par, se suman los dos del medio y se dividen.
Media: Promedio. Sumar el total y dividir por la cantidad de casos (=MEDIA).
2) Medidas de dispersión: Nos permiten analizar qué tan homogénea o heterogénea
es la muestra.
Rango: Diferencia entre el valor más grande y el más chico.
Varianza: Procedimiento: Los valores – la media, elevados al cuadrado y
divididos por el número de la muestra (si hay 4 casos, se divide por ese
número).
Desvío Estándar: Cuanto se alejan en promedio los casos de la media
(=DESVEST.M).
Se puede calcular manualmente: S=raíz cuadrada de S2
i = 1 (i es la cantidad de casos)
Procedimiento para calcular la varianza:
Paso 1: Sacar el promedio
Paso 2: A cada valor restarle el promedio (o la media)
Paso 3: Sumar todos, deben dar 0.
Paso 4: Elevarlos al cuadrado. Todos los valores quedan positivos.
Paso 5: Sumar esos valores (El resultado es la varianza).
Procedimiento para calcular el desvío estándar:
Paso 6: Hacer la raíz cuadrada
Tabla de frecuencia:
Frecuencia absoluta: Cantidad de veces que se repite cada opción.
Ejemplo 1:
Valoración de la situación económica de Argentina Frecuencia absoluta Frecuencia
acumulada Frecuencia Relativa acumulada Frecuencia % Frecuencia acumulada %
Muy buena 4 4 4/1796= 0,00222717 4x100/1797= 0,22% 0,22%
Buena 32 36 (4 + 32) 32/1796 = 0,01781737 32x100/1797= 1,78% 0,22 + 1,78= 2%
Regular 335 371 (32 + 335) 335/1796= 335x100/1797= 18,64% 2 + 18,64= 20,64%
Mala 636 1007 (371 + 636) 636/1796= 636x100/1797=
Muy Mala 789 1796 (1007 + 789) 789/1796= 789x100/1797=
Total 1796 1796/1796 = 1 1796x100/1797= 100,00% 100%
Frecuencia Relativa: La proporción en base a 1.
Frecuencia acumulada relativa: Cada valor divido el total.
Frecuencia % acumulada: Regla de 3 simples.
Tip: Para fijar el valor clic en F4
Para poner filtros: Ctrl + shift + L
Matriz de datos: Estructura que conserva la estructura 3partita del dato. Tres
componentes (variables, unidad de análisis y valores).
En las columnas están las variables, en las filas cada una de las unidades de
análisis, y en las celdas el valor que asume esa unidad de análisis.
Análisis univariado: sistematizamos la información de 1 columna Tabla de
frecuencia (distribución de frecuencia).
Ejemplo 2:
Variable (Edad) Frecuencia Absoluta Media (promedio) Desvío estándar
(cada valor menos el promedio) Valor anterior al cuadrado Valor x Frecuencia
Total – (n-1)
13 1 13x1= 13 -3,2 10,24 10,24
14 3 14x3= 42 -2,2 4,84 14,52
15 4 15x4= 60 -1,2 1,44 5,76
16 9 16x9= 144 -0,2 0,04 0,36
17 7 17x7= 119 0,8 0,64 4,48
18 6 18x6= 108 1,8 3,24 19,44
Total 30 486/30= 16,2 - - 54,8 1,37
Al total del valor por frecuencia lo dividimos por (n-1) que es 29. Da 1,88 y a
eso la raíz cuadrada.
El desvío estándar implica que en promedio, los casos se alejan un 1,37 (años).
El desvío siempre es la misma unidad de la que se está midiendo.
Ejemplo 3: Variable: ¿Cómo cree que estará su situación económica personal en
los próximos meses?
Variable Frecuencia N = 1685
Mejor 33%
Igual 19%
Peor 45%
Ns/Nc 3%
Total 100%
Análisis Bivariado: sistematizamos la información de 2 columnas Tabla de
frecuencia (distribución de frecuencia). Se utiliza para analizar como una
variable se comporta con respecto a otra (variable dependiente y variable
independiente).
Si No
Si
No
Las tablas bivariadas o cuadros de contingencia, es el cruce de estas dos
variables.
Ejemplo 4: Hipótesis: La categoría del pasaje influye en la posibilidad de
sobrevivir (al Titanic por ejemplo).
Variable: Posibilidad de sobrevivir al hundimiento según la categoría del
pasaje.
Variable independiente: Categoría del pasaje. Variable dependiente: Si
(sobrevivió) / No
La distribución de frecuencia: El 68% de los pasajeros no sobrevivió, y el 32%
sí lo hizo.
Categoría Primera Clase Primera Clase % Segunda Clase Segunda Clase % Tercera
Clase Tercera Clase % Tripulación Tripulación %
No 122 37,53 167 58,59 528 74,79 673 76, 05
Si 203 62,46 118 41,40 178 25,21 212 23,95
Total 325 100% 285 100% 706 100% 885 100%
Coeficiente de correlación simple:
R de Pearson: Es el coeficiente de correlación más utilizado.
Correlación (lineal): La trayectoria o variación de una variable está vinculada
o no a la trayectoria de otra (esto no quiere decir que esté influyendo en la
otra). Correlación no es causalidad.
Por ejemplo: Educación e ingresos. Son dos variables que habitualmente en las
investigaciones de Cs Política tienen correlación. En general, a mayor nivel
educativo (medido en años de educación), tienen mayores ingresos. Esto no
implica que todas las unidades con mayores estudios tienen mayores ingresos.
Covarianza: Serie de cálculos en base a promedios. Es la relación y movimiento
entre dos variables.
El valor siempre da entre -1 y 1.
Regresión: Los valores extremos tienden a volver a la media (al promedio).
Por ejemplo: En los casos extremos (personas muy altas o muy bajas por ejemplo)
hay una regresión al promedio, es decir que sus hijos sean más bajos.
La regresión es una herramienta estadística más utilizada en las Ciencias
Sociales, la cual me permite:
1) Estimar que va a suceder con una variable en el futuro, a partir del vínculo
que tiene esa variable con otras variables en el pasado.
2) Observar que variable pesa más en el efecto de mi variable dependiente.
(Tengo una serie de variables independientes, y una dependiente. La regresión me
dice cuanto pesa cada una de esas variables independientes sobre el resultado de
mi variable dependiente).
3) Estimar cuanto se modifica en promedio la variable dependiente para cada
unidad de cambio de cada variable independiente, manteniendo constantes las
otras variables independientes.
Por ejemplo: Si quiere conocer el peso de un individuo (Juan), puedo arriesgar
que tiene el peso promedio de la población. Es difícil acertar. Para ello,
podemos encontrar otra variable (en este caso la altura) la cuál debe estar
relacionada con la primera variable.
Si conozco cuanto mide Juan y también cuál es el peso promedio para cada nivel
de altura, la posibilidad de acertar es mayor que conociendo sólo la media
general, siempre y cuando exista una relación lineal entre ambas variables.
Cuanto más correlacionadas estén las variables, más se reducirá el error de
estimación.
En conclusión, lo que hace la regresión es analizar la correlación con otras
variables para encontrar un incógnito. A este ejemplo podemos sumarle más
variables tales como la edad y el género. De esta forma es posible obtener
poblaciones más chicas, y así aumentar las posibilidades de estimación.
Ecuación: Y = 2X
X Y
1 2
2 4
3 6
4 8
5 10
6 12
7 14
Para calcular cuánto daría 7, debemos usar la siguiente ecuación (Y = 2X).
Constante u ordenada de origen: Es el valor que asume la variable dependiente
cuando mi variable independiente es igual a 0. Es de donde parte la recta de
regresión. Para ello se utiliza la siguiente ecuación (Y=2+2X).
El 2 es la constante.
X Y
1 4
2 6
3 8
4 10
5 12
Ecuación de regresión:
Regresión múltiple:
Y = a +b1X1i + b2X2i + b3X3i + …. ei
b = es cuanto cambia la variable dependiente a partir del cambio de una unidad
en la variable independiente.
La Y es la variable dependiente. La X es la variable independiente.
La constante el valor que tiene la variable dependiente, cuando las
independientes son cero. La constante se suele encontrar con la letra “a”. El
efecto que tiene cada variable independiente en la variación de mi variable
dependiente.
ei = Error aleatorio (es algo que el modelo no puede estimar).
Ejemplo de regresión múltiple
Variable dependiente: Ingresos
Variable independiente: Edad, Educación y Status ocupacional.
Para validar la correlación entre las variables:
- Hipótesis nula. Con que valor se rechaza? Tener en cuenta valor P.
- Resultados significativos: tienen que ser inferiores al 0,05. En tal caso, no
estoy seguro de que esa variable sea significativa. De no ser significativa
estadísticamente la debo sacar del modelo.
- T: Coeficiente estandarizado, sobre el coeficiente no estandarizado debe dar
más de 1,96. Sino, al igual que en el caso anterior, debe ser retirado del
modelo. En este caso, la edad no cumple con la “t” mínima.
LAS VARIABLES INDEPENDIENTES (VI)) SON AQUELLAS QUE SE PRESUPONE ACTÚAN COMO UN
FACTOR CAUSAL DE LA RELACIÓN ESTABLECIDA.
LAS VARIABLES DEPENDIENTES (VD) EN CAMBIO, SON MODIFICADAS A RAÍZ DE LOS CAMBIOS
EN LAS VARIABLES INDEPENDIENTES, Y GENERALMENTE SON LAS QUE INTERESA ESTUDIAR.
Coeficientes de asociación - Etapas de la investigación
1) Proyecto
2) Recolección de datos
3) Procesamiento
4) Análisis de datos
Análisis de una tabla: Hay básicamente dos modos de abordar el análisis de una
tabla.
- Asimétricamente: El interés está puesto en observar el efecto de una de las
variables sobre la otra El caso asimétrico se plantea siempre que se elige
considerar que una variable –la variable independiente- incide sobre la
distribución de la otra- la variable dependiente. Hay tablas en las que
cualquiera de las dos variables puede funcionar como “causa” de la otra. Aunque
también suele imponer que se imponga, por así decirlo, el análisis en una
determinada dirección.
- Simétricamente: No se presupone que una variable sea la “causa” de la otra
No es apto para examinar la existencia de una relación de dependencia entre las
dos variables; optamos por este tipo de análisis cuando no interesa indagar
acerca del presunto “efecto” de una variable.
Existen dos tipos de coeficientes:
1) Coeficiente de asociación: Es una formula construida de una manera tal que,
al aplicarla arroja un valor único que puede ser interpretado como una medida
del grado en que dos variables se encuentran relacionadas. Estadísticamente, se
pretende en general que un coeficiente de asociación está construido de tal modo
que produzca siempre un valor comprendido entre 1 y 0. esto facilitará
considerablemente
• ¿Qué miden? Es un número que nos expresa en qué medida dos o más hechos están
relacionados, hasta qué punto las variaciones de uno concuerdan con las
variaciones del otro.
• ¿Qué es lo que buscamos comprobar a través de los coeficientes de asociación?
Estamos inquiriendo si la relación entre variables es estadísticamente
significativamente.
2) Coeficiente de correlación: El análisis de correlación consiste en un
procedimiento estadístico para determinar si dos variables (numéricas) están
relacionadas o no. El resultado del análisis es un coeficiente de correlación
que puede tomar valores entre -1 y +1.
• El signo nos indica la dirección de la relación, como hemos visto en el
diagrama de dispersión.
• Un valor positivo indica una relación directa o positiva, es decir, cuando la
magnitud de una incrementa, la otra también).
• Un valor negativo indica relación indirecta, inversa entre las dos variables
(mientras los valores de una incrementan, los de la segunda variable disminuyen.
Si dos variables son independientes).
• Un valor nulo indica que no existe una tendencia entre ambas variables (puede
ocurrir que no exista relación o que la relación sea más compleja que una
tendencia, por ejemplo, una relación en forma de U).
¿Cómo interpretar el valor de un coeficiente?
- 1 o -1 = asociación perfecta
- superior a 0.80 = muy fuerte
- entre 0.60 y 0.80 = fuerte
- entre 0.40 y 0.60 = moderada
- entre 0.20 y 0.40 = débil
- menos de 0.20 = puede que no exista asociación sino que se deba al azar
¿Cómo se mide la correlación?
Coeficiente de correlación lineal de Pearson: sirve para cuantificar tendencias
lineales, y el coeficiente de correlación de Spearman que se utiliza para
tendencias de aumento o disminución, no necesariamente lineales pero sí
monótonas (las variables tienden a moverse en la misma dirección relativa, pero
no necesariamente a un ritmo constante.
El coeficiente de correlación de Pearson cuando se aplica a una población se
representa por la letra griega (rho) y se refiere a ella coeficiente de
correlación poblacional o el coeficiente de correlación poblacional de Pearson.