Resumen de Toda la Materia | Metodología de la Investigación en Ciencias Sociales II (Rotman - 2024) | Cs. Sociales

Para llevar a cabo una investigación, el primer paso es elegir un 1) tema de investigación (seleccionar una cuestión que se considere relevante para ser indagada, pero generalmente demasiado amplia como para ser examinada directamente). Este primer paso es subjetivo, y depende del investigador a cargo.
En segundo lugar, hay que extraer un 2) problema de investigación. La formulación del problema de investigación implica la enunciación de una o varias preguntas sobre qué es lo que se quiere saber y acerca de quién; explicita algo de alguien que se quiere conocer, y el cuándo y dónde de este interrogante.
- Puntualizar el quién es especificar las unidades de análisis. Éstas pueden ser individuales (en el caso que se trate de personas) o colectivas (por ejemplo países, partidos políticos).
- El cuándo y dónde se utilizan para realizar un corte temporal y otro espacial.
Población: Es el conjunto de todos los casos que concuerdan con una serie de especificaciones.
Muestra: Subgrupo de la población.
Hipótesis: Relación entre dos o más variables, las cuales deben ser testeables por los métodos de las ciencias sociales.
Simetría: Hay hipótesis en donde no se puede identificar la variable dependiente o la independiente.
Variable: Algo que asume diferentes estados (categorías)  Es un atributo/propiedad de mis objetos de estudio.
- Variables independientes: son aquellas que actúan como factor causal de la relación establecida.
- Variables dependientes: son modificadas a raíz de los cambios en las variables independientes, y generalmente son las que interesa estudiar.
Además, existen otro tipo de variables:
- Variables categóricas: son aquellas cuyas categorías puedan asumir una cantidad finita de posibilidades (puede ser solo algunas posibilidades)  nominales, ordinales y algunas intervalares.
- Variables continuas: son aquellas que pueden tener cantidades infinitas de categorías (siempre son numéricas e intervalares).
• Por ejemplo: la edad (23 años, 4 meses, 12 días, 8hs, 30 min, 5 segs…)
Categorías: son los distintos estados que puede asumir la propiedad de un concepto (variable).
Deben respetar 3 principios:
 Mismo criterio: Todas las categorías deben responder con el mismo criterio.
o Por ejemplo Muy justo, justo, poco justo, nada justo.
 Mutua exclusión: Cada objeto sólo deberá estar en 1 categoría.
 Exhaustividad: Todos los objetos deben poder ser incluidos en alguna categoría.
La autonomía semántica es la última cuestión a tener en cuenta para categorizar una propiedad. Es la definición automática de la categoría. Si usamos valores en números como categorías, es importante aclarar si son cantidad de habitantes, cantidad de elementos, etc.
o Por ejemplo, si la variable es tipo de gobierno, las categorías “presidencial”, “semipresidencial” y “parlamentario” cuentan con plena autonomía semántica y no hace falta acudir a una aclaración.
Tipos de categorías:
 Nominales: no se detalla ningún orden o gradación
o Por ejemplo: Tipo de gobierno.
 Ordinales: se ordenan por rangos, pero no es posible saber la distancia exacta entre una unidad colocada en una categoría y otra dispuesta en la categoría siguiente-
o Por ejemplo: Muy de acuerdo, de acuerdo, ni de acuerdo ni en desacuerdo, en desacuerdo, muy en desacuerdo.
 Intervalares: Permite conocer la distancia exacta entre las categorías y hacer operaciones matemáticas. Suele tratarse de categorías numéricas.
o Por ejemplo: Porcentaje de proyectos votados con disciplina partidaria (todos los % posibles).
Índice: es una herramienta que nos permite combinar distintos indicadores.
Indicador: es una variable; un aspecto de la unidad de análisis que quiero conocer y quiero asumir sus estados (en el libro se lo denomina “propiedades”) pero hay que decir variable! Es aquello que me permite construir información empírica (de forma directa y confiable, es decir, no requiero otro indicador para explicarlo).
o Un ejemplo de creación de indicadores: Variable Pobreza (ausencia de condiciones mínimas para poder desarrollarse y poder vivir). Tiene una definición operativa directo, pero no es confiable (no sé qué concepto tiene cada uno sobre la pobreza). Es por esto, que siempre se mide a través de indicadores:
Dos dimensiones: Coyuntural/Estructural.
Indicador: Ingresos. Categorías: Cubre la canasta básica total, cubre parcialmente la canasta básica total, no cubre la canasta básica tota.
 Canasta básica universal
o Encuesta de consumos
o Encuesta permanente de hogares (se le pregunta a cada hogar encuestado, cuántas personas viven y de qué edad, y cuantos son los ingresos del hogar).
o Unidades de referencia kilocalóricas (tabla de cantidad de calorías según su edad y su género, necesita para subsistir).
o Índice de Precio al consumidor (IPC)  variación de precio.
Se suman todos estos índices y se transmiten a pesos. Se calcula la cantidad de integrantes, las edades y sus las calorías requeridas, y se suma el índice de precios al consumidor, lo cual determina un monto total en pesos de la Canasta. Si los ingresos de la familia no alcanzan a cubrir el valor de la canasta básica universal  se consideran indigentes.
Luego se suma el resultado de cada familia y luego, se divide por todas las familias encuestadas. Allí se determinan los pobres e indigentes.
Con la inflación mensual, aumenta el Índice de Precio al Consumidor. Si esa familia no incrementa sus ingresos, podrá pasar a ser indigente.
Segundo indicador: Necesidades básicas Insatisfechas (NBI). Es un indicador que contiene 5 indicadores.
o Hacinamiento (cuantas personas viven y cuantas habitaciones tiene la casa, además de la cocina y el baño). Si hay más de 3 personas por ambiente, se considera que esa persona durmió hacinada.
o Tipo de vivienda (Categorías: Vivienda en barrio de emergencia?)
o Sistema de eliminación de excrementos
o Si hay algún niño/niña de 6 años que no ocurre a la escuela (Si/No).
o Capacidad económica (Si hay al menos 4 personas adultas en el hogar que no tengan trabajo).
Si cualquiera de estos indicadores da de manera positiva, se considera que ese hogar se considera NBI (es decir, no se cumplen las necesidades básicas).
Ejemplo de elección de indicadores:
Variable: Estatus socioeconómico (no se puede preguntar directamente a una persona de la calle cuál es su estatus socioeconómico porque muchos no entenderían la pregunta, y otros le darían significados muy diferentes de los que se le dan en sociología.
1) Aspectos relativos a la educación:
a. Título de estudio del sujeto,
b. Título de estudio del padre del sujeto,
c. Título de estudio de la madre del sujeto.

2) Aspectos relativos a la ocupación:
a. Ocupación principal del sujeto o última ocupación del sujeto desempleado o jubilado,
b. Ocupación principal del jefe o jefa de la familia.

3) Aspectos económicos:
a. Ingreso anual medio del sujeto en los últimos 5 años,
b. Ingreso anual medio de su familia en los últimos 5 años/número de individuos convivientes,
c. Metros cuadraros de espacio habitable a disposición de la familia / número de individuos convivientes,
d. Tipo al cual pertenece la viviendo principal de la familia.

4) Bienes duraderos poseídos por la familia:
a. Número de coches poseídos por la familia / número de adultos convivientes,
b. Número de equipos de TV / número de adultos convivientes,
c. Costo del coche más caro poseído por la familia.

5) Costumbres del tiempo libre:
a. Gasto mensual medio (en el último año) para comidas de la familia en restaurantes / número de adultos convivientes,
b. Gasto medio anual en vacaciones de miembros de la familia / número de adultos convivientes.
El dividir una cifra por una base relevante para neutralizar aspectos de un fenómeno que no interesan se llama NORMALIZACIÓN y se aplica habitualmente solo en la creación de indicadores, sino en el análisis estadístico de los datos. Ejemplo: dividir la cantidad de coches que tiene una familia por la cantidad de adultos mayores de edad de esa familia.
Para variables de nivel de dinamismo económicos-demográficos:
Para los aspectos económicos en general se podrían elegir indicadores como:
 La variación en el ingreso per cápita,
 La variación en los depósitos bancarios per cápita,
 La variación en el gasto en obras públicas.
Para los aspectos relativos a empresas se podrían elegir indicadores como:
 El saldo demográfico de las empresas (total de nuevas empresas menos total de empresas quebradas) en el intervalo considerado,
 La variación del monto anual de inversiones per cápita,
 La variación en la proporción de suelo ocupado por establecimientos industriales y comerciales.
Para los aspectos relativos a la ocupación se podrían elegir indicadores como:
 La variación en la tasa de empleados sobre la población en edad laborable,
 La variación en la cuota de empleados procedentes de otras provincias o Estados.
Para los aspectos demográficos se podrían elegir indicadores como:
 El saldo demográfico natural (total de nacidos menos total de fallecidos) en el intervalo considerado,
 El saldo demográfico debido a transferencias de otras provincias o Estados menos transferencias a otras provincias o Estados.
UCA: Observatorio de la deuda social Argentina  fuente de datos de medición de la pobreza.
Relación de indicación: Es la relación semántica, entre el indicador y el concepto principal, y debe ser cercana.
En determinado contexto de Investigación, a algunas variables el investigador le puede asignar el rol de indicador. Es importante identificar en qué contexto. Los indicadores son construidos por ende por el investigador.
Los indicadores son necesarios cuando el contexto es muy abstracto (es algo arbitrario). Por ello, en la materia vamos a establecer indicadores cuando tenemos una dificultad con la definición operativa.

Todas las variables, además de las categorías, tienen una definición operativa.
Definición operativa: Debe ser directa y confiable, sino me veo obligado a construir indicadores. Es el conjunto de procedimientos y reglas que tengo que llevar adelante para poder construir la información empírica con esa variable (por ejemplo detallar la fuente: Informe de PBI per cápita CEPAL 2023).
Me veo obligado a construir indicadores cuando la definición operativa:
 No es directa (cuando trabajo con unidades de análisis colectivas  no les puedo preguntar, y no tengo una fuente confiable a la cual recurrir).
 No es confiable (cuando trabajo con unidades de análisis individuales  no son confiables)
Casos en los cuales tengo una definición operativa directa pero no es confiable:
 Tengo respuestas socialmente esperables (por ejemplo temas relacionados discriminación)
 Cuando estoy trabajando con algún concepto que es familiar al investigador, pero ajeno a las unidades de análisis (por ejemplo alienación en el trabajo). ¿Qué entiende cada persona de la palabra “Alienación”?
 Cuando trabajo con situaciones controversiales con la moral dominante (por ejemplos encuestas sobre prácticas de aborto)  forma de preguntas mediante indicador: Ustedes conoce alguna persona que se haya realizado un aborto?
EJEMPLO 1:
Variable: Desarrollo económico en América Latina.
Categorías: bajo, medio bajo, medio y alto (Como no puedo preguntarles a los países y no coincido/confío con ninguna fuente, construyo indicadores).
Indicadores: Deben ser categorías directas y confiables, y tener una relación semántica cercana con mi concepto principal... ósea debe indicarme algo del desarrollo económico.
 PBI/PC: también tiene categorías. Por ejemplo, de 0 a 1000 = bajo; 10001 a 2000 =medio bajo; 20001 a 3000 = medio; 30001 a 4000 =alto. Por ende, suponemos que a mayor PBI per cápita, el desarrollo económico se inclina a la categoría alto).
EJEMPLO 2:
Variable: Polarización ideológica
Indicador: Hay personas que dicen que el Estado debe intervenir en la economía, y hay otras que dicen que no debe intervenir. Siendo 1 nada y 10 mucho, que cree ustedes que el Estado deba intervenir en la Economía? En base al resultado, el investigador ubica en las categorías “Izquierda”, “Centro” o “Derecha”.
Diseño de investigación: es la planificación de las tareas a realizar fijando las estrategias metodológicas que configuran “un particular modo de transitar el proceso de investigación”. Se toma la decisión de cómo avanzar con la investigación.
En un primer lugar, es posible determinar dos tipos de diseños de investigación.
 Diseños cualitativos (exploración de la realidad con una orientación ideográfica, es decir, sin intenciones de generalizar y extrapolar los resultados a un universo más amplio). El objetivo es comprender las motivaciones de los actores para realizar las acciones sociales investigadas.
 Diseños cuantitativos (trabajo con gran cantidad de casos). El objetivo es obtener generalizaciones que prediquen sobre los objetos de análisis.
Elección de los casos: Una de las primeras tareas de los investigadores es escoger en qué unidades de análisis se rastreará la evidencia empírica.
Si el objeto de estudio es uno o unos pocos, se puede analizarlos a todos. En otros casos, se deberán escoger muestras.
Marco muestral: Es un marco de referencia que nos permite identificar los elementos de la población, así como la posibilidad de enumerarlos y seleccionar los elementos muestrales.
Muestras cuantitativas:
Cuando se trabaja con un gran número de unidades de análisis, se utilizan técnicas de estadísticas de muestreo, definiendo una muestra para luego generalizar los resultados al conjunto del universo.
Las muestras en las que se trabaja con grandes números (más de 100 casos) se dividen en dos grandes categorías:
 Probabilísticas: partiendo de las teorías de la probabilidad, cada elemento del universo tiene una posibilidad, conocida y distinta de cero, de formar parte de la muestra. Para ello, se respeta la aleatoriedad en todo el proceso de selección de los casos, y como resultado se puede conocer el error muestral o margen de error. (TIP: Siempre que sea posible, se recomienda utilizar una muestra probabilística tanto por la medición del error de estimación como por la elección puntual de cada unidad de análisis de la muestra).
¿Cómo se lleva a cabo el procedimiento de selección de la muestra probabilística?
 Tómbola  procedimiento muy simple pero no muy rápido. Consiste en numerar todos los elementos muestrales del 1 al número n. Hay fichas o papeles, uno por cada elemento. Revolverlos en una caja e ir sacando n número de fichas, según el tamaño de la muestra. Los números elegidos al azar conformarán la muestra.
o Ejemplo: Tenemos una población N=53 empresas extractivas y siderúrgicas, se necesita una muestra n=13 directivos generales de tales empresas. En una lista se numeran cada una de las empresas. En fichas aparte se sortea cada uno de los 53 números, hasta obtener los 13 necesarios (pueden ser las 13 primeras fichas que se extraigan). Los números obtenidos se verifican con los nombres y direcciones de nuestra lista, para precisar los que serán participantes del estudio.
 Números random o al azar utilización de una tabla de números que implica un mecanismo de probabilidad muy bien diseñado (no significa la selección azarosa de números). Los números random fueron generados con una ruleta electrónica, y existe una tabla de un millón de dígitos, cuyas partes se encuentran en los apéndices de muchos libros de estadística.
Margen de error estándar: menor de 0.01. (es decir que, de 100 casos, 99 veces mi predicción sea correcta).
Las muestras probabilísticas requieren dos procedimientos básicos:
1) La determinación del tamaño de la muestra y,
2) La selección aleatoria de los elementos muestrales.

o Muestreo aleatorio simple: Si se tiene un listado de todas las unidades de análisis del universo, se las numerará y se sortearán unidades tanta cantidad de veces como casos tendrá la muestra.
 Ejemplo: Muestreo al azar por marcado telefónico
o Muestreo aleatorio sistemático: Se obtienen los casos a relevar mediante el coeficiente de elevación N/n, donde N constituye el número de unidades del universo y n el total de elementos de la muestra. Se comienza por elegir al azar un número menor al coeficiente de elevación para que oficie de punto de partida, y luego se le suma sucesivamente el coeficiente, de modo de ir obteniendo todos los elementos que formarán parte de la muestra. (TIP: Al usar esta muestra se debe desordenar el listado antes de numerarlo, para evitar posibles sesgos).
o Muestreo aleatorio estratificado: Subgrupo en el que la población se divide en segmentos y se selecciona una muestra para cada segmento. Cada estrato es un conjunto de unidades homogéneo a su interior y heterogéneo respecto del resto, cuya existencia permite tratarlos diferenciadamente tanto en el mecanismo de selección de las unidades últimas de muestreo como en el número de unidades, escogiendo menos estratos más homogéneos. (TIP: Para llevar a cabo un muestreo de este tipo se deben elegir los criterios de estratificación entre las propiedades de las que se conoce su distribución del universo, que se denominan parámetros).
o Muestra por racimos, conglomerados o cluster: Subgrupo en el que las unidades de análisis se encuentran encapsuladas en determinados lugares físicos. Implica diferenciar entre la unidad de análisis y la unidad muestral. (Se reducen los costos, tiempo y energía, al considerar que muchas veces las unidades de análisis se encuentran encapsuladas o encerradas en determinados lugares físicos o geográficos).
TIP (Comparación entre el muestreo aleatorio estratificado y el muestreo por racimos, conglomerados o cluster): Los dos segmentan a la población, los estratificados tienen la característica de que son homogéneos al interior (comparten características todas las unidades que componen ese estrato) y heterogéneos en su exterior. Por ejemplo, en estudiantes universitarios. Cada facultad puede ser un estrato (tienen características e interés diferentes entre las facultas pero las mismas dentro de cada universidad). Lo que seleccionamos en el estratificado son unidades.
Con relación a los conglomerados, investigamos conglomerados (cada conglomera es heterogéneo al interior – cada conglomerado contiene la diversidad de factores que uno podría encontrarse, y homogéneos entre sí). Se supone que cada conglomerado es similar. Por ejemplo, puede elegir un conglomerado u otro, si total a su interior se supone que son similares. Seleccionas aleatoriamente los conglomerados. Los alistas, se pueden censar todas las unidades de análisis o un muestreo en dos etapas, haciendo un marco muestral y ahí comenzar con un muestreo aleatorio simple (u otro!).
Paso a paso para el muestreo por conglomerados (Ejemplo municipios):
1) Tomo 70 municipios,
2) Los enlisto,
3) Selecciono al azar una x cantidad de municipios,
4) A partir de acá, comienza la segunda etapa del análisis
a. En caso de no tener el listado de cada unidad de análisis puedo realizar cuotas.
b. En caso de tener la información de cada una de las unidades de análisis dentro de cada municipio, puedo avanzar con un muestreo aleatorio simple.

 No probabilísticas o dirigidas: Subgrupo de la población en la que la elección de los elementos no depende de la probabilidad sino de las características de la investigación. No se respeta el principio de aleatoriedad en la selección de los casos, por lo tanto, no es posible luego aplicar el principio de la representatividad. Sin embargo, lo positivo de esta muestra es que realiza una cuidadosa y controlada elección de sujetos con ciertas características específicas.
o Muestra por cuotas: se reproducen las distribuciones de algunos parámetros del universo (Por ejemplo: si el universo cuenta con un 60% de hombres y 40% de mujeres, en la muestra se buscará la misma proporción por género). TIP Importante: Este tipo de muestreo al no basarse en los principios de la aleatoriedad puede tener errores de estimación, ya que se trabaja a ciegas.
Muestras cualitativas:
Se busca seleccionar en el momento del diseño algunos contextos y fechas relevantes para la investigación, pero sabiendo que en el transcurso de esta se irán descubriendo nuevos contextos, y en ellos, sujetos que harán las veces de informantes. Por ende, parte del objeto de estudio se desconoce.
o Muestra según propósitos o selección basada en criterios: se buscan intencionadamente escenarios, personas o eventos particulares en función de la información que se cree que pueden ofrecer. Los criterios varían incluso dentro de un mismo trabajo de campo, siendo la tipicidad o la heterogeneidad uno de los más utilizados.
o Muestreo teórico: la selección se realiza únicamente teniendo en cuenta la contribución que se pueda hacer a la teoría que se está construyendo en el proceso de investigación.
 Estrategias muy utilizadas: Bola de nieve y saturación teórica.

Recolección de datos:
 Datos primarios: son datos que genera el mismo investigador.
 Datos secundarios: se obtienen de otros estudios o instituciones públicas o privadas.
Tipos de encuestas:
 “Cara a cara”: se caracterizan porque la entrevista reúne al entrevistado y al entrevistador en un mismo tiempo y espacio.
 Telefónicas: hay coincidencia temporal pero no espacial.
 Por correo: se acentúa la distancia entre el entrevistado y el entrevistador, no habiendo concurrencia ni en el momento ni en el lugar.
El cuestionario es el instrumento de recolección de datos de las encuestas. Un cuestionario es un conjunto de preguntas fijas estructuradas intencionalmente para extraer información que interesa de cierto tipo de unidades de análisis, acompañadas de categorías de respuestas, instrucciones y aclaraciones dirigidas al entrevistador o al entrevistado, y espacio para la codificación de las respuestas.
El cuestionario se irá estructurando de acuerdo con las definiciones operativas e indicadores con los que cuente. Cada definición operativa o indicador puede requerir la formulación de una o varias preguntas.
1. Introducción: Párrafo breve que presenta el estudio. Objetivo: que las personas accedan a responder la encuesta. En entrevistas cara a cara o telefónicas, la realiza el mismo entrevistador. Aquí se indica la duración aproximada de la encuesta.
2. Cuerpo/estructura:
- Fluidez
- Orden: Puede haber preguntas que influyan otras preguntas. Deben ir al final.
- Longitud: Debe ser lo más corto posible.
- Implementación: puede ser por encuestadores, IVR o CATI.
3. Clasificación: Es con fines teóricos y prácticos, ya que también define como se hará la redacción y el tipo de información que se recibirá al final del estudio.
-Según su función: Filtro, De pase, Observación y Clasificación.
- Según su estructura: Abiertas, Cerradas, Dicotómicas, Alternativas múltiples, Respuesta simple, Respuesta Múltiple.
- Según su procedimiento: Espontánea, Guiada
- Según lo que pretende medir: Factual, Actitudinal, Evaluativa, De opinión, Ranking.
Existen diferentes clases de preguntas que permiten obtener distinto tipo de información:
 Preguntas abiertas: se caracterizan por no poseer categorías entre las cuales el encuestado tiene que optar, pudiendo explayarse libremente. Esto hace más rica la respuesta, pero se corre el riesgo de perder el eje del tema.
 Preguntas cerradas:
o Cerradas simples: se caracterizan por tener dos o tres categorías nominales.
o Cerradas de alternativas múltiples: se solicita al entrevistado que elija solo 1 respuesta entre más de 3 opciones posibles
o Cerradas de respuestas múltiples: el encuestado elige más de una opción entre las distintas categorías.
o Cerradas con escala: poseen categorías ordenadas que pueden ser palabras o números
o Cerradas con frases: permiten abordar temas espinosos sin requerir una opinión directa del entrevistado.
Diseños Experimentales
Existen métodos y técnicas. Los diseños experimentales pertenecen a los métodos de Investigación. Los métodos son pasos o procedimientos para responder nuestros objetivos de investigación. Esos métodos se alinean desde sus sustentos teóricos y epistemológicos con ciertas metodologías. La metodología usada acá es cualitativa.
Los instrumentos son las herramientas que usan los diferentes métodos para relevar la información. Dentro de la metodología cuanto podemos pensar la encuesta, método experimental o el uso de datos secundarios. Pensamos los experimentos como un “método”.
Los diseños experimentas son prácticamente los únicos que nos permiten generar relaciones causales (causa-efecto). Los otros diseños de investigación cuantitativos, no nos permiten hablar de causalidad ya que no hay una medición.
Que es un experimento?
Construcción del conocimiento, mediante las adaptaciones de otras disciplinas.
Hay un investigador que selecciona, o elige ciertas variables que va a manipular en un entorno controlado (que podría ser en un laboratorio), donde aparece un estímulo-respuesta, y eso, lo hacemos para probar una hipótesis.
Una hipótesis es la relacionen entre dos o más variables. Una variable dependiente, y la otra es independiente. Una variable genera una modificación sobre la otra variable.
Tomar un sujeto y ver cuál es el comportamiento de ese sujeto si antes a ese sujeto le dimos un estímulo. Le damos 100 pesos antes de entrar y le ofrecemos comprar caramelos. Luego con otro sujeto realizamos el mismo experimento sin darle el estímulo (los 100 pesos) y analizamos cuantos caramelos compra.
Debido a que a la misma persona no se le puede simular ambas situaciones, es que trabajamos con dos grupos. Cada grupo va a estar compuesto por personas que van a compartir mismos factores o características. A un grupo se le va a aplicar el estímulo, y al otro no. Al que si se le aplica, lo llamamos “grupo de tratamiento”. Al grupo que no le asignamos un estímulo, lo denominamos “grupo de control”. El estímulo es la variable independiente, y se utiliza para poder adjudicarle al estímulo la causalidad de obediencia de uno de los dos grupos. El estímulo puede ser positivo o negativo, en caso de hacer efecto o no.
Como vamos a medir esa homogeneidad entre ambos grupos? Se hace de forma estadística, tratando de asegurarnos que todos tengan en promedio las mismas características.
Características principales de los diseños experimentales:
 Trabajamos a partir de 2 grupos (experimental/tratamiento o de control/comprobación)
 Hay un estímulo (variable independiente que busca modificar el valor en la variable dependiente)
 La asignación aleatoria (para evitar sesgos) de las unidades a cada uno de los grupos (debería poder definir de manera aleatoria que unidad va a cada uno de los grupos sin que afecte el experimento, por eso es importante la homogeneidad de las unidades de análisis)
 Una mitad va a ser asignada aleatoriamente al grupo de tratamiento (grupo al cual se le aplica el estímulo), y la otra mitad es asignada al grupo de control (no tiene estímulo).
 TIP: Es la mayoría de los experimentos es muy difícil que la selección inicial sea aleatoria (ya que las personas deben inscribirse a acceder a ser analizado, por ende no son seleccionadas de forma aleatoria). Sin embargo, una vez tenidas todas las personas, se las enlista y divide en dos grupos de forma aleatoria.
Momento 1: Aparece el estímulo o el placebo
Momento 2: Volvemos a replicar esa medición original pero esperamos ver las diferencias entre el grupo de control y el grupo de tratamiento. El objetivo es poder explicar que esas diferencias obtenidas son causales del estímulo.

Validez interna: Significa que el impacto estimado del programa es el impacto libre de todos los demás factores de confusión potenciales.
Validez externa: Quiere decir que la muestra de la evaluación representa con precisión a la población de unidades elegibles. Los resultados de la evaluación se pueden entonces generalizar a la población de unidades elegibles.
Tipos de diseños experimentales o experimentos:
 Experimentos puros
o Experimentos de laboratorio:
 Ámbito: espacios creados y controlados por el investigador. Hay un fuerte control del ambiente. Entorno y variables controladas.
 Estímulo: fuertemente controlado por el investigador.
 Validez interna/externa: Hay un alto grado de control (validez interna). Pero hay un bajo grado de validez externa.
 Resumen: Los sujetos son reclutados en un lugar específico (ajeno y externo) donde se realiza el experimento y el investigador controla casi todos los aspectos del entorno. Las personas son reclutadas y forman parte de un estudio. Esas personas se van a dividir en 2 grupos. Algunas recibirán el tratamiento, otros no.
 Ventaja: Son estos los experimentos en Ciencias Sociales donde contamos con un mayor nivel de control sobre el proceso de producción de la información (permite dejar constantes las demás variables que pueden afectar un resultado y aislar el efecto de la variable de interés).
 Desventaja: Son experimentos demasiado artificiales, ficticios (y puede suceder que los actores actúes de manera distinta frente a un escenario hipotético en un laboratorio que frente a un escenario real fuera de este).

o Experimentos de campo:
 Ambiente: no se controla. Se da en el mundo real.
 Estímulo: no siempre podemos controlar la aleatoriedad de quienes reciben el estímulo y quienes no.
 Validez interna/externa: La validez interna es menor, se pierde la asignación del estímulo, pero puede que su validez sea mejor, ya que es más natural el ambiente en el que se da. Además, si hay aleatoriedad en la elección de los casos, mejor.
 Resumen: Son aquellos experimentos que tiene lugar en un entorno natural, donde, más allá de la intervención puntual, tenemos un control limitado del entorno.
 Cuatro cuestiones básicas a tener en cuenta:
2) Los participantes se encuentran a un problema real.
3) El diseño debe ser lo suficientemente limpio y claro para poder sacar conclusiones útiles
4) Se deben evitar efectos no controlados en la medida de lo posible,
5) Especialmente en aquellos de carácter económico, se deben proporcionar incentivos apropiados.
 Resumen: se desarrollan en un ambiente no controlado, es positivo ya que es el entorno natural de los sujetos, pero se restringe la posibilidad de analizar las variables por separado. Se dan en el ambiente habitual donde los sujetos transcurren sus vidas. Perdés la posibilidad de determinar si el estímulo utilizado es el único que afecta (no hay una exclusiva causalidad).

o Experimentos de encuesta:
 Ambiente: se da a través de un muestreo/cuestionario en un ámbito controlado y ficticio.
 Estímulo: el propio estímulo está dentro del diseño de la encuesta.
 Validez interna/externa: tienen un alto grado de validez interna (diseño muy cuidadoso de las variables y los estímulos), y podría tener una validez externa alta si se garantiza una selección aleatoria.
 Resumen: se desarrolla un formulario, y al grupo de tratamiento se le agrega un estímulo. Puede ser una pregunta adicional, un distinto orden de las preguntas, etc. Se direccionan ciertas preguntas para intentar generar una orientación. Luego se analiza si causan o no el efecto esperado. La ventaja de la encuesta es que es más fácil de llegar a un muestreo probabilístico en ambas etapas, eso le da una muestra de validez externa. La encuesta en sí es un instrumento artificial (no es lo mismo que ir a un laboratorio, pero tampoco suelen ser preguntas que mantengan al usuario en su total zona de confort). Es un punto medio entre el experimento de campo y el de laboratorio. Hay un alto grado de control de las variables.

 Cuasi experimentales
o Se utilizan datos de carácter observacional, es decir, aquellos en cuya producción no interviene quien investiga.
o Ejemplo: un terremoto. Puedo analizar un país y una sociedad, y revisar sus conductas sociales, y luego un país y su sociedad que atravesó un terremoto, y ver las conductas. Luego puedo compararlas y encontrar diferencias. No es posible controlar el entorno, ni tampoco las variables. No podemos concluir una causalidad. Este diseño se caracteriza más con lo observacional, ya que las variables no se manipulan.
Experimental vs observacional (observa y no manipula).

Medidas de tendencia central y medidas de dispersión
1) Medidas de tendencia central 2) Medidas de dispersión
Escala de medición Moda Mediana Media Rango Varianza Desvío Estándar
Nominal X NO NO NO NO NO
Ordinal X X NO NO NO NO
Intervalar X X X x X X

1) Medidas de tendencia central:
Moda: La categoría que más veces aparece (=MODA).
Mediana: Divide la muestra en dos (=MEDIANA).
- Ordenar los números de mayor a menor.
- Dividirlos a la mitad.
- El número que cae al medio es la mediana.
- Si el total es par, se suman los dos del medio y se dividen.
Media: Promedio. Sumar el total y dividir por la cantidad de casos (=MEDIA).

2) Medidas de dispersión: Nos permiten analizar qué tan homogénea o heterogénea es la muestra.
Rango: Diferencia entre el valor más grande y el más chico.
Varianza: Procedimiento: Los valores – la media, elevados al cuadrado y divididos por el número de la muestra (si hay 4 casos, se divide por ese número).
Desvío Estándar: Cuanto se alejan en promedio los casos de la media (=DESVEST.M).
Se puede calcular manualmente: S=raíz cuadrada de S2
i = 1 (i es la cantidad de casos)

Procedimiento para calcular la varianza:
Paso 1: Sacar el promedio
Paso 2: A cada valor restarle el promedio (o la media)
Paso 3: Sumar todos, deben dar 0.
Paso 4: Elevarlos al cuadrado. Todos los valores quedan positivos.
Paso 5: Sumar esos valores (El resultado es la varianza).

Procedimiento para calcular el desvío estándar:
Paso 6: Hacer la raíz cuadrada

Tabla de frecuencia:
Frecuencia absoluta: Cantidad de veces que se repite cada opción.
Ejemplo 1:
Valoración de la situación económica de Argentina Frecuencia absoluta Frecuencia acumulada Frecuencia Relativa acumulada Frecuencia % Frecuencia acumulada %
Muy buena 4 4 4/1796= 0,00222717 4x100/1797= 0,22% 0,22%
Buena 32 36 (4 + 32) 32/1796 = 0,01781737 32x100/1797= 1,78% 0,22 + 1,78= 2%
Regular 335 371 (32 + 335) 335/1796= 335x100/1797= 18,64% 2 + 18,64= 20,64%
Mala 636 1007 (371 + 636) 636/1796= 636x100/1797=
Muy Mala 789 1796 (1007 + 789) 789/1796= 789x100/1797=
Total 1796 1796/1796 = 1 1796x100/1797= 100,00% 100%

Frecuencia Relativa: La proporción en base a 1.
Frecuencia acumulada relativa: Cada valor divido el total.
Frecuencia % acumulada: Regla de 3 simples.
Tip: Para fijar el valor clic en F4
Para poner filtros: Ctrl + shift + L

Matriz de datos: Estructura que conserva la estructura 3partita del dato. Tres componentes (variables, unidad de análisis y valores).
En las columnas están las variables, en las filas cada una de las unidades de análisis, y en las celdas el valor que asume esa unidad de análisis.
Análisis univariado: sistematizamos la información de 1 columna  Tabla de frecuencia (distribución de frecuencia).
Ejemplo 2:
Variable (Edad) Frecuencia Absoluta Media (promedio) Desvío estándar
(cada valor menos el promedio) Valor anterior al cuadrado Valor x Frecuencia Total – (n-1)
13 1 13x1= 13 -3,2 10,24 10,24
14 3 14x3= 42 -2,2 4,84 14,52
15 4 15x4= 60 -1,2 1,44 5,76
16 9 16x9= 144 -0,2 0,04 0,36
17 7 17x7= 119 0,8 0,64 4,48
18 6 18x6= 108 1,8 3,24 19,44
Total 30 486/30= 16,2 - - 54,8 1,37

Al total del valor por frecuencia lo dividimos por (n-1) que es 29. Da 1,88 y a eso la raíz cuadrada.
El desvío estándar implica que en promedio, los casos se alejan un 1,37 (años). El desvío siempre es la misma unidad de la que se está midiendo.
Ejemplo 3: Variable: ¿Cómo cree que estará su situación económica personal en los próximos meses?
Variable Frecuencia N = 1685
Mejor 33%
Igual 19%
Peor 45%
Ns/Nc 3%
Total 100%

Análisis Bivariado: sistematizamos la información de 2 columnas  Tabla de frecuencia (distribución de frecuencia). Se utiliza para analizar como una variable se comporta con respecto a otra (variable dependiente y variable independiente).
Si No
Si
No

Las tablas bivariadas o cuadros de contingencia, es el cruce de estas dos variables.
Ejemplo 4: Hipótesis: La categoría del pasaje influye en la posibilidad de sobrevivir (al Titanic por ejemplo).
Variable: Posibilidad de sobrevivir al hundimiento según la categoría del pasaje.
Variable independiente: Categoría del pasaje. Variable dependiente: Si (sobrevivió) / No
La distribución de frecuencia: El 68% de los pasajeros no sobrevivió, y el 32% sí lo hizo.
Categoría Primera Clase Primera Clase % Segunda Clase Segunda Clase % Tercera Clase Tercera Clase % Tripulación Tripulación %
No 122 37,53 167 58,59 528 74,79 673 76, 05
Si 203 62,46 118 41,40 178 25,21 212 23,95
Total 325 100% 285 100% 706 100% 885 100%

Coeficiente de correlación simple:
R de Pearson: Es el coeficiente de correlación más utilizado.
Correlación (lineal): La trayectoria o variación de una variable está vinculada o no a la trayectoria de otra (esto no quiere decir que esté influyendo en la otra). Correlación no es causalidad.
Por ejemplo: Educación e ingresos. Son dos variables que habitualmente en las investigaciones de Cs Política tienen correlación. En general, a mayor nivel educativo (medido en años de educación), tienen mayores ingresos. Esto no implica que todas las unidades con mayores estudios tienen mayores ingresos.
Covarianza: Serie de cálculos en base a promedios. Es la relación y movimiento entre dos variables.
El valor siempre da entre -1 y 1.
Regresión: Los valores extremos tienden a volver a la media (al promedio).
Por ejemplo: En los casos extremos (personas muy altas o muy bajas por ejemplo) hay una regresión al promedio, es decir que sus hijos sean más bajos.
La regresión es una herramienta estadística más utilizada en las Ciencias Sociales, la cual me permite:
1) Estimar que va a suceder con una variable en el futuro, a partir del vínculo que tiene esa variable con otras variables en el pasado.
2) Observar que variable pesa más en el efecto de mi variable dependiente. (Tengo una serie de variables independientes, y una dependiente. La regresión me dice cuanto pesa cada una de esas variables independientes sobre el resultado de mi variable dependiente).
3) Estimar cuanto se modifica en promedio la variable dependiente para cada unidad de cambio de cada variable independiente, manteniendo constantes las otras variables independientes.
Por ejemplo: Si quiere conocer el peso de un individuo (Juan), puedo arriesgar que tiene el peso promedio de la población. Es difícil acertar. Para ello, podemos encontrar otra variable (en este caso la altura) la cuál debe estar relacionada con la primera variable.
Si conozco cuanto mide Juan y también cuál es el peso promedio para cada nivel de altura, la posibilidad de acertar es mayor que conociendo sólo la media general, siempre y cuando exista una relación lineal entre ambas variables. Cuanto más correlacionadas estén las variables, más se reducirá el error de estimación.
En conclusión, lo que hace la regresión es analizar la correlación con otras variables para encontrar un incógnito. A este ejemplo podemos sumarle más variables tales como la edad y el género. De esta forma es posible obtener poblaciones más chicas, y así aumentar las posibilidades de estimación.
Ecuación: Y = 2X

X Y
1 2
2 4
3 6
4 8
5 10
6 12
7 14

Para calcular cuánto daría 7, debemos usar la siguiente ecuación (Y = 2X).
Constante u ordenada de origen: Es el valor que asume la variable dependiente cuando mi variable independiente es igual a 0. Es de donde parte la recta de regresión. Para ello se utiliza la siguiente ecuación (Y=2+2X).
El 2 es la constante.
X Y
1 4
2 6
3 8
4 10
5 12

Ecuación de regresión:
Regresión múltiple:
Y = a +b1X1i + b2X2i + b3X3i + …. ei
b = es cuanto cambia la variable dependiente a partir del cambio de una unidad en la variable independiente.
La Y es la variable dependiente. La X es la variable independiente.
La constante el valor que tiene la variable dependiente, cuando las independientes son cero. La constante se suele encontrar con la letra “a”. El efecto que tiene cada variable independiente en la variación de mi variable dependiente.
ei = Error aleatorio (es algo que el modelo no puede estimar).

Ejemplo de regresión múltiple
Variable dependiente: Ingresos
Variable independiente: Edad, Educación y Status ocupacional.
Para validar la correlación entre las variables:
- Hipótesis nula. Con que valor se rechaza? Tener en cuenta valor P.
- Resultados significativos: tienen que ser inferiores al 0,05. En tal caso, no estoy seguro de que esa variable sea significativa. De no ser significativa estadísticamente la debo sacar del modelo.
- T: Coeficiente estandarizado, sobre el coeficiente no estandarizado debe dar más de 1,96. Sino, al igual que en el caso anterior, debe ser retirado del modelo. En este caso, la edad no cumple con la “t” mínima.
LAS VARIABLES INDEPENDIENTES (VI)) SON AQUELLAS QUE SE PRESUPONE ACTÚAN COMO UN FACTOR CAUSAL DE LA RELACIÓN ESTABLECIDA.
LAS VARIABLES DEPENDIENTES (VD) EN CAMBIO, SON MODIFICADAS A RAÍZ DE LOS CAMBIOS EN LAS VARIABLES INDEPENDIENTES, Y GENERALMENTE SON LAS QUE INTERESA ESTUDIAR.
Coeficientes de asociación - Etapas de la investigación
1) Proyecto
2) Recolección de datos
3) Procesamiento
4) Análisis de datos
Análisis de una tabla: Hay básicamente dos modos de abordar el análisis de una tabla.
- Asimétricamente: El interés está puesto en observar el efecto de una de las variables sobre la otra  El caso asimétrico se plantea siempre que se elige considerar que una variable –la variable independiente- incide sobre la distribución de la otra- la variable dependiente. Hay tablas en las que cualquiera de las dos variables puede funcionar como “causa” de la otra. Aunque también suele imponer que se imponga, por así decirlo, el análisis en una determinada dirección.
- Simétricamente: No se presupone que una variable sea la “causa” de la otra  No es apto para examinar la existencia de una relación de dependencia entre las dos variables; optamos por este tipo de análisis cuando no interesa indagar acerca del presunto “efecto” de una variable.
Existen dos tipos de coeficientes:
1) Coeficiente de asociación: Es una formula construida de una manera tal que, al aplicarla arroja un valor único que puede ser interpretado como una medida del grado en que dos variables se encuentran relacionadas. Estadísticamente, se pretende en general que un coeficiente de asociación está construido de tal modo que produzca siempre un valor comprendido entre 1 y 0. esto facilitará considerablemente
• ¿Qué miden? Es un número que nos expresa en qué medida dos o más hechos están relacionados, hasta qué punto las variaciones de uno concuerdan con las variaciones del otro.
• ¿Qué es lo que buscamos comprobar a través de los coeficientes de asociación? Estamos inquiriendo si la relación entre variables es estadísticamente significativamente.

2) Coeficiente de correlación: El análisis de correlación consiste en un procedimiento estadístico para determinar si dos variables (numéricas) están relacionadas o no. El resultado del análisis es un coeficiente de correlación que puede tomar valores entre -1 y +1.
• El signo nos indica la dirección de la relación, como hemos visto en el diagrama de dispersión.
• Un valor positivo indica una relación directa o positiva, es decir, cuando la magnitud de una incrementa, la otra también).
• Un valor negativo indica relación indirecta, inversa entre las dos variables (mientras los valores de una incrementan, los de la segunda variable disminuyen. Si dos variables son independientes).
• Un valor nulo indica que no existe una tendencia entre ambas variables (puede ocurrir que no exista relación o que la relación sea más compleja que una tendencia, por ejemplo, una relación en forma de U).
¿Cómo interpretar el valor de un coeficiente?
- 1 o -1 = asociación perfecta
- superior a 0.80 = muy fuerte
- entre 0.60 y 0.80 = fuerte
- entre 0.40 y 0.60 = moderada
- entre 0.20 y 0.40 = débil
- menos de 0.20 = puede que no exista asociación sino que se deba al azar

¿Cómo se mide la correlación?
Coeficiente de correlación lineal de Pearson: sirve para cuantificar tendencias lineales, y el coeficiente de correlación de Spearman que se utiliza para tendencias de aumento o disminución, no necesariamente lineales pero sí monótonas (las variables tienden a moverse en la misma dirección relativa, pero no necesariamente a un ritmo constante.
El coeficiente de correlación de Pearson cuando se aplica a una población se representa por la letra griega (rho) y se refiere a ella coeficiente de correlación poblacional o el coeficiente de correlación poblacional de Pearson.