Investigación de Mercado y Estudios Sociales

lunes, 12 de mayo de 2014

2da Guía de Estadística II Semestre I-2014


1.   Un almacén recibe pedidos de cierto artículo de tres proveedores distintos, P1, P2 y P3. De esos pedidos 50% del total se le compra a P1, mientras que a P2 y P3 se le compra 25% a cada uno. El porcentaje de artículos en malas condiciones que proporciona P1, P2 y P3 es de 3%, 7% y 9% respectivamente. Si los artículos se almacenan sin importar quién es el proveedor y se escoge uno al azar; determine:
a.   La probabilidad de que sea defectuoso.
b.   Si es defectuosos, ¿cuál es la probabilidad de haya sido despachado por el proveedor P3?

2.   Se tienen dos urnas, y cada una de ellas contiene un número diferente de bolas blancas y rojas: Primera urna, U1: 5 bolas blancas y 3 rojas; Segunda urna, U2: 6 bolas blancas y 4 rojas. Se realiza el siguiente experimento aleatorio: Se lanza un dado equilibrado y si sale par se elige una bola de la primera urna, y si sale impar de la segunda.
a.   ¿Cuál es la probabilidad de que salga una bola blanca?
b.   Si el resultado fue bola roja, cual es la probabilidad de que provenga de la segunda urna

3.   Una agencia automotriz recibe un embarque de 25 automóviles nuevos. Entre estos, tres tiene defectos. La agencia decide seleccionar aleatoriamente dos automóviles  de entre los 25 y aceptar el embarque si ninguno de los automóviles seleccionados tiene defectos. ¿Cuál es la probabilidad de aceptar el embarque?

4.   Una empresa vende sus productos en tres ciudades. Los porcentajes de venta son: 45% en A, 30% en B y 25% en C. La probabilidad de que se produzca falta de pago es, respectivamente, 0,03 en A, 0,05 en B y 0,07 en C.
a.   Cuál es la probabilidad de que un producto, tomado aleatoriamente de los registros de la empresa, se encuentre en condición de falto de pago
b.   Habiéndose dado una falta  de pago, ¿de qué ciudad es más probable que proceda?

5.   Sea P(A) = 0,35 y P(B/A) = 0,75, hallar P(A∩B)

6.   Una entidad bancaria califica a sus clientes, a la hora de conceder préstamos, en dos grupos: clientes "preferentes" y clientes "no preferentes". En su Memoria de 2011 aparecen los siguientes datos:
- El 30% de los préstamos fueron fallidos (no se pagaron a tiempo).
- El 40% de los préstamos fallidos fueron concedidos a clientes "preferentes".
- El 55% de los préstamos no fallidos fueron concedidos a clientes "preferentes".
Calcule:
a.   Probabilidad de que un préstamo concedido a un cliente "preferente" resulte fallido.
b.   Probabilidad de que un préstamo concedido a un cliente "no preferente" no sea fallido.

7.   Suponga que A es el evento “El teléfono está intervenido” y B es el evento “El teléfono es negro” Si 35% de los teléfonos están intervenidos; además del total 25% son negros y 10% de los teléfonos negro y está intervenidos. ¿Son A y B sucesos independientes?

8.   Se sabe que si el Producto Nacional Bruto (PNB) aumenta, la probabilidad de que el valor de unas acciones aumente es de 0,75. Si el PNB se mantiene constante, la probabilidad de que suban las acciones es 0,25, y si el PNB disminuye, la probabilidad de que aumente el valor de las acciones es de 0,15. Si para el futuro se asignan las probabilidades 0,4; 0,3 y 0,3 a los sucesos: suba el PNB, se mantenga constante y disminuya, respectivamente, responda a las siguientes cuestiones:
a.   Determine la probabilidad de que aumente el valor de las acciones.
b.   Suponiendo que las acciones subieron, determine la probabilidad de que el PNB haya subido efectivamente.
c.   Suponiendo que haya subido el PNB, determine la probabilidad de que las acciones bajen de valor.

9.   De acuerdo con las tablas de mortalidad, la probabilidad de que una persona de 65 años llegue a los 66 años es 0,96. Una pareja de un matrimonio ha cumplido 65 años ¿Cuál es la probabilidad de que cumplan ambos esposos los 66 años?

10.   En cuatro ciudades de una región del país se dan las siguientes cifras de población activa y desempleo:
Ciudad
Población Activa
Tasa de Desempleo
A
250.000
6%
B
550.000
7%
C
750.000
13%
D
450.000
15%
Se pide:
a.   La probabilidad de que elegida una persona activa al azar, ésta sea de la Ciudad A.
b.   La probabilidad de que elegida al azar una persona activa de esta Ciudad A, dicha persona se encuentre desempleada.
c.   Si se ha elegido una persona activa al azar y resulta no estar desempleada, ¿cuál es la probabilidad de que proceda de la provincia A?
d.   Si se ha elegido una persona activa al azar y resulta que está desempleada, ¿De cuál provincia es más probable que proceda?

11.   Se eligen al azar 3 deportistas de un equipo de 10 integrantes para realizar un control antidopaje; Se sabe que 2 de los jugadores del equipo han tomado sustancias prohibidas. ¿Cuál es la probabilidad de elegir para el análisis a alguno de los infractores?

12.   En una fábrica de tornillos, las máquinas A, B y C producen  20%,   35% y   45% del total, respectivamente. Se sabe que 3% de los tornillos producidos por la A, el 4% de la B y el 5% de la C, son defectuosos. Si de la producción total se elige un tornillo al azar,
a.   ¿Cuál es la probabilidad de que sea defectuoso?
b.   Si el tornillo es bueno, ¿Cuál es la probabilidad de que sea de la máquina B?
c.   Si el tornillo es defectuosos, ¿Cuál es la probabilidad de que provenga de la máquina A?

13.   En una población, el 3% de los varones y el 4% de las mujeres son daltónicos. Las mujeres son el 53% de la población. ¿Cuál es la proporción de varones entre los daltónicos?

14.   Estamos interesados en saber cuál de dos análisis A y B es mejor para el diagnóstico de una determinada enfermedad, de la cual sabemos que la presentan un 10% de individuos de la población. El porcentaje de resultados falsos positivos del análisis A es del 17% y el de B es del 19%. El porcentaje de falsos negativos de A es del 5% y de B es del 7%. ¿Cuál es la probabilidad de acertar en el diagnóstico con cada método?

15.   En un bosque hay 100 elefantes: 50 son grises, 30 blancos y 20 marrones. Se eligen al azar 9 elefantes, con reemplazo. Calcular la probabilidad de que resulten: 4 grises, 2 blancos y 3 marrones.

16.   El 60% de los estudiantes aprueba una asignatura A y 40% aprueba otra asignatura B. Sabemos, además, que 25% del total aprueba ambas. Elegido un estudiante al azar, calcular las probabilidades de las siguientes situaciones:
a.   Haya aprobado la asignatura B, sabiendo que ha aprobado la A.
b.   Haya aprobado la asignatura B, sabiendo que no ha aprobado la A.
c.   No haya aprobado la asignatura B, sabiendo que ha aprobado la A.
d.   No haya aprobado la asignatura B, sabiendo que no ha aprobado la A

17.   Se ha declarado un concurso para otorgar becas a los mejores estudiantes de la UBA y se llaman a participar a cinco hembras y dos varones de Ingeniería, seis hembras y cinco varones de Administración y Contaduría y Ocho hembras y tres varones de Comunicación Social. En virtud de que los meritos de todos los participantes son similares se decide escoger una Escuela de forma aleatoria y elegir un estudiante de ella.
a.   Cuál es la probabilidad que sea elegido un varón
b.   Si luego de elegir la Escuela se seleccionó a una hembra, cuál es la probabilidad de que ella sea de la Escuela de Ingeniería

18.   Suponga que hay tres cajas idénticas A, B y C. La caja A contiene dos monedas de cobre, la caja B una cobre y dos de níquel y la caja C contiene una de plata, dos de níquel y dos de cobre. Se toma al azar una de las cajas y luego se saca una moneda de ésta. Si la moneda es de cobre, ¿cuál es la probabilidad de que haya sido tomada de?:
a.      La Caja A
b.      La Caja B
c.      La Caja C

19.  Supongamos que {Bi}i=1 es una partición de un espacio muestral W. Si A es un evento de W, probar que P(A) = P(A/B1)P(B1) + P(A/B2)P(B2) + . . . + P(A/Bn)P(Bn)

20.  Supongamos que {Bi}i=1 es una partición de un espacio muestral W. Si A es un evento de W, probar que:
                                                  P(A/Bk)P(Bk)
 P(Bk/A)) =  ---------------------------------------------------------------------------------
                       P(A/B1)P(B1) + P(A/B2)P(B2) + . . . + P(A/Bn)P(Bn)


21.  Las probabilidades a priori de los eventos A1 y A2 son P(A1) = 0,45 y P(A2) = 0,55. También se sabe que P(A1­∩A2) = 0. Suponga que P(B/A1) = 0,25 y que P(B/A2) =0,45. Se pide:
a.    Calcule P(A1UA2).
b.    Calcule P(A1­∩B) y P(A2­∩B).
c.    Calcule P(B).
d.    Calcule P(A1/B) y P(A2/B).

22.   El número de camiones que pasan por una carretera donde hay un surtidor de gasolina está en relación 5 a 3 respecto de otra clase de vehículos. La probabilidad de que pasando un camión éste llegue al surtidor a abastecerse es de 0,15. Respecto a otra clase de vehículos dicha probabilidad es 0,25. Si llega un vehículo a abastecerse, ¿qué probabilidad hay de que sea un camión?

23.   Sobre la población activa de un Estado se tienen los siguientes datos: el 35% son obreros no calificados, el 55% son obreros especialistas y el resto son técnicos medios o superiores. Actualmente, el desempleo afecta a 30% de los no calificados y a 15% de los especialistas, constituyendo los obreros no cualificados el 48% del total de los parados. Determine el porcentaje de paro que existe entre los técnicos.

24.   Una caja contiene tres bolas negras y siete bolas blancas. Se efectúa en siguiente juego. Se extrae una bola, se observa su color y luego se devuelve a la caja con dos bolas adicionales del mismo color. Si se realizan tres extracciones, una a continuación de la otra. Halle la probabilidad de que en cada una de ellas se extraiga una bola negra.

25.   En una investigación de mercado realizada sobre una población se puedo observar que 20% de sus habitantes son zurdos; 30% son adictos al alcohol y 6% es adicta al alcohol. ¿Son independientes los eventos ser zurdo y ser adicto al alcohol?

26.   A los habitantes de Maracay se les hizo una entrevista con el propósito de determinar el número de lectores de El Siglo y El Aragüeño. Los resultados del estudio fueron los siguientes: 20% de los habitantes lee El Siglo, 16% lee El Aragüeño y 5% lee ambos periódicos diariamente. Si se elige al azar un lector.
a.   Cuál es la probabilidad de que sea lector de El Siglo, sabiendo que lee El Aragüeño
b.   Cuál es la probabilidad de que se lector de El Aragüeño sabiendo que lee El Siglo

27.   Se extraen tres bolas sucesivamente de una caja que contiene 6 bolas rojas, 4 bolas blancas y 5 bolas azules. Hallar la probabilidad de que se extraigan en el orden roja, blanca y azul si las bolas
a.         Se remplazan,
b.         No se remplazan.

28.   Demostrar que si P(A ) > P(B) entonces P(A/B) > P(B/A)

29.   Tres joyeros idénticos tienen dos compartimientos. En cada compartimiento del primer joyero hay un reloj de oro. En cada compartimiento del segundo joyero hay un reloj de plata. En el tercer joyero el un compartimiento hay un reloj de oro, en tanto que en el otro hay un reloj de plata Si seleccionamos un joyero aleatoriamente, abrimos uno de los compartimientos y hallamos un reloj de plata, ¿cuál es la probabilidad de que el otro compartimiento tenga un reloj de oro?

30.   Durante los últimos años se ha escrito mucho sobre la posible relación entre el fumar y el cáncer pulmonar. Supóngase que en un centro médico, de los fumadores de quienes se sospecha que tenían cáncer pulmonar, 90% realmente lo tenía, mientras que únicamente 5% de los no fumadores lo padecía. Si la proporción de fumadores es de 0,45, ¿Cuál es la probabilidad de que un paciente con cáncer pulmonar seleccionado al azar, sea fumador?

Realizado por:
Prof. José Pérez Leal

viernes, 26 de abril de 2013

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA



Introducción a la inferencia estadística, definiciones básicas
Para comenzar con esta asignatura debemos partir de construir una definición de los que se entenderá por Inferencia Estadística para los fines del curso, por lo tanto se comenzará este proceso por darle un significado válido a los dos términos o palabras  que la compones el nombre de la asignatura, Inferencia y Estadística

Inferencia: Según el Diccionario de la Real Academia de la Lengua Española (DRAE) define inferencia como “(De inferir). 1. f. Acción y efecto de inferir” y define la palabra inferir como “(Del lat. inferre, llevar a). 1. tr. Sacar una consecuencia o deducir algo de otra cosa. U. t. c. prnl. 2. tr. Llevar consigo, ocasionar, conducir a un resultado. 3. tr. Producir o causar ofensas, agravios, heridas, etc.”
Como puede apreciarse el significado 1 y el 2 son los que se aproximan o van a servir para establecer una definición de Inferencia Estadística y es el primer significado es que aporta la mejor aproximación.
Así en primer lugar se tiene como inferir: “Sacar una consecuencia o deducir algo de otra cosa” (DRAE, 2001)

Por otra parte el mismo DRAE contiene los siguientes significados para la palabra estadística: 1. f. Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas. 2. f. Conjunto de estos datos. 3. f. Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades.

Como se puede apreciar, el primer significado se refiere al estudio de datos cuantitativos de diversos géneros de la población, mientras que el segundo significado se circunscribe al conjunto de datos y el tercer significado agrega que la estadística es una rama de la matemática, utiliza datos cuantitativos, obtiene inferencias en probabilidad. Por lo tanto se tomará este último significado, para en combinación del significado de inferir hacer una construcción preliminar de una definición para el nombre de esta asignatura.

Así, Inferir “Sacar una consecuencia o deducir algo de otra cosa”
Y, estadística “Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades”
Pueden combinar estos dos significados para construir la siguiente definición preliminar: Estadística Inferencial es la rama de la matemática que utiliza grandes conjuntos de datos numéricos para sacar una consecuencia o deducir algo de otra cosa y obtener inferencias basadas en el cálculo de probabilidades. Definición que tiene muy poco sentido pero que para comenzar es un buen inicio para ir dándole forma concreta al significado válido para el curso.

En este sentido se emplearán definiciones aportadas por otras autores, buscar elementos comunes y nuevos aportes para construir el significado definitivo de Estadística Inferencia.
Por una parte Rivas, (2000) dice que la Estadística Inferencia o Inductiva “es la que trata de estimar las características del universo estadístico o población total a través del estudio de una parte de este universo”
Igualmente, Pestaña (1996) define Estadística Inferencial o Inductiva como “la estadística que tiene por objeto estimar las característica de una población a partir de los datos referentes a una muestra”.

En este contexto Chao (1999) dice que la “Inferencia Estadística es el proceso de hacer predicciones acerca de un todo o tomar decisiones al basarse en la información contenida en una muestra”.

Tomando los elementos comunes de estas definiciones se construye la siguiente definición

Estadística inferencial es la rama de la estadística que se encarga de estudiar los procesos mediantes los cuales es posible estimar y hacer predicciones del comportamiento de una población o universo estadística, con base a los resultados obtenidos de una muestra o fracción representativa de dicho universo.
A su vez, la estadística inferencia estadística comprende los métodos de muestreo, la teoría de estimaciones y las pruebas de hipótesis estadística

Muestreo, descripción y Tipos

Van a existir ocasiones en que no es posible o conveniente observar a todos los elementos del universo o realizar un censo por varios motivos, los cuales pueden ser:

-       No se dispone del los recursos económicos y financiero para cubrir toda la población.
-       El tiempo del cual se dispone para tomar una decisión es muy corto.
-       La población se encuentra demasiada dispersa sobre un espacio geográfico y algunos de sus elementos se encuentra en sitios remotos o de difícil acceso.
-       El proceso de observación es destructivo para el elemento observado y se hace imposible estudiar a la población completa.

Así, cuando se presenta alguna de estas circunstancias o razones de peso para el investigador, se selecciona una muestra, entendiendo por tal una parte representativa de la población. El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población.

Por lo tanto, la muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha población que son importantes para la investigación. Para que una muestra sea representativa, y por lo tanto útil, debe reflejar lo más aproximadamente, las similitudes y diferencias encontradas en la población, es decir ejemplificar las características de ésta.

Cabe destacar que con las estimaciones obtenidas a partir del uso de muestras es muy probable que se cometan algunos errores, los cuales pueden ser errores muestrales y errores ajenos al muestreo.
Los errores más comunes que se pueden cometer son:
1.    Hacer conclusiones muy generales a partir de la observación de sólo una parte de la Población, se denomina error de muestreo.
2.    Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se tomo la muestra.
3.    Error de Inferencia. En la estadística se usa la palabra población para referirse no sólo a personas si no a todos los elementos que han sido escogidos para su estudio y el término muestra se usa para describir una porción escogida de la población.

Tipos de Muestreo

Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.

Muestreo probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas.
Sólo estos métodos de muestreo probabilísticos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos se encuentra los siguientes tipos

1.    Muestreo aleatorio simple
El procedimiento empleado es el siguiente: Primero se asigna un número a cada individuo de la población y segundo a través de algún medio mecánico, ya sean bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u computadora, etc. se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que se está estudiando es muy grande.

2.    Muestreo aleatorio sistemático
Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k = N/n.

El número i que se emplea como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) puede introducirse una homogeneidad que no se da en la población.

Imagínese que se está seleccionando una muestra sobre listas de 1.000 individuos en los que los 50 primeros son varones y los 50 siguientes mujeres, si se emplea un muestreo aleatorio sistemático con k = 100 siempre se seleccionarán o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

3.      Muestreo aleatorio estratificado
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí o estratos que poseen gran homogeneidad respecto a alguna característica, se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.

De este modo, lo que se pretende con este tipo de muestreo es asegurarse que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. Tamaño geográfico, sexos, edades, entre otras.

Es por eso que la distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:
-       Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.
-       Afijación Proporcional: La distribución se hace de acuerdo con el peso o tamaño de la población en cada estrato.
-       Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica.
Tiene poca aplicación ya que no se suele conocer la desviación.

4.    Muestreo aleatorio por conglomerados
Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que se llamarán conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, un estado del país, un municipio o una parroquia, son conglomerados naturales.

En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de muestreo por áreas.
Así, el muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados, el necesario para alcanzar el tamaño muestral establecido y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.

Métodos de muestreo no probabilísticos

A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, estimaciones inferenciales sobre la población, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos.

En general, se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población.

Entre los métodos de muestreo no probabilísticos más utilizados en investigación se encuentran:

1.    Muestreo por cuotas
También denominado en ocasiones accidental. Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población o de los individuos más representativos o adecuados para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.

En este tipo de muestreo se fijan unas cuotas que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Maracay. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

2.    Muestreo intencional o de conveniencia
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras representativas mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tienen fácil acceso, los profesores universitarios emplean con mucha frecuencia a sus propios alumnos.

3.    Técnica de Bola de nieve
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones marginales, delincuentes, sectas, determinados tipos de enfermos, en aquellos casos en que las características a ser observadas o las características mismas del observado no son comunes y fáciles de encontrar en la población, como buscar músicos, lectores de cierto material bibliográfico, deportistas o amantes de ciertos deportes extremos, entre otros.

4.     Muestreo Discrecional
A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.


Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico

Tipo de Muestreo
Características
Ventajas
Inconvenientes
Aleatorio simple
Se selecciona una muestra de tamaño n de una población de N unidades, cada elemento tiene una probabilidad de inclusión igual y conocida de n/N.
Sencillo y de fácil comprensión.
Cálculo rápido de medias y varianzas.
Se basa en la teoría estadística, y por tanto existen paquetes informáticos para analizar los datos
Requiere que se posea de antemano un listado completo de toda la población. Cuando se trabaja con muestras pequeñas es posible que no represente a la población adecuadamente.
Sistemático
Conseguir un listado de los N elementos de la población
Determinar tamaño muestral n.
Definir un intervalo k= N/n.
Elegir un número aleatorio, r, entre 1 y k (r= arranque aleatorio).
Seleccionar los elementos de la lista.
Fácil de aplicar.
No siempre es necesario tener un listado de toda la población.
Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos.
Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones obtenidas a partir de la muestra pueden contener sesgo de selección
Estratificado
En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés. Para ello debemos conocer la composición estratificada de la población objetivo a hacer un muestreo. Una vez calculado el tamaño muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la población usando una simple regla de tres.
Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables seleccionadas.
Se obtienen estimaciones más precisa
Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que a la o las variables estratificadoras se refiere.
Se ha de conocer la distribución en la población de las variables utilizadas para la estratificación. 

Conglomerados
Se realizan varias fases de muestreo sucesivas (polietápico)
La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior.
Es muy eficiente cuando la población es muy grande y dispersa.
No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo.
El error estándar es mayor que en el muestreo aleatorio simple o estratificado.
El cálculo del error estándar es complejo.

Errores estándares de algunos estimadores.Fuente: Tomado de Chao, Lincoln (1999) Estadística para las Ciencias Administrativas. Colombia. McGraw-Hill. Página 196

Propiedades deseables de un estimador

Estimación de parámetros

-       Estimar: Proceso que consiste en encontrar una función de las variables aleatorias de una muestra, tal que al ser evaluada con los valores obtenidos en la selección y extracción de la muestra, da un valor que refleja adecuadamente el valor del parámetro poblacional.
-       Estimador: Es una función de las variables aleatorias que componen la muestra aleatoria y representa una característica de la población.
-       Estimación: Es una función particular de las observaciones de la muestra, es decir que es el cálculo del estimador para una muestra en particular.
La estimación estadística se divide en dos grandes grupos: la estimación puntual y la estimación por intervalos.

La estimación puntual

-       Consiste en obtener un único número, calculado a partir de las observaciones muestrales, y que es utilizado como estimación del valor del parámetro q. Se le llama estimación puntual porque a ese número, que se utiliza como estimación del parámetro q, se le puede asignar un punto sobre la recta real.

La estimación por intervalos

-       En esta estimación se obtienen dos puntos, un extremo inferior y un extremo superior, que definen un intervalo sobre la recta real, el cual contendrá con cierta seguridad, o nivel de confianza, el valor del parámetro q.
A continuación en la Figura Nº 1 se presenta un esquema de la estimación puntual, en donde la población viene representada por su función de distribución F(x; q), siendo q el parámetro poblacional desconocido que tomará valores en el espacio paramétrico W y la muestra aleatoria de tamaño n, está compuesta por las n variables aleatorias X1, X2, ..., Xn

Propiedades de un buen estimador

Para poder utilizar la información que se tenga de la mejor forma posible, se necesita identificar los estadísticos que sean buenos estimadores. En este sentido, existen cuatro criterios que se suelen aplicar para determinar si un estadístico es un buen estimador; insesgamiento, eficiencia, consistencia y suficiencia.
Es bueno destacar que además de las propiedades que se acaban de mencionar para un buen estimador, existe otra que en cierta forma comprende conjuntamente con las propiedades de insesgamiento y eficiencia. Se trata del Error Cuadrático Medio.

Error cuadrático medio

Sea T un estimador del parámetro q, el cual es desconocido. El Error Cuadrático Medio de T, denotado ECM(T), se define como el valor esperado de  (T - q)2. Esto es:
ECM(T) = E[(T - q)2]

¿Cuál es la información que proporciona el Error Cuadrático Medio?