Consultar ensayos de calidad


EstadÍstica - poblaciÓn y muestra, ciclo metodolÓgico de un trabajo estadÍstico



ESTADÍSTICA

1.


INTRODUCCIÓN
El actual desarrollo científico-tecnológico de la sociedad, en casi todos sus
niveles, exige permanentemente el manejo de una gran masa de datos que por
su extensión hace prácticamente imposible el proceso de manipulación de ellos y
por tanto se dificulta enormemente los estudios y conclusiones que deben
obtenerse en cada situación concreta.
El método estadístico es uno de los procesos que utilizamos para tratar de
resolver tales situaciones y así poder efectuar el tipo de generalizaciones que nos
permitan la comprensión de un fenómeno económico, social, físico, político, etc.
La industria precisa de la información estadística para poder tomar decisiones en
materia de inversión, planeación, ventas, producción, etc.
El estado utiliza este instrumento para estimar la recaudación de impuestos, para


control de precios y de productos, para proyectar la construcción de obras de
infraestructura, para investigaciones en materia económica que le permitan
aplicar nuevas y mejoras políticas ajustadas a sus propósitos y metas. La
medicina, la química, la física, las ciencias sociales, en fin todas las áreas de la
ciencia, precisan de los conceptos y técnicas estadísticas para su desarrollo.
1.1

POBLACIÓN Y MUESTRA
Población es el conjunto mayor de personas o cosas cuyo estudio nos
interesa o acerca de los cuales se desea información. Los elementos de
este
conjunto se denominan datos u observaciones.
La población puede ser infinita, y por tanto, es imposible tener una
información completa sobre ella o si la población es numerosa y no sea
posible estudiar todos y cada uno de sus elementos, se acude a la
información proporcionada por una parte finita de dicha población
llamada muestra.
En términos matemáticos: Población es el universode la teoría de
conjuntos y muestra es un subconjunto propio finito de la población.

1.2

ESTADÍSTICA
Disciplina que nos proporciona un conjunto de métodos y procedimientos
que nos permitan recopilar, clasificar, presentar y describir datos en
forma adecuada para tomar decisiones frente a la incertidumbre o

65


Matemática II

TECSUP - PFR

predecir o afirmar algo acerca de la población a partir de los datos
extraídos de la misma.
Esta definición nos permite distinguir la Estadística Descriptiva de la
Inferencial.

ï‚· Estadística Descriptiva trata de la recopilación, clasificación,


presentación y descripción de los datos.
ï‚· Estadística Inferencial nos proporciona la teoría necesaria para
afirmar algo acerca de la población o tomar decisiones generales a
partir de los datos bajo estudio.
1.3

CICLO METODOLÓGICO DE UN TRABAJO ESTADÍSTICO
Cuando no sea posible obtener una información completa de la población
se extraen muestras representativas de dicha población mediante las
técnicas de muestreo, y en base al estudio o información obtenidas de los
datos muestrales se afirma algo acerca de la población total o se toman
decisiones generales confiables con ayuda de la Estadística Inferencial.
Este ciclo se cumple en la mayoría de las veces del quehacer estadístico

-

POBLACIÓN

Estadística
Descriptiva

(Técnicas de muestreo)

MUESTRA

MUESTRA

Estadística
Inferencial

1.4

VARIABLES
La estadística se interesa fundamentalmente en el estudio de ciertas
variables llamadas aleatorias, cuyo comportamiento lo veremos luego. Por
ahora se especificará que existen dos tipos de variables estadísticas, a
saber
Variables discretas: aquellas que solo pueden tomar valores enteros. Por
ejemplo, el número de hijos de una familia, el número de objetos
producidos por una máquina, etc.,pueden ser descritos mediante una
variable del tipo discreto:

66


TECSUP - PFR

Matemática II

x = 1, 2, 3, 4, etc.
Variables continuas: aquellas cuyo campo de variación o conjunto de
valores a tomar son números reales pertenecientes a cierto intervalo. Por
ejemplo, pesos de individuos, estaturas, medidas de longitud, diámetros
de piezas producidas por una o varias máquinas pueden ser descritos
mediante variables del tipo continuo. Así, si 1 ï‚£ x ï‚£ 2; x es una variable
que puede tomar cualquier número real comprendido entre 1 y 2 incluidos
ambos.



ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva se ocupa de la recopilación, clasificación, presentación y
descripción de los datos.
2.1

RECOPILACIÓN
Los datos pueden recopilarse de dos maneras fundamentales
a) Si se consideran todos los elementos de la población y se registran
sus características se denomina censo.
b) Si se seleccionan algunos elementos de la población, pero no todos
se denomina muestra y la información obtenida por este
procedimiento se llama por muestreo; si la recopilación de los
elementos muestrales se efectúa al azar se dice que el muestreo es
aleatorio y la muestra se denomina muestra aleatoria.
Un ejemplo de una recopilación completa o censo es el Censo Poblacional
del Perú realizado en el año 1993.

2.2

CLASIFICACIÓN
Los datos obtenidos por observación o medición suelen ser registrados en
el orden en que se recopilan. Para facilitar su interpretación y el análisis
correspondiente deben ser clasificados y esto equivale a que los datos
deben ser organizados de alguna manera sistemática o particionado en
clases bien definidas y una manera sencilla de hacerlo es ordenar los
datos según su magnitud o agruparlos de acuerdo a sus características.

2.3

PRESENTACIÓN DE DATOS
Una vez recolectados los datos y optadopor su posible clasificación es
necesario presentarlos en forma tal que se facilite su comprensión y su
posterior análisis. Para ello se ordenan en cuadros numéricos llamados
TABLAS (Tablas de frecuencias) y luego se presentan mediante GRÁFICAS

67


Matemática II

TECSUP - PFR

(de barras, sectores circulares, histograma, polígono de frecuencias, ojiva,
pictograma, etc.).
Haremos algunas definiciones en base a un ejemplo: Clasificar los
siguientes datos recopilados del número de cabezas de ganado vacuno
que posee cada una de las 40 familias de las comunidades campesinas de
la Sierra Central del Perú, tomados al azar.
1
4
0
5

2
3
0
4

0
3
4
6

3
5
9
8



5
12
0
11

1
10
1
0

0
4
3
1

8
3
13
3

1
0
1
8

2
10
3
0

ï‚· Alcance (A): es el intervalo definido por los datos de mayor y menor
valor.
En el ejemplo:

A  ï›0; 13 ï

ï‚· Intervalos de clase ( Ii ) y Límites de clase ( Li ): clasificar los
datos en k grupos equivale a particionar el alcance A en k clases o k
intervalos Ii ,donde: i=1, 2, ,k
y determinar cuántos datos
pertenecen a cada uno.

I i  ï› Li , Li 1 , i=1, 2, ,k
Los intervalos semi-abiertos por la derecha Ii se denominan intervalos de
clase.
Los Li , i=1, 2, ,k+1 se denominan los límites de clase.
El valor entero de k, fundamentalmente, depende del estadístico y/o
investigador, pero es recomendable utilizar la regla de Sturges para
determinar un valor aproximado de k

k  1  3,3logn
Donde “n” es el número total de datos disponibles.
La fórmula es un poco conservadora y nos da un número de intervalos
un poco menor del que se utiliza en la práctica. Cuando el número de
datos es menor que 100, el número de intervalos se debe tomar menor
que 10.
Para un número de datos bastante grande, el número de
intervalos es mayor que 10,la práctica aconseja los siguientes límites: 5
ï‚£ k ï‚£ 15 .
En el ejemplo
k = 1 + 3,3 log(40) = 6,286

68


TECSUP - PFR

Matemática II

Luego k podrá tomar valores enteros: 5, 6 o 7
Tomemos:

k=7.

ï‚· Ancho de Clase ( Wi ): es la longitud de un intervalo de clase.

Wi  l ( I i )  Li 1  Li
Para conseguir anchos de clase iguales (W ), como es deseable; se usa
la siguiente relación:

W 

l ( A)
, donde l ( A) es la longitud del alcance.
k

En el ejemplo:
W 

13
1
,857
7

 tomamos W = 2

ï‚· Frecuencia Absoluta (ni ): una vez decidido el valor de k y calculado
el ancho de clase. Mediante la tabulación se determina el número de
datos contenidos en cada clase y este número entero se denomina
frecuencia absoluta( ni )

ni : frecuencia absoluta de i – ésima clase .
ï‚· Distribución de Frecuencias Absolutas:
Cabezas de ganado

Tabulación

Ns de familias por
clases
Frecuencias Absolutas: ni

Intervalos de clase o
clases: Ii
[0; 2>

14

[2; 4>

9

[4; 6>

7

[6; 8>

1

[8; 10>

4

[10; 12>

3

[12; 14>

2

TOTAL

40
Tabla 1

En el ejemplo: n = 40

,k=7

69


Matemática II

TECSUP - PFR

Se verifica que:

ï‚£n ï‚£

i
1
14
k
 ni  n1  n2  n3  n4  n5  n6  n7  14  9  7  1  4  3  2  40  n
i 1

n3= 3, se lee: “la frecuencia absoluta de la tercera clase es”
Los intervalos de clase son:
I1  0;2 , I2   2; 4 , I3  ï› 4; 6  , I4  ï› 6;8  , I5  ï›8;10  , I6  ï›10;12  , I7  ï›12;14 



Los límites de clase son:
L1  0, L 2  2, L3  4, L 4  6, L5  8, L 6  10, L7  12, L8  14
Cabezas
de ganado

Ns de
familias

Marcas
de clase

Frecuencias
relativas

Frecuencias
relativas
acumuladas

Frecuencias
absolutas
acumuladas

Frecuencias
relativas
porcentuales

Frecuencias
relativas
acumuladasporcentuales

Clases
[0; 2>

ni
14

xi
1

hi
0,350

Hi
0,35

Ni
14

100hi%
35

100Hi%
35

[2; 4>

9

3

0,225

0,575

23

22,5

57,5

[4; 6>

7

5

0,175

0,750

30

17,5

75

[6; 8>

1

7

0,025

0,775

31

2,5

77,5

[8; 10>

4

9

0,100

0,875

35

10

87,5

[10; 12>

3

11

0,075

0,950

38

7,5

95

[12; 14>

2

13

0,050

1

40

5

100

TOTALES

40

1

100
Tabla 2

Sigamos con las definiciones, observando la Tabla 2:
ï‚· Marcas de Clase ( xi ): son los puntos medios de los intervalos de
clase.

xi 

Li  Li 1
2

i = 1, 2, .., k

;

L  L2 0  2
x1  1

1
2
2

70


TECSUP - PFR

Matemática II

L  L3 2  4
x2  2

3
2
2

;



x3 = 5 , se lee: “la marca de clase del tercer intervalo de clase es 5 ”
 Frecuencias Relativas ( hi ): se define: hi 

ni
n

; i = 1, 2, .., k

n
14
h1  1 
 0,350
n
40
n
9
h2  2 
 0, 225
n
40

; ..

Se verifica que:
0 ï‚£ hi ï‚£ 1
k
 hi  h1  h2  h3  h4  h5  h6  h7  0,350  0,225  0,175  0,025  0,100  0,075  0, 050  1
i 1

h3= 0,175, se lee: “la frecuencia relativa de la tercera clase es 0,175”
ï‚· Frecuencia Relativa Porcentual (100 hi%)
Nos permite contestar preguntas del siguiente tipo: sQué porcentaje
de familias, de las 40 bajo estudio, tienen 4 ó 5 cabezas de ganado?
Respuesta: 17 %
ï‚· Frecuencia Absoluta Acumulada ( Ni ):
Se define:
Ni = n1 + n2 + . + ni

;

En el ejemplo:
N1  n1  14
N2  n1  n2  14  9  23
N3  30,. N7  40

Se verifica:
0 ï‚£ Ni ï‚£ 40
Nk  N7  40

71

i = 1, 2, .., k


Matemática II

TECSUP - PFR

N 4  31, se lee: “la frecuencia absoluta acumulada hasta la cuarta
clase es 31”
ï‚· Frecuencia Relativa Acumulada( Hi ):
Se define:

H i  h1  h2   hi

ó

Hi 

Ni
; i  1, 2, , k
n

H1  h1  0,350
H2  h1  h2  0,575
H3  0,750,.. H7  1

Se verifica
0 ï‚£ Hi ï‚£ 1
Hk  H7  1

H 2  0,575, se lee: “la frecuencia relativa acumulada hasta la
2da.clase es 0,575”
ï‚· Frecuencia Relativa Acumulada Porcentual (100 Hi%):
Nos permite contestar preguntas del siguiente tipo: sQué porcentaje
de familias, de las 40 bajo estudio tienen menos de 8 cabezas de
ganado?
Respuesta: 77 %
Gráficas
Las distribuciones de frecuencias pueden ser representadas gráficamente
mediante:
a) Histogramas
Son gráficas de barras o rectángulos cuyas bases representan los
intervalos de clase y las alturas las frecuencias absolutas o relativas.

Ii

vs. ni

ó

72

Ii

vs. hi

(Fig. Ns 2)


TECSUP - PFR

Matemática II

b) Polígonos de frecuencias

x

,n ó

x

,h

i
i
i
i
Son polígonos construidos uniendo los puntos
mediante segmentos de recta, o uniendo los puntos medios de los
“techos” de los rectángulos del histograma. (Figura 3.)

ni

ni

Histograma

15

Polígono de Frecuencias

15

Fig. N°2

Fig. N°3

10

10

5

5

0

2

4

6

8

10

12

14

Ii

0

2

4

6

8

10

12

14

Ii

c) Diagramas escalonados o funciones escalonadas
Son gráficas de barras o rectángulos cuyas bases representan los
intervalos de clase y las alturas las frecuencias absolutas o relativas
acumuladas.

Ii

vs. N i

ó

Ii

vs. H i

(Fig. Ns 4)

d) Ojivas
Son poligonales asociadas a distribuciones de frecuencias absolutas o
relativas acumuladas construidas como aparece en la Figura Ns5

73


Matemática II

TECSUP - PFR

Ni
Función Escalonada

Ni

Ojiva

40

40

30
30

20
20

10

10

0

2

4

6

8

10

1214

Ii

0

2

4

6

Fig. N°4

8

10

12

14

Fig. N°5
PROBLEMAS PROPUESTOS

1. Los accidentes en una planta de papas fritas se clasifican de acuerdo con la parte
del cuerpo lesionada.
Dedos: 17
Brazos: 2

Ojos: 5
Piernas: 1

Trace un diagrama de barras

2. Los siguientes datos son velocidades (en Km/h) de 30 carros que pasaron por un
punto de control de velocidad. Clasificar estos datos convenientemente. Hallar las
tablas de frecuencias, graficar el histograma y la ojiva correspondiente a las
frecuencias absolutas.

Los siguientes datos constituyen las vidas útiles en horas de una muestra aleatoria
de 60 bombillas de luz de 100 watts:

74

Ii


TECSUP - PFR

807
660
881
766
1056
832

Matemática II

811
753
872
787
1076
863

620
1050
869
923
958
852

650
918
841
792
970
788

815
850
863
799
765
968

725
876
842
937
896
817

743
1027
851
816
740
678

703
889
837
758
891
865

844
878
822
817
1075
759

907
890
811
753
1074
923

a) Constrúyase una distribución de frecuencias con anchos de clases iguales
b)

Trácese el polígono de frecuencias sobre un Histograma de intervalos de
clases vs. frecuencias relativas.

c)

Trácese la ojiva asociada a la función escalonada representando intervalos de
clases vs. frecuencias absolutas acumuladas.

4. La siguiente tabla muestra la distribución de los empleados de una compañía
aseguradora por sueldos mensuales en nuevos soles (año 2001
Clases
menos de 450
450 a menos de 900
900 a menos de 1350
1350 a menos de 1800
1800 a menos de 2500
2500 a menos de 4250
4250 a más
TOTAL

Frecuencias
32
47
75
89
126
38
10
417a) sQué porcentaje de empleados ganan sueldos mensuales inferiores a 900
nuevos soles?. sQué porcentaje ganan 2500 nuevos soles o más?
b) sQué porcentaje de empleados ganan entre 1350 y 4250 nuevos soles?
c) Determinar los anchos y las marcas de clase.
Nota Se averiguó que el máximo haber percibido en la compañía es de 5500
nuevos soles. Si no se tiene ninguna información se asume un máximo valor
de acuerdo al problema en cuestión; así como se supondrá cero, como el
haber mínimo.
5. Para un estudio sobre resistencia de un metal, se han realizado cien experiencias
de rotura frente a la carga de un hilo del mismo grosor, y han sido anotados los
pesos límites en cada caso.

75


Matemática II

TECSUP - PFR

Cargas de rotura de un hilo en gramos
711
915
853
789
941

862
873
700
790
909

851
926
885
753
784

912
864
857
910
882

922
800
844
847
859

791
931
907
784
903

825
722
917
936
925

935
774
786
706
704

895
903
820
758
792

758
925
930
887
888

890
763
892
914
889

925
805
893
794
791

895
796
915
931
782

768
759
890
701
713

869
916
888
772
724

892
853
865
935
868

895
789
909
887
842

912
943
931
880
892

850
712
710
933
905

920
764
798
905
792

a) Reagrupar estos datos en 7 intervalos de clase de igual longitud.
b) Trácese el histograma y el polígono de frecuencias.
c) Trácese la ojiva correspondiente, y conteste
sQué porcentaje presentan una carga no menor de 770 gramos?
sQué porcentaje presentan una carga entre 800 y 900 gramos?
6. Las distribuciones cualitativas o por categorías se suelen presentar en diagramas
de sectores en la que un círculo aparece dividido en sectores proporcionales en su
abertura a las frecuencias de las categorías que representan:
a) Construir undiagrama de sectores para trasmitir la información de que (según
las cifras más recientes disponibles) en el Perú el número total de botellas de
vino consumidas provienen el 69% de ICA, el 18% de otras partes del país, el
5% se importan de Francia y el resto de otros países.
b) Dibujar un diagrama de sectores para mostrar que en un hospital de una gran
ciudad la distribución de su presupuesto es como sigue: 73% de sueldos,
honorarios profesionales médicos y bonificaciones a los empleados; 13% en
suministros y equipo médico y quirúrgico; 8% en mantenimiento, alimentación
y energía y el 6% en gastos administrativos.
7. En 1972, la población activa de Francia estaba compuesta de:
11,1% de agricultores,
10,6% de patronos,
16,5% de ejecutivos,
16,7% de empleados,
38,6% de obreros,
6,5% de personal de servicios y otras categorías.
Representar esta distribución mediante el gráfico que parezca más adecuado.

76


TECSUP - PFR

Matemática II

8.
Las pérdidas en una fábrica de papel (en miles de dólares) debidas a rasgaduras
pueden dividirse según el producto
Papel higiénico: 132
Servilletas: 43

Toallas desechables: 85
Otros: 12 productos

a) Trace un diagrama en barras.
b) sQué porcentaje de las pérdidas ocurre en la elaboración de papel higiénico
c) sQué porcentaje de las pérdidas ocurre en la elaboración de papel higiénico o
toallas desechables?
9. Los pesos de ciertos especimenes minerales, dados en la décima más cercana de
una onza, se agrupan en una tabla con los intervalos: 10,5 – 11,4; 11,5 – 12,4;
12,5 – 13,4; y 13,5 – 14,4 onzas.
a) Determine las marcas de clase.
b) sEs posible determinar a partir de los datos agrupados cuántos especimenes
minerales pesan
ï‚·
ï‚·
ï‚·
ï‚·
ï‚·

Menos de 11, 5 onzas.
Más de 11 onzas.
Al menos 12 onzas.
Cuando mucho 12 onzas.
sDe 11 a 13,5 onzas?10. La siguiente tabla muestra el número de jóvenes que obtuvieron los puntajes
señalados en una prueba de ingreso.
Puntaje

Número de Jóvenes
10

ï› 10  15
ï› 15  20
ï› 20  25
ï› 25  30
ï› 30  35

15
28
20
17

Siendo A el porcentaje de jóvenes con puntaje mayor a 20, B el porcentaje de
jóvenes con puntaje menor a 15. Señale el valor de A-B
11.
Dado el tablero incompleto de la distribución de frecuencias de las notas de 50
alumnos. Completar el tablero, con un ancho de clase constante e igual a 2.
Señale: sCuántos alumnos sacaron un puntaje menor de 10? y sQué porcentaje de
alumnos obtuvieron 12 ó más de 12 pero menos de 16?

77


Matemática II

TECSUP - PFR

ï›
ï›
ï›
ï›
ï›
ï›

Ii

xi

ni

Ni

hi %

9

,

22%

,

11

,

12

,

7

,

6%

,

12. Dada la siguiente tabla incompleta, de las frecuencias de las edades de 80
empleados:
Ii

xi

ï› 26 ,
ï›
ï›
ï›
ï›

ni

Ni

hi %
8,75%

20

,

20

,
,

44

,

18,75%

Siendo el ancho de clase constante, encontrar:
a) sCuántos empleados tienen más de 30 años?
b) sQué porcentaje del total de empleados poseen menos de 42 años?
13. En cierta fábrica se hizo un estudio sobre la edad de los trabajadores con el fin de
establecer un plan de seguro grupal. Los resultados fueron los siguientes
25

54

43

32

23

22

47

60

63

52

37

42

39

29

21

39

20

35

49

58

45

43

47

48

38

41

57

42

28

21

33

41

36

57

67

26

38

49

43

41

59

26

19

27

23

58

38

49

40

36

30

50

32

23

28

49

51

28

55

60

39

27

33

37

40

52

36

48

41

37

a) Construya una distribución de frecuencias apropiada para estos datos.
b) Conteste lassiguientes preguntas, a partir de la tabla obtenida en a):
 sCuál el ancho de clase común?

78


TECSUP - PFR

Matemática II

sCuál es el límite inferior de la tercera clase?
L3 =
sCuál es la frecuencia absoluta de la cuarta clase? n4 =
sCuál es la frecuencia relativa de la segunda clase? h2 =
sCuántos trabajadores tienen menos de 50 años? sY qué porcentaje
representan?

 sCuántos trabajadores tienen 50 años o más? sY qué porcentaje
representan?

 sQué porcentaje de trabajadores tienen entre 30 a 45 años?
Trácese el polígono de frecuencias y la ojiva correspondiente.
Los siguientes datos son las velocidades (en km/h) de 80 carros que pasaron por
un punto de control de velocidad:
60

30

31

60

45

20

34

29

35

20

40

54

38

35

27

45

40

55

45

60

49

49

85

83

30

40

46

105

29

38

102

60

80

35

28

60

82

72

63

36

70

60

31

65

34

73

68

81

65

80

25

70

108

26

24

27

40

75

43

85

120

45

39

83

65

72

46

62

43

63

60

70

100

55

50

63

64

65

61

69

Clasifique estos datos convenientemente y:
a) Muestre el histograma y el polígono de frecuencias correspondiente.
b) Diseñe la función escalonada y la ojiva respectiva.
c) Los carros con velocidades mayores a 80 km/h, son multados por exceso de
velocidad. sQué porcentaje serán multados?
d) Los carros con velocidades entre 45 y 70 km/h, van a ser considerados en
premios organizados por una compañía. sQué porcentaje serán premiados?
15. El gráfico muestra el impuesto mensual (en soles) que debe pagar una persona
según su sueldo mensual (en soles):
IMPUESTO
900

360

120

1000

2200

3400
79

4000

SUELDO


Matemática IITECSUP - PFR

sCuánto de impuesto mensual paga una persona que gana s/.1500?. sCuánto gana
una persona que paga mensualmente s/.300 de impuesto?

16. La siguiente tabla de frecuencias muestra los haberes mensuales de 200 obreros
de cierta fábrica, en nuevos soles (año2000).
Haberes mensuales

Número de obreros

Menores a 500

4

ï› 500 , 700
ï› 700 , 900
ï› 900 , 1100
ï› 1100 ,1300
ï› 1300 ,1500
ï› 1500 ,1700

60
40
48
24
14
8

más de 1700

2

TOTAL

200

Con referencia a esta tabla, contestar:
a) sQué porcentaje de obreros tienen haberes inferiores a s/.1000 mensuales?
b) sQué porcentaje de obreros tienen haberes superiores a s/.1100 mensuales?
c) sQué porcentaje de obreros tienen haberes entre 1000 a 1500 soles
mensuales?
d) Graficar el histograma, el polígono de frecuencias y la ojiva correspondientes.
2.4

DESCRIPCIÓN DE DATOS
En esta etapa nos ocuparemos del cálculo y estudio de los estadígrafos.
Estadígrafos Son números que describen alguna característica de la
muestra y se obtienen a partir de los datos muestrales o experimentales.
Existen básicamente dos tipos de estadígrafos
a) Estadígrafos de Posición: Localizan el “centro” de la distribución
de frecuencias. Se denominan también medidas de tendencia central
o de localización.
Ejemplos: media, mediana, moda, cuarteles, etc.

80


TECSUP - PFR

Matemática II

b) Estadígrafos de Dispersión: Nos indican como están dispersos los
datos con respecto a algún estadígrafo de posición. Miden el grado de
variabilidad de los datos alrededor de alguna medida de tendencia
central, por esta razón, se les denomina también estadígrafos de
variabilidad. Ejemplos: rango, la desviación media, varianza,
desviación típica, etc.
2.4.1

MEDIA ( x )
Llamada también media aritmética o promedio aritmético es un
estadígrafo que localizael “centro” de la distribución en base a
su “centro de gravedad” y se obtiene a partir de las siguientes
fórmulas.
ï‚· Para datos no clasificados:
Sean x1 , x2 ,, xn las variables matemáticas que representan
n

los datos muestrales, entonces:

x

x
i 1

i

n

ï‚· Para datos clasificados:
k

x

xn

i i

i 1

k

x   xi hi

o

n

i 1

Donde:

k : número de clases

x1 , x2 ,, xk : marcas de clase

n: número total de datos n1 , n2 ,, nk : frecuencias absolutas

h1 , h2 ,, hk : frecuencias relativas.
ï‚· Media Ponderada:
k

x

x P
i 1
k

i i

P
i 1

i

Siendo

P , P2 ,, Pk pesos asociados
1
x1 , x2 ,, xk respectivamente.

81

a

las

variables


Matemática II

TECSUP - PFR

ï‚· Media global:
Si una muestra de tamaño n se particiona en k submuestras
y

x1 , x 2 ,, x k son las medias de las k submuestras de
tamaños n1 , n 2 ,, n k respectivamente.
k

Entonces: x 


i 1

ni xi
n

se denomina la media global de la

muestra particionada.
Ejemplos:
ï‚· Media de datos no clasificados:

x1  9 ,

x2  5 ,

x3  3 ,

x4  10 ,

x5  8

5
 xi
x  x2  x3  x 4  x5 9  5  3  10  8
x  i 1  1

7
5
5
5

ï‚· Media de datos clasificados:
Halle la velocidad media de los 30 carros que pasaron por un
punto de control de velocidad, del problema 2.
Use las fórmulas que incluyen frecuencias absolutas y
relativas.

Intervalos de clase

ni

xi

xi ni

hi

xi hi

[10, 26
[26, 42
[42, 58
[58, 74
[74, 90
[90, 106
Total

4
12
7
4
2
1
30

18
34
50
66
82
98

72
408
350
264
164
98
1356

0,133
0,400
0,233
0,133
0,067
0,033
1

2,394
13,600
11,650
8,778
5,494
3,234
45,15

Tabla 3

82


TECSUP - PFR

Matemática II

 xini
1356
i 1x

 45, 2
n
30

o

x   xihi  45,15
i 1

ï‚· Media ponderada:
Notas

xi

Pi

xi Pi

05
13

1
3

5
39

4

Ex. Parcial
Ex. Final

Pesos

44

Tabla 4

k
 xiPi
44
x  i 1

 11
k
4
 Pi
i 1

ï‚· Media Global:
Si una muestra de tamaño 60 se particiona en 5 submuestras de tamaños 8, 18, 12, 9, 13 con medias
15,14,12,8,11 respectivamente. Entonces, la media global
será
 xini
8 * 15  18 * 14  12 * 12  9 * 8  13 * 11 731
i 1
x


 12,18
n
60
60

2.4.1.

MEDIANA

(Xm)

La mediana es un valor que divide a un conjunto de
observaciones ordenadas en forma ascendente o descendente
en dos grupos de igual número de observaciones.
ï‚· Para datos no clasificados
Sean

x1 , x 2 ,, x n los datos
x1 ï‚£ x 2 ï‚£ ï‚£ x n . Entonces

83

muestrales

tales

que


Matemática II

TECSUP - PFR




Xm  




x n 1

; si n es impar

2

1
( xn  xn  2 )
2 2
2

; si n es par

En palabras: una vez ordenados los datos en orden creciente
(o decreciente) de sus magnitudes:
Si n es impar, la mediana es el valor del dato que equidista
de los extremos.
Si n es par, la mediana es el promedio aritmético de dos
datos consecutivos equidistantes de los extremos.
Ejemplos:
Hallar la mediana de los siguientes conjuntos de datos:

Previamente ordenamos los datos:
x1  3

x2  6

x3  9

x 4  10

x5  14

como n es impar ( n = 5 )

X m  x 5  1  x3  9
2


Previamente ordenados los datos:
x1  5

x2  10

x3  17

x 4  21 x5  29

como n es par ( n = 6 ) Xm  19
ï‚· Para datos clasificados:
Está dada por la fórmula:

n

  N m 1 

X m  Lm  Wm  2
 nm






84

x6  43


TECSUP - PFR

Matemática II

donde:

Lm

: Límiteinferior de la clase mediana (*)

n

: Número total de datos

N m 1 : Frecuencia

absoluta

acumulada

hasta

la

clase

inmediata
m 1

anterior a la clase mediana

N m 1   n i
i 1

nm

: Frecuencia absoluta de la clase mediana.

Wm

: Ancho de clase de la clase mediana

Wm  Lm 1  Lm

Clase Mediana
Es el intervalo de clase que contiene el dato que ocupa la
posición media o central. Se identifica observando las
frecuencias acumuladas absolutas o relativas y es aquella que

n
hasta ese nivel acumuló la mitad del número total de datos
ó 0,5) o superó por primera vez a la mitad.
Clase mediana=

[ Lm , Lm 1 ;

X m  [ Lm , Lm 1 

Ejemplo:
Velocidades en Km/h
[10, 26
[26, 42
[42, 58
[58, 74
[74, 90
[90, 106
Total

ni
4
12
7
4
2
1
30

Ni
4
16
23
27
29
30

Hi
0,133
0,533
0,766
0,899
0,966
1

Tabla 5

n 30

 15
2
2

La frecuencia absoluta acumulada correspondiente a la segunda
clase (N2 = 16), supera por primera vez a 15; o la frecuencia
relativa acumulada a la segunda clase (H2 = 0,533), supera por
primera vez a 0,5.

85


Matemática II

TECSUP - PFR

Luego la clase mediana es [26 >.

Lm  26

n = 12

Wm  16
nm  12
N m 1  4
 30

ïƒS 2  4ïƒs
Xm  26  16 ïƒS
ïƒs  40,67
ïƒS 12 ïƒs
ïƒS
ïƒs


Ni
30
25
20
15
10
5

10

26

42

58

74

90

106

Ii

MEDIANA COMO UNA MEDIDA DE TENDENCIA CENTRAL
MÁS REPRESENTATIVA
La media es un estadígrafo bastante sensible a los valores
extremos y como medida del “centro de gravedad” de la
distribución tiende a inclinarse a los datos de mayor valor. Si
existen valores extremos que difieren considerablemente del
resto no localiza como se debe el “centro” de la distribución. En
tanto que la mediana por no ser sensible a los valores extremos
ylocalizar el “centro” de la distribución en base a la posición
central que ocupa resulta siendo mejor que la media o más
representativa en el sentido que localiza mejor el “centro” de la
distribución; pero, en general, la media es más representativa
que la mediana, como estadígrafo de localización:
Ejemplo:
Un empleador dice que el promedio mensual de salario pagado
a los ingenieros de su firma es de 3 500, esto sugiere que esta
86


TECSUP - PFR

Matemática II

firma paga bien. Sin embargo, un examen posterior indica que
se trata de una pequeña compañía que emplea 5 jóvenes
ingenieros con 1 000 soles de haber mensuales c/u y la renta
del ingeniero Jefe es de 16 000 soles mensuales.
sUd. puede seguir afirmando que la firma paga bien?. No.
Halle la mediana y compare, scuál de los estadígrafos es más
representativo?

X  3500;
x1  1000,

x2  1000,

x3  1000,

x 4  1000,

x5  1000,

x6  16 000

X m = 1000
En este caso, la mediana es la más representativa en el sentido
que localiza mejor que la media el “centro” de los datos bajo
consideración.
Existe un valor extremo bastante discrepante o exagerado
( x6  16 000).
USOS DE LA MEDIA ARITMÉTICA
ï‚· La media de la muestra se usa cuando se necesita una
medida de tendencia central que no varíe mucho entre una y
otra muestra extraída de la misma población, esta es la
razón para preferirla cuando se desea la máxima
confiabilidad en la estimación de la media poblacional.
ï‚· También se usa la media cuando la distribución de
frecuencias de los datos es simétrica o tiene poca asimetría.
ï‚· Se calcula la media cuando en un estudio también se debe
calcular la varianza o la desviación estándar.
USOS DE LA MEDIANA
ï‚· Se prefiere a la mediana como medida de concentración,
cuando en los datos existen valores extremos muy grandes o
muy pequeños, osea, valores muy altos o muy bajos que
obligan a la media aritmética a desplazarse a la derecha o
izquierda del punto medio de la distribución. En cambio la
Mediana siempre señala al punto que divide a los datos en
dos partes iguales: 50% a un lado y 50% al otro, sin
importar donde se halle ese punto.
ï‚· Cuando simplemente necesitamos conocer si los datos que
nos interesan están dentro de la mitad superior o inferior de
87


Matemática II

TECSUP - PFR

la distribución de los datos y no tiene importancia saber
particularmente su alejamiento con respecto al centro de la
distribución.

2.4.2

MODA (

Mo )

La moda es un valor de la variable que tiene la más alta
frecuencia, esto es, es el valor más frecuente de la distribución.
Si la distribución de frecuencias tiene un solo máximo (máximo
absoluto), se dice que la distribución es unimodal; en cambio si
tiene más de un máximo (máximos relativos), se dice que la
distribución es multimodal.
Si todas las frecuencias son iguales se dice que la distribución
no tiene moda y se trata de una distribución uniforme.
a) Para datos no clasificados
ï‚· Determinar la moda del siguiente conjunto de datos
2, 2, 3, 4, 5, 5, 6, 7, 7, 7, 9, 9, 12.
La moda es el número 7 porque es el dato más repetido
(3 veces).
Esta distribución se llama unimodal porque sólo posee
una moda.

ï‚· El siguiente conjunto de datos no tiene moda.

Porque ninguno de ellos está repetido
ï‚· 3.-La siguiente distribución es bimodal es decir, tiene dos
modas
8, 9, 9, 13, 13, 13, 18, 20, 24,24,24, 33, 59, 78, 78.
Mo = 13 y también Mo = 24
ï‚· La siguiente distribución es trimodal
4, 8, 8, 8, 8, 15, 15, 15, 20, 20, 21, 21, 21, 21,32, 40,
40,40, 40, 80, 80, 90.
Mo = 8, Mo = 21, Mo = 40 Tiene tres modas.

88


TECSUP - PFR

Matemática II

b) Para datosclasificados

 ï„1
M o  Li  W i 
ïƒ§ï„ ï€«ï„
2
 1






I i  [ Li , Li 1  : clase modal, es aquella que tiene la
frecuencia máxima

Li : límite inferior de la clase modal.
Wi : ancho de la clase modal
ï„ 1  ni  ni 1 : exceso de la frecuencia modal sobre la
frecuencia de la clase contigua inferior.

ï„ 2  ni  ni  exceso de la frecuencia modal sobre la
frecuencia de la clase contigua superior.
Ejemplo
Determinar la moda de la siguiente distribución de
frecuencias:

Ii

ni

[12,5
[20,5

20,5
28,5

1
8

[28,5
[36,5
[44,5
[52,5

36,5
44,5
52,5
60,5

22
26
20
12

[60,5 68,5
[68,5 76,5
TOTALES

6
5

Tabla 6

La clase modal será: I = [36,5; 44,5 
Además es una distribución unimodal.
ï„1 =

26 -22 = 4

ï„2 =

26 -20 = 6

89


Matemática II

TECSUP - PFR

 ï„1 
 4 
Mo  36,5  W 
  36,5  8 
  39,7
4 6
 ï„1  ï„2 

ni

25
20
15
10
5

12,5 20,5 28,5 36,5 44,5 52,5 60,5 68,5 76,5
39,7

2.4.2

CUARTILES (QI)
Son medidas de posición que dividen en cuatro partes iguales al
conjunto de valores ordenados en una distribución de
frecuencias. Estas medidas son: el primer Cuartil Q1, el segundo
Cuartil Q2 y el tercer Cuartil Q3
25%

Q1
25%

Q2

Q3
75%

Las fórmulas para calcular los cuartiles se derivan de la fórmula
utilizada para calcular la mediana y los pasos para el cálculo
son los mismos:
Para el primer cuartil:

Para el tercer cuartil:

n

  N i 1 

Q1  Li  Wi  4
 ni






 3n

 N i 1 


Q3  Li  Wi  4
ni







90

Ii


TECSUP - PFR

Matemática II

Ejemplo
A partir de la siguiente tabla determinar el 25% inferior y el
25% superior.
Altura en
pulgadas
[60, 63

ni

Ni

Hi

5

5

0,05

[63, 66

18

23

0,23[66, 69

42

65

0,65

[69, 72

27

92

0,92

[72, 75

8

100

1

TOTALES
Tabla 7

Para determinar el 25% inferior debemos calcular el primer
cuartil.
Para determinar el 25% superior debemos calcular el tercer
cuartil
Cálculo de Q1 :
n 100

 25
4
4

.Luego tomamos la clase: I = [66; 69 

Luego:
 100

 4  23 
Q1  66  3 
  66,14
42







Cálculo de Q3 :
3n 3x100

 75
4
4

.Luego tomamos la clase: I = [69; 72  

Luego:
 3x100

 4  65 
Q3  69  3 
  70,11
27







91


Matemática II

TECSUP - PFR

2.4.3.

DECILES ( DI )
Son medidas de posición que dividen en 10 puntos iguales al
conjunto de los valores ordenados de una distribución de
frecuencias. Estas medidas son: el primer decil D1, el segundo
decil D2 y así sucesivamente hasta el noveno decil D9.
El primer decil distribuye al lado izquierdo el 10% de los datos y
al otro lado el 90%, es decir, ocupa la posición n/10.
En igual forma para los demás deciles hasta el noveno decil
9n/10 que deja a la izquierda el 90% de los datos y a la
derecha el 10%.
30%

D1

D2

D3

D4

10%

D5

D6

D7

D8

D9

90%

ï‚· Entre cada dos deciles consecutivos debe encontrarse
comprendido el 10% del número de datos.
La fórmula para calcular deciles es

 rn

  N i 1 

Dr  Li  Wi  10

ni





Donde:
Dr = el decil buscado.
Li = límite inferior del intervalo donde se halla el decil buscado
r = indica el decil. Por ejemplo si queremos el tercer decil  r
= 3.
rn
 indica la situación del decil, es decir, la clase donde está el
10
decil

Los demás signos: n , Ni-1 , Wi , ni tienen los mismos
significados que para el caso de la mediana.
Ejemplo
Se presenta la distribución de frecuencias de los puntajesobtenidos por 250 alumnos en una prueba de rendimiento de

92


TECSUP - PFR

Matemática II

Física.
Determinar qué puntajes deben tener los que se hallen
en el 20% inferior y cuáles puntajes los que se encuentren en
el décimo superior.

Intervalos

ni
4

14

18

32

25

57

46

103

53

156

37

193

29

222

18

240

10

Totales

4

10

ï›40; 45
ï›45; 50
ï›50; 55
ï›55; 60
ï›60; 65
ï›65; 70
ï›70; 75
ï›75; 80
ï›80; 85
ï›85; 90

Ni

250

250
Tabla 8

Primero debemos determinar el segundo decil a fin de
determinar el 20% inferior.
Cálculo de D2:
2n 2x250

 Luego el segundo decil está en la clase: I
10
10
= [55, 60 

 50  32 
  58, 6
 25 

Por fórmula: D  55  5 

Para hallar los que se encuentran en el décimo superior
calculamos el noveno decil.
Cálculo de D9:
9n 9x250

 225 ; Luego el noveno decil está en la clase: I
10
10
= ï›80; 85 

 225  222 
  80,83
18



Por fórmula: D  80  5 

93


Matemática II

TECSUP - PFR

CARACTERÍSTICAS DE DISPERSIÓN
Las dos siguientes series de datos:
95
50

97
75

100
100

103
125

105
150

Tienen la misma media aritmética y la misma mediana (100).
Sin embargo difieren profundamente. Lo que las hace
diferentes es lo que, en estadística, se llama dispersión; la
segunda serie es mucho más dispersa que la primera.
Es pues importante resumir una serie estadística no sólo por
características de tendencia central, sino por características de
dispersión.
Veremos de dos tipos: las ligadas a la media
desviación típica; las ligadas a la mediana: intervalo
intercuartílico, intervalo interdecílico.
2.4.3

MEDIDAS DE DISPERSIÓN
2
ï‚· Varianza ( S x ó V( x ) )

Se define:

V( x )

 n
2
  ( xi  x)
 i 1

2
n
 Sx   k
  ( xi  x) 2 ni
 i 1
n


, datos no clasifcados

, datos clasificados

Se interpreta como la media aritmética de los cuadrados de
las desviaciones de las xi con respecto a x .
A menudo el cálculo de la varianza es muy laborioso, sobre
todo si la media no es entera, para facilitar los cálculos
podemos usar una segunda forma:
k

V( x ) 

n x

2
i i

i 1

n

2

 x ; datos clasificados

ï‚· Desviación Típica

S x 

S x  V( x )
Una idea sencilla del significado de la desviación típica se
obtiene cuando se comparan dos series de la misma

94


TECSUP - PFR

Matemática II

naturaleza: la que posee una desviación típica más alta es la
más dispersa.
ï‚· Coeficiente de variación (C.V.

C.V . ½

Sx
x

Generalmente se expresa en porcentajes. Es útil para la
comparación en términos relativos del grado de
concentración en torno a la media de dos distribuciones
distintas.
ï‚· Rango o extensión (e
Indica la extensión del intervalo en donde se halla toda la
población estudiada.
e = Lk – L1 =l(A)
Por ejemplo de la Tabla Ns8, tenemos e = 90 - 40 = 50
ï‚· Rango interdecílico = D9 – D1
ï‚· Rango intercuartílico = Q3 – Q1
Por ejemplo, a partir de la tabla Ns8, tenemos:
Rango intercuartil = 74,26 – 60.97 = 13,99
Rango interdecílico = 80,83 – 53,06 = 27,77
ASIMETRÍA
Es la deformación horizontal de las curvas de frecuencias.
Cuando la curva está inclinada o alargada hacia la derecha se
denomina asimetría a la derecha o asimetría positiva (Fig.1).

Observamos que la media aritmética queda hacia el lado más
largo (el derecho) y que x  X m  M o .
Cuando la curva está inclinada o alargada al lado izquierdo se
denomina asimetría a la izquierda o negativa (Fig.2).
Notamos
que la media aritmética está del lado más largo (el izquierdo) y
que x  X m  M o .

95


Matemática II

TECSUP - PFR

En laFig.
3 observamos que la curva está igualmente inclinada
a los dos lados por eso se llama curva simétrica.
En este caso

x  Xm  Mo

Fig. 1

Fig. 2

Mo Md x

Fig. 3

x Md Mo

x
Md
Mo

Primer coeficiente de Asimetría de Pearson

AS1 

Media  Moda
desviación estándar

AS1 

x  Mo
Sx

Notar que el valor del Primer coeficiente de Asimetría de
Pearson nos indica el tipo de asimetría que tendrá la curva.
Ejemplo
Considerando la tabla del Problema 1, calcular: la varianza, la
desviación típica, el coeficiente de variación, el rango, el rango
intercuartil, el rango interdecílico y con ayuda del primer
coeficiente de Pearson indicar que tipo de asimetría presenta al
curva.

xi  X 2 ni
ï›10; 26
ï›26; 42
ï›42; 58
ï›58; 74
ï›74; 90
ï›90;106
Tabla 9

96

ni xi2


TECSUP - PFR

Matemática II

11852,8
V(x) 
 395,09
30
S x  395,09  19,88

Sx

19,88
C.V. 

 0, 44
45,2
X

73144
V(x) 
 45, 22  395,09
30
1356
X
 45, 2
30
 8 
M0  26  16 
  35,85
8 5

e  l(A)  105  10  95
 30

 4 4
Q1  26  16 
  30,67
 12 





 90

 4  16 
Q3  42  16 
  56,86
7






RIQ  Q3  Q1  56,86  30, 67  26,19

 30

 10  0 
D1  10  16 
  22
 4 





 270

 10  23 
D9  58  16 
  74
4







RID  D9  D1  74  22  52

AS1 

AS1 

X  Mo
Sx

45, 2  35,85
 0, 47
19,88

Asimetría a la derecha o positiva.

97


Matemática II

TECSUP - PFR

PROBLEMAS PROPUESTOS
1.


Si el salario promedio semanal de n obreros es de 150 soles y cada obrero recibe
un aumento general de 7,5 soles semanales y una bonificación semanal del 1,5%
del salario incrementado.
sCuál es el salario promedio actual semanal de los obreros?



En unafábrica trabajan 20 mujeres y 45 hombres, el salario promedio semanal
de las mujeres es de 100 soles y el de los hombres 120 soles.
sCuál es el promedio del salario semanal de todos los trabajadores de la fábrica?



Para los siguientes datos:
55.31

81.47

64.90

70.88

86.02

77.25

76.76

84.21

84.92

90.23

78.01

88.05

73.37

87.09

57.41

85.43

74.76

86.51

86.37

76.15

88.64

84.71

66.05

56.02

83.91

a)
b)
4.

Calcular la mediana antes de clasificar los datos.
Agrupar los datos en una tabla de frecuencias cuyas marcas de clase sean
60, 70, etc. y calcular la desviación típica y la mediana.

El salario medio semanal pagado a los trabajadores de una compañía es de 300
soles. Los salarios medios semanales pagados a hombres y mujeres de la
compañía son 315 y 240 soles respectivamente. Determinar el porcentaje de
hombres y mujeres que trabajan en la compañía.

Un estudio final realizado determinó que existen 800 trabajadores, sCuántos son
hombres?



En una sección de matemática 24 estudiantes llevan el curso por primera vez, 6
llevan por segunda vez y 2 por tercera vez. Se sabe que 12 es el promedio de
notas de los que llevan por primera vez y que las notas de los que llevan por
segunda vez en promedio son superiores en un 10% de los que llevan por
primera vez.
Calcular el promedio de notas de los que llevan el curso por tercera vez si la
suma total de las notas es de 390.



Se tiene la siguiente información sobre la distribución de frecuencias de 100
elementos de un material sometido a prueba de ruptura (en kg/cm2).
La longitud de los intervalos de clase es constante:

98


TECSUP - PFR

Matemática II

Ii

ï›
ï›
ï›
ï›
ï›
ï›

ni

Ni

xi
30

,

ni xi2

600
800

,
46

,
,

xi ni

700

34
880,120
,

TOTALES

a) Determinar la media, la mediana y los cuartiles de la distribución.
b) El Ns de datos que estima pertenezcan al intervalo [media, mediana].
c) La desviación estándar.
d) El intervalo interdecílico. Precisar el significado del resultado obtenido.


100 elementos de un material determinado fueron sometidos a prueba de ruptura
por compresión (obteniéndose los resultados en kg/cm2).
Cuando se acudió a la tabla de cálculos que el operador debió confeccionar se
encontró solamente lo siguiente
Ii

ï› ,
ï› 12.5 ,
ï› ,
ï› ,
ï› , 72.5

ni

Ni

xi
10

xi ni

ni xi2

180
42

30

360
750

98
120

TOTALES

a) Determinar la media, la moda y el valor mediano.
b) El coeficiente de variación.
c) El primer coeficiente de Pearson. sQué puede afirmar acerca de la asimetría?
d) El intervalo intercuartílico. Precisar el significado del resultado obtenido.

99


Matemática II

8.


TECSUP - PFR

Una máquina llena automáticamente paquetes de tabaco.
Se extrae una muestra
de la producción; tras su pesado, se obtiene
Pesos de los paquetes de tabaco
Pesos en gramos
menos de 38
menos de 39
menos de 39,5
menos de 40
menos de 40,5
menos de 41
menos de 41,5
menos de 42
menos de 42,5
menos de 43
menos de 44

Cantidades
0
3
8
18
31
51
69
84
95
99
100

más de 44

0

a) Trazar el histograma de esta serie estadística.
b) Construir una nueva tabla, dando las frecuencias por clases de amplitud 2
gramos. Trazar el histograma representativo. sQué se puede deducir de la
comparación de los dos histogramas?

c) Calcular la media, la mediana y la desviación típica de la distribución de los
pesos de los paquetes de tabaco.
d) Utilizando los datos agrupados por clases de amplitud 2 (b), repetir los
mismos cálculos. sQué se puede deducir de ello?
9.

Sea lasiguiente distribución de lados X en mm medidos en 10 piezas: 1,20 – 2,40
– 6,00 – 7,20 – 12,00 – 13,20 – 16,80 – 21,60 – 22,80 y 25,20 mm.
a) Determinar la media x y la desviación típica Sx de la variable X.
b) Tras emplear el cambio de variable Y  5 X  54  / 6 determinar la media y y
la desviación típica Sy de la nueva variable Y.

10

Los siguientes datos son las temperaturas registradas en grados Farenheit:
415

510

460

475

420

490

480

450

435

485

470

465

500

455

435

100


TECSUP - PFR

Matemática II

Encontrar x y Sx a partir de los datos.
11

Dada la siguiente gráfica de la distribución de salarios básicos de 90 trabajadores
de una fábrica, donde el haber básico mínimo es de 650 soles y el haber básico
máximo es de 3150 soles. Determinar
a) La moda, la desviación típica.
b) El coeficiente de variación.
c) El coeficiente de Pearson.
d) El decil D4 y el cuartil Q3.

Ni
90

90
83
72

75
60
45

45

30

15

9

Ii
650

12.


1150

1650

2150

2650

3150

La siguiente tabla muestra la distribución de salarios de 150 trabajadores de
TECSUP durante el mes de Abril del año 2001.
Haberes

Número de
trabajadores
15
24
29
38
24
20

ï› 600 , 900 
ï› 900 , 1400 
ï› 1400 , 1700 
ï› 1700 , 2100 
ï› 2100 , 2400 

ï› 2400 , 2600



Por incremento del costo de vida se plantean dos alternativas de aumento para el
mes siguiente. La primera propuesta consiste en un aumento general de 350
soles mensuales.

101


Matemática II

TECSUP - PFR

La segunda propuesta consiste en un aumento del 30% de los salarios de Abril a
los trabajadores que ganan menos de 2100 soles y del 5% a los trabajadores que
ganan más de 2100 soles y un aumento adicional de 100 soles para todos los
trabajadores.
a) sCuál de las propuestasconvendría a los trabajadores?
b) Para los trabajadores que ganan menos de 2100 soles sQué propuesta les
convendría?
13

El ingreso percápita anual de un país es de 9000 dólares. El sector obrero que
1
constituye el 60% de la población percibe 5 del ingreso total. Calcular el ingreso
percápita del sector no obrero.

14.

La producción de la fábrica A es el triple de la de B y la de ésta 18% inferior a la
de C. Si los costos unitarios correspondientes, todos inferiores en 20% de sus
respectivos precios de venta son:
200, 240 y 260. Se pide calcular el precio medio de venta.

15

Se da la clasificación de un grupo de niños por estaturas:
Estatura (en cm)

ni

80 a menos de 90 cm
90 a menos de 95 cm
95 a menos de 100 cm
100 a menos de 105 cm
105 a menos de 110 cm
110 a menos de 120 cm
TOTALES

3
15
22
18
12
5

ni xi2

xi ni

xi

a) Calcular la media y la desviación típica S de la distribución de los niños por
estaturas.
b) Determinar la mediana de estas observaciones.
c) sCuál es la moda de la distribución?
d) sCuál es la proporción de niños que tienen una estatura comprendida entre
x  2S y x  2S ?
16

Sea
la distribución de salarios (en nuevos soles) de 20 trabajadores de una
compañía (año 2000)

xi

150

300

420

570

ni

3

11

4

2

102


TECSUP - PFR

Matemática II

Hallar x y S x
17.

Se tiene la siguiente tabla de frecuencias de los pesos de 200 objetos de similar
confección, cuya distribución es simétrica: sCuántos objetos tienen pesos
comprendidos entre 15 y 20Kg?
Pesos

ï› 10 ,
ï› ,
ï› ,
ï› ,
ï› 18 ,
ï› ,

ni

Ni




100 hi %
13%

a




b

142




c

TOTALES

sCuánto resulta a+b-c?
Nota el ancho de clase es constante

3.

ANÁLISIS DE DATOS BIVARIADOS
Hemos estudiado ahora datosprovenientes de una sola variable, sin embargo
con frecuencia es necesario analizar respecto a la relación entre dos variables.
La
relación entre dos variables puede darse de la siguiente manera:
Cualitativa vs cualitativa
Cualitativa vs cuantitativa
Para el segundo caso “cualitativa vs cuantitativa” puede trabajarse la variable
cuantitativa con sus datos originales o puede elaborarse intervalos y analizarlo
como el primer caso “cualitativa vs cualitativa”.
Cualitativa vs cualitativa
Supongamos que se toma una muestra de tamaño “n” de una población que se
está investigando.

Sean X e Y las variables a estudiar, tal que los datos obtenidos son:
( X1,Y1 ),( X2,Y2), ….,( Xn,Yn).

103


Matemática II

TECSUP - PFR

Distribución conjunta y marginal
La tabla de frecuencia que agrupa a esta información se conoce “tabla de
contingencia“. Por ejemplo, para el caso de dos variables cualitativas con dos
modalidades o categorías, la tabla sería
Y
Categoría 1 Categoría 2

Total

Celda

Celda

Total marginal

f11

f12

f1.

Celda

Celda

Total marginal

f21

f22

f2.

Total

Total

Total de

marginal

marginal

individuos

f.1

f.2

n

Categoría 1

Categoría 2

Total

Distribución Marginal
Cuando sólo interesa conocer la frecuencia de ocurrencia de cada una de las
variables por separado se habla de Frecuencia Marginal de la variable.
Por ejemplo:

SEXO

HábitosdeFum
ar
SI
NO

Total

VA
RON
MU
JER

DIS IBU
TR CION
C
ONJUN
TA

DISTR CION
IBU
MA INA
RG L

Total

DIS IBU
TR CION
MA
RGINA
L

Tam
año
de
m
uestra

sCuántas variables tenemos?
………………………………………………………………………………………………………..

104


TECSUP - PFR

Matemática II

sCuáles son?

………………………………………………………………………………………………………..
Ejemplo 1:
Frecuencia absoluta: conjunta y marginal
SEXOSI

VARON

Hábitos de Fumar
NO

Total

800

2000

3000

1800

Total

2000

1000

MUJER

1200

3200

5000

Frecuencia relativa: conjunta y marginal

Categoría
variable X

Categoría
variable X

Total

Categoría

Categoría

variable Y

variable Y

f11

f12

n

n

f21

f22

n

n

Total

X/Y

Total

Total de

marginal

marginal

indivíduos

f.1/n

f.2/n

n/n

Total
Total
marginal
f1./n
Total
marginal
f2./n

105


Matemática II

TECSUP - PFR

H itosd um r
áb
eF a
S
I
N
O
0.16
0
.24
0.20
0
.40
0.36
0
.64

SEX
O
VR N
AO
M JE
U R
To
tal

To
tal
0.40
0.60
1

Frecuencia Condicional
Cuando se “pregunta” por la frecuencia relativa de una de las variables, digamos
X, restringida a los elementos observados de una clase dada de la otra; esto es,
estudiar el comportamiento de una variable dado un valor fijo de la otra.
Y
Categoría

Categoría

variable Y

variable Y

Categoría 1

f1 / f.1

f12/f.2

Categoría 2

f21/f.1

f22/f.2

Total

1

1

EJERCICIO
En la ciudad de Lima se ha incrementado durante los últimos cinco años el
número de restaurantes de comida rápida. Debido a esto los expertos la empresa
de investigación de mercado Consultores-ECE se pregunta. sLa preferencia de un
cliente por la comida rápida tiene que ver la edad? La empresa eligió una
muestra aleatoria de 500 clientes de comida rápida mayores de 16 años y se les
preguntó su restaurante favorito, obteniéndose los siguientes datos
Grupo de
edad
16 - 21
21 - 30
30 - 49
50 a más

Kentuky
75
89
54
21

Restaurant
McDonalds Burger-King
34
10
42
19
52
28
25
7

Otro
6
10
18
10

sCuáles serán las conclusiones que llegarán los expertos de la empresa
Consultores-ECE?

106




Política de privacidad