Consultar ensayos de calidad


Nociones de probabilidad - la teorÍa de conjunto y la probabilidad, reglas de la problabilidad



Nociones de Probabilidad

Notación

|Símbolo |Significado |
|A,…, Z |Conjunto o Evento |
|a,…, z |Elementos o resultados |
|A= |Conjunto expresado por extensión |
|A = Las vocales |Conjunto expresado por comprensión |
|, |Conjunto vacio |
Complemento del conjunto A |
|, S, U |Universo, espacio muestral, población |
|n(A) |Cardinal del conjunto A: cantidad de elementos en el conjunto A |
Pertenece a |
No pertenece |
Incluye |
No incluye |
|> |Mayor |
|< |Menor|
Mayor o igual que |
Menor o igual que |
Distinto, diferente |
Por lo tanto |
Si …, entonces |
Si y sólo si |
Unión |
Intersección |
Y |
O |
Tal que, dado que |
|P(A) |Probabilidad de que ocurra el evento A |
|P(A’) |Probabilidad de que no ocurra el evento A |
|P(AB) |Probabilidad de que ocurra el evento A o el evento B |
|P(AB) |Probabilidad de que ocurra el evento A y el evento B |


|P(AB)|Probabilidad de que ocurra el evento A dado que ocurra el evento B |









FUNDAMENTOS

a‡¨ La probabilidad de un evento siempre será igual a un número positivo: P(A) > 0

a‡¨ El valor mínimo de la probabilidad de un evento es igual a 0: P(A) = 0; este se conoce como evento imposible.

a‡¨ El valor máximo de la probabilidad de un evento es igual a 1: P(A) = 1; este se conoce como evento seguro.

aଠLa probabilidad del espacio muestral es igual a la suma de las probabilidades de cada uno de los posibles resultados de un experimento y esta probabilidad siempre es igual a 1: [pic

a‡¨ La probabilidad de un evento siempre será igual a un número entre 0 y 1, inclusive:


TEORÍA DE CONJUNTO

El universo es el abecedario, U = . De este universo podemos extraer muchos conjuntos; por ejemplo, A = , B =, C = , D =

A: Conjunto A. Todos los elementos que pertenecen al conjunto A, área sombreada.







A’: Complemento del conjunto A. Todos los elementos que no están en el conjunto A y que le faltan al conjunto A para ser igual al universo, área sombreada.



A[pic]D: unión del conjunto A con el conjunto D. Todos los elementos que pertenecen al conjunto A o al conjunto D o ambos. En este caso, no hay elementos en común, área sombreada.





d) Feu una interpretació del primer i segon component (Màxim 5 línies

S’observa que per la component PC1 existeix una major correlació positiva amb la variable “Nombre d’anys de formació” i “Salari actual en milers d’euros a l’any”, mentre que per la component PC2 la correlació es majoritàriament negativa, mes elevada per la variable “Nombre de mesos a l’empresa”, seguit de la variable “Nombre de mesos d’experiència prèvia”. Per tant, la 1a component esta molt relacionada amb la qualificació i la 2a component amb l’experiència.

2.
e) Una persona proposa realitzar una anàlisi cluster amb les variables del fitxer. Quin profit creieu que s’obtindrà de fer aquesta anàlisi? (Màxim 4 línies)

L’anàlisi clúster agrupa elements que tenen propietats semblants, en base a la distància que existeix entre els elements analitzats, distància que serà el mes petita possible entre els elements del mateix grup, i la major distància possible entre els elements de diferent grup. Es dir, forma grups (clústers) que son homogenis interiorment, i el màxim de diferents entre si.

f) És correcte utilitzar totes les variables del fitxer per realitzar aquesta anàlisi? Argumenteu la vostra resposta en un màxim de 3 línies.

Les variables de la mostra son de tipus qualitatiu nominal (gènere) i quantitatiu, la qual cosa ens porta a elegir les variables adequades per presentar grups homogenis. Farem servir les variables quantitatives “nivell_educ”, “sal_actual”, “temps_emp” i “ex_pre”, i no utilitzarem la variable “gènere”.

g) Realitzeu una anàlisi cluster amb minitab d’acord amb la resposta anterior. Seleccioneu a LinkageMethod: Ward, a Distance Method: Euclidean, i a Number of Clusters: 3. (No cal presentar el resultat: Amalgamation Steps). És realment necessari, en aquest cas, procedir a la estandarització de les variables? (Màxim 3 línies sense comptar els resultats de Minitab).

Atès que les variables “temps_emp” i “ex_pre”, determinaran la distància temps en mesos, la variable “nivell_educ” la distància temps en anys, i “sal_actual” la distància de retribució anyal, cal estandarditzar-les per evitar la distorsió en el càlcul de les dissimilituds.

-------- ----- ------ ----- ----- ------
Cluster Analysis of Observations: nivell_educ; sal_actual; temps_emp; ex_pre
-------- ----- ------ ----- ----- ------

-------- ----- ------ ----- ----- ------
Standardized Variables, Euclidean Distance, Ward Linkage
-------- ----- ------ ----- ----- ------
Amalgamation Steps
-------- ----- ------ ----- ----- ------
Average Maximum
-------- ----- ------ ----- ----- ------
Within distance distance
-------- ----- ------ ----- ----- ------
Number of cluster sum from from
-------- ----- ------ ----- ----- ------
observations of squares centroid centroid
-------- ----- ------ ----- ----- ------
Cluster1 192 572,194 1,57594 5,52782
-------- ----- ------ ----- ----- ------
Cluster2 63 137,883 1,40980 2,26908
-------- ----- ------ ----- ----- ------
Cluster3 219 397,458 1,24183 2,67996
-------- ----- ------ ----- ----- ------

-------- ----- ------ ----- ----- ------
Cluster Centroids
-------- ----- ------ ----- ----- ------

-------- ----- ------ ----- ----- ------
Variable Cluster1 Cluster2 Cluster3 Grand centroid
-------- ----- ------ ----- ----- ------
nivell_educ 0,916463 -0,75913 -0,585095 0,0000000
-------- ----- ------ ----- ----- ------
sal_actual 0,736977 -0,46156 -0,513339 0,0000000
-------- ----- ------ ----- ----- ------
temps_emp 0,289867 0,10269 -0,283671 0,0000000----- ----- --------------
A[pic]C: unión del conjunto A con el conjunto C. Todos los elementos que pertenecen al conjunto A o al conjunto C o ambos. En este caso, si hay elementos en común, área sombreada.



A[pic]C: intersección del conjunto A con el conjunto C. Todos los elementos que pertenecen al conjunto A y al conjunto C, área sombreada.




LA TEORÍA DE CONJUNTO Y LA PROBABILIDAD

Probabilidad de un evento: es un valor producto de una división de dos números enteros



Espacio Muestral (S): todos los posibles resultados de un experimento.

Evento: es un resultado específico deinterés.

Experimento: acción realizada por el investigador; pregunta aplicada o variable.



Ejemplo

Experimento: lanzar un dado legal una vez y observar su resultado.

Espacio muestral: cada una de las 6 caras que tiene el dado; es decir, S =

Evento A: que salga un número menor que 3; es decir, A =

Probabilidad de que salga un número menor que 3 al lanzar un dado legal una vez: P(A)

Cantidad de resultados del evento A: n(A) = 2

Cantidad de todos los posibles resultados del experimento: n(S) = 6



Evento B: que salga un número par; es decir, A =

Probabilidad de que salga un número par al lanzar un dado legal una vez: P(B)

Cantidad de resultados del evento B: n(B) = 3

Cantidad de todos los posibles resultados del experimento: n(S) = 6



Evento C: que salga un número mayor o igual que 3; es decir, A =

Probabilidad de que salga un número mayor o igual que 3 al lanzar un dado legal una vez: P(C)

Cantidad de resultados del evento A: n(C) = 4

Cantidad de todos los posibles resultados del experimento: n(S) = 6



Evento A’: que no salga un número menor que 3; es decir, A’ =

Probabilidad de que no salga un número menor que 3 al lanzar un dado legal una vez: P(A’)

Cantidad de resultados del evento A: n(A’) = 2

Cantidad de todos los posibles resultados del experimento: n(S) = 6




REGLAS DE LA PROBLABILIDAD:

a–t Probabilidad del completo de un evento: P(A’) = 1 – P(A)

a–t Probabilidad de la unión de eventos: P(AB) = P(A) + P(B) – P(AB) (Regla Aditiva)

a–t Probabilidad de la intersección de eventos: P(AB) = P(A)*P(B); si A y B son eventos independientes (Regla Multiplicativa)

a–t Probabilidad condicional: ; si A y B son eventos dependientes





Política de privacidad