1.5. Algoritmo A Priori Parte I

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

Algoritmo A-

Priori: Parte I
Curso Minería de Datos

Img. 0 Objetos
Supermercado
Fuente Img. 0: Creación Propia

1
Objetivos

◉ Aprender un algoritmo
para encontrar reglas de
asociación con un mínimo
soporte y confianza

online.ing.puc.cl
Fuente Img. 1: https://static.pexels.com/photos/356079/pexels-photo-356079.jpegxf

Algoritmo Apriori

◉ Algoritmo Apriori (Agrawal, 1994):


○ Para encontrar reglas de
asociación X -> Y
Primero debemos encontrar los
itemsets frecuentes {X, Y}

online.ing.puc.cl

2
Encontrar Itemsets

◉ Posible idea: Obtener todos


los itemsets posibles y para
cada uno de ellos contar su
frecuencia dentro de los
datos

online.ing.puc.cl

Itemset Lattice
Null

A B C D E

AB AC AD AE BC BD BE CD CE DE

ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE

ABCD ABCE ABDE ACDE BCDE

ABCDE

online.ing.puc.cl
Fuente Img. 2: Creación propia

3
Encontrar Itemsets

◉ ¿Cuántos itemsets posibles


existen?

online.ing.puc.cl

Encontrar Itemsets

◉ ¿Posibles Itemsets con 3 items?

online.ing.puc.cl

4
Encontrar Itemsets

◉ ¿Posibles Itemsets con 3 items?

online.ing.puc.cl

Encontrar Itemsets

◉ ¿Posibles Itemsets con 3 items?

online.ing.puc.cl

5
Encontrar Itemsets

◉ ¿Posibles Itemsets con 3 items?

online.ing.puc.cl

Encontrar Itemsets

◉ ¿Posibles Itemsets con 3 items?

1 4 7

2 5

3 6

online.ing.puc.cl

6
Encontrar Itemsets

◉ ¿Posibles Itemsets con n items?


○ n items -> 2n-1 itemsets
posibles
○ Por ejemplo: 3 items:
23-1 = 7

online.ing.puc.cl

Encontrar Itemsets

◉ ¿Cuán grande es 2n-1?

◉ La idea de generar todos los


posibles itemsets no es
viable en la práctica :(

online.ing.puc.cl

7
Principio de Monotonicidad

◉ Si un itemset es frecuente,
entonces todos los
subgrupos de éste también
son frecuentes

online.ing.puc.cl

Principio de Monotonicidad

◉ Si un itemset NO es
frecuente, entonces
cualquier conjunto que
contenga a este itemset
tampoco lo será

online.ing.puc.cl

8
Principio de Monotonicidad
Ejemplo

Compra 1 Compra 2 Compra 3

s{Pera, Manzana}=2/4

umbral mínimo = 3/4


Compra 4
Fuente Img. 3:
https://c.pxhere.com/photos/ce/7c/apple_food_fruit_healthy-944141.jpg!d
https://images.pexels.com/photos/52533/orange-fruit-vitamins-healthy-eating-52533.jpeg?cs=srgb&dl=citrus-citrus-fruit-close-up-52533.jpg&fm=jpg
https://c1.staticflickr.com/4/3817/11844779764_24a6ea00a0_b.jpg
https://cdn.pixabay.com/photo/2014/09/04/05/27/milk-435295_960_720.png online.ing.puc.cl
https://cdn.pixabay.com/photo/2017/04/24/09/26/lemon-2255878_960_720.png
https://upload.wikimedia.org/wikipedia/commons/8/8a/Banana-Single.jpg

Principio de Monotonicidad
Ejemplo

Compra 1 Compra 2 Compra 3

s{Pera, Manzana, Leche}=1/4

umbral mínimo = 3/4


Compra 4
Fuente Img. 4:
https://c.pxhere.com/photos/ce/7c/apple_food_fruit_healthy-944141.jpg!d
https://images.pexels.com/photos/52533/orange-fruit-vitamins-healthy-eating-52533.jpeg?cs=srgb&dl=citrus-citrus-fruit-close-up-52533.jpg&fm=jpg
https://c1.staticflickr.com/4/3817/11844779764_24a6ea00a0_b.jpg
https://cdn.pixabay.com/photo/2014/09/04/05/27/milk-435295_960_720.png online.ing.puc.cl
https://cdn.pixabay.com/photo/2017/04/24/09/26/lemon-2255878_960_720.png
https://upload.wikimedia.org/wikipedia/commons/8/8a/Banana-Single.jpg

9
Itemset Lattice
Null

Infrecuente
A B C D E

AB AC AD AE BC BD BE CD CE DE

ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE

ABCD ABCE ABDE ACDE BCDE

ABCDE

online.ing.puc.cl
Fuente Img. 5: Creación propia

Resumen

◉ La primera parte del algoritmo


Apriori es encontrar los itemsets
frecuentes

◉ No es viable generar todos los


itemsets posibles de una base de
datos

◉ El principio de Monotonicidad nos


ayuda a descartar muchos itemsets y
hace posible la búsqueda
online.ing.puc.cl

10
11

También podría gustarte