Vés al contingut

Algorisme k-means

De la Viquipèdia, l'enciclopèdia lliure
[1]exemple de k-means++

L'algorisme K-means és un mètode de quantificació vectorial que té com a objectiu la partició d'un conjunt n observacions en k grups en el qual cada observació pertany al grup més proper a la mitjana. És un mètode utilitzat en mineria de dades.[2]

Descripció

[modifica]

Donat un conjunt d'observacions (x1, x₂, …, xn), on cada observació és un vector real de d dimensions, k-means construeix una partició de les observacions en k conjunts (kn) S = {S1, S₂, …, Sk}. A fi de minimitzar la suma dels quadrats a dins de cada grup (WCSS):

on µi és la mitjana de punts en Si.

Aplicacions

[modifica]

L'algorisme k-means és fàcil d'aplicar fins i tot en grans grups de dades. S'utilitza sovint abans d'aplicar altres algorismes per donar un punt de partida al programa (preprocessing).

Clusterització de dades

[modifica]

Un dels seus usos és la clusterització de dades,[1] fonamental en l'aprenentatge automàtic. Consisteix a agrupar punts de dades segons la seva similitud. Aquest us serveix, per exemple, per la segmentació de mercat, on els clients són agrupats segons característiques o comportaments similars.

Quantificació vectorial

[modifica]

L'algorisme k-means s'utilitza per quantificar colors dins dels grups k. Amb això es pot, per exemple, agrupar els colors d'una imatge digital per “simplificar-la” i així evitar perdre qualitat quan es comprimeix.[2]

Referències

[modifica]
  1. «A demo of K-Means clustering on the handwritten digits data» (en anglès). [Consulta: 21 octubre 2024].
  2. «Color Quantization using K-Means» (en anglès). [Consulta: 21 octubre 2024].