Reducció de dimensionalitat
La reducció de dimensionalitat, o reducció de dimensió, és la transformació de dades d'un espai d'alta dimensió a un espai de baixa dimensió de manera que la representació de baixa dimensió conserva algunes propietats significatives de les dades originals, idealment properes a la seva dimensió intrínseca. Treballar en espais de grans dimensions pot ser indesitjable per moltes raons; Les dades en brut sovint són escasses com a conseqüència de la maledicció de la dimensionalitat, i l'anàlisi de les dades sol ser computacionalment intractable (difícil de controlar o tractar). La reducció de la dimensionalitat és habitual en camps que tracten un gran nombre d'observacions i/o un gran nombre de variables, com ara el processament del senyal, el reconeixement de la parla, la neuroinformàtica i la bioinformàtica.[1]
Els mètodes es divideixen habitualment en enfocaments lineals i no lineals.[2] Els enfocaments també es poden dividir en selecció de característiques i extracció de característiques.[3] La reducció de la dimensionalitat es pot utilitzar per a la reducció del soroll, la visualització de dades, l'anàlisi de clúster o com a pas intermedi per facilitar altres anàlisis.
Selecció de funcions
[modifica]Els enfocaments de selecció de característiques intenten trobar un subconjunt de variables d'entrada (també anomenades característiques o atributs). Les tres estratègies són: l'estratègia de filtre (per exemple, guany d'informació), l'estratègia d'embolcall (per exemple, cerca guiada per la precisió) i l'estratègia incrustada (les característiques seleccionades s'afegeixen o s'eliminen mentre es construeix el model basant-se en errors de predicció).
L'anàlisi de dades com ara la regressió o la classificació es pot fer a l'espai reduït amb més precisió que a l'espai original.[4]
Projecció de funcions
[modifica]La projecció de característiques (també anomenada extracció de característiques) transforma les dades de l'espai d'alta dimensió a un espai de menys dimensions. La transformació de dades pot ser lineal, com en l'anàlisi de components principals (PCA), però també existeixen moltes tècniques de reducció de dimensionalitat no lineal. Per a dades multidimensionals, la representació tensor es pot utilitzar en la reducció de la dimensionalitat mitjançant l'aprenentatge subespai multilineal.[5]
Aplicacions
[modifica]Una tècnica de reducció de la dimensionalitat que de vegades s'utilitza en neurociència és les dimensions màximament informatives, que troba una representació de dimensions inferiors d'un conjunt de dades de manera que es preservi tanta informació com sigui possible sobre les dades originals.
Referències
[modifica]- ↑ van der Maaten, Laurens; Postma, Eric; van den Herik, Jaap J Mach Learn Res, 10, 26-10-2009, pàg. 66–71.
- ↑ van der Maaten, Laurens; Postma, Eric; van den Herik, Jaap J Mach Learn Res, 10, 26-10-2009, pàg. 66–71.
- ↑ Pudil, P. «Novel Methods for Feature Subset Selection with Respect to Problem Knowledge». A: Liu. Feature Extraction, Construction and Selection (en anglès), 1998, p. 101. DOI 10.1007/978-1-4615-5725-8_7. ISBN 978-1-4613-7622-4.
- ↑ Rico-Sulayes, Antonio Revista Ingeniería Electrónica, Automática y Comunicaciones, 38, 2017, pàg. 26–35. ISSN: 1815-5928.
- ↑ Lu, Haiping; Plataniotis, K.N.; Venetsanopoulos, A.N. Pattern Recognition, 44, 2011, pàg. 1540–1551. Bibcode: 2011PatRe..44.1540L. DOI: 10.1016/j.patcog.2011.01.004.