Selección de características para atributos continuos en tareas de clasificación de actividad física

Features selection for continuous attributes in classification of physical activity tasks

Seleção de recursos para atributos contínuos em tarefas de classificação de atividade física

Enrique V. Carrera
Universidad de las Fuerzas Armadas ESPE, Ecuador
evcarrera@espe.edu.ec

Jefferson Stalin Rodríguez Páramo
Universidad de las Fuerzas Armadas ESPE, Ecuador
jsrodriguez2@espe.edu.ec

 

Resumen
Los dispositivos móviles contienen diversos sensores con capacidad para enviar datos que se utilizan en la toma de decisiones, un ejemplo es la clasificación de actividad física basada en el uso de acelerómetros y giroscopios. Las señales de los sensores se procesaron previamente aplicando diferentes técnicas que extrajeron un sinnúmero de atributos, los cuales sirvieron para el desarrollo de tareas de clasificación. La optimización de sistemas de clasificación requirió la disminución del número de características de entrada con la finalidad de sintetizar la dimensión de su conjunto y tiempo de aprendizaje. Este artículo empleó métricas de ganancia de información para atributos continuos, que redujeron la incertidumbre y extrajeron únicamente aquellas características más significativas a través de los datos procesados. El análisis de los resultados que se obtuvieron en la clasificación de actividad física usando redes neuronales, mostraron no solamente la disminución de características, sino también un error por debajo del 5 % y la reducción del tiempo de procesamiento en aproximadamente 55 %.

Palabras clave: aprendizaje de máquina, actividad física, selección de características, atributos continuos, ganancia de información.

Abstract
Mobile devices contain different sensors with the ability to send data that are used in decision-making, an example is the classification of physical activity based on the use of accelerometers and gyroscopes. The signals from the sensors were processed previously applying different techniques which extracted a countless number of attributes, which were used for the development of classification tasks. Optimizing systems of classification required the decrease of the number of input features with the purpose of synthesizing the dimension of its set and learning time. This article used metrics of information gain for continuous attributes, that reduced the uncertainty and extracted only those most significant characteristics through the processed data. The analysis of the results that were obtained in the classification of physical activity using neural networks, showed not only the reduction of features, but also an error below the 5% and the reduction of processing time by approximately 55%.

Key words: machine learning, physical activity, features selection, continuous attributes, information gain.

Resumo
Dispositivos móveis contêm vários sensores capazes de enviar os dados utilizados na tomada de decisões, um exemplo é a classificação de actividade física baseada na utilização de acelerómetros e giroscópios. Os sinais dos sensores são processados ​​através da aplicação de diferentes técnicas extraídos inúmeros atributos, que serviram para o desenvolvimento de tarefas de classificação. A optimização do sistema de classificação necessária a redução do número de características de entrada, a fim de sintetizar a dimensão de tempo em conjunto e aprendizagem. Este artigo usou métricas de ganho informações para atributos contínuos, o que reduziu a incerteza e extraídas apenas as características mais significativas através dos dados processados. A análise dos resultados obtidos na classificação de actividade física utilizando redes neurais, não só mostraram diminuição características, mas também um erro inferior a 5% e o tempo de processamento reduzido em cerca de 55%.

Palavras-chave: aprendizagem de máquina, atividade física, seleção de características, atributos contínuos, ganho de informação.

Fecha recepción:   Enero 2016                                          Fecha aceptación: Junio 2016


Introducción
Los dispositivos móviles contienen diversos sensores que en la actualidad son utilizados en varios campos y con un sinnúmero de aplicaciones alrededor del mundo (Das, Green, Perez, y Murphy, 2010). Los dispositivos móviles “inteligentes” debido a su tamaño pequeño, capacidad para enviar y recibir datos y potencia de cálculo, permiten almacenar información que puede ser manipulada (Kwapisz, Weiss, y Moore, 2011).

Toda la información recopilada por estos dispositivos electrónicos brinda un aporte significativo para el desarrollo y monitoreo, aspectos referentes al cuidado de la salud, rehabilitaciones, diagnóstico de enfermedades, seguridad de las personas, entre otros (Mitchell, Monaghan, y O'Connor, 2013).

Las señales que son emitidas por los sensores no pueden ser clasificadas con algoritmos estándares, por lo que en primera instancia se deben transformar los datos de estado puro a información, cuyo procesamiento sea más sencillo en función del tiempo o la frecuencia (Weiss y Hirsh, 1998). De este modo, se consigue procesarlos y extraer un determinado número de características con base en diferentes métricas.

La gran cantidad de datos de entrada existentes provoca que el tiempo de procesamiento aumente (Han, Kamber, y Pei, 2011), lo que ocasiona que la optimización de sistemas de clasificación demande la reducción de estas. Para ello es necesario utilizar un algoritmo que permita la selección de características, de tal manera que se sintetice la dimensión de su conjunto y el tiempo de aprendizaje (Yang y Wang, 2011).

La clasificación o selección automática de características es una de las tareas más comunes en donde las redes neuronales artificiales han demostrado su eficacia, ya que realizan un procesamiento automático de datos y están basadas en el sistema nervioso biológico (Isasi y Galván, 2004).

Es importante mencionar que las Redes Neuronales Artificiales, desde su aparición y por su desarrollo acelerado, han tenido un uso significativo como un tipo de tecnología para minería de datos, ello debido a que dicha tecnología tiene atributos para una modelación efectiva y eficiente de problemas complejos (Lu, Setiono, y Liu, 1996).

La presente investigación tiene como base el tratamiento de información de tipo continuo mediante métricas para ganancia de información, lo cual por medio de un algoritmo será discretizado. En consecuencia, será posible el proceso de selección de características para atributos continuos en tareas de clasificación de actividad física; es decir, se identificarán las características más relevantes para el proceso de clasificación, al reducir la incertidumbre y obtener únicamente aquellas más significativas.

Las características seleccionadas deben precisar la actividad física de una persona (caminar, subir o bajar gradas, sentarse, pararse, acostarse).

Cabe mencionar que el criterio de maximización de la ganancia de información produce un sesgo hacia los atributos que presentan gran cantidad de valores distintos, lo que resuelve este problema al usar la razón de ganancia como criterio de separación (Hong, 1997). Esta medida tiene en cuenta tanto la ganancia de información como las probabilidades de los distintos valores de los atributos; a su vez, dichas probabilidades son recogidas mediante la información de separación, que no es más que la entropía del conjunto de datos respecto a los valores de los atributos.

Los resultados de la clasificación de actividad física usando redes neuronales, como se describe más adelante, muestran que al utilizar: ganancia de información, puntos de quiebre para los 5 grupos de intervalos de selección y porcentaje de error en cada uno de ellos, se consiguió disminuir el conjunto de características (561) en 86 % (78), por lo que se percibe una optimización en cuanto al tiempo de procesamiento de datos.

La estructura de este artículo se detalla a continuación: en la sección 1 se muestra la descripción de los materiales y métodos adoptados, los cuales exponen el desarrollo experimental para la captura de datos, la descripción matemática del algoritmo propuesto y el proceso de entrenamiento de la red. En la sección 2 se exhiben los resultados experimentales y su análisis; y, finalmente en la sección 3 se exponen las conclusiones.

  1.  MATERIALES Y MÉTODOS

Conjunto de datos y sensores

En el mercado existe una amplia diversidad de dispositivos móviles para los que se han desarrollado distintos sistemas operativos como: iOS de Apple y Android de Google. En el presente trabajo se utilizó la base de datos “Human Activity Recognition Using Smartphones Data Set” (UCI HAR Dataset), del Repositorio de Aprendizaje de Máquina de la Universidad de California, misma que trabaja con un Smartphone (Samsung Galaxy S II) colocado en la cintura. A través de su acelerómetro y giroscopio embebidos, se obtiene la aceleración lineal y la velocidad angular en sus tres ejes XYZ. Los experimentos fueron grabados en video para etiquetar los datos de forma manual. El conjunto de datos se divide aleatoriamente en dos grupos. Ahí, 70 % (21 personas) de los voluntarios fue seleccionado para generar los datos de entrenamiento y 30 % (9 personas) proporcionó los datos de prueba.
Las características seleccionadas para esta base de datos provienen de las señales en bruto de los tres ejes del acelerómetro y giroscopio, las cuales en el dominio del tiempo se capturaron a una velocidad constante de 50 Hertz (Hz) y fueron muestreadas con ventanas deslizantes de ancho fijo de 2.56 segundos (s) y 50 % de solapamiento (128 lecturas/ventana). La señal de aceleración tiene dos componentes: gravitacional y movimiento del cuerpo; los cuales se separaron y depuraron en aceleración del cuerpo y gravedad, recurriendo a un filtro pasa banda y otro de tercer orden pasa bajo Butterworth, ambos con una frecuencia de corte de 20 Hz para eliminar el ruido. La fuerza de gravedad posee únicamente componentes de baja frecuencia, por lo tanto, se utilizó un filtro pasa bajo Butterworth con frecuencia de corte de 0.3 Hz. A partir de cada ventana se obtuvo el vector de características mediante el cálculo de las variables de tiempo y dominio de la frecuencia.

La aceleración del cuerpo y la velocidad angular se derivaron en función del tiempo, para obtener las señales Jerk, y la magnitud de estas señales tridimensionales se calculó con el manejo de la norma euclidiana (distancia respecto al origen).

Se empleó una Transformada Rápida de Fourier (FFT) en algunas de las señales que fueron utilizadas para estimar variables del vector de características, las cuales proporcionaron una matriz de datos de 10.299 muestras y 561 características en dominio del tiempo y la frecuencia (Linchman, 2013).

Métricas

La base de datos del Repositorio de Aprendizaje de Máquina de la Universidad de California cuenta con 33 variables obtenidas de las señales en los tres ejes del acelerómetro y giroscopio, las cuales fueron procesadas con 17 métricas. Esto da un total de 561 características, derivadas de la multiplicación entre variables y métricas. A continuación, se observan las métricas y variables en sus tablas correspondientes.

La tabla 1 contiene algunas variables iguales pero en diferentes ejes, razón por la cual se contabiliza tres veces la variable para los tres ejes (X, Y, Z).

Tabla 1. Conjunto de Variables

#

Descripción

1,2,3

Aceleración del cuerpo en los tres ejes (XYZ), en función del tiempo.

4,5,6

Aceleración de la gravedad en los tres ejes (XYZ), en función del tiempo.

7,8,9

Derivada de la aceleración del cuerpo en los tres ejes (XYZ), en función del tiempo.

10,11,12

Velocidad angular del cuerpo en los tres ejes (XYZ), en función del tiempo.

13,14,15

Derivada de la velocidad angular del cuerpo en los tres ejes (XYZ), en función del tiempo.

16

Magnitud de la aceleración del cuerpo, en función del tiempo.

17

Magnitud de la aceleración de la gravedad, en función del tiempo.

18

Magnitud de la derivada de la aceleración del cuerpo, en función del tiempo.

19

Magnitud de la velocidad angular del cuerpo, en función del tiempo.

20

Magnitud de la derivada de la velocidad angular del cuerpo, en función del tiempo.

21,22,23

Aceleración del cuerpo en los tres ejes (XYZ), en dominio de la frecuencia.

24,25,26

Derivada de la aceleración del cuerpo en los tres ejes (XYZ), en dominio de la frecuencia.

27,28,29

Velocidad angular del cuerpo en los tres ejes (XYZ), en dominio de la frecuencia.

30

Magnitud de la aceleración del cuerpo, en dominio de la frecuencia.

31

Magnitud de la derivada de la aceleración del cuerpo, en dominio del tiempo.

32

Magnitud de la velocidad angular del cuerpo, en dominio de la frecuencia.

33

Magnitud de la derivada de la velocidad angular del cuerpo, en dominio de la frecuencia.

Tabla 2. Conjunto de Métricas

#

Métricas

1

Media

2

Desviación Estándar

3

Desviación Media Absoluta

4

Valor Máximo

5

Valor Mínimo

6

SMA

7

Energía

8

IQR

9

Entropía

10

Auto regresión

11

Correlación

12

Máximo Índice

13

Frecuencia Media

14

Skewness

15

Kurtosis

16

Energía de un intervalo de frecuencia

17

Ángulo entre vectores

Ganancia de Información

Ya se mencionó que el criterio de maximización de la ganancia de información está basado en la entropía de la teoría de la información, es decir, es una medida de incertidumbre de una variable aleatoria (Roobaert, Karakoulas, y Chawla, 2006).

Para determinar la ganancia de información del presente estudio se discretizaron los atributos, a partir de lo cual se calculó dicha ganancia para los 5 grupos de intervalos de selección; con ello se generó una lista ordenada y eliminaron aquellos atributos con los menores resultados.

Los 5 grupos utilizados fueron de: 4, 6, 8, 10 y 12 intervalos; la razón de emplear únicamente estos grupos obedece a que sus intervalos muestran una tendencia general, es decir, si se usa un mayor o menor número de intervalos (menos de 4 o más de 12), la media seguirá siendo la misma, lo cual no cambia los datos obtenidos.

En conclusión, se realizó la reducción esperada de la entropía de los datos al conocer el valor de atributos continuos en tareas de clasificación de actividad física.

Redes neuronales

Su principal función es el aprendizaje y su esquema determina el tipo de problemas que será capaz de resolver (Isasi y Galván, 2004). Por otro lado, los investigadores de inteligencia artificial y estadística se han interesado en las propiedades más abstractas de las redes neuronales, tales como su habilidad para desarrollar computación distribuida y tolerar el ruido en la entrada de la red (Cazorla, Colomina Pardo, y Viejo Hernando, 2011). Actualmente se entiende que otras clases de sistemas (incluyendo redes bayesianas) tienen estas propiedades, sin embargo, las redes neuronales son dignas de estudio pues permanecen como una de las formas más populares y efectivas al momento de construir sistemas de aprendizaje (Russell y Norving, 2004).

En el presente trabajo se precisa saber qué tipo de red neuronal ofrece una mayor eficiencia al momento de cumplir con los requerimientos propuestos. Se optó por las redes de alimentación directa (feedforward), las cuales contienen una serie de capas: una con conexión de entrada a la red, una capa posterior que tiene una conexión de la capa anterior y una capa que produce la salida de la red. Estas redes con suficientes neuronas en su capa oculta pueden adaptarse a cualquier problema de asignación de entrada-salida finita. Dos tipos de redes de alimentación directa conocidas y utilizadas en la herramienta matemática MATLAB® son Fitnet y Patternnet.

Fitnet es una red de alimentación directa de dos capas con función de activación sigmoidea: una capa de neuronas oculta y otra de neuronas de salida lineal, que se acoplan a problemas de asignación multidimensionales con datos consistentes. La red será entrenada con un algoritmo de propagación hacia atrás “Levenberg-Marquardt”, y en caso de que la memoria no sea suficiente se utilizará un algoritmo de propagación hacia atrás gradiente conjugado escalado (Monar, 2014).

Las redes de reconocimiento de patrones (Patternnet) es una red de alimentación directa de dos capas: una oculta y otra con neuronas de salida Softmax (patrón de red) con función de transferencia tipo sigmoidea.  Esta red se entrena con el algoritmo de propagación hacia atrás gradiente conjugado escalado para clasificar las salidas de acuerdo a las entradas, y los datos de destino deben consistir en vectores de todos los valores de cero a excepción de un 1 en el elemento (i), que es la clase a representar (Monar, 2014).

RESULTADOS Y ANÁLISIS

Con el fin de seleccionar la red neuronal que ofrece una mayor eficiencia respecto al tiempo de procesamiento y porcentaje de error, se realizaron tres pruebas de entrenamiento con 1, 70 y 561 características respectivamente, como se muestra en la tabla 3.

Tabla 3. Entrenamiento de redes neuronales.

Red Neuronal

Número de Características

Número de Muestras

Tiempo de Procesamiento (s)

Porcentaje de Error Train (%)

Porcentaje de Error Test (%)

Fitnet

1

7 352

6.296

15.821

15.845

70

7 352

97.340

1.352

4.515

561

7 352

325.761

0.4528

1.8709

Patternnet

1

7 352

9.647

29.491

29.583

70

7 352

44.226

1.990

5.417

561

7 352

112.262

0.701

2.322

En referencia a los resultados de los entrenamientos de cada red, se observa que la red Patternnet presenta un menor tiempo de procesamiento de datos y un porcentaje de error considerable en comparación a la red Fitnet, lo que permitirá conocer el estado de actividad física de una o varias personas simultáneamente y en tiempo real; dichas razones sustentan el uso de esta red.

Posteriormente se calculó la ganancia de información que tiene cada característica, dividiendo el conjunto de datos de entrenamiento en 5 grupos que contienen diferentes números de intervalos. Estos fueron estructurados de la siguiente manera: el primer grupo dividido en 4 intervalos, el segundo en 6 intervalos, el tercero en 8 intervalos, el cuarto en 10 intervalos y el quinto en 12 intervalos. Esto se realizó debido a que los datos presentan atributos continuos (Cao, Ma, Liu, y Guo, 2012).

Características del acelerómetro y giroscopio

Las características fueron ordenadas desde aquella que aporta mayor cantidad de información hasta llegar a la que menos aporta, como muestra la figura 1.

Figura 1.- Ganancia de información para los 5 grupos de intervalos (561 características).

Al calcular la derivada de ganancia de información se pueden apreciar los puntos de quiebre en cada grupo de intervalos, por ejemplo, alrededor de 200 características es clara la caída de la curva, a partir de ello se obtiene la media (promedio), que posteriormente servirá para establecer el número de características y el respectivo error que marcan tanto en el entrenamiento (train) como en la prueba (test), lo cual se aprecia en la tabla 4.

Tabla 4. Selección de puntos de quiebre.

INTERVALOS

INTERVALOS

4

6

8

10

12

Promedio

4

6

8

10

12

Promedio

NÚMERO DE CARACTERÍSTICAS

280

276

278

280

278

278

133

131

139

129

133

133

267

266

263

263

254

263

127

123

125

125

126

125

261

259

259

254

253

257

103

102

104

101

109

104

250

248

252

247

248

249

85

94

93

86

89

89

234

234

232

231

229

232

85

83

85

81

78

82

230

229

224

227

229

228

72

71

69

72

70

71

211

214

213

215

213

213

61

63

60

64

61

62

206

205

208

204

203

205

51

52

47

50

50

50

198

201

195

192

191

195

34

43

40

38

39

39

193

188

184

185

181

186

24

25

30

25

22

25

178

179

170

179

171

175

16

14

13

16

14

15

171

169

161

164

168

167

7

7

7

7

7

7

157

150

150

152

151

152

5

4

4

4

3

4

137

142

142

140

141

140

1

1

1

1

1

1

A través de la aplicación se determinaron todas las características idénticas de los atributos en los 5 grupos de intervalos, identificando de esa manera cuáles son las que contribuyen con más información relevante al proceso de clasificación de actividad física para el caso específico.

Es evidente que el porcentaje de error tanto para el conjunto de entrenamiento como para el de prueba, se incrementa gradualmente mientras se reducen las características. De esta forma se elige el número de datos mínimos, capaces de generar un error menor al 5 % para que la red neuronal aprenda y el clasificador pueda detectar los patrones que determinan la actividad física que se está realizando.

Tabla 5. Reducción de características del acelerómetro y giroscopio con características idénticas.

Número Características

Número Características Idénticas

Train (%)

Test (%)

Número Características

Número Características Idénticas

Train (%)

Test (%)

561

561

0.7743

2,9446

133

133

1.6391

3.6263

278

235

1.4187

3,1113

125

125

1.7344

3.6958

263

224

1.587

3,2117

104

104

1.6841

3.8639

257

221

1.4117

2,9988

89

89

6.6016

7.0473

249

218

1.5557

3,1409

82

82

6.9032

7.3374

232

213

1.4177

3,1252

71

71

7.0418

7.6495

228

211

1.5069

3,0083

62

62

7.204

7.6347

213

205

1.738

3,3246

50

50

7.3649

8.0591

205

201

1.547

3,0004

39

39

8.8933

8.7641

195

194

1.5908

3,2094

25

25

10.197

10.2485

186

185

1.3913

3,1513

15

15

12.2387

13.3877

175

174

1.4069

3,1168

7

7

13.216

14.8047

167

167

1.4222

3,0931

4

4

13.2696

14.865

152

152

1.5395

3,3428

1

1

15.2551

15.9221

140

140

1.6762

3.5242

 

 

 

 

Como se evidencia en la tabla 5, conforme disminuye el número de características tiende a cotejarse con el número de características idénticas. De tal manera, si se observa para el número de características 167, se tiene la misma cifra de número de características idénticas, y conforme disminuyen dichas características el error tiende a incrementarse. Por lo tanto, al hacer el cálculo combinado para el acelerómetro como para el giroscopio se obtiene una disminución conjunta de hasta 104 características, con un error del conjunto de prueba de 3.8639 %, que se convierte en el límite de disminución de características antes de superar el error de 5 %.

Figura 2.- Tiempo de procesamiento (todas las características).

Al disminuir el número de características como se aprecia en la figura 2, muestra una eficiente reducción del tiempo de procesamiento llegando a obtener un óptimo resultado de 58.8267 (s) para las 104 características.

Características del acelerómetro

La base de datos utilizada nos proporciona las 561 características, de las cuales 345 son del acelerómetro y 216 del giroscopio.

Una vez clasificados estos datos se realiza el mismo análisis de selección y reducción de atributos, tomando las características del acelerómetro y giroscopio por separado como se presenta en las siguientes tablas y figuras.

Figura 3.- Ganancia de información para los 5 grupos de intervalos (345 características del acelerómetro).

Por medio de la derivada de ganancia de información se pueden apreciar los puntos de quiebre en cada grupo de intervalos. En el caso del acelerómetro específicamente se denota una caída de la curva en aproximadamente 120 características, como muestra la figura 3. En la tabla 6 se establece la media para fijar el número de características con el cual se realizará el respectivo cálculo del error que marca tanto el conjunto de entrenamiento como el de prueba.

Tabla 6. Selección de puntos de quiebre (acelerómetro).

 

INTERVALOS

INTERVALOS

4

6

8

10

12

Promedio

4

6

8

10

12

Promedio

NÚMERO DE CARACTERÍSTICAS

195

194

200

200

206

199

88

92

86

84

85

87

187

181

182

178

184

182

78

82

80

78

74

78

166

168

168

167

169

168

73

70

70

67

67

69

152

161

159

159

163

159

64

61

61

62

64

62

146

147

149

147

147

147

49

50

47

43

46

47

144

141

144

143

144

143

38

38

40

33

34

37

125

129

132

132

128

129

22

25

30

25

24

25

121

122

121

124

122

122

14

16

13

14

16

15

103

100

99

100

98

100

7

7

7

7

7

7

91

94

95

90

96

93

1

1

1

1

1

1

A partir de los puntos de quiebre calculados, se aprecia en la tabla 7 que la disminución adecuada antes de sobrepasar 5 % de error, corresponde a 78 características, demostrando que en forma independiente se obtiene una mayor disminución de características en el caso particular del acelerómetro. Cabe recalcar que aplica el mismo cálculo y análisis para el caso del giroscopio.

Tabla 7. Reducción de características del acelerómetro con características idénticas.

Número Características

Número Características Idénticas

Train (%)

Test (%)

Número Características

Número Características Idénticas

Train (%)

Test (%)

345

345

0.7721

3.0793

87

87

1.3014

4.1031

199

164

1.0944

3.3315

78

78

2.9037

4.1573

182

155

1.1282

3.244

69

69

6.8814

8.3506

168

148

1.1226

3.5088

62

62

7.3665

8.47

159

145

1.1337

3.4383

47

47

8.1803

9.1972

147

140

1.279

3.3502

37

37

7.5788

9.337

143

138

1.1135

3.2756

25

25

9.6996

11.576

129

129

1.3649

3.6542

15

15

11.1481

12.1537

122

122

1.0565

3.8856

7

7

12.7406

13.3385

100

100

1.4052

4.0535

1

1

15.228

15.8485

93

93

1.1843

3.9107

De igual manera se puede observar en la figura 4 que las 78 características idénticas se procesan en 55.9645 (s). Esto genera una reducción de tiempo significativo con respecto al procesamiento de datos de ambos sensores.

Figura 4.- Tiempo de procesamiento (características del acelerómetro).

Características del giroscopio

La figura 5 muestra una ganancia de información distinta para los 5 grupos de intervalos, por lo que al calcular su derivada los puntos de quiebre serán más evidentes. En este caso se observa una caída de la curva en torno a 80 características. Consecutivamente se realiza el análisis de selección y reducción de atributos únicamente con las características del giroscopio.

Figura 5.- Ganancia de información para los 5 grupos de intervalos (216 características del giroscopio).

La tabla 8 muestra una evidente disminución en la cantidad de puntos de quiebre comparados con los resultados anteriores, de igual manera se determina la media del número de características y posteriormente se calcula el porcentaje de error para el conjunto de entrenamiento y de prueba.

Tabla 8. Selección de puntos de quiebre (giroscopio).

INTERVALOS

4

6

8

10

12

Promedio

NÚMERO DE CARACTERÍSTICAS

133

138

147

136

140

139

122

124

128

122

128

125

113

116

118

119

118

117

103

102

101

102

102

102

96

92

94

96

94

94

88

84

85

88

86

86

78

75

79

80

79

78

60

58

61

53

55

57

47

51

48

47

46

48

34

32

39

34

35

35

19

19

18

21

18

19

13

16

12

14

14

14

1

3

1

4

3

2

La menor cantidad de puntos de quiebre calculados, como se juzga en la tabla 9, muestra que la disminución adecuada antes de sobrepasar 5 % de error, corresponde a 78 características, lo que demuestra que en forma independiente las características del giroscopio también pueden ser utilizadas para el clasificador.

Tabla 9. Reducción de características del giroscopio con características idénticas.

Número Características

Número Características Idénticas

Train (%)

Test (%)

216

216

0.758

3.1706

139

116

1.257

4.1913

125

110

1.2988

4.2884

117

109

1.299

4.2975

102

102

1.4572

4.2413

94

94

2.025

3.7185

86

86

1.9113

4.0126

78

78

2.0773

3.7174

57

57

5.8204

6.3557

48

48

6.3161

6.6827

35

35

7.4344

7.5665

19

19

9.6658

11.5729

14

14

10.1099

12.0147

2

2

16.0832

17.1085

De manera similar, la gráfica del tiempo de procesamiento para las características del giroscopio expresa una disminución igual de eficiente a la del acelerómetro en sus valores, como se puede observar en la figura 6.

Figura 6.- Tiempo de procesamiento (características del giroscopio).

En el caso del acelerómetro, en cerca de 78 características idénticas se obtiene el rango de error permitido (3.7185 %) antes de exceder un error del 5 % y un tiempo de procesamiento eficiente de 42. 0811 segundos.

El análisis de las características para cada uno de los sensores comprueba que el proceso de selección es más eficiente si se trabaja de forma independiente. Aunque el dispositivo móvil cuente con los dos sensores (acelerómetro y giroscopio), es preferible que el proceso de clasificación de características se realice con uno de los dos, así se logrará optimizar al máximo el tiempo de procesamiento. Este resultado que no se consigue de manera eficiente si ambos sensores trabajan a la par.

Conclusión

Se utiliza 14 % del total de atributos continuos tomados como muestra, y se determina que se puede obtener una reducción del tiempo de procesamiento en aproximadamente 55 % y un error menor al 5 % en el proceso de selección de características sin afectar la clasificación de actividad física.

En el transcurso de la investigación se logró establecer mediante la reducción de características para atributos continuos, que se puede conocer la actividad física y/o estado de una persona (caminar, saltar, correr, etcétera) de forma más eficiente por medio del giroscopio o del acelerómetro en forma independiente.

El presente artículo sirve como fundamento para trabajos futuros con el planteamiento de otro tipo de métodos. Se puede citar como ejemplo a la mejora del algoritmo de ganancia de información a través de la introducción del grado de dependencia de atributos. Así, se conseguirá recoger los datos no solo de una persona, sino de varias simultáneamente y con un procesamiento de la información en tiempo real.

Bibliografía
Cao, D., Ma, N., Liu, Y., & Guo, J. (2012). A Feature Selection Algorithm for Continuous Attributes Based on the Information Entropy. Journal of Computational Information Systems, 1467-1475.
Cazorla, M., Colomina Pardo, O., y Viejo Hernando, D. (19 de mayo de 2011). Presentaciones de la asignatura Técnicas de Inteligencia Artificial (Curso 2010-2011). Obtenido de http://hdl.handle.net/10045/17323
Das, S., Green, L., Perez, B., & Murphy, M. (30 de julio de 2010). Detecting User Activities using the Accelerometer on Android Smartphones. TRUST REU The Team for Research in Ubiquitous Secure Technology, 29.
Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques, tercera edición, USA: Elsevier.
Hong, S. J. (1997). Use of contextual information for feature ranking and discretization. IEEE transactions on knowledge and data engineering, 9(5), 718-730.
Isasi, P., y Galván, I. (2004). Redes De Neuronas Artificiales. Un enfoque práctico, primera edición, Madrid, España: Pearson.
Kwapisz, J., Weiss, G., & Moore, S. (2011). Activity recognition using cell phones accelerometers. ACM SIGKDD Explorations Newsletter, segunda edición, vol. 12, New York, USA.
Linchman, M. (04 de abril de 2013). UCI Machine Learning Repository. Recuperado el 10 de noviembre de 2015, de http://archive.ics.uci.edu/ml
Lu, H., Setiono, R., & Liu, H. (1996). Effective data mining using neural networks. IEEE transactions on knowledge and data engineering, 8(6), 957-961.
Mitchell, E., Monaghan, D., & O'Connor, N. (19 de abril de 2013). Classification of Sporting Activities Using Smartphone Accelerometers. Sensors, 13, 16.
Monar, W. L. (octubre de 2014). Repositorio Digital - Escuela Pilitécnica Nacional. Recuperado el 30 de julio de 2016, de http://bibdigital.epn.edu.ec/handle/15000/8711
Roobaert, D., Karakoulas, G., & Chawla, N. (2006). Information gain, correlation and support vector machines. Feature Extraction. Springer Berlin Heidelberg, 207, 463-470.
Russell, S., y Norving, P. (2004). Inteligencia Artificial un enfoque Moderno, segunda edición, Madrid, España: Pearson.
Weiss, G., & Hirsh, H. (27 de agosto de 1998). Learning to Predict Rare Events in Event Sequences. Knowledge Discovery and Data Mining.
Yang , B., & Wang, L. (2011). The Construction Method of Knowledge Discovery Theory System Based on Cognitive. (C. a. Circuits, Ed.) Wuhan: IEEE.