Ejercicio resuelto de estadística descriptiva - Parte I

En el presente post vamos a tratar lo siguiente:

Ejercicio resuelto Estadística Descriptiva


Cabe destacar que es la resolución de un ejercicio, las definiciones de los temas planteados no son considerados en esta presentación. 

Se tratará de realizar la resolución del ejercicio aplicando Excel 2013 en los casos que la aplicación lo permita.

Dado que la resolución del ejercicio es muy extensa, vamos a realizar varias entradas, pero puede descargar el ejercicio resuelto y explicado por completo desde la sección de descargas o desde este enlace.

El ejercicio propuesto es el siguiente:

La Srta. Kathryn Ball es miembro del equipo de alta gerencia de Applewood Auto Group, ella es responsable de rastrear y analizar los precios de venta y la rentabilidad de los vehículos. A ella le gustaría resumir las ganancias obtenidas de la venta de los vehículos en tablas y gráficas que pudiese revisar cada mes. Para iniciar con el análisis, ella ha tabulado la ganancia de cada uno de los 180 vehículos que se vendieron el mes pasado en Applewood Auto Group.

1387
2148
2201
963
820
2230
3043
2584
2370
1754
2207
996
1298
1266
2341
1059
2666
2637
1817
2252
2813
1410
1741
3292
1674
2991
1426
1040
1428
323
1553
1772
1108
1807
934
2944
1273
1889
352
1648
1932
1295
2056
2063
2147
1529
1166
482
2071
2350
1344
2236
2083
1973
3082
1320
1144
2116
2422
1906
2928
2856
2502
1951
2265
1485
1500
2446
1952
1269
2989
783
2692
1323
1509
1549
369
2070
1717
910
1538
1206
1761
1638
2348
978
2454
1797
1536
2339
1342
1919
1961
2498
1238
1606
1955
1957
2700
443
2357
2127
294
1818
1680
2199
2240
2222
754
2866
2430
1115
1824
1827
2482
2695
2597
1621
732
1704
1124
1907
1915
2701
1325
2742
870
1464
1876
1532
1938
2084
3210
2250
1837
1174
1626
2010
1688
1940
2639
377
2279
2842
1412
1761
2165
1822
2197
842
1220
2626
2434
1809
1915
2231
1897
2646
1963
1401
1501
1640
2415
2119
2389
2445
1461
2059
2175
1752
1821
1564
1766
335
2886
1731
2338
1118
2058
2487



Ordenamiento de datos.

Lo primero antes de realizar un análisis descriptivo, es ordenar los datos, lo cual nos ayudará a determinar con mayor facilidad ciertos valores y sobre todo a construir una tabla de frecuencias con mayor rapidez.

Precios de vehículos vendidos el mes pasado en Applewood Auto Group (Datos ordenados)
294
1059
1344
1606
1807
1951
2148
2350
2646
323
1108
1387
1621
1809
1952
2165
2357
2666
335
1115
1401
1626
1817
1955
2175
2370
2692
352
1118
1410
1638
1818
1957
2197
2389
2695
369
1124
1412
1640
1821
1961
2199
2415
2700
377
1144
1426
1648
1822
1963
2201
2422
2701
443
1166
1428
1674
1824
1973
2207
2430
2742
482
1174
1461
1680
1827
2010
2222
2434
2813
732
1206
1464
1688
1837
2056
2230
2445
2842
754
1220
1485
1704
1876
2058
2231
2446
2856
783
1238
1500
1717
1889
2059
2236
2454
2866
820
1266
1501
1731
1897
2063
2240
2482
2886
842
1269
1509
1741
1906
2070
2250
2487
2928
870
1273
1529
1752
1907
2071
2252
2498
2944
910
1295
1532
1754
1915
2083
2265
2502
2989
934
1298
1536
1761
1915
2084
2279
2584
2991
963
1320
1538
1761
1919
2116
2338
2597
3043
978
1323
1549
1766
1932
2119
2339
2626
3082
996
1325
1553
1772
1938
2127
2341
2637
3210
1040
1342
1564
1797
1940
2147
2348
2639
3292


Con los datos ordenados podemos determinar con facilidad, cual es el valor mínimo o máximo del conjunto de datos, es decir, podemos responder las siguientes preguntas: 

a. ¿Cuál es la ganancia más alta? 

Observando la tabla de datos ordenada, podemos afirmar que la ganancia obtenida más alta por la venta de un vehículo es $ 3292.

Utilizando Excel, sin importar si los datos están ordenados, podemos utilizar la siguiente fórmula para responder: 

=MAX(Rango de datos) = 3292 


b. ¿Cuál es la ganancia más baja? 

Observando la tabla de datos ordenada, podemos afirmar que la menor ganancia obtenida por la venta de un vehículo es $ 294. 

Utilizando Excel sin importar si los datos están ordenados, podemos utilizar la siguiente fórmula para responder: 

=MIN(Rango de datos) = 294



Geekerds - Todo lo que necesites en Tecnología: Servicios & Equipos



Tabla de Distribución de Frecuencias.

Para construir una tabla de frecuencias es necesario realizar lo siguiente: 

1. Definir el número de intervalos o clases: 

Una regla para determinar el número de intervalos (k) es utilizar la regla en la cual k es el mínimo valor que cumple:

Regla k para obtener número de intervalos.

Donde n es el número de observaciones (cantidad de datos).

En nuestro caso particular n=180, por tanto, el valor mínimo de k sería 8.

Entonces, el número de intervalos recomendados es 8. Este valor debe también estar sujeto a criterio del investigador

2. Definir el intervalo o ancho de clase:
El ancho de clase debe ser igual para cada uno de los intervalos que conforman la tabla de frecuencias. Y se define con la siguiente fórmula:


Ancho de clase.
Calcular ancho de clase.
















En la práctica, el valor de i obtenido se redondea dependiendo de los datos y el criterio del investigador. Para nuestro ejemplo, vamos a definir i=400.

3. Establecer los límites de clase:

Lo siguiente a realizar es donde comienza el primer intervalo. A modo de ejemplo se muestra una tabla comparativa:

Intervalo
Empezando en 0
Empezando en 200
Empezando en 294
1
[0 - 400)
[200 - 600)
[294 - 694)
2
[400 - 800)
[600 - 1000)
[694 - 1094)
3
[800 - 1200)
[1000 - 1400)
[1094 - 1494)
4
[1200 - 1600)
[1400 - 1800)
[1494 - 1894)
5
[1600 - 2000)
[1800 - 2200)
[1894 - 2294)
6
[2000 - 2400)
[2200 - 2600)
[2294 - 2694)
7
[2400 - 2800)
[2600 - 3000)
[2694 - 3094)
8
[2800 - 3200)
[3000 - 3400)
[3094 - 3494)





  • Si empezamos el primer intervalo en 0 podemos observar que ni siquiera cubrimos la totalidad del conjunto de datos puesto que existen valores por encima de 3200.
  • Si tomamos el valor mínimo de nuestro conjunto de datos como el límite inferior de nuestro primer intervalo podríamos llevar a cabo sin ningún inconveniente la realización de la tabla de distribución de frecuencias.
  • Una mejor opción es redondear los límites a un valor conveniente, esto dependerá de los datos, así como del criterio del investigador, en este caso hemos utilizado como límite inferior del primer intervalo el valor de 200. Esto nos permite cumplir con los 8 intervalos con un ancho de clase de 400 unidades.
  • Por tanto, los límites de clase estarán dados por:

    [200 - 600)
    [600 - 1000)
    [1000 - 1400)
    [1400 - 1800)
    [1800 - 2200)
    [2200 - 2600)
    [2600 - 3000)
    [3000 - 3400)


    El símbolo [ indica que el valor del límite inferior está incluido.
    El símbolo ) indica que el valor del límite superior no está incluido.

    4. Contar los elementos que corresponden a cada intervalo o clase: 

    El siguiente y último paso es cuantificar los elementos del conjunto de datos que corresponden a cada intervalo.

    Entonces, la tabla de distribución de frecuencias para nuestro ejemplo estaría dada por:

    Clase
    Frecuencia
    [200 - 600)
    8
    [600 - 1000)
    11
    [1000 - 1400)
    23
    [1400 - 1800)
    38
    [1800 - 2200)
    45
    [2200 - 2600)
    32
    [2600 - 3000)
    19
    [3000 - 3400)
    4
    Total
    180



    Con la tabla mostrada anteriormente, podemos afirmar lo siguiente:

    • · Las ganancias por vehículo vendido oscilan entre $200 y $3400. 
    • · La mayor cantidad de vehículos vendidos proveen ganancias entre $1800 y $2200.