Estadística Descriptiva


La estadística descriptiva es una rama de la estadística que se encarga de recopilar, organizar, analizar y representar datos de manera que puedan interpretarse fácilmente. Esta herramienta es fundamental para entender grandes volúmenes de información y tomar decisiones acertadas en distintos contextos como la educación, la salud, los negocios, la política o el entorno social.

Visualización De Datos


La estadística descriptiva se puede comprender mejor mediante herramientas visuales. Estos métodos ayudan a identificar tendencias, patrones y distribuciones en los datos. Algunas formas de representar los datos son:

Tablas de distribución de frecuencias

Estas tablas ilustran la frecuencia con la que aparecen ciertos valores o rangos de valores en un conjunto de datos. Pueden variar desde tablas simples que resumen valores individuales junto con sus frecuencias correspondientes, hasta tablas agrupadas donde los valores individuales se combinan para formar intervalo.

Gráficos

Los gráficos y diagramas constituyen otra forma valiosa de presentar datos visualmente. Pueden representar porcentajes, frecuencias, distribuciones, etc. Ejemplos de esto son los gráficos de barras, los gráficos circulares y los diagramas de dispersión, que simplifican datos complejos para facilitar su comprensión y análisis.


Caso Aplicado Procuraduría General de la Nación


La Procuraduría General de la Nación (PGN) es el organismo encargado del control disciplinario, la defensa de los derechos humanos y la vigilancia de la función pública en Colombia. La estadística desempeña un papel clave en la Procuraduría General de la Nación, ya que permite analizar datos sobre la gestión pública, el cumplimiento normativo y la eficiencia de los procesos disciplinarios. A través de indicadores y reportes estadísticos, la entidad puede evaluar el desempeño de sus funciones, identificar tendencias en la administración de justicia y mejorar la toma de decisiones estratégicas.

Por ejemplo, la Procuraduría utiliza estadísticas en sus canales de atención al ciudadano, recopilando datos sobre peticiones, quejas y reclamos para optimizar la gestión de respuestas y mejorar la calidad del servicio. Además, la estadística es fundamental en la función disciplinaria, ayudando a monitorear el número de investigaciones, sanciones y procesos en curso

Objetivo

Organizar la información sobre denuncias recibidas por año, tipo de conducta disciplinaria, región o entidad denunciada. 

Conceptos

Se presentan a continuación los conceptos fundamentales de la estadística descriptiva, ilustrados con ejemplos aplicados al caso de estudio de la Procuraduría General de la Nación (PGN), facilitando su comprensión en un contexto práctico.

Población  

Conjunto total de elementos y que son de interés para un experimento, un estudio o una consideración de algún tipo.


Las poblaciones estadísticas se clasifican en dos, de acuerdo a su finitud:

Población estadística finitaEstá formada por una cantidad delimitada y abarcable de elementos, que en un instante determinado del tiempo equivale a un número concreto.

Ejemplo: Todos los procesos disciplinarios Activos del país.


Población estadística infinita: constituida  por número virtualmente ilimitado de elementos, es decir, no tienen un fin determinado en un momento dado, ya sea porque realmente son ilimitados, o porque su número es tan grande, que jamás podríamos saberlo con certeza.

Ejemplo: Todas las posibles faltas disciplinarias que pueden cometer los funcionarios públicos de Colombia a lo largo del tiempo.

Muestra

Subconjunto más o menos representativo de una población estadística, aislado del resto con fines de evaluación y estudio. Es decir, se trata de un fragmento de la totalidad de elementos a estudiar, compuesta por un número más manejable de ellos, seleccionados (idealmente) al azar.

Ejemplo: 500 casos activos de 2023  

Muestras estadísticas probabilísticas. Son aquellas que se escogen a través de métodos más o menos aleatorios:

  • Muestras aleatorias simples. Se eligen absolutamente al azar entre la población.

  • Muestras estratificadas. Se eligen de manera aleatoria entre los distintos estratos o niveles de clasificación en los que previamente se ha organizado la población.  

  • Muestras por conglomerado. Similares a las estratificadas, se eligen aleatoriamente entre un conjunto previamente determinado, pero en este caso estos conjuntos no son fruto de los criterios del investigador, sino que están dados de manera espontánea 

Muestras estadísticas no probabilísticas.  Determinada de acuerdo a criterios de búsqueda del investigador.

  • Muestras intencionales. Aquellas que son escogidas de acuerdo a los criterios del investigador, o sea, tomando aquellas que considera darán mejores resultados, al ser más representativas 
  • Muestras por conveniencia. Son seleccionados basándose en su fácil acceso o disponibilidad para el investigador.

    Muestras consecutivas. Aquellas que forman parte de un recorrido del investigador, que va de grupo en grupo extrayendo los datos para posteriormente constituir un todo

Unidad

La unidad de análisis es el elemento básico de observación sobre el cual se recolectan los datos en un estudio estadístico. Puede ser una persona, grupo, institución, evento, objeto o fenómeno.

Es la base de cualquier estudio porque determina el nivel de inferencia: sobre qué o quién se pretende hacer generalizaciones.

Importancia

Seleccionar adecuadamente la unidad de análisis garantiza la validez de los resultados. Si se confunde, por ejemplo, la persona con la institución a la que pertenece, se incurre en errores de inferencia.

Tipos de Unidad

  • Individual: Una persona (estudiante, paciente)
  • Colectiva: Una familia, empresa, escuela
  • Institucional: Ministerio, alcaldía, universidad
  • Temporal: Día, mes, año (cuando se estudian eventos en el tiempo)
  • Territorial: Municipio, región, país

Ejemplo:

Cada proceso disciplinario. 

Variable

Característica que se mide, Es un dato o valor asociado a cada unidad de análisis, que puede usarse para:

  • Clasificar
  • Contar
  • Calcular promedios
  • Identificar patrones o tendencias

Variables cuantitativas. Son aquellas variables que se expresan mediante argumentos numéricos.

  • Datos discretos: solo pueden tomar valores enteros y contables, sin fracciones ni decimales. 
  • Datos continuos: pueden tomar cualquier valor dentro de un rango, incluidos decimales y fracciones. (Toman valores en un intervalo continuo )

Variables cualitativas. Son aquellas variables cuyo valor no puede expresarse en números, ya que se refieren a características o cualidades de un referente. 

  • Datos dicotómicos: Toman solo dos categorías posibles. (binarias)
  • Datos nominales: Pueden dividirse en más de dos categorías sin que exista un orden lógico o jerarquía entre ellas
  • Datos ordinales: Pueden dividirse en más de dos categorías donde el orden importa, pero no se puede medir con precisión la distancia entre las categorías.

Ejemplo: 

Tipo de falta, entidad denunciada, fecha, región, resultado. 

Representaciones gráficas

Gráfica de Barras – Casos por Región

Es una representación visual de datos categóricos. Cada categoría se representa mediante una barra cuya altura (o longitud) es proporcional al valor que representa.

Propósito:
Comparar cantidades entre diferentes grupos o categorías. Se usa cuando las variables son cualitativas (nominales u ordinales) o cuantitativas discretas.

Lo que representa:
Permite identificar visualmente qué categorías tienen más o menos frecuencia, facilitando la comparación directa.

Ejemplo

Comparar la cantidad de procesos disciplinarios por región del país (Andina, Caribe, etc.). 


Gráfica Circular – Distribución por Tipo de Falta

Muestra proporciones o porcentajes de un total. Cada categoría se representa como un sector de un círculo.

Propósito:
Visualizar la distribución relativa de una variable dentro de un conjunto total.

Lo que representa:

Hace evidente la parte del todo que representa cada categoría, ideal para destacar mayorías, minorías o desigualdades en proporciones.

Ejemplo

Mostrar qué porcentaje de los casos corresponden a faltas gravísimas, graves o leves.


Gráfica de Líneas – Evolución Anual de Quejas

Representa datos cuantitativos a lo largo del tiempo mediante puntos conectados por líneas.

Propósito:
Visualizar tendencias, fluctuaciones o comportamientos en series temporales (mensuales, anuales, etc.).

Lo que representa:

Permite ver si los valores están aumentando, disminuyendo, o presentando ciclos. Es útil para predecir comportamientos futuros.

Ejemplo

Mostrar cómo ha evolucionado el número de quejas ciudadanas recibidas por año entre 2015 y 2024.


Diagrama de Cajas – Tiempo de Resolución de Casos

Resume la distribución de un conjunto de datos mediante cinco valores clave: mínimo, primer cuartil (Q1), mediana, tercer cuartil (Q3) y máximo. También muestra posibles valores atípicos.

Propósito:
Evaluar la dispersión de los datos, identificar asimetrías y detectar valores extremos (outliers).

Lo que representa:
Muestra qué tan concentrados o dispersos están los datos, cómo se distribuyen y si hay casos que se alejan del comportamiento general.

Ejemplo

Analizar la distribución del tiempo de resolución de procesos disciplinarios para ver si hay demoras o casos fuera del promedio.

¡Crea tu página web gratis! Esta página web fue creada con Webnode. Crea tu propia web gratis hoy mismo! Comenzar