Como quitar los mezquinos

La media en matemáticas

¿Qué es una media? Es una media. Es la suma de n elementos dividida por n. No es difícil. La eliminación en este contexto es simplemente una sustracción matemática. Para eliminar una media de, digamos, un vector de números, hay que sumar los números, dividir la suma por el número de elementos del vector y restar ese número a cada elemento del vector. Un ejemplo de vector:
Este es el vector de la media eliminada. Al igual que en la codificación diferencial, el objetivo principal es que los números sean pequeños. A partir de aquí, el códec de vídeo tiene que encontrar formas eficientes de transmitir el vector de la media removida (también llamado residuo), así como la media del vector. La codificación del residuo suele suponer una pérdida de información. Sin embargo, el número más significativo es la media de todo el vector, que debe transmitirse sin pérdidas.

Medio

Me estoy ensuciando las manos con los Contenedores y Docker. En el mundo de Docker (o en el mundo de los Contenedores en general), estoy tratando de entender qué significa “eliminar un contenedor”. El modelo mental que tengo de un contenedor es que es una instancia en ejecución de una imagen. Si un contenedor ha dejado de ejecutarse, ¿qué recursos está consumiendo que deben ser liberados? Puedo entender que se elimine la(s) imagen(es) asociada(s) ya que consume(n) espacio en disco. Quizás mi modelo mental de un contenedor como “una instancia en ejecución de una imagen” no es correcto, y hay algo más. Si alguien pudiera arrojar algo de luz, lo agradecería enormemente.
En Docker, cuando se ejecuta un contenedor, el demonio de Docker monta las capas de las imágenes utilizando un unionfs. Añade una capa encima de las capas de imágenes para rastrear los cambios que están ocurriendo dentro de ese contenedor. Digamos que se escribe un archivo de registro que se rastrea como parte de esta capa.
Cuando un contenedor se detiene, la CPU y la memoria se liberan pero el espacio del disco duro se sigue utilizando. (Puedes comprobar los contenedores parados usando docker ps -a; esto te mostrará todos los contenedores en todos los estados)

La moda en matemáticas

Se llama media recortada. Básicamente, lo que se hace es calcular la media del 80% central de los datos, ignorando el 10% superior e inferior. Por supuesto, estas cifras pueden variar, pero ésa es la idea general.
La forma más común de tener una media robusta (la palabra habitual significa resistente a los datos malos) es utilizar la mediana. Ésta es simplemente el valor medio de la lista ordenada (de la mitad de los dos valores medios), así que para tu ejemplo sería 90,5 = la mitad de 90 y 91.
Si quieres entrar de lleno en la estadística robusta (como las estimaciones robustas de la desviación estándar, etc.) te recomendaría que te perdieras el código del grupo AGORAS, pero puede que sea demasiado avanzado para tus propósitos.
No hay ninguna designación especial para ese método. Llámelo como quiera, siempre que diga a la audiencia cómo ha llegado a su resultado, y tenga los valores atípicos en la mano para mostrarlos si lo piden (y créame: lo pedirán).
Si todo lo que tienes es una variable (como das a entender), creo que algunos de los encuestados de arriba están siendo demasiado críticos con tu enfoque. Ciertamente, otros métodos que tienen en cuenta aspectos como el apalancamiento son más sólidos desde el punto de vista estadístico; sin embargo, eso implica que se está realizando algún tipo de modelización. Si sólo tienes, por ejemplo, las puntuaciones de un examen o la edad de las personas mayores (casos plausibles de tu ejemplo), creo que es práctico y razonable sospechar del valor atípico que mencionas. Podrías mirar la media general y la media recortada y ver cuánto cambia, pero eso estará en función del tamaño de tu muestra y de la desviación de la media de tus valores atípicos.

Media, mediana, moda, rango

Se llama media recortada. Básicamente, lo que se hace es calcular la media del 80% central de los datos, ignorando el 10% superior e inferior. Por supuesto, estos números pueden variar, pero esa es la idea general.
La forma más común de tener una media robusta (la palabra habitual significa resistente a los datos malos) es utilizar la mediana. Ésta es simplemente el valor medio de la lista ordenada (de la mitad de los dos valores medios), así que para tu ejemplo sería 90,5 = la mitad de 90 y 91.
Si quieres entrar de lleno en la estadística robusta (como las estimaciones robustas de la desviación estándar, etc.) te recomendaría que te perdieras el código del grupo AGORAS, pero puede que sea demasiado avanzado para tus propósitos.
No hay ninguna designación especial para ese método. Llámelo como quiera, siempre que diga a la audiencia cómo ha llegado a su resultado, y tenga los valores atípicos en la mano para mostrarlos si lo piden (y créame: lo pedirán).
Si todo lo que tienes es una variable (como das a entender), creo que algunos de los encuestados de arriba están siendo demasiado críticos con tu enfoque. Ciertamente, otros métodos que tienen en cuenta aspectos como el apalancamiento son más sólidos desde el punto de vista estadístico; sin embargo, eso implica que se está realizando algún tipo de modelización. Si sólo tienes, por ejemplo, las puntuaciones de un examen o la edad de las personas mayores (casos plausibles de tu ejemplo), creo que es práctico y razonable sospechar del valor atípico que mencionas. Podrías mirar la media general y la media recortada y ver cuánto cambia, pero eso estará en función del tamaño de tu muestra y de la desviación de la media de tus valores atípicos.

Acerca del autor

admin

Ver todos los artículos