domingo, 23 de noviembre de 2014

Coeficiente R de Pearson

Coeficiente de correlación de Pearson

En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

De manera análoga podemos calcular este coeficiente sobre un estadístico muestral,denotado como r {xy}:
               
                     


Interpretación, el valor del índice de correlación varía en el intervalo [-1,1]:

  • Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.
  • Si 0 < r < 1, existe una correlación positiva.
  • Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
  •  Si -1 < r < 0, existe una correlación negativa.
  • Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

sábado, 22 de noviembre de 2014

Medidas de tendencia central

Las medidas de tendencia central

Las medidas de tendencia central y variabilidad son medidas descriptivas cuantitativas en las que ciertos valores numerosos pueden utilizarse de referencia para describir propiedades de alguna variable de una población en estudios, con parámetros definidos (promedios,varianzas, desviaciones estándar entre otros) de una determinada muestra por medio de estadísticos especificados.

Para determinar las medidas de tendencia central o variabilidad es importante conocer las condiciones en que se disponen los datos,ya que en estos pueden estar de forma no agrupada en tablas (datos no tabulados) o bien se encuentren agrupados en una tabla de distribución de frecuencias (datos tabulados) por lo que en función de lo anterior se establecen ciertas metodologías para ubicar las medidas descriptivas deseadas (las metodologías se exponen en los siguientes apartados).

Media:
Es la suma de todos los valores observables de una variable muestra una poblacional entre la cantidad de valores obtenidos y se identifica comúnmente como media aritmética o promedio aritmético. La media se puede considerar como un punto de equilibrio de un conjunto de datos (semejante a un centro de gravedad).

Mediana (Med):
Medida descriptiva central de un conjunto de datos previamente ordenados de menor a mayor o viceversa y que toma un valor tal que el número de datos menores que él es igual al número de datos mayores que él por lo que divide cantidad de datos en dos mitades iguales (50% hacia un extremo y otro 50% hacia otro extremo)

Moda (Mod):
Valor de un conjunto de datos que aparece con más frecuencia, es decir es el más común por que se repite más.


Desviación estándar

La varianza es similar a la desviación media porque se basa también en realizar la resta entre cada uno de los valores del conjunto de datos con respecto a su media aritmética, pero con la diferencia en que antes de sumar las desviaciones se elevan al cuadrado. Por lo tanto esto se puede definir de la forma siguiente:
  • Varianza: Media aritmética de las desviaciones cuadráticas con respecto a la media.
  • Desviación estándar: Raíz cuadrada de la varianza.

La estadística con otras áreas de conocimiento

La estadística con otras áreas de conocimiento

Las ciencias naturales: 
Se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos.


Ciencias sociales y económicas, sociología y demografía:
  • En las ciencias sociales y económicas: Es un pilar básico del desarrollo de la demografía y la sociología aplicada.
  • En economía: Suministra los valores que ayudan a descubrir interrelaciones entre múltiples parámetros macro y micro económicos.


Ciencias médicas:
  • En las ciencias médicas: Permite establecer pautas sobre la evolución de las enfermedades y los enfermos, los índices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etcétera.


Informática:
Suele ser bastante común que los estudiantes se cuestionen por qué determinada asignatura está incluida en su plan de estudios. Esto ocurre con frecuencia entre los alumnos de informática respecto de la asignatura de estadística. Las líneas siguientes tratan de aclarar, en parte, la cuestión.



Método científico

Es un método de investigación usado principalmente en la producción de conocimiento en las ciencias. Para ser llamado científico, un método de investigación debe basarse en la empírica y en la medición, sujeto a los principios específicos de las pruebas de razonamiento. El método científico es sumamente importante e indispensable para la estadística, ya que es la base y la guía del proceso mediante el cual, se recopilan, se manejan, distribuyen y analizan todos los datos,  esto de manera sistematizada y concreta.

Sus pasos son:

Observación:
Consiste en examinar atentamente los hechos y fenómenos que tienen lugar en la naturaleza y que pueden ser percibidos por los sentidos.

Formulación de hipótesis:
Consiste en elaborar una explicación provisional de los hechos observados y de sus posibles causas.


Experimentación:
Consiste en reproducir y observar varias veces el hecho o fenómeno que se quiere estudiar, modificando las circunstancias que se consideren convenientes. Durante la experimentación, los científicos acostumbran a realizar múltiples medidas de diferentes magnitudes físicas. De esta manera pueden estudiar qué relación existe entre una magnitud y la otra.

Conclusiones:
Consiste en la interpretación de los hechos observados de acuerdo con los datos experimentales. A veces se repiten ciertas pautas en todos los hechos y fenómenos observados. En este caso puede enunciarse una ley. Una ley científica es la formulación de las regularidades observadas en un hecho o fenómeno natural. Por lo general, se expresa matemáticamente. Las leyes científicas se integran en teorías. Una teoría científica es una explicación global de una serie de observaciones y leyes interrelacionadas.



Pasos importantes para el metodo científico.

Estadística

Estadística

La estadística se puede definir como:

  • Una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.
  • Un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población.
  • Una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares.
La estadística al igual que otros campos de estudio tiene elementos específicos que ayudan tanto a la interpretación como al manejo de tal, algunos de estos elementos son:

Población:
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.

Población finita:
Es el conjunto compuesto por una cantidad limitada de elementos, como el numero de especies, estudiantes, trabajadores, etc.

Población infinita:
Es aquella lo bastante grande con relación al sistema de servicio como para que el cambio de tamaño ocasionado por sustracciones o adiciones a la población no afecte significativamente las probabilidades del sistema.

Muestra:
Es una parte generalmente pequeña, que se toma del conjunto total para analizarlo y hacer estudios que le permitan al investigador inferir o estimar las características de un problema.

Fenómeno: 
Son objetos de estudio y análisis sobre su mayor o menos intensidad de producción.

Fenómeno determinista: 
Es aquel en el que se obtiene siempre el mismo resultado bajo las mismas condiciones iniciales, la relación causa-efecto se conoce en su totalidad. 

Fenómeno aleatorio:
Es aquel que bajo las mismas condiciones iniciales, puede presentar resultados diferentes.

Variable:
Es una medida en un experimento, representada por "x" o por un "y"  que puede tomar un valor de un conjunto de valores.

Variable cualitativa:
Es la que se manifiesta en atributos como pueden ser: bueno, malo, aceptable, regular, defectuoso, feo, bonito, etc.

Variable cuantitativa: 
Es la que se puede expresar en cantidades, por ejemplo: 18.9, 13, 75.41, 988812, etc.

Variable discreta:
Es la que puede tomar, por conteo, cualquier valor.

Variable continua: 
Es la que puede tomar cualquier valor decimal, del intervalo de una recta, como consecuencia de una medición

Estadística:
Es el conjunto de procedimientos destinados a recopilar, procesar y analizar la información que se obtiene con una muestra para inferir las características o parámetros de una población o de un problema determinado.

Estadística descriptiva: 
Tiene por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones a fin de compararlas. 

Estadística inferencial:
Es una parte de la estadística que estudia como sacar conclusiones sobre las características generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de resultados obtenidos.

Probabilidad: 
Es una rama de las matemáticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que un suceso o experimento produzca un determinado resultado.

domingo, 28 de septiembre de 2014

Variable cualitativa y cuantitativa

Variable cualitativa y cuantitativa

Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:

Variable cualitativa nominal: Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo:
  • El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.


Variable cualitativa ordinal: Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden. Por ejemplo:
  • La nota en un examen: suspenso, aprobado, notable, sobresaliente.
  • Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
  • Medallas de una prueba deportiva: oro, plata, bronce.


Ejemplo de variables cualitativas (Diagrama de barras)


Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable discreta: Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo:
  • El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua: Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo:
  • La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
  • En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.

Ejemplo de variables cuantitativas (Histograma)


Estas son las características y tipos más importantes de las variables tanto cualitativas como cuantitativas, a partir de esto podemos comenzar a leer y estructurar este tipo de gráficas.
A continuación les dejo un link para que puedan entender los gráficos de cada una de las gráficas que les acabo de presentar esperando que sean de gran utilidad para ustedes.




Tabla estadística

ESTADÍSTICA


Tabla estadística

O cuadro estadístico, es un arreglo rectangular de renglones y columnas que se utiliza para publicar de forma organizada información de algún estudio estadístico sobre una o más variables.
Se define también a la tabla estadística como el conjunto de datos estadísticos ordenados en columnas y filas, que permite leer, comparar e interpretar las características de una o más variables. Los datos son el resultado de una investigación estadística.


Elementos importantes:
  • Código de número de identificación: Reconocer de forma práctica una tabla estadística. Este se debe de ubicar en la parte superior izquierda de la tabla.
  • Título: Se coloca después del código, debe ser claro y preciso. Para lograr un letrero ideal es importante que responda a las preguntas ¿Dónde? ¿Qué? ¿Cómo? ¿Cuándo?.
  • Nota de título: Texto concreto que se ubica entre paréntesis después del título. Clarifica puntos importantes.
  • Encabezado: Títulos en la parte superior de las colunas que conforman la tabla.. Existen dos tipos; de matiz, que se ubica de lado izquierdo de la tabla en la primera columna y del cuerpo de la tabla, que se ubican en la parte superior de las demás columnas.
  • Cuerpo: área de la tabla constituida por una sección de casillas o celdas donde se colocan los datos numéricos correspondientes.
  • Pie de tabla: Es la parte inferior de la tabla donde se pueden colocar textos muy concretos que sirven para clarificar algunos aspectos relevantes.
  • Nota: Texto que proporciona información en forma de definiciones.
  • Llamadas: Son aclaraciones textuales muy específicas en determinadas secciones de tabla.
  • Fuente: Es un texto que tiene como propósito señalar el documento de donde se obtiene la información presentada.

Tabla para variable cualitativa

En el caso de variable cualitativa no se pueden calcular las frecuencias acumuladas pues no es posible establecer un orden en las clases dentro de la modalidad.Colocamos en la tabla aquellos valores que son independientes del lugar en que se pongan las modalidades.A partir de aquí se determina n dos tipos de frecuencias simples que son: la absoluta y la relativa.


Tabla de distribución de frecuencias

La construcción de una tabla de frecuencias para datos cuantitativos presenta como su punto de mayor importancia la determinación del número de intervalos (clases) que la conformaran. Este número depende de la cantidad y de la naturaleza de los datos a resumir y del propósito que se busca con el resumen. A continuación se presentan ciertas pautas para la construcción de una tabla de frecuencias.
El número de intervalos debe escogerse de acuerdo con el número de datos.
Una vez escogido el número de intervalos, se determina la longitud que deben tener los intervalos, dividiendo el rango en el número de clases o intervalos. rango/Número de clases.
El primer intervalo debe contener el menor de los datos y el último el mayor.