domingo, 23 de noviembre de 2014

Coeficiente R de Pearson

Coeficiente de correlación de Pearson

En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

De manera análoga podemos calcular este coeficiente sobre un estadístico muestral,denotado como r {xy}:
               
                     


Interpretación, el valor del índice de correlación varía en el intervalo [-1,1]:

  • Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.
  • Si 0 < r < 1, existe una correlación positiva.
  • Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
  •  Si -1 < r < 0, existe una correlación negativa.
  • Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

sábado, 22 de noviembre de 2014

Medidas de tendencia central

Las medidas de tendencia central

Las medidas de tendencia central y variabilidad son medidas descriptivas cuantitativas en las que ciertos valores numerosos pueden utilizarse de referencia para describir propiedades de alguna variable de una población en estudios, con parámetros definidos (promedios,varianzas, desviaciones estándar entre otros) de una determinada muestra por medio de estadísticos especificados.

Para determinar las medidas de tendencia central o variabilidad es importante conocer las condiciones en que se disponen los datos,ya que en estos pueden estar de forma no agrupada en tablas (datos no tabulados) o bien se encuentren agrupados en una tabla de distribución de frecuencias (datos tabulados) por lo que en función de lo anterior se establecen ciertas metodologías para ubicar las medidas descriptivas deseadas (las metodologías se exponen en los siguientes apartados).

Media:
Es la suma de todos los valores observables de una variable muestra una poblacional entre la cantidad de valores obtenidos y se identifica comúnmente como media aritmética o promedio aritmético. La media se puede considerar como un punto de equilibrio de un conjunto de datos (semejante a un centro de gravedad).

Mediana (Med):
Medida descriptiva central de un conjunto de datos previamente ordenados de menor a mayor o viceversa y que toma un valor tal que el número de datos menores que él es igual al número de datos mayores que él por lo que divide cantidad de datos en dos mitades iguales (50% hacia un extremo y otro 50% hacia otro extremo)

Moda (Mod):
Valor de un conjunto de datos que aparece con más frecuencia, es decir es el más común por que se repite más.


Desviación estándar

La varianza es similar a la desviación media porque se basa también en realizar la resta entre cada uno de los valores del conjunto de datos con respecto a su media aritmética, pero con la diferencia en que antes de sumar las desviaciones se elevan al cuadrado. Por lo tanto esto se puede definir de la forma siguiente:
  • Varianza: Media aritmética de las desviaciones cuadráticas con respecto a la media.
  • Desviación estándar: Raíz cuadrada de la varianza.

La estadística con otras áreas de conocimiento

La estadística con otras áreas de conocimiento

Las ciencias naturales: 
Se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos.


Ciencias sociales y económicas, sociología y demografía:
  • En las ciencias sociales y económicas: Es un pilar básico del desarrollo de la demografía y la sociología aplicada.
  • En economía: Suministra los valores que ayudan a descubrir interrelaciones entre múltiples parámetros macro y micro económicos.


Ciencias médicas:
  • En las ciencias médicas: Permite establecer pautas sobre la evolución de las enfermedades y los enfermos, los índices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etcétera.


Informática:
Suele ser bastante común que los estudiantes se cuestionen por qué determinada asignatura está incluida en su plan de estudios. Esto ocurre con frecuencia entre los alumnos de informática respecto de la asignatura de estadística. Las líneas siguientes tratan de aclarar, en parte, la cuestión.



Método científico

Es un método de investigación usado principalmente en la producción de conocimiento en las ciencias. Para ser llamado científico, un método de investigación debe basarse en la empírica y en la medición, sujeto a los principios específicos de las pruebas de razonamiento. El método científico es sumamente importante e indispensable para la estadística, ya que es la base y la guía del proceso mediante el cual, se recopilan, se manejan, distribuyen y analizan todos los datos,  esto de manera sistematizada y concreta.

Sus pasos son:

Observación:
Consiste en examinar atentamente los hechos y fenómenos que tienen lugar en la naturaleza y que pueden ser percibidos por los sentidos.

Formulación de hipótesis:
Consiste en elaborar una explicación provisional de los hechos observados y de sus posibles causas.


Experimentación:
Consiste en reproducir y observar varias veces el hecho o fenómeno que se quiere estudiar, modificando las circunstancias que se consideren convenientes. Durante la experimentación, los científicos acostumbran a realizar múltiples medidas de diferentes magnitudes físicas. De esta manera pueden estudiar qué relación existe entre una magnitud y la otra.

Conclusiones:
Consiste en la interpretación de los hechos observados de acuerdo con los datos experimentales. A veces se repiten ciertas pautas en todos los hechos y fenómenos observados. En este caso puede enunciarse una ley. Una ley científica es la formulación de las regularidades observadas en un hecho o fenómeno natural. Por lo general, se expresa matemáticamente. Las leyes científicas se integran en teorías. Una teoría científica es una explicación global de una serie de observaciones y leyes interrelacionadas.



Pasos importantes para el metodo científico.

Estadística

Estadística

La estadística se puede definir como:

  • Una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.
  • Un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población.
  • Una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares.
La estadística al igual que otros campos de estudio tiene elementos específicos que ayudan tanto a la interpretación como al manejo de tal, algunos de estos elementos son:

Población:
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.

Población finita:
Es el conjunto compuesto por una cantidad limitada de elementos, como el numero de especies, estudiantes, trabajadores, etc.

Población infinita:
Es aquella lo bastante grande con relación al sistema de servicio como para que el cambio de tamaño ocasionado por sustracciones o adiciones a la población no afecte significativamente las probabilidades del sistema.

Muestra:
Es una parte generalmente pequeña, que se toma del conjunto total para analizarlo y hacer estudios que le permitan al investigador inferir o estimar las características de un problema.

Fenómeno: 
Son objetos de estudio y análisis sobre su mayor o menos intensidad de producción.

Fenómeno determinista: 
Es aquel en el que se obtiene siempre el mismo resultado bajo las mismas condiciones iniciales, la relación causa-efecto se conoce en su totalidad. 

Fenómeno aleatorio:
Es aquel que bajo las mismas condiciones iniciales, puede presentar resultados diferentes.

Variable:
Es una medida en un experimento, representada por "x" o por un "y"  que puede tomar un valor de un conjunto de valores.

Variable cualitativa:
Es la que se manifiesta en atributos como pueden ser: bueno, malo, aceptable, regular, defectuoso, feo, bonito, etc.

Variable cuantitativa: 
Es la que se puede expresar en cantidades, por ejemplo: 18.9, 13, 75.41, 988812, etc.

Variable discreta:
Es la que puede tomar, por conteo, cualquier valor.

Variable continua: 
Es la que puede tomar cualquier valor decimal, del intervalo de una recta, como consecuencia de una medición

Estadística:
Es el conjunto de procedimientos destinados a recopilar, procesar y analizar la información que se obtiene con una muestra para inferir las características o parámetros de una población o de un problema determinado.

Estadística descriptiva: 
Tiene por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones a fin de compararlas. 

Estadística inferencial:
Es una parte de la estadística que estudia como sacar conclusiones sobre las características generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de resultados obtenidos.

Probabilidad: 
Es una rama de las matemáticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que un suceso o experimento produzca un determinado resultado.