Los valores infinitos y NaN (Not a Number) en estadística para el manejo del Big Data forman parte de la primera instancia de la estadística de los macrodatos que pretende identificar cuáles son las características de los datos con los que te encuentras trabajando, de manera que los procesos, las asignaciones y operaciones que apliques sean consecuentes con el tipo de información que los datos pueden brindarte.
En KeepCoding reconocemos la importancia de este tipo de saberes, así que si pretender aprender más al respecto, ¡quédate hasta el final de este post! A continuación, te lo explicamos todo sobre los valores infinitos y NaN (Not a Number) en estadística para el manejo Big Data.
¿Cómo funciona la estadística para Big Data?
En primera instancia, antes de ponerte en contexto con los valores infinitos y NaN (Not a Number) en estadística para el manejo del Big Data, te recordamos que este tipo de procesos estadísticos tratan de entender las variables de la información y su relación entre ellas; de esta manera, te ayudan a comprender cómo es tu población de los datos por medio de los estimadores, los percentiles, la varianza, la moda, las operaciones, los tests estadísticos, las asignaciones, etc.
Por otra parte, la estadística en el Big Data requiere de un sistema de código abierto (open source) como lo es R, por ello, este es el lenguaje de programación predilecto, ya que fue diseñado con este fin y en la actualidad sigue estando orientado a la estadística.
Asimismo, la estadística es una disciplina que se dedica a analizar los datos de manera minuciosa para, posteriormente, identificar las coincidencias de variables con las que cuenta la información.
Valores infinitos y NaN (Not a Number) en estadística
Los valores infinitos y NaN (Not a Number) en estadística para el manejo del Big Data son un tipo de datos que podrás encontrarte dentro del gran volumen de datos con el que estés trabajando. Por ello, son parte de la primera etapa de identificación de la información que se está utilizando.
En primer lugar, los valores infinitos hacen referencia al tipo de datos que en operaciones básicas arrojan como resultado valores infinitos o no convencionales que no pueden esquematizarse porque son un punto flotante.
En segundo lugar, los NaN (Not a Number) son un tipo de resultado arrojado por las operaciones básicas que, por un lado, pueden haberse desarrollado mal o, por otra lado, no tienen un sentido matemático.
Por último, los valores infinitos y NaN (Not a Number) en estadística para el manejo del Big Data cuentan con Inf e -Inf, que son positivo y negativo para el primer tipo de datos, mientras que NaN significa “Not a Number” en el segundo.
Por ejemplo
Ahora, te exponemos cómo se escribe este tipo de funciones de valores infinitos y NaN (Not a Number) en estadística para el manejo del Big Data por medio de un ejemplo práctico:
#x <- 10 #x <- 1/0 x <- 0/0 paste("El valor de x es",x) is.finite(x) is.infinite(x) is.nan(x)
‘El valor de x es NaN’
FALSE
FALSE
TRUE
#Valores NaN is.nan(NaN) is.nan(0/0) is.nan(Inf-Inf)
TRUE
TRUE
TRUE
La comprobación de si un número es NaN se tiene que realizar con la funcion is.nan()
x<-NaN x==NaN is.nan(x)
<NA>
TRUE
Aprende más sobre el manejo Big Data
En este post, te hemos explicado las bases sobre los valores infinitos y NaN (Not a Number) en estadística. Sin embargo, estos son solo un tipo de resultados de la gran variedad que puede producirse, ¡así que aún falta mucho por aprender sobre el manejo Big Data!
Por esta razón, desde KeepCoding te aconsejamos echarle un vistazo al Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning si lo que deseas es continuar aprendiendo y formarte como un data scientist profesional. Por medio de 11 módulos y de la mano de grandes expertos en el mundo Big Data, podrás instruirte en los sistemas, lenguajes y programas más importantes para el manejo de los macrodatos. ¡No esperes más para inscribirte!