¿Qué es NumPy y cómo funciona?

| Última modificación: 16 de abril de 2024 | Tiempo de Lectura: 3 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

Si estás relacionado con el mundo del Big Data, seguramente has escuchado hablar del término Numpy, pero, sabes qué es y ¿qué tipo de datos almacena numpy? Este nombre no es famoso de manera gratuita, ya que en analítica de datos y machine learning es un paquete fundamental para la ciencia de datos en Python.

Numpy es una biblioteca de Python que nos crea un objeto con un array multidimensional, objetos derivados y una serie de operaciones para arrays. Esta librería de código abierto fue creada en 2005 por Travis Oliphant. Su nombre se traduce como Python numérico, de ahí el porqué se trabajan arrays con esta.

Sepas o no de Big Data o de Python, esta es una librería que tendrás que aprender a usar, porque te será útil para realizar arrays y operaciones con matrices.

¿Cómo funcionan los arrays en Numpy?

Numpy tiene una amplia gama de opciones para trabajar, entre ellas están el dominio del álgebra lineal, la transformación de Fourier y las matrices.

Los objetos de arrays en Numpy se denominan ndarray y se encuentran en el núcleo del paquete de la librería. Los ndarrays capturan arrays con n_dimensiones y diferentes tipos de datos.

Una de las grandes ventajas de los arrays de Numpy es que son bastante ordenados, ya que, a diferencia de las listas en Python (que crecen de manera dinámica), este tipo de matrices ya tienen un tamaño fijo en su creación. De modo que cambiar el tamaño de un ndarray creará una nueva matriz y eliminará la original.

Es necesario que todos los elementos de un array tengan el mismo tipo de datos, porque así tendrán el mismo tamaño en memoria. La única excepción es que se pueden tener matrices de objetos, lo cual permite las matrices de elementos de diferentes tamaños.

Las matrices de Numpy son mucho mejores que las listas en muchas ocasiones, ya que se almacenan en un lugar continuo en la memoria, a diferencia de las listas. Por tanto, durante las transacciones es mucho más rápido acceder a ellas y manipularlas. Esto es lo que se conoce como cercanía de referencias o locality of reference.

Una de las grandes ventajas de los arrays de Numpy es que permiten crear operaciones matemáticas de alta complejidad. Al mismo tiempo, se puede trabajar con ecuaciones lineales de álgebra lineal o estructuras de datos, entre otras operaciones.

Lenguaje que usa Numpy

Contrario a lo que muchos podríamos pensar, Num py no está escrito en lenguaje Python o, al menos, no por completo. Está escrito en Python solo parcialmente, ya que la mayoría de las partes que requieren un cálculo rápido están escritas en C o C++. Esta es una de las razones por las que Numpy es tan rápido, porque está escrito en C y este, al trabajar a bajo nivel y compilar a código máquina directamente, ofrece un gran poder.

¿Cuál es la diferencia entre arrays y matrices?

Las matrices, en un sentido estricto, son un tipo de array de dos dimensiones, ya que poseen un largo y un ancho preciso.

Los arrays, por otro lado, no tienen un número definido de dimensiones; pueden ser de n_dimensiones e ir cambiando. Esto quiere decir que pueden ser cubos, hipercubos o cualquier otro tipo de forma tridimensional, contrario a las matrices, que poseen una forma rectangular con sus filas y columnas bien definidas.

Así pues:

  • Los arrays de una dimensión representan vectores.
  • Los arrays de dos dimensiones representan matrices.
  • Los arrays más grandes representan tensores.
numpy

¿Cómo instalar Numpy?

Hay dos modos de instalar Numpy:

Con conda

Si usas conda, Numpy se puede instalar de manera predeterminada o por medio de conda-forge:

//importar numpy en python
conda create -n my-env
conda activate my-env

//que es opencv
conda config --env --add channels conda-forge

conda install numpy

Con pip

También puedes instalar Numpy con pip en una sola línea:

pip install numpy

Con estas pocas líneas ya tienes a tu disposición una de las librerías más potentes e importantes dentro del machine learning y el Big Data.

¿Quieres seguir aprendiendo?

Existen muchísimas otras librerías que pueden serte de gran utilidad en el proceso de análisis y ciencia de datos. Si quieres conocer más a fondo cuáles son estas y otras temáticas indispensables en el mundo del Big Data, te recomendamos el Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, una formación intensiva que te ayudará a adquirir todos los conocimientos teóricos y prácticos para impulsar tu carrera. ¡No lo pienses más y solicita información ahora!

Sandra Navarro

Business Intelligence & Big Data Advisor & Coordinadora del Bootcamp en Data Science, Big Data & Machine Learning.

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado