Aprende a usar Count Distinct en SQL | KeepCoding

Autor: | Última modificación: 9 de abril de 2024 | Tiempo de Lectura: 3 minutos
Temas en este post:

Algunos de nuestros reconocimientos:

Premios KeepCoding

En el mundo del manejo de bases de datos, contar valores únicos es una tarea fundamental. Por eso vamos a aprender a usar la función Count Distinct en SQL. Esta función es una herramienta poderosa que te permite calcular el número de valores distintos que no son nulos en una columna o expresión. En este artículo, exploraremos qué es exactamente, cómo funciona, su sintaxis básica, un ejemplo práctico y los errores que podrían surgir al utilizarla.

Aprendiendo qué es Count Distinct en SQL

Count Distinct en SQL qué es

La función Count Distinct en SQL es una forma eficiente de contar valores únicos en una tabla o conjunto de resultados. Elimina todos los valores duplicados de la expresión especificada antes de realizar el recuento, lo que significa que obtendrás el número de valores únicos no nulos de la tabla o conjunto de resultados que estemos consultando. Esto quiere decir que nos brinda una visión clara y precisa de la distribución de datos en una columna específica.

La capacidad de obtener una visión clara y precisa de la distribución de datos en una columna específica es invaluable en numerosos escenarios, desde análisis de mercado hasta la toma de decisiones empresariales fundamentadas en datos. También se puede utilizar dinámicamente en consultas más complejas para obtener información relevante en tiempo real. Esta flexibilidad la convierte en una herramienta imprescindible para cualquier profesional que trabaje con bases de datos y desee profundizar su comprensión de los datos que maneja.

¿Cómo funciona?

Cuando utilizas la función Count Distinct en SQL, estás solicitando a la base de datos que realice dos tareas principales:

  1. Eliminación de duplicados: Antes de realizar el recuento, la base de datos realiza un proceso de depuración en el que examina cada valor dentro de la columna o expresión especificada. Durante esta fase, la base de datos identifica y elimina todas las repeticiones de valores, dejando únicamente una instancia de cada valor único en la lista. Este proceso asegura que cada valor se cuente solo una vez, evitando así distorsiones en los resultados finales del recuento.
  2. Conteo de valores únicos: Una vez que se han eliminado los duplicados, la base de datos procede a contar cuántos valores únicos distintos permanecen en la columna o expresión. Este conteo se realiza de manera precisa y eficiente, garantizando que cada valor único sea contabilizado correctamente sin duplicaciones ni omisiones. El resultado final proporciona una comprensión clara de la diversidad y distribución de los datos en la columna específica, lo que facilita la toma de decisiones informadas basadas en la información contenida en la base de datos.

Sintaxis básica

La sintaxis básica de la función Count Distinct en SQL es bastante simple:

SELECT COUNT(DISTINCT columna)
FROM tabla;

Donde columna es la columna de la cual deseas contar los valores distintos y tabla es la tabla en la que se encuentra esa columna.

Ejemplo práctico

Para comprender mejor cómo funciona, vamos a tener usar la siguiente tabla llamada usuarios:

IDNombreCiudad
1JuanMadrid
2MaríaBarcelona
3PedroMadrid
4AnaValencia
5CarlosMadrid
Fuente. KeepCoding

Vamos a imaginar que quieres contar cuántas ciudades únicas hay en nuestra tabla. Podrías usar la función Count Distinct en SQL de la siguiente manera:

SELECT COUNT(DISTINCT Ciudad) AS Ciudades_Unicas
FROM usuarios;

Este consulta te devolvería el resultado 3, ya que hay tres ciudades únicas en la tabla: Madrid, Barcelona y Valencia.

Errores que pueden surgir

Aunque Count Distinct en SQL es una función poderosa y útil, es importante tener en cuenta que puede surgir errores si no se utiliza correctamente. Algunos de los errores comunes incluyen:

  • Contar valores nulos: Si no se manejan adecuadamente, los valores nulos pueden afectar el resultado de la función. Es importante asegurarse de que la columna de la que estás contando valores distintos no contenga valores nulos si deseas obtener resultados precisos.
  • Uso excesivo de recursos: En tablas enormes con millones de registros, el uso de la función Count Distinct en SQL puede consumir muchos recursos y ralentizar el rendimiento de la consulta. En tales casos, es recomendable optimizar la consulta o considerar enfoques alternativos.

Sabemos que te apasiona el mundo de la tecnología y por eso deseas cambiar radicalmente tu carrera profesional. Así que, te ofrecemos nuestro Bootcamp de Big Data, Data Science, Machine Learning e IA. En KeepCoding, no solo te enseñamos las habilidades técnicas necesarias para triunfar en el sector IT, sino que también te brindamos el apoyo y la orientación necesarios para asegurar tu éxito. Al finalizar el Bootcamp, estarás listo para enfrentarte a los desafíos del mundo real y abrirte camino en una industria con una alta demanda de profesionales bien preparados. ¡No esperes más para dar el primer paso hacia una vida profesional más emocionante y gratificante!

Artículos ms leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado