Tratamiento de registros duplicados en Excel

Entrada núm: 15 of 16 de la serie Análisis de datos

Cuando usamos Excel como una pequeña base de datos, tarde o temprano nos encontramos con la necesidad de actuar sobre los registros duplicados. El tratamiento de registros duplicados en Excel se puede resumir en tres tareas diferentes:

1-Localizar duplicados en una lista

Usaremos fórmulas que calculen el número de ocurrencias de cada registro. Los registros únicos tendrán el valor 1, y el resto tendrán valores mayores que 1. En el video adjunto, abordaremos este problema de tres formas diferentes.

  1. Adjuntando una columna con la fórmula CONTAR.SI
  2. Adjuntando una columna con la formula SUMAPRODUCTO
  3. Aplicando formato condicional, opción DUPLICADOS

2-Eliminar duplicados de una lista

A veces sabemos que, por algún motivo, se han producido duplicados o valores repetidos en una lista que solo debería tener valores únicos. Entonces lo único que nos interesa es limpiar la lista de valores duplicados. Para eso usaremos dos métodos del menú de la cinta o ribbon de Excel. Con la lista seleccionada tendremos dos opciones:

  1. Datos/Quitar duplicados. Este es un proceso poco claro, pues perdemos la información que tuviéramos en la lista.
  2. Filtro/Copiar valores únicos. Con este método, al menos conservamos la información original, de forma que siempre podremos volver a ella por si es necesario hacer comprobaciones.

3-Impedir la entrada de duplicados en una lista

A veces tenemos bases de datos que contienen campos que, necesariamente, no pueden tener valores repetidos. En este caso tenemos que implementar un método que asegure que si se intenta introducir un valor que ya está presente en la lista, el programa no lo permita. Daremos dos soluciones a este problema.

  1. Validación/Personalizada/Contar.Si. Esta aproximación funciona muy bien, pero tiene ciertas inconsistencias si intentamos introducir nombres de rango en la fórmula personalizada de validación. No obstante, dejaremos esas inconsistencias para otro artículo.
  2. Evento de hoja que activa macro. Esta es una solución automatizada que se implementa a base de una subrutina que se activa con el evento de hoja SelectionChange. La lista de partida no debe contener duplicados y en el caso de que se intente introducir un valor repetido, la macro lo localizará y lo borrará al cambiar la selección o al validar la entrada pulsando retorno. La macro lee toda la lista y elimina el valor recién entrado si encuentra otro igual en lo anteriormente introducido. Por eso debe partir de una lista “limpia”.

 

Series Navigation<< Generador de muestras aleatorias sin repeticiónEliminar filas con valores repetidos en varias columnas >>

Comments

So empty here ... leave a comment!

Deja tu comentario aquí:

Sidebar



A %d blogueros les gusta esto: