Registros duplicados en varias columnas

Entrada núm: 25 of 25 de la serie Análisis de datos

Trabajo general con registros duplicados

Nos encontramos de nuevo ante un problema de registros duplicados, que en esta ocasión nos plantea Elías, desde Chile. En realidad no es tan nuevo, pues ya son varios los casos que hemos resuelto sobre registros duplicados. El problema de Elías se refiere a filas (registros en nomenclatura de bases de datos) duplicadas según más de una columna (campos en términos de bases de datos), asunto sobre el que también he hecho ya alguna entrada específica.

Localizar registros no únicos

La primera tarea con registros duplicados, sea cual sea el número de criterios, o campos, o columnas a considerar, es localizarlos, y eso lo hacemos con alguna de las variantes de la fórmula =CONTAR.SI, por ejemplo =CONTAR.SI.CONJUNTO, para varios criterios, o quizás usando la concatenación para juntar los criterios en una única columna. Aquellas filas dónde la fórmula construida arroje un valor mayor que 1, serán registros duplicados, o mejor dicho, registros NO ÚNICOS, puesto que nada impide que sean triplicados o cuadruplicados, o más.

Resaltar registros no únicos

En segundo lugar tenemos que marcar o resaltar estas filas que contienen los registros no únicos y la mejor forma de hacerlo es usando la utilidad de FORMATO CONDICIONAL y basarla en una fórmula relacionada con la columna en la que hemos obtenido la cuenta de registros. En el cuadro de diálogo flotante del formato condicional seleccionaremos Nueva regla, y después Usar fórmula. Las fórmulas que usemos en los cuadros flotantes de formato condicional tienen que empezar, como toda fórmula, por el signo igual “=”, y expresar una pregunta lógica, o sea, una pregunta cuyas únicas respuestas sean SI/NO, o en términos correctos de las variables lógicas de la hoja en español: VERDADERO/FALSO. La aplicación de esta condición deberá incluir referencias absolutas (o sea con signo $ previo) en columna, o sea justo antes de la letra de columna, para que al propagarse a toda la selección lo haga de forma correcta, dejando libre o “relativa”, o sin signo $ previo, la referencia a la fila, que es lo que debe variar.

Eliminar registros no únicos

Por último tenemos que dar la opción de eliminar los registros duplicados. Para esto tenemos al menos dos buenas opciones desde las herramientas nativas de Excel: el filtro avanzado con copia de registros únicos y la opción directa de Quitar duplicados, ambas en la pestaña de DATOS. Sin embargo la que utilizo en el video es la que diseñé tiempo atrás para dar una solución general a los problemas de este tipo, o sea de eliminación de registros duplicados en columnas múltiples. En el video uso la opción de importar el archivo con extensión .bas que antes había exportado del ejemplo de antaño, es decir del libro de Excel que preparé para la eliminación de registros duplicados y que vuelvo a enlazar aquí. En la zona de descarga de esta entrada, más abajo, acompaño un enlace para que ustedes se lo puedan bajar y así tengan esa solución definitiva y generalizada para eliminar registros duplicados con múltiples criterios. Para instalarlo en su archivo hagan como yo en el video, vayan al editor VBA e importen el archivo .bas.

Zona de descarga

QuitFilRep
QuitFilRep
QuitFilRep.bas
3.9 KiB
15 Downloads
Details
Series Navigation<< Separar cadena de texto según comas decimales

Comments

So empty here ... leave a comment!

Deja tu comentario aquí:

Sidebar



A %d blogueros les gusta esto: