Hace dos años que tengo la idea de hacer un sistema integral de gestion de la cursada.
Es algo muy largo para explicar. Actualmente, estoy centrandome en generar un repositorio con apuntes de mi facultad.
La idea, es que estén tageadas por materia, por temas, por puntuacion, y un tag para saber si es bibliografia oficial o no.
Despues de bajarme muchos apuntes, existe el siguiente problema: Varios archivos, en distintas carpetas, con distintos nombres, pero que son iguales.
No encontre una opcion para que un servidor SVN filtre por MD5, envez de por path+nombre del archivo. Asique pensé en hacerme un script... pero como uso GNU/Linux, lo solucione de la siguiente forma:
A ) find ./* -type f -print0 | xargs -0 -n 1 md5sum >> misMd5.MD5
B ) uniq --check-chars=32 -D misMd5.MD5
Esto, me tirará una lista de archivos.
20949771f76a1fca0015e8f56dca4fca ./1er anio/Discreta/Basura/Matematica Discreta - Apuntes Dictado semi-presencial(2).rar
20949771f76a1fca0015e8f56dca4fca ./1er anio/Discreta/Basura/Matematica Discreta - Apuntes Dictado semi-presencial.rar
1aba56a807acaa308b7ca7ae9ee1ccb4 ./1er anio/Algoritmos/Examenes/AYE_06_12_2005.tif (2)
1aba56a807acaa308b7ca7ae9ee1ccb4 ./1er anio/Algoritmos/Examenes/AYE_06_12_2005.tif
01950cb9e9a5d5d40903dbfd9025a33b ./1er anio/Algoritmos/Examenes/Final 16.02.08 PremSociosCiaAviac.doc
01950cb9e9a5d5d40903dbfd9025a33b ./1er anio/Algoritmos/Examenes/20080216F1_PremSociosCiaAviac.doc
e461af86a659ecb51df414bd0a47cbb1 ./1er anio/Arquitectura/Basura/2008/Final-Dic3-2008_Resuelto.doc
e461af86a659ecb51df414bd0a47cbb1 ./1er anio/Arquitectura/Basura/Final-Dic3-2008_Resuelto.doc
Y asi, debería de eliminar, por ahora a mano, todas las veces que se repite un mismo archivo ;).
La linea final:
find ./* -type f -print0 | xargs -0 -n 1 md5sum | uniq --check-chars=32 -D
sábado, 29 de mayo de 2010
Suscribirse a:
Comentarios (Atom)