Skip to content

JesusBandaG/hackathon_RIIAA2021

 
 

Repository files navigation

Hackathon RIIAA 2021 "JusticIA para los desaparecidos"

Nombre del equipo
<inserte nombre>

Integrantes

  • Carolina Acosta
  • Gerald García
  • Jesús Banda
  • Cuauhtémoc Bautista
  • Arturo Granados

Descripción

El objetivo de este proyecto es la creación de un multi-clasificador utilizando las fichas digitalizadas originalmente producidas por la extinta Dirección Federal de Seguridad (DFS); el cual será capaz de clasificar el texto como: persona (víctima o funcionario), organizaciones, lugares, fechas o desconocido. La finalidad de este clasificador es esclarecer el paradero de personas desaparecidas de manera forzada por el Estado Mexicano entre los años 1964 y 1985.

Video descriptivo (Pitch)

Para conocer más sobre nuestro trabajo puedes ver este video .

Pipeline

Pipeline

Cómo correr el código

Ejecutar el notebook que se encuentra en el folder notebooks, llamado `pipeline.ipynb. Es recomendado utilizar Google Colab para su ejecución, con GPU.

La salida de evaluación serán 2 .csv nombrados: reto_2a.csv y reto_2b.csv; el path se especifíca dentro del notebook. Existe un tercer .csv nombrado similitud.csv que nos ayudará a encontrar similitud de organizaciones, nombres o estados existentes en la lista que se dispuso previamente y fue dada en el drive del "Hackathon RIIAA 2021: Justicia para los desaparecidos."

Notas

Requisitos en sistema:

Versión python

python 3.7.4

Otros:

libleptonica-dev tesseract-ocr libtesseract-dev

Estructura del proyecto

+ binarize (módulo para procesar la imagen obtenido de Gallego 2019. Ver Referencia 1)
+ imagenes
+ notebooks
    + pipeline.ipynb (Notebook con pipeline desde la lectura de la imagen original hasta el output esperado de reconocimiento de entidades)
+ src
    + busquedadesaparecidos 
        + ner (módulo para buscar el no. de expediente y reconocer entidades con spacy)
        + ocr (módulo para procesar imagen y extraer texto)
        + utils (módulo general y limpieza de texto)
+ requirements.txt

Para instalar la librería en ambiente virtual, utilizar (ya esta en las instrucciones del notebook):

pip install "git+https://github.com/caroacostatovany/hackathon_RIIAA2021.git#egg=busquedadesaparecidos&subdirectory=src"

Referencias

  • All Binarize module was obtained from Gallego 2019
  • AGUAYO, Sergio, 1968. Los archivos de la violencia. México: Grijalbo, 1998.
  • AGUAYO, Sergio, La charola. Una historia de los servicios de inteligencia en México. México: Grijalbo, 2001. AGUAYO, Servio, El Cisen y la AGN, Reforma, México, 29 de abril de 2015.
  • BOCCIA Paz, Alfredo et. al., En los sótanos de los generales. Los documentos ocultos del Operativo Cóndor, Asunción: Expolibro-Servilibro, 2002.
  • DA SILVA Canela Ludmila y Elizabeth Jelin (Compiladores), Los archivos de la represión: Documentos, memoria y verdad, Siglo XXI.
  • GARCÍA Morales, Alfonso et. al., México. La Fiscalía Especial para Movimientos Sociales y Políticos del Pasado, en Rubén Ruiz Guerra (coord.). Entre la memoria y la justicia.
  • Experiencias latinoamericanas sobre la Guerra Sucia y la defensa de Derechos Humanos. México: UNAM, 2005.
  • GLOCKNER Fritz, Los años heridos. La historia de la guerrilla en Mèxico 1968 – 1985, JELIN Elizabeth, Introducción. Gestión política, gestión administrativa y gestión histórica: ocultamientos y descubrimiento de los archivos de la represión, en Jelin (2002) Jelin, Elizabeth y Ludmila Da Silva, Los archivos de la represión. Documentos memoria y verdad. Madrid: Siglo XXI, 2002.
  • ORTEGA Galindo, Anuar, Sobre el parcial cierre del archivo de la DFS en el Archivo General de la Nación, en Vertical, 24 de abril de 2015, Disponible en http://verticalmex.com/sobre-el-parcial-cierre-del-archivo-de-la-dfs-en-el-archivo-general-de-la-nacion/
  • PAXMAN Andrew, Crisis en el Archivo General de la Nación, en Arena Pública, 4 de abril de 2015, Disponible en http://arenapublica.com/blogs/andrew-paxman/2015/04/06/3427
  • OVALLE Camilo Vicente, Tiempo suspendido. Una historia de la desaparición forzada en Mèxico, 1940 - 1980.
  • PÉREZ Alfaro, María Magdalena, “Archivo, censura, memoria”, en El presente del pasado 2. 0, 16 de abril de 2015, Disponible en http://elpresentedelpasado.com/2015/04/16/archivo-censura-memoria/
  • VERDUZCO Carolina e Ileana Chávez, Informe histórico presentado a la Sociedad Mexicana: fiscalía especial FEMOSPP. México: Comité 68 Pro-Libertades Democráticas, 2008.
  • VICENTE Ovalle, Camilo, Archivo: entre historia, democracia e impunidad, 29 de abril de 2015, Disponible en http://camilovicente.com/wp-content/uploads/2015/05/Archivo_entre-_historia_democracia_impunidad.pdf

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 92.6%
  • Python 7.4%