-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathscript.sh
More file actions
executable file
·38 lines (27 loc) · 1.02 KB
/
Copy pathscript.sh
File metadata and controls
executable file
·38 lines (27 loc) · 1.02 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
#!/bin/bash
# Variáveis que definem os diretórios
download_folder=downloads
extract_folder=arquivos
concat_folder=concatenados
mkdir -p "$download_folder"
cd "$download_folder"
# Faz o download dos dados
curl -O http://agencia.tse.jus.br/estatistica/sead/odsele/consulta_cand/consulta_cand_[1996-2016:2].zip
cd "../"
mkdir -p "$extract_folder"
# Extrai os dados dos arquivos compactados
unzip -d "$extract_folder" "$download_folder""/*.zip" "*.txt"
mkdir -p "$concat_folder"
for ano in {1996..2016..2}; do
file=$concat_folder/$ano.csv
# Concatena todos os arquivos de determinado ano
find "$extract_folder" -regex ".*$ano.*" -print0 | xargs -0 cat > "$file"
# Identifica qual a codificação original
encoding=`file -b --mime-encoding "$file"`
mv "$file" "$file.bkp"
# Converte o arquivo concatenado para UTF-8 para evitar problemas com acentuação
iconv -f "$encoding" -t utf-8 "$file.bkp" > "$file"
rm "$file.bkp"
# Faz pequenas correções nos dados
sed -r -f subs.sed -i "$file"
done