-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathrapide.sh
More file actions
98 lines (80 loc) · 4.95 KB
/
rapide.sh
File metadata and controls
98 lines (80 loc) · 4.95 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
# bash rapide.sh
#racine=~/Bureau/projet-GEM/corpus/ina/
#corpus=GMMP/radio/lium_asr_xml/
#corpus=corpus_2/lium_asr_xml/
racine=./tv-realite/
#corpus=corpus-tvr2/
corpus=corpus-tvr-all/
#corpus=tmp/
case $1 in
visu) perl visualisation-code-barre_v5.pl $racine/$corpus visu-emo.html $2;;
conv) perl conversion-xml-to-tab.pl $racine/$corpus/ 0.5;;
tag)
for fichier in `ls $racine/$corpus/*tab`
do
cat $fichier | sed "s/^$/§/g" >`echo $fichier | sed "s/tab/tok/"`
done
for fichier in `ls $racine/$corpus/*tok`
do
../../treetagger/bin/tree-tagger -token -lemma -no-unknown ../../treetagger/lib/french.par $fichier >`echo $fichier | sed "s/tok/tag/"`
done
for fichier in `ls $racine/$corpus/*tag`
do
cat $fichier | sed "s/§\t.*\t§//g" >`echo $fichier | sed "s/tag/tok/"`
done
;;
emo) perl fouille-emotions-colonne.pl $racine/$corpus
for fichier in `ls $racine/$corpus/*gen`
do
paste $fichier `echo $fichier | sed "s/gen/time/"` `echo $fichier | sed "s/gen/emo/"` >`echo $fichier | sed "s/gen/paste/"`
done
;;
all)
perl conversion-xml-to-tab.pl $racine/$corpus/ 0
for fichier in `ls $racine/$corpus/*tab`
do
cat $fichier | sed "s/^$/§/g" >`echo $fichier | sed "s/tab/tok/"`
done
for fichier in `ls $racine/$corpus/*tok`
do
../../treetagger/bin/tree-tagger -token -lemma -no-unknown ../../treetagger/lib/french.par $fichier >`echo $fichier | sed "s/tok/tag/"`
done
for fichier in `ls $racine/$corpus/*tag`
do
cat $fichier | sed "s/§\t.*\t§//g" >`echo $fichier | sed "s/tag/tok/"`
done
perl fouille-emotions-colonne.pl $racine/$corpus
for fichier in `ls $racine/$corpus/*gen`
do
paste $fichier `echo $fichier | sed "s/gen/time/"` `echo $fichier | sed "s/gen/emo/"` >`echo $fichier | sed "s/gen/paste/"`
done
perl modifiePasteTSV.pl $racine/$corpus
perl visualisation-code-barre_v5.pl $racine/$corpus visu-emo.html
## Spécifique à corpus-tvr/
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-loft.csv $racine/$corpus/DL_T_VIS_20010503_M6__003_001.tsv >$racine/$corpus/DL_T_VIS_20010503_M6__003_001_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-marseillais.csv $racine/$corpus/20210223W9_19002000.tsv >$racine/$corpus/20210223W9_19002000_confessionnal.tsv
## Spécifique à corpus-tvr2/
## - les fichiers timecode-xxx.csv ont été préparés manuellement par Laetitia, avec trois colonnes : 16:44.500 16:57.200 Jean-Edouard
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-loft1a.csv $racine/$corpus/DL_T_VIS_20010503_M6__003_001.tsv >$racine/$corpus/DL_T_VIS_20010503_M6__003_001_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-loft1b.csv $racine/$corpus/DL_T_VIS_20010503_M6__003_002.tsv >$racine/$corpus/DL_T_VIS_20010503_M6__003_002_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-loft2a.csv $racine/$corpus/DL_T_VIS_20010524_M6__004_001.tsv >$racine/$corpus/DL_T_VIS_20010524_M6__004_001_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-loft2b.csv $racine/$corpus/DL_T_VIS_20010524_M6__004_002.tsv >$racine/$corpus/DL_T_VIS_20010524_M6__004_002_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-loft3a.csv $racine/$corpus/DL_T_VIS_20010531_M6__003_001.tsv >$racine/$corpus/DL_T_VIS_20010531_M6__003_001_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-loft3b.csv $racine/$corpus/DL_T_VIS_20010531_M6__003_002.tsv >$racine/$corpus/DL_T_VIS_20010531_M6__003_002_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-20210223W9.csv $racine/$corpus/20210223W9_19002000.tsv >$racine/$corpus/20210223W9_19002000_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-20210226W9.csv $racine/$corpus/20210226W9_19002000.tsv >$racine/$corpus/20210226W9_19002000_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-20210305W9.csv $racine/$corpus/20210305W9_20002100.tsv >$racine/$corpus/20210305W9_20002100_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-20210402W9.csv $racine/$corpus/20210402W9_20002100.tsv >$racine/$corpus/20210402W9_20002100_confessionnal.tsv
# perl $racine/mapping-timecode.pl $racine/$corpus/timecode-20210512W9.csv $racine/$corpus/20210512W9_19002000.tsv >$racine/$corpus/20210512W9_19002000_confessionnal.tsv
## Boucle pour traiter corpus-tvr-all/ (correspondance directe entre fichier CSV de timecode et XML de transcription)
## - les fichiers nom.csv ont été préparés par David et comprennent notamment les colonnes : 16:44.720 1004.72 16:57.480 1017.48 (nom du personnage absent)
for fichier in `ls $racine/$corpus/*csv`
do
tsv=`echo $fichier | sed "s/csv/tsv/"`
confes=`echo $tsv | sed "s/.tsv/\_confessionnal.tsv/"`
perl $racine/mapping-timecode-fichiers-david.pl $fichier $tsv >$confes
done
#rm $racine/$corpus/*{emo,gen,paste,tab,tag,time,tok}
echo "Terminé"
;;
esac