forked from leofn/combate_desinformacao_2024
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathindex.qmd
480 lines (286 loc) · 12.6 KB
/
index.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
---
format:
revealjs:
logo: "images/logo.png"
width: 1600
height: 900
self-contained: false
incremental: false
footer: "Slides by [Leonardo F. Nascimento](https://leofn.com) (@leofn3). Code available [on GitHub](https://github.com/LABHDUFBA/openai_ufba_2025)"
theme: ["simple"]
slide-number: c/t
title-slide-attributes:
data-background-image: background-iframe="colored-particles/index.html"
data-background-size: cover
show-slide-number: all
hash-type: number
preview-links: false
preload-iframes: true
---
# {background-iframe="colored-particles/index.html"}
<br><br>
<div style="text-align: center; font-size: 100px;"> <strong>Inteligência artificial na pesquisa sobre desinformação em saúde, extremismos políticos e análise de dados sociais</strong> </div>
<div style="text-align: center; font-size: 60px;"> <strong>LABHDUFBA</strong> </div>
<div style="text-align: center; font-size: 50px;"> 14/03/2025 </div>
{.absolute bottom=0 right=5 width="275" height="300"}
##
<div style="text-align: center; font-size: 55px;"> <strong>O LABORATÓRIO DE HUMANIDADES DIGITAIS DA UFBA</strong> </div>
<br>
::: columns
::: {.column width="60%"}
- Surge em 2018 em associação com o Programa de Pós-Graduação em Ciências Sociais (PPGCS) da UFBA
- Tem como missão promover pesquisa e ensino entre as humanidades e o campo ciência de dados
- Contatos:
- [Website](https://labhd.ufba.br)
- [Twitter](https://twitter.com/labhdufba)
- [Canal do Telegram](https://t.me/labhdufba_labhdufrj)
- [Bluesky](https://bsky.app/profile/labhdufba.bsky.social)
:::
::: {.column width="40%"}

:::
:::
##
<div style="text-align: center; font-size: 55px;"> <strong>O LABHDUFBA investiga, desde 2020, grupos e canais extremista do Telegram...</strong> </div>
<br>
::: columns
::: {.column width="65%"}
::: {.incremental}
- Em parceria com PPGAS/UFSC (Prof. Letícia Cesarino) e apoio do InternetLab
<br><br>
- \+ de 70 milhões de mensagens
<br><br>
- \+ 3.5 milhões de imagens e \+ de 900 mil vídeos
<br><br>
- \+ de 3 milhões de links do Youtube
<br><br>
- \+ 30 Terabytes de dados
:::
:::
::: {.column width="35%"}

:::
:::
##
<div style="text-align: center; font-size: 55px;"> <strong>Aliança entre raciocínio computacional com a compreensão interpretativa das ciências sociais</strong> </div>
<br><br>
::: columns
::: {.column width="60%"}
::: {.incremental}
- **Ciência de dados com ciências sociais**
<br><br>
- **Rastreabilidade** total dos conteúdos
<br><br>
- Detecção de **"talkatives"** e porta-vozes
<br><br>
- **Fine-tunning de modelos de NLP**: NER, Topic Modeling, Clustering e detecção automatizada de violência online, como [racismo](https://huggingface.co/leofn3/modelo_racismo_setfit_5jan24), misoginia e anti-semitismo.
<br><br>
- Telegram enquanto **espaço de experimentações**
:::
:::
::: {.column width="40%"}
::: {style="font-size: 80%;"}
::: {.incremental}
- [Públicos refratados: grupos de extrema-direita brasileiros na plataforma Telegram](https://revista.internetlab.org.br/wp-content/uploads/2023/01/publicos.pdf)
____
- [Demarcating patriotic science on digital platforms: Covid-19, chloroquine and the institutionalisation of ignorance in Brazil](https://www.tandfonline.com/doi/abs/10.1080/09505431.2022.2105691)
____
- [“Intankaveis contra o Bostil”: racismo, misoginia e anti-semitismo em chats do Telegram (2020-2023) - em Breve!](https://periodicosnic.emnuvens.com.br/revista/index)
:::
:::
:::
:::
## Ecossistema multiplataforma de desinformação e radicalização
<br><br>
::: columns
::: {.column width="40%"}
<br>
<div style="text-align: justify"> A utilização **sistemática e estratégica** de ferramentas, tecnologias e serviços que permitem a criação e disseminação de desinformação e incitação à radicalização política em **diferentes plataformas**, como redes sociais, sites de notícias e aplicativos de mensagens. </div>
:::
::: {.column width="60%"}
{fig-align="center"}
:::
:::
#
<div style="text-align: center; font-size: 55px;"> <strong>QUAIS SÃO OS DESAFIOS?</strong> </div>
<br><br>
::: {.incremental}
- Acesso aos dados
<br><br>
- Complexidade metodológica
<br><br>
- Recursos computacionais
:::
#
<div style="text-align: center; font-size: 55px;"> <strong>ACESSO AOS DADOS</strong> </div>
<br>
::: {.incremental}
- **Política de acesso aos dados digitais** de todas as plataformas
<br><br>
- **"Sem API não há solução!"**
<br><br>
- Plataforma pública e auditável de **armazenamento** de conteúdos
<br><br>
- Pensar os **dados digitais enquanto memória social**
<br><br>
:::
#
<div style="text-align: center; font-size: 55px;"> <strong>COMPLEXIDADE METODOLÓGICA</strong> </div>
<br>
::: {.incremental}
- Dados digitais contituem um **"objeto epistêmico complexo"** [Aradau & Blanke, 2015](http://dx.doi.org/10.1177/2053951715609066)
<br><br>
- **Estratégia penelopeana de desinformação e radicalização**
<br><br>
- Coleta de dados em tempo real: a **vigilância-como-método**
<br><br>
- Necessidade de **atualização do Sistema CEP/Conep** diante das pesquisas com dados digitais
<br><br>
- Esboçar, de modo inequívoco, a **relação dos dados coletados de plataformas digitais com a LGPD**
:::
#
<div style="text-align: center; font-size: 55px;"> <strong>Acesso a recursos computacionais</strong> </div>
<br>
::: {.incremental}
- **Necessidade de uma divisão igualitária de recursos com a região norte-nordeste**;
<br><br>
- **Estrutura pública de servidores (VMs) e armazenamento (S3)** ou "cotas" em nuvens federadas;
<br><br>
- Acesso a **créditos para uso de APIs de IA generativa e a modelos avançados de processamento de linguagem natural**.
<br><br>
:::
##
<div style="text-align: center; font-size: 55px;"> <strong>A partir de 2025 vamos investigar a desinformação em saúde</strong> </div>
<br>
::: columns
::: {.column width="65%"}
::: {.incremental}
- Em parceria com o Programa Integrado em Economia, Tecnologia e Inovação em Saúde (PECS/ISC/UFBA) e apoio do CNPq.
<br><br>
- Coletar e analisar dados de redes sociais, sites de notícias e aplicativos de mensagens;
<br><br>
- Implantação de aplicações de IA para classificação automática de conteúdos multimodais.;
<br><br>
- Painel de detecção de conteúdos em tempo real.
:::
:::
::: {.column width="35%"}

:::
:::
#
<div style="text-align: center; font-size: 55px;"> <strong>Resultados preliminares</strong> </div>
<br>
#
<div style="text-align: center; font-size: 50px;"> <strong>Uso de Knowledge graphs (KGs)/redes semânticas para análise de polarização política em momentos extremos</strong> </div>
<br>
::: columns
::: {.column width="50%"}
::: {.incremental}
- **Servem para a compreensão contextualizada de dados, especialmente em contextos de grandes volumes de informações heterogêneas**;
<br><br>
- **Em contexto políticos os KG ajudam a conectar conceitos possibilitando análises sobre as dinâmicas de narrativas (OSMONOVA; TIKHONOV; YAMSHCHIKOV, 2024)**;
<br><br>
:::
:::
::: {.column width="50%"}

:::
:::
##
<div style="text-align: center; font-size: 55px;"> <strong>Uso de Knowledge graphs (KGs)/redes semânticas para análise de polarização política em momentos extremos</strong> </div>
<br>
::: {.incremental}
- **945k de mensagens de 01/01/2023 a 10/01/2023 em 207 grupos e 268 canais do Telegram**.
<br><br>
- **Amostra de 7610 mensagens (5825 de grupos e 1785 de canais) que continham os termos “forças armadas” ou “militares”**;
<br><br>
- **Utilizamos o LLMGraphTransformer + gpt-4o-mini para: identificar entidades, relações, tipos de nós e conexões e extração de propriedades**.
<br><br>
:::
##
<!-- Inserindo o iframe corretamente -->
<iframe src="./html/grafo_interativo.html" style="width: 300vw; height: 500vh; border: none;"></iframe>
##
<div style="text-align: center; font-size: 55px;"> <strong>Uso de Knowledge graphs (KGs)/redes semânticas para análise de polarização política em momentos extremos</strong> </div>
<br>
::: {.incremental}
- **Em seguida, usamos os mesmos dados na plataforma [InfraNodus](https://infranodus.com/), apenas para acelerar o processo de visualização**;
<br><br>
- **KG resultante apresenta quatro grandes narrativas ou (clusters) principais: a) intervenção militar; b) força nacional; c) Brasil popular e d) governo Bolsonaro**;
<br><br>
- **Resultados são valiosos em cenários mutáveis em que precisamos entender os impacto de narrativas políticas no comportamento social (JUNGHERR, 2015).**.
<br><br>
:::
##
<div style="text-align: center; font-size: 30px;"> <strong>Knowledge Graph de mensagens com os termos “forças armadas” ou “militares” (01/01/2023 - 00:00h a 10/01/2023 - 23:59h)</strong> </div>
<br>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Intervenção Militar: expressa o papel dos militares e as demandas por intervenção</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Governo Bolsonaro: inclui debates sobre dinâmicas políticas, críticas ao ex-presidente Lula e discursos sobre a legitimidade do novo governo</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Força Nacional: refere-se à atuação da Força Nacional, explorando questões relacionadas à segurança pública para garantir a ordem no dia 08 de Janeiro</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong> Brasil Popular: narrativas voltadas para a população brasileira, com um discurso mais emocional para a mobilização popular unida em torno de valores nacionais e religiosos</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 55px;"> <strong>Clusterizar imagens de grupos masculinistas do Telegram</strong> </div>
<br>
::: {.incremental}
- **22k de imagens de 10 grupos masculinistas postadas do surgimento até dezembro de 2024 **;
<br><br>
- **Aplicação do modelo CLIP (Contrastive Language-Image Pretraining), desenvolvido pela OpenAI**;
<br><br>
- **Entender formas imagéticas de violência, mais difíceis de detecção automatizada**.
<br><br>
:::
#
<div style="text-align: center; font-size: 30px;"> <strong>Cluster 01</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Cluster 02</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Cluster 03</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Cluster 04</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 55px;"> <strong>Clusterização de imagens de grupos anti-vacina em grupos do Telegram</strong> </div>
<br>
::: {.incremental}
- **Amostra de 10k de imagens de 7 grupos anti-vacina de jan/dez de 2024**;
<br><br>
- **Aplicação do modelo CLIP (Contrastive Language-Image Pretraining), desenvolvido pela OpenAI**;
<br><br>
- **Semântica Rica, Zero-Shot Learning e Escalabilidade**.
<br><br>
:::
#
<div style="text-align: center; font-size: 30px;"> <strong>Frequência mensal de postagens das imagens nos grupos analisados </strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Cluster 0</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Cluster 11</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Cluster 6</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Cluster 7</strong> </div>
{fig-align="center"}
#
<div style="text-align: center; font-size: 30px;"> <strong>Cluster 2</strong> </div>
{fig-align="center"}
# {background-iframe="colored-particles/index.html"}
<br>
<div style="text-align: center; font-size: 200px;"> <strong>Obrigado!</strong> </div>