You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: notebooks/03_silver_to_gold.ipynb
+120-7Lines changed: 120 additions & 7 deletions
Original file line number
Diff line number
Diff line change
@@ -306,8 +306,21 @@
306
306
"cell_type": "markdown",
307
307
"metadata": {},
308
308
"source": [
309
-
"## 6. SparkSQL - Sentiment par domaine\n",
310
-
"\n",
309
+
"## 6. Requêtes en batch"
310
+
]
311
+
},
312
+
{
313
+
"cell_type": "markdown",
314
+
"metadata": {},
315
+
"source": [
316
+
"### 6a. SparkSQL - Sentiment par domaine\n",
317
+
"\n"
318
+
]
319
+
},
320
+
{
321
+
"cell_type": "markdown",
322
+
"metadata": {},
323
+
"source": [
311
324
"Jointure comments + stories pour répondre à : *\"Quels sites génèrent les discussions les plus positives/négatives ?\"*"
312
325
]
313
326
},
@@ -341,11 +354,18 @@
341
354
},
342
355
{
343
356
"cell_type": "markdown",
344
-
"source": "## 6b. Batch avec Window Function - Classement des auteurs\n\nUtilisation de RANK() pour classer les auteurs par leur ratio de commentaires positifs.",
345
-
"metadata": {}
357
+
"metadata": {},
358
+
"source": [
359
+
"## 6b. Window Function - Classement des auteurs\n",
360
+
"\n",
361
+
"Utilisation de RANK() pour classer les auteurs par leur ratio de commentaires positifs."
362
+
]
346
363
},
347
364
{
348
365
"cell_type": "code",
366
+
"execution_count": null,
367
+
"metadata": {},
368
+
"outputs": [],
349
369
"source": [
350
370
"# Agrégation par auteur : total comments, positifs, négatifs\n",
0 commit comments