felipelube
diff --git a/‎Pipfile‎
Lines changed: 1 addition & 0 deletions b/‎Pipfile‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎Pipfile.lock‎
Lines changed: 15 additions & 1 deletion b/‎Pipfile.lock‎
Lines changed: 15 additions & 1 deletion
diff --git a/‎xram_memory/artifact/admin/forms/news_bulk.py‎
Lines changed: 7 additions & 1 deletion b/‎xram_memory/artifact/admin/forms/news_bulk.py‎
Lines changed: 7 additions & 1 deletion
diff --git a/‎xram_memory/artifact/models/documents.py‎
Lines changed: 9 additions & 0 deletions b/‎xram_memory/artifact/models/documents.py‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎xram_memory/artifact/models/news.py‎
Lines changed: 9 additions & 0 deletions b/‎xram_memory/artifact/models/news.py‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎xram_memory/artifact/receivers.py‎
Lines changed: 105 additions & 63 deletions b/‎xram_memory/artifact/receivers.py‎
Lines changed: 105 additions & 63 deletions
@@ -36,6 +36,7 @@ beautifulsoup4 = "*"
 djangorestframework = "*"
 django-cors-headers = "*"
 boltons = "*"
+retrying = "*"
 
 [packages.pdfkit]
 editable = true
 
@@ -24,6 +24,9 @@ class URLForm(forms.Form):
                                   help_text="Insira os endereços das notícias, um por linha")
 
     def clean_urls(self, *args, **kwargs):
+        """
+        Valida cada uma das urls informadas.
+        """
         urls = self.cleaned_data['urls']
         if not urls:
             raise ValidationError("É necessário informar uma URL.")
@@ -52,9 +55,12 @@ def is_valid(value):
 
 @staff_member_required
 def news_bulk_insertion(request):
+    """
+    Controller para a página de inserção em massa de notícias.
+    """
     admin_site = default_site
     if request.method == 'POST':
-        # crie um formulário preenchido com os dados enviados
+        # crie uma instância do formulário URLForm para validar os dados.
         form = URLForm(request.POST)
         if form.is_valid():
             # pegue as urls sanitizadas
 
@@ -96,18 +96,27 @@ def determine_mime_type(self):
             self.mime_type = ''
 
     def determine_file_size(self):
+        """
+        Determina o tamanho do arquivo buscando a informação do campo `file`.
+        """
         try:
             self.file_size = self.file.size
         except:
             self.file_size = '0'
 
     @property
     def file_indexing(self):
+        """
+        Propriedade usada para indexar a URL para este documento.
+        """
         if self.file:
             return self.file.url
 
     @cachedproperty
     def thumbnail(self):
+        """
+        Retorna a url para uma miniatura de visualização deste documento.
+        """
         if self.file:
             try:
                 return get_thumbnailer(self.file)['thumbnail'].url
 
@@ -112,6 +112,9 @@ def has_pdf_capture(self):
 
     @log_process(operation="pegar o título", object_type="Notícia")
     def set_web_title(self):
+        """
+        Pega o título para a página desta notícia.
+        """
         self.title = NewsFetcher.fetch_web_title(self.url)
 
     @log_process(operation="verificar por uma versão no archive.org", object_type="Notícia")
@@ -231,6 +234,9 @@ def add_fetched_image(self):
 
     @property
     def image_capture_indexing(self):
+        """
+        Retorna a url para uma captura de imagem desta notícia, se existente.
+        """
         try:
             if self.image_capture and self.image_capture.image_document and self.image_capture.image_document.file:
                 url = get_thumbnailer(self.image_capture.image_document.file)[
@@ -241,6 +247,9 @@ def image_capture_indexing(self):
 
     @property
     def published_year(self):
+        """
+        Retorna o ano de publicação desta notícia.
+        """
         try:
             # Tente retornar o ano da data de publicação
             return self.published_date.timetuple()[0]
 
@@ -1,11 +1,13 @@
-from urllib.parse import urlsplit
-
+from celery import group
 from django.db import transaction
-from django.dispatch import receiver
 from django.db.models.signals import post_save
-
-import xram_memory.artifact.tasks as background_tasks
+from django.dispatch import receiver
+from retrying import retry
+from urllib.parse import urlsplit
 from xram_memory.artifact.models import Document, News, Newspaper
+from xram_memory.utils import celery_is_avaliable
+import random
+import xram_memory.artifact.tasks as background_tasks
 
 
 @receiver(post_save)
@@ -31,76 +33,116 @@ def set_mimetype_filesize_for_documents(sender, **kwargs):
             del instance._save_in_signal
 
 
-@receiver(post_save)
-def news_add_newspaper(sender, **kwargs):
-    instance = kwargs['instance']
-    if hasattr(instance, '_save_in_signal_add_newspaper'):
-        return
-    if isinstance(instance, (News)) and not instance.newspaper:
-        instance._save_in_signal_add_newspaper = True
+# TODO: mover para o modelo da notícia
+def associate_newspaper(news_instance: News):
+    """
+    Com base na URL da notícia, associa ela com um jornal existente ou cria este jornal e, por fim, faz a associação.
+    """
+    news_instance._save_in_signal = True
+    try:
+        base_url = "{uri.scheme}://{uri.netloc}".format(
+            uri=urlsplit(news_instance.url))
+        news_instance.newspaper = Newspaper.objects.get(url=base_url)
+        news_instance.save()
+    except Newspaper.DoesNotExist:
+        # crie um jornal (newspaper ) básico agora
+        newspaper = None
         try:
-            base_url = "{uri.scheme}://{uri.netloc}".format(
-                uri=urlsplit(instance.url))
-            instance.newspaper = Newspaper.objects.get(url=base_url)
-            instance.save()
-        except Newspaper.DoesNotExist:
-            # crie um jornal (newspaper ) básico agora
-            newspaper = None
-            try:
-                newspaper = Newspaper.objects.create(
-                    title=base_url,
-                    url=base_url,
-                    created_by=instance.created_by,
-                    modified_by=instance.modified_by
-                )
-            except:
-                pass
-            else:
-                instance.newspaper = newspaper
-                instance.save()
-        finally:
-            del instance._save_in_signal_add_newspaper
+            newspaper = Newspaper.objects.create(
+                title=base_url,
+                url=base_url,
+                created_by=news_instance.created_by,
+                modified_by=news_instance.modified_by
+            )
+        except:
+            pass
+        else:
+            news_instance.newspaper = newspaper
+            news_instance.save()
+    finally:
+        del news_instance._save_in_signal
+
+
+def try_task(task, args):
+    """
+    Emula o comportamento de tentar novamente do celery para uma tarefas que será executada sincronicamente.
+    """
+    expect_to_throw = tuple(getattr(task, 'throws', ()))
+    autoretry_for = tuple(getattr(task, 'autoretry_for', ()))
+    stop_max_attempt_number = 3
+    wait_exponential_multiplier = 1000
+    wait_exponential_max = 30 * 1000
 
+    def need_to_retry_for(exception):
+        return isinstance(exception, autoretry_for)
 
-@receiver(post_save)
-def newspaper_add_basic_info(sender, **kwargs):
-    instance = kwargs['instance']
-    # Não entre em loop infinito
-    if hasattr(instance, '_save_in_signal_newspaper_add_basic_info'):
-        return
-    if isinstance(instance, (Newspaper)) and not instance.has_basic_info:
-        transaction.on_commit(lambda instance=instance: background_tasks.newspaper_set_basic_info.delay(
-            instance.pk))
+    @retry(stop_max_attempt_number=stop_max_attempt_number,
+           retry_on_exception=need_to_retry_for, wait_exponential_multiplier=wait_exponential_multiplier,
+           wait_exponential_max=wait_exponential_max)
+    def retry_task(the_task, arguments):
+        the_task(*arguments)
 
+    retry_task(task, args)
 
-@receiver(post_save)
-def news_add_basic_info(sender, **kwargs):
-    instance = kwargs['instance']
-    # Não agende a captura em pdf se o sinal foi enviado durante o cadastro de um jornal
-    if hasattr(instance, '_save_in_signal_add_newspaper'):
-        return
-    if isinstance(instance, (News)) and getattr(instance, '_set_basic_info', False):
-        transaction.on_commit(lambda instance=instance:
-                              background_tasks.news_set_basic_info.delay(instance.pk))
 
+def determine_additional_tasks_to_run(news_instance, execute_async=True):
+    """
+    Com base nas opções definidas pelo usuário, determine quais tarefas de processamento adicional executar.
+    """
+    fields_and_task_info = {
+        '_set_basic_info': (background_tasks.news_set_basic_info, (news_instance.pk, not execute_async)),
+        '_fetch_archived_url': (background_tasks.news_add_archived_url, (news_instance.pk,)),
+        '_add_pdf_capture': (background_tasks.news_add_pdf_capture, (news_instance.pk,)),
+    }
+    tasks = []
+
+    for field, task_info in fields_and_task_info.items():
+        if getattr(news_instance, field, False):
+            tasks.append(task_info)
 
+    return tasks
+
+# Sinais para o processamento de News
 @receiver(post_save)
-def news_add_archived_url(sender, **kwargs):
+def news_additional_processing(sender, **kwargs):
+    """
+    De acorodo com as opções selecionadas pelo usuário, executa ou agenda tarefas para obter informações adicionais
+    sobre determinada Notícia.
+    """
     instance = kwargs['instance']
-    # Não agende a captura em pdf se o sinal foi enviado durante o cadastro de um jornal
-    if hasattr(instance, '_save_in_signal_add_newspaper'):
+    if hasattr(instance, '_save_in_signal'):
         return
-    if isinstance(instance, (News)) and getattr(instance, '_fetch_archived_url', False):
-        transaction.on_commit(lambda instance=instance:
-                              background_tasks.news_add_archived_url.delay(instance.pk))
+    if isinstance(instance, News):
+        # Se esta notícia não tem jornal, associe ela a um
+        if not instance.newspaper:
+            associate_newspaper(instance)
+
+        execute_async = celery_is_avaliable()
+        tasks = determine_additional_tasks_to_run(instance, execute_async)
+        if len(tasks):
+            if execute_async:
+                transaction.on_commit(lambda instance=instance, tasks=tasks: group(
+                    [task.s(*args) for task, args in tasks]).apply_async()
+                )
+            else:
+                for task, args in tasks:
+                    transaction.on_commit(
+                        lambda task=task, args=args: try_task(task, args))
 
 
+# Sinais para o processamento de Newspaper
 @receiver(post_save)
-def news_add_pdf_capture(sender, **kwargs):
+def newspaper_additional_processing(sender, **kwargs):
+    """
+    Agenda ou executa tarefa para obter informações básicas sobre um Jornal.
+    """
     instance = kwargs['instance']
-    # Não agende a captura em pdf se o sinal foi enviado durante o cadastro de um jornal
-    if hasattr(instance, '_save_in_signal_add_newspaper'):
+    if hasattr(instance, '_save_in_signal'):
         return
-    if isinstance(instance, (News)) and getattr(instance, '_add_pdf_capture', False):
-        transaction.on_commit(lambda instance=instance:
-                              background_tasks.news_add_pdf_capture.delay(instance.pk))
+    if isinstance(instance, Newspaper) and not instance.has_basic_info:
+        if celery_is_avaliable():
+            transaction.on_commit(
+                lambda instance=instance: background_tasks.newspaper_set_basic_info.delay(instance.pk))
+        else:
+            transaction.on_commit(
+                lambda instance=instance: try_task(background_tasks.newspaper_set_basic_info, (instance.pk,)))