Skip to content
This repository has been archived by the owner on Sep 19, 2018. It is now read-only.
This repository has been archived by the owner on Sep 19, 2018. It is now read-only.

Indexação de Arquivos via DB #31

Open
@ericktedeschi

Description

Srs do Conselho,
estou abrindo essa thread para discutir sobre a meneira como está sendo feita a indexação dos arquivos.
Abaixo relaciono alguns itens:

  • Atualmente a indexação está sendo feita por meio de iteração do diretório configurado para Upload. O problema é que, quando a quantidade de arquivos for muito grande vai começar a baleiar para listar os arquivos.
  • Quando o diretório ultrapassar o número de 65535 arquivos, irá estourar a quantidade de inodes.
  • Não é possível fazer controle de acesso (visando futuro)

Sugestão.

  • Todo arquivo deve ser apenas um "hash" dentro do diretório de upload. E o metadado dele guardado em um banco, para posteriormente devolvermos para quem baixar com o nome correto
  • Podemos utilizar um MongoDB por exemplo para guardar os metadados de cada arquivo
  • guardando os arquivos como hash, será possível dois usuários fazerem uploads de arquivos do mesmo nome... E ainda, caso existam arquivos identicos, podemos apenas manter a referência (otimização de espaço).

Como trata-se de uma issue de arquitetura, não sei se consegui endereçar a preocupação corretamente aqui. Talvez fosse mais adequado uma lista, mas acho que ainda não temos! hehe ou passei despercebido.

abz

Activity

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Metadata

Assignees

No one assigned

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions