Skip to content

rcssggb/tg2-report

Repository files navigation

tg2-report

Repo for writing the report for TG2

Correções da Banca

  • Reescrever parágrafo da Propriedade de Markov mais similar à apresentação (e termo 'dinâmica futura') (página 8)
  • Mostrar resultados específicos sobre o melhor treinamento (quantos gols faz?), comportamento final do jogador
  • Detalhar mais como chegamos na recompensa
  • Melhorar a explicação da função q pi e v pi no final da Seção 2.1 página 10
  • Revisar exemplo episódico x continuado
  • Descrever na introdução o que são os comportamentos e as ações elementares (termos apareceram jogados na seção 1.5)
  • Reescrever parte de bootstrapping na Seção 2.2.1 de acordo com comentários do João Paulo, utilização da própria estimativa durante o treinamento
  • Deixar claro que o número de gols é refletido com maior peso no retorno
  • Referenciar Sutton e Barto nas formulações do capítulo 2 (especialmente no double Q-learning) (já fiz mas confere lá)
  • Adicionar referência nas fórmulas (aqui)
  • Adicionar o ggb-single na conclusão
  • Corrigir tabela da rede neural (entradas não são neurônios)
  • Trocar 'fatias' e 'janelas' por termos mais formais (traduzi para 'setores' por que existe 'setor circular' e 'intervalos')
  • Deixar claro que é agente único (especialmente nas montagens onde o jogador aparece várias vezes)
  • Retirar ação de agarrar
  • Clarificar que sensor adiciona ruído e 'perde' informações com a distância
  • Substituir Wiener 1950 pelo artigo original de 1948 nas referências
  • Deixar claro que não é uma partida é um treino de partida, tempo de simulação (6000 ciclos)
  • Esclarecer trecho sobre velocidade de simulação
  • Deixar mais claro no dota são números ponto flutuante contínuos (página 2)
  • Mudar imagem do arco na estimação de estados
  • Pontuar legendas das figuras, códigos...
  • Mudar título para: Aprendizagem Por Reforço no Contexto de Futebol de Robôs: RoboCup Soccer Simulation 2D
  • 2D vs 2d? Não acho que tenha nada para mudar, mas vamos conferir
  • Colocar 'theta_j ' e 'theta_f' na Lista da Símbolos
  • Mudar o termo 'ações abstratas'
  • Corrigir referências (nomes, locais, edição do Sutton)
  • Mudar Contínuo para Continuada (Continuing), 2.1.1
  • Mudar termo end-to-end a não ser que encontremos uma fonte que usa
  • Typo 'Poda' em 2.2.3
  • Colocar termos em inglês em itálico
  • Tirar DOIs das referências
  • Mudar nome de ações puras para ações elementares

Tarefas

  • Adicionar ficha catalográfica (depois de aprovado)
  • Revisar resultados
  • Revisar conclusão
  • Escrever agradecimentos
  • Escrever dedicatória
  • Revisar primeira versão do abstract (inglês)
  • Gráfico Sarsa
  • Alterar resultado Sarsa com novo gráfico
  • Adicionar introdução do capítulo seguinte no final do capítulo atual
  • Revisar resumo
  • Escrever abstract
  • Refazer gráficos
  • Escrever conclusão
  • Descrever transformações trigonométricas dos sensores
  • Mudar parâmetros usados no Sarsa
  • Retirar subsubseções
  • Corrigir os trechos de código sem legendas
  • Conferir palavras informais que podem ser substituidas por formais
  • Corrigir equações e formatos de mensagens para incorporar ao texto (mensagem é da forma: (see 23), onde ...)
  • Escrever Sarsa na fundamentação teórica
  • Revisar Sarsa na fundamentação teórica
  • Escrever Sarsa no desenvolvimento
  • Inverter a ordem dos experimentos no Desenvolvimento
  • Inverter a ordem dos experimentos nos Resultados
  • Produzir imagens do campo e jogador
  • Escrever Sarsa nos resultados
  • Mudar título do trabalho ❗️
  • Validar mudança do título do trabalho ❗️
  • Escrever resumo
  • Lista de símbolos
  • Lista de algoritmos
  • Terminar a revisão do cap. 3
  • Migrar descrição de figuras para o texto

About

Repo for writing the report for TG2

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages