Repo for writing the report for TG2
- Reescrever parágrafo da Propriedade de Markov mais similar à apresentação (e termo 'dinâmica futura') (página 8)
- Mostrar resultados específicos sobre o melhor treinamento (quantos gols faz?), comportamento final do jogador
- Detalhar mais como chegamos na recompensa
- Melhorar a explicação da função q pi e v pi no final da Seção 2.1 página 10
- Revisar exemplo episódico x continuado
- Descrever na introdução o que são os comportamentos e as ações elementares (termos apareceram jogados na seção 1.5)
- Reescrever parte de bootstrapping na Seção 2.2.1 de acordo com comentários do João Paulo, utilização da própria estimativa durante o treinamento
- Deixar claro que o número de gols é refletido com maior peso no retorno
- Referenciar Sutton e Barto nas formulações do capítulo 2 (especialmente no double Q-learning) (já fiz mas confere lá)
- Adicionar referência nas fórmulas (aqui)
- Adicionar o ggb-single na conclusão
- Corrigir tabela da rede neural (entradas não são neurônios)
- Trocar 'fatias' e 'janelas' por termos mais formais (traduzi para 'setores' por que existe 'setor circular' e 'intervalos')
- Deixar claro que é agente único (especialmente nas montagens onde o jogador aparece várias vezes)
- Retirar ação de agarrar
- Clarificar que sensor adiciona ruído e 'perde' informações com a distância
- Substituir Wiener 1950 pelo artigo original de 1948 nas referências
- Deixar claro que não é uma partida é um treino de partida, tempo de simulação (6000 ciclos)
- Esclarecer trecho sobre velocidade de simulação
- Deixar mais claro no dota são números ponto flutuante contínuos (página 2)
- Mudar imagem do arco na estimação de estados
- Pontuar legendas das figuras, códigos...
- Mudar título para: Aprendizagem Por Reforço no Contexto de Futebol de Robôs: RoboCup Soccer Simulation 2D
- 2D vs 2d? Não acho que tenha nada para mudar, mas vamos conferir
- Colocar 'theta_j ' e 'theta_f' na Lista da Símbolos
- Mudar o termo 'ações abstratas'
- Corrigir referências (nomes, locais, edição do Sutton)
- Mudar Contínuo para Continuada (Continuing), 2.1.1
- Mudar termo end-to-end a não ser que encontremos uma fonte que usa
- Typo 'Poda' em 2.2.3
- Colocar termos em inglês em itálico
- Tirar DOIs das referências
- Mudar nome de ações puras para ações elementares
- Adicionar ficha catalográfica (depois de aprovado)
- Revisar resultados
- Revisar conclusão
- Escrever agradecimentos
- Escrever dedicatória
- Revisar primeira versão do abstract (inglês)
- Gráfico Sarsa
- Alterar resultado Sarsa com novo gráfico
- Adicionar introdução do capítulo seguinte no final do capítulo atual
- Revisar resumo
- Escrever abstract
- Refazer gráficos
- Escrever conclusão
- Descrever transformações trigonométricas dos sensores
- Mudar parâmetros usados no Sarsa
- Retirar subsubseções
- Corrigir os trechos de código sem legendas
- Conferir palavras informais que podem ser substituidas por formais
- Corrigir equações e formatos de mensagens para incorporar ao texto (
mensagem é da forma: (see 23), onde ...) - Escrever Sarsa na fundamentação teórica
- Revisar Sarsa na fundamentação teórica
- Escrever Sarsa no desenvolvimento
- Inverter a ordem dos experimentos no Desenvolvimento
- Inverter a ordem dos experimentos nos Resultados
- Produzir imagens do campo e jogador
- Escrever Sarsa nos resultados
- Mudar título do trabalho ❗️
- Validar mudança do título do trabalho ❗️
- Escrever resumo
- Lista de símbolos
- Lista de algoritmos
- Terminar a revisão do cap. 3
- Migrar descrição de figuras para o texto