Skip to content

Latest commit

 

History

History
70 lines (47 loc) · 4.57 KB

File metadata and controls

70 lines (47 loc) · 4.57 KB

Phi-3.5-Instruct WebGPU RAG Chatbot

Demonstração para apresentar WebGPU e o Padrão RAG

O Padrão RAG com o modelo Phi-3.5 Onnx Hospedado utiliza a abordagem Retrieval-Augmented Generation, combinando o poder dos modelos Phi-3.5 com hospedagem ONNX para implantações de IA eficientes. Esse padrão é fundamental para o ajuste fino de modelos para tarefas específicas de domínio, oferecendo uma combinação de qualidade, custo-benefício e compreensão de contextos longos. Faz parte da suíte Azure AI, que oferece uma ampla seleção de modelos fáceis de encontrar, testar e usar, atendendo às necessidades de personalização de diversos setores.

O que é WebGPU

WebGPU é uma API moderna de gráficos para web, projetada para fornecer acesso eficiente à unidade de processamento gráfico (GPU) de um dispositivo diretamente pelos navegadores. É destinada a ser a sucessora do WebGL, oferecendo várias melhorias importantes:

  1. Compatibilidade com GPUs Modernas: WebGPU foi criada para funcionar perfeitamente com arquiteturas contemporâneas de GPU, aproveitando APIs do sistema como Vulkan, Metal e Direct3D 12.
  2. Desempenho Aprimorado: Suporta computações gerais na GPU e operações mais rápidas, tornando-a adequada tanto para renderização gráfica quanto para tarefas de aprendizado de máquina.
  3. Recursos Avançados: WebGPU oferece acesso a capacidades mais avançadas da GPU, permitindo cargas de trabalho gráficas e computacionais mais complexas e dinâmicas.
  4. Redução da Carga no JavaScript: Ao transferir mais tarefas para a GPU, WebGPU reduz significativamente a carga no JavaScript, resultando em melhor desempenho e experiências mais suaves.

Atualmente, o WebGPU é suportado em navegadores como o Google Chrome, com trabalhos em andamento para expandir o suporte a outras plataformas.

03.WebGPU

Ambiente Requerido:

Navegadores suportados:

  • Google Chrome 113+
  • Microsoft Edge 113+
  • Safari 18 (macOS 15)
  • Firefox Nightly.

Como habilitar o WebGPU:

  • No Chrome/Microsoft Edge

Ative a flag chrome://flags/#enable-unsafe-webgpu.

Abra seu navegador:

Inicie o Google Chrome ou Microsoft Edge.

Acesse a página de Flags:

Na barra de endereços, digite chrome://flags e pressione Enter.

Procure pela flag:

Na caixa de busca no topo da página, digite 'enable-unsafe-webgpu'

Ative a flag:

Encontre a flag #enable-unsafe-webgpu na lista de resultados.

Clique no menu suspenso ao lado e selecione Enabled.

Reinicie seu navegador:

Após ativar a flag, será necessário reiniciar o navegador para que as alterações tenham efeito. Clique no botão Relaunch que aparecerá na parte inferior da página.

  • No Linux, inicie o navegador com --enable-features=Vulkan.
  • Safari 18 (macOS 15) já vem com WebGPU ativado por padrão.
  • No Firefox Nightly, digite about:config na barra de endereços e defina dom.webgpu.enabled como true.

Configurando a GPU para Microsoft Edge

Aqui estão os passos para configurar uma GPU de alto desempenho para o Microsoft Edge no Windows:

  • Abra as Configurações: Clique no menu Iniciar e selecione Configurações.
  • Configurações do Sistema: Vá em Sistema e depois em Tela.
  • Configurações de Gráficos: Role para baixo e clique em Configurações de gráficos.
  • Escolha o App: Em “Escolha um app para definir preferência,” selecione Aplicativo de área de trabalho e depois Procurar.
  • Selecione o Edge: Navegue até a pasta de instalação do Edge (geralmente C:\Program Files (x86)\Microsoft\Edge\Application) e selecione msedge.exe.
  • Defina a preferência: Clique em Opções, escolha Alto desempenho e depois clique em Salvar.
    Isso garantirá que o Microsoft Edge utilize sua GPU de alto desempenho para melhor performance.
  • Reinicie seu computador para que as configurações entrem em vigor.

Exemplos : Por favor, clique neste link

Aviso Legal:
Este documento foi traduzido utilizando o serviço de tradução por IA Co-op Translator. Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autorizada. Para informações críticas, recomenda-se tradução profissional humana. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.