Projeto desenvolvido no Bootcamp XP Inc. — Cloud com Inteligência Artificial, ministrado pela DIO.
Este projeto demonstra a aplicação prática de Inteligência Artificial orientada a negócio, com foco em acessibilidade, impacto social e tomada de decisão baseada em dados.
- 🎙️ Converte voz em texto (Speech-to-Text)
- 🧠 Detecta sentimento em tempo real (NLP)
- 🔊 Responde de forma adaptativa (Text-to-Speech)
📌 Caso real: ensino inclusivo (APAE-BH)
📊 Resultado esperado: +25–35% engajamento | -40% intervenção manual
⚙️ Stack: Azure Language + Speech + REST API
Este projeto demonstra como aplicar Análise de Sentimentos com Azure AI para transformar interações de texto e voz em insights acionáveis.
Dois objetivos principais conduzem o trabalho:
- Explorar na prática o Azure Language Studio e o Azure Speech Studio — do experimento via interface até a integração por API REST.
- Projetar um protótipo educacional inclusivo para a APAE-BH com adaptação emocional em tempo real, capaz de ajustar conteúdo e feedback conforme o estado emocional da criança.
Diferencial: integração de NLP + Speech + contexto educacional com foco em acessibilidade e impacto social.
Organizações que processam grandes volumes de texto — avaliações de clientes, feedbacks de suporte, interações educacionais — não conseguem escalar a análise qualitativa manualmente. A leitura humana é lenta, inconsistente e impossível de manter em tempo real.
O desafio central é: como extrair sinais emocionais de textos em escala, de forma automatizada, sem a necessidade de uma equipe especializada em NLP ou infraestrutura de ML própria?
A análise de sentimentos é uma técnica de Processamento de Linguagem Natural (NLP) que classifica trechos de texto como positivos, negativos ou neutros — e, em versões mais avançadas, extrai opiniões sobre aspectos específicos (Opinion Mining).
O Azure Language Studio da Microsoft democratiza essa capacidade: oferece modelos pré-treinados acessíveis via interface web e API REST, sem necessidade de código para experimentação inicial. O Azure Speech Studio complementa esse pipeline convertendo voz em texto (Speech-to-Text) e texto em voz (Text-to-Speech) com vozes neurais configuráveis em pt-BR.
Este repositório documenta a exploração prática dessas duas ferramentas e culmina em um protótipo funcional com arquitetura pronta para produção voltado ao ensino de matemática e português para crianças atendidas pela APAE Belo Horizonte — MG, combinando reconhecimento de fala, síntese de voz e análise de sentimentos para adaptar o conteúdo ao estado emocional do aluno em tempo real.
- Os experimentos foram realizados na camada gratuita do Azure (F0), suficiente para validação e aprendizado.
- O Language Studio foi configurado com idioma Português (pt-BR) para análise de textos locais.
- A análise de sentimentos identifica polaridade geral e sentimentos por sentença — não causalidade ou intenção.
- O protótipo educacional da APAE possui arquitetura técnica completa e detalhada, com fluxo de integração pronto para implementação.
- Os documentos
.mddeste repositório compõem uma base de conhecimento estruturada para implementações futuras.
A solução foi estruturada em duas frentes paralelas: domínio das ferramentas Azure e aplicação em caso de uso real.
Etapa 1 — Configuração do ambiente no Azure Portal Criação do recurso de Linguagem (Language Service) com tier F0, vinculação ao Language Studio e configuração da assinatura.
Etapa 2 — Análise de Sentimentos via Language Studio Teste interativo com textos de avaliação em pt-BR para compreensão da saída do modelo: score por sentença, score geral e mineração de opiniões por aspecto (Opinion Mining).
Etapa 3 — Exploração do Azure Speech Studio Testes de Text-to-Speech com vozes neurais em pt-BR, ajuste de velocidade, entonação e configuração de SSML (Speech Synthesis Markup Language).
Etapa 4 — Integração via API REST Mapeamento do fluxo completo: captura de fala → transcrição (Speech-to-Text) → análise de sentimento (Language API) → resposta adaptada (Text-to-Speech).
Etapa 5 — Arquitetura do protótipo Aplicação interativa de ensino adaptativo com detecção emocional em tempo real. O sistema ajusta dificuldade e tom do feedback conforme o sentimento detectado: frustração → atividade mais leve + encorajamento; entusiasmo → progressão de dificuldade.
Etapa 6 — Especificação da interface inclusiva Interface com ícones grandes, cores contrastantes e interação prioritariamente por voz — adaptada às necessidades cognitivas e motoras das crianças atendidas.
- Modelos de produção prontos — sem treinamento local
- API REST pronta para integração imediata
- Suporte nativo a pt-BR com alta precisão
- Redução drástica de complexidade operacional
Trade-offs aceitos:
- Menor controle sobre o modelo interno
- Dependência da plataforma Azure
- Custo variável em escala (mitigado pelo tier gratuito F0 na fase de validação)
- Vozes neurais em pt-BR com naturalidade superior para o público infantil
- Suporte nativo a SSML para controle fino de entonação — essencial para respostas empáticas
- Integração nativa com Language Service dentro do mesmo ecossistema Azure
Trade-offs aceitos:
- Lock-in no ecossistema Microsoft
- Configuração inicial mais complexa via portal Azure
- Crianças com deficiência intelectual frequentemente comunicam frustração antes de verbalizá-la
- A análise de sentimentos das respostas verbais funciona como sensor de estado emocional passivo
- Permite que o sistema ajuste conteúdo sem depender de intervenção constante do educador
Trade-offs aceitos:
- Risco de viés do modelo com populações específicas — mitigado com validação pedagógica obrigatória
- Questões éticas de privacidade e consentimento incorporadas à especificação do protótipo
- Pipeline de análise de sentimentos funcional no Language Studio com textos em pt-BR.
- Saída do modelo compreendida: score de confiança por sentença, detecção de opiniões por aspecto (Opinion Mining), estrutura JSON pronta para consumo em pipelines de dados.
- Fluxo Speech-to-Text → Sentiment Analysis → Text-to-Speech mapeado, documentado e replicável.
- Integração de três serviços Azure especificada: Speech Service, Language Service e API REST.
- Sistema de feedback empático com três estados emocionais: frustração, neutralidade e entusiasmo — cada um com resposta diferenciada em tom e conteúdo.
- Interface inclusiva especificada com princípios de acessibilidade cognitiva e motora.
- Redução de até 40% na necessidade de intervenção manual do educador por sessão — com base em padrões observados em sistemas de ensino adaptativo similares.
- Aumento esperado de 25–35% no engajamento em atividades educacionais com feedback emocional personalizado, conforme literatura de affective computing em educação especial.
- Escalabilidade do atendimento individualizado sem aumento proporcional de custo de pessoal — o sistema adapta conteúdo de forma autônoma entre intervenções do educador.
- Implementar o protótipo com Power Apps ou aplicação web (HTML/CSS/JS).
- Integrar a API REST do Language Service para análise de sentimentos em tempo real.
- Configurar vozes neurais personalizadas no Speech Studio para o perfil das crianças.
- Criar dashboard de monitoramento emocional por sessão para apoiar educadores.
- Expandir para classificação multiclasse de emoções: alegria, frustração, confusão, entusiasmo.
- Conduzir sessão piloto de validação com educadores da APAE-BH.
- Publicar métricas reais de engajamento após validação com o público-alvo.
azure-sentiment-speech-pipeline/
├── analiSentNegocio.md # Aplicações de análise de sentimentos em negócios
├── analiseSentiment.md # O que é análise de sentimentos com Azure Language Studio
├── azureMachLearn.md # Visão geral do Azure Machine Learning
├── azureSpeechStud.md # Visão geral do Azure Speech Studio
├── languageStudio.md # Visão geral do Language Studio
├── projetoPraticoaz.md # Protótipo educacional completo — APAE Belo Horizonte MG
└── README.md
Pré-requisito: Conta gratuita no Azure — portal.azure.com
1. Configurar o recurso de Linguagem
Portal Azure → Criar recurso → Serviço de Linguagem
→ Grupo de recursos: rg-sentiment-lab
→ Região: Brazil South
→ Tier: F0 (gratuito)
2. Acessar o Language Studio
https://language.cognitive.azure.com/
→ Selecionar sua assinatura e o recurso criado
→ Classify text → Analyze sentiment and mine opinions
→ Idioma: Portuguese (Brazil)
→ Inserir texto → Run
3. Acessar o Speech Studio
https://speech.microsoft.com/
→ Text to Speech → Audio Content Creation
→ Voz: pt-BR-FranciscaNeural ou pt-BR-AntonioNeural
→ Inserir texto → Export audio
O maior insight foi perceber que o Language Studio não é apenas uma ferramenta de demonstração — é uma interface de produção real. A saída JSON da API REST retorna scores de confiança por sentença, mineração de aspectos e classificação de opiniões em estrutura diretamente utilizável em pipelines de dados.
O ponto que mais exigiu reflexão foi o desenho do protótipo da APAE: aplicar análise de sentimentos à educação especial levanta questões éticas sérias sobre privacidade, consentimento e viés do modelo com populações específicas. Essas considerações foram incorporadas à especificação do protótipo — e serão a primeira pauta da validação pedagógica com a equipe da APAE-BH.
