O que é Confident AI?
Confident AI é a plataforma de avaliação de LLM que você precisa para testar, benchmarkear, proteger e melhorar o desempenho de aplicações de LLM. Com métricas de primeira classe e guardrails, ela garante que seus sistemas de LLM estejam sempre no topo.
Quais são as características de Confident AI?
- Avaliação de LLM: Benchmarking de sistemas de LLM para otimizar prompts, modelos e detectar regressões.
- Observabilidade de LLM: Monitoramento, rastreamento, testes A/B e insights de desempenho em tempo real.
- Curar Conjuntos de Dados: Anotação de conjuntos de dados na nuvem para avaliação.
- Melhorar Conjuntos de Dados: Mantenha seus dados atualizados com as informações mais recentes e realistas.
- Alinhar Métricas de Avaliação: Personalize os resultados das métricas de LLM para seu caso de uso específico.
Quais são os casos de uso de Confident AI?
- Otimização de Custos: Reduza custos de LLM em até 80%.
- Testes em CI/CD: Integração com Pytest para testes unitários de sistemas de LLM.
- Monitoramento em Produção: Avaliação automática de saídas de LLM em tempo real.
Como usar Confident AI?
- Instale a biblioteca DeepEval:
pip install -U deepeval
- Execute testes de LLM:
deepeval test run test_llm.py
- Monitore e trace saídas de LLM:
import deepeval
deepeval.monitor(input="Seu input", response="Sua resposta", model="gpt-4")















