Chunking Semântico
Divisão inteligente de documentos preservando contexto e estrutura
- Detecção de capítulos e seções
- Controle de tamanho (3800 tokens)
- Preservação de metadados
Sistema avançado de processamento documental com LLMs, utilizando chunking semântico, embeddings e reranking contextual
Sandro X. de Faria
Bacharelando em Inteligência Artificial - Universidade Federal de Goiás
🚀 Startup em desenvolvimento na UFG
Divisão inteligente de documentos preservando contexto e estrutura
Sistema híbrido de embeddings com fallback
Busca vetorial otimizada
# Endpoint para processamento
POST https://sxai.com.br/process
Content-Type: multipart/form-data
# Parâmetros
- file: documento.pdf
- chunk_size: 3800
- model: "text-embedding-3-small"
Precisão com Reranking
Tokens por Chunk
Dimensões do Embedding