SX Artificial Intelligence

Sistema avançado de processamento documental com LLMs, utilizando chunking semântico, embeddings e reranking contextual

Desenvolvedor

Sandro X. de Faria

Bacharelando em Inteligência Artificial - Universidade Federal de Goiás

✉️ [email protected]

🚀 Startup em desenvolvimento na UFG

Pipeline de Processamento

Chunking Semântico

Divisão inteligente de documentos preservando contexto e estrutura

  • Detecção de capítulos e seções
  • Controle de tamanho (3800 tokens)
  • Preservação de metadados

Embeddings Avançados

Sistema híbrido de embeddings com fallback

  • OpenAI text-embedding-3-small
  • BAAI/bge-small-en-v1.5 local
  • Processamento em MPS/CPU

FAISS Vector Store

Busca vetorial otimizada

  • IndexFlatL2 para precisão
  • Persistência de índices
  • Busca por similaridade

API Integration


# Endpoint para processamento
POST https://sxai.com.br/process
Content-Type: multipart/form-data

# Parâmetros
- file: documento.pdf
- chunk_size: 3800
- model: "text-embedding-3-small"
                
92%

Precisão com Reranking

3800

Tokens por Chunk

1536D

Dimensões do Embedding

Visitas: 0