SX Artificial Intelligence

Sistema avançado de processamento documental com LLMs, utilizando chunking semântico, embeddings e reranking contextual

Desenvolvedor

Sandro X. de Faria

Bacharelando em Inteligência Artificial - Universidade Federal de Goiás

✉️ sandro.faria@discente.ufg.br

🚀 Startup em desenvolvimento na UFG

Pipeline de Processamento

Chunking Semântico

Divisão inteligente de documentos preservando contexto e estrutura

Detecção de capítulos e seções
Controle de tamanho (3800 tokens)
Preservação de metadados

Embeddings Avançados

Sistema híbrido de embeddings com fallback

OpenAI text-embedding-3-small
BAAI/bge-small-en-v1.5 local
Processamento em MPS/CPU

FAISS Vector Store

Busca vetorial otimizada

IndexFlatL2 para precisão
Persistência de índices
Busca por similaridade

API Integration


# Endpoint para processamento
POST https://sxai.com.br/process
Content-Type: multipart/form-data

# Parâmetros
- file: documento.pdf
- chunk_size: 3800
- model: "text-embedding-3-small"

92%

Precisão com Reranking

3800

Tokens por Chunk

1536D

Dimensões do Embedding