🚀 NexTraction

Pipeline RAG Web pour l'extraction d'insights

Transformez le web en connaissances exploitables

Le Défi

🌐

Information Dispersée

Les informations sont éparpillées sur des milliers de sites web

⏱

Recherche Manuelle

La collecte et l'analyse manuelle prend des heures, voire des jours

đŸ€–

Besoin d'IA

Besoin d'un systÚme intelligent pour extraire et synthétiser l'information

La Solution NexTraction

Un pipeline RAG (Retrieval-Augmented Generation) complet

🔍

Ingestion Automatique

Récupération et indexation automatique de pages web

🧠

Intelligence Vectorielle

Stockage et recherche sémantique avec FAISS

💬

Réponses Contextuelles

Génération de réponses basées sur les données indexées

🔐

Sécurisé

Authentification JWT et gestion des utilisateurs

Comment ça fonctionne ?

1

Ingestion

Fournissez des URLs de départ et laissez NexTraction explorer et indexer les pages web

2

Nettoyage & Chunking

Extraction du contenu, nettoyage HTML et découpage en chunks optimaux

3

Embedding & Indexation

Génération d'embeddings vectoriels et stockage dans FAISS pour recherche rapide

4

Question-Réponse

Posez des questions et obtenez des réponses contextuelles avec citations

API REST ComplĂšte

Endpoints principaux

POST /ingest

Démarrer une ingestion de pages web

GET /status/{job_id}

Vérifier le statut d'un job d'ingestion

POST /ask

Poser une question sur les données indexées

GET /docs

Documentation interactive Swagger

Stack Technologique

FastAPI
Python 3.11
FAISS
OpenAI / Gemini
Docker
Uvicorn

Architecture moderne, scalable et prĂȘte pour la production

Fonctionnalités Clés

🌍

Exploration Web

Exploration en profondeur avec contrĂŽle de domaine et limite de pages

📊

Suivi en Temps Réel

Monitoring du statut des jobs avec progression en direct

🔗

Citations Sources

Chaque réponse inclut des citations avec URLs et scores de pertinence

⚡

Performance

Recherche vectorielle ultra-rapide avec FAISS

Déploiement Docker

Simple et rapide

$ docker build -t nextraction-api .
$ docker-compose up -d
$ curl http://localhost:8000/health

Accessible sur http://localhost:8000

PrĂȘt Ă  commencer ?

Déployez NexTraction et transformez le web en connaissances

Essayer maintenant

Documentation complĂšte disponible sur /docs