🚀 NexTraction

Pipeline RAG Web pour l'extraction d'insights

Transformez le web en connaissances exploitables

Le Défi

🌐

Information Dispersée

Les informations sont éparpillées sur des milliers de sites web

⏱️

Recherche Manuelle

La collecte et l'analyse manuelle prend des heures, voire des jours

🤖

Besoin d'IA

Besoin d'un système intelligent pour extraire et synthétiser l'information

La Solution NexTraction

Un pipeline RAG (Retrieval-Augmented Generation) complet

🔍

Ingestion Automatique

Récupération et indexation automatique de pages web

🧠

Intelligence Vectorielle

Stockage et recherche sémantique avec FAISS

💬

Réponses Contextuelles

Génération de réponses basées sur les données indexées

🔐

Sécurisé

Authentification JWT et gestion des utilisateurs

Comment ça fonctionne ?

1

Ingestion

Fournissez des URLs de départ et laissez NexTraction explorer et indexer les pages web

2

Nettoyage & Chunking

Extraction du contenu, nettoyage HTML et découpage en chunks optimaux

3

Embedding & Indexation

Génération d'embeddings vectoriels et stockage dans FAISS pour recherche rapide

4

Question-Réponse

Posez des questions et obtenez des réponses contextuelles avec citations

API REST Complète

Endpoints principaux

POST /ingest

Démarrer une ingestion de pages web

GET /status/{job_id}

Vérifier le statut d'un job d'ingestion

POST /ask

Poser une question sur les données indexées

GET /docs

Documentation interactive Swagger

Stack Technologique

FastAPI

Python 3.11

FAISS

OpenAI / Gemini

Docker

Uvicorn

Architecture moderne, scalable et prête pour la production

Fonctionnalités Clés

🌍

Exploration Web

Exploration en profondeur avec contrôle de domaine et limite de pages

📊

Suivi en Temps Réel

Monitoring du statut des jobs avec progression en direct

🔗

Citations Sources

Chaque réponse inclut des citations avec URLs et scores de pertinence

⚡

Performance

Recherche vectorielle ultra-rapide avec FAISS

Déploiement Docker

Simple et rapide

                $ docker build -t nextraction-api .
            
                $ docker-compose up -d
            
                $ curl http://localhost:8000/health

Accessible sur http://localhost:8000

Prêt à commencer ?

Déployez NexTraction et transformez le web en connaissances

Essayer maintenant

Documentation complète disponible sur /docs