Saltar al contenido
AtalayaAtalaya
Retour

Méthodologie

Comment nous construisons chaque score, sans boîte noire.

Cette page documente les sources, transformations et pondérations qui produisent l'Atalaya Score. Si une décision d'investissement repose sur un nombre, ce nombre doit être auditable. Voici le modèle complet.

Modèle · heuristic-v2026.04.23 · vision-v1

Sources

Onze sources, ingérées directement.

Nous ne revendons pas de listings. Chaque actif est ingéré depuis la source originale, normalisé vers un schéma unique et exposé avec traçabilité par actif. Aucune donnée sans provenance. Couverture : ~37 000 actifs actifs dans toute l'Espagne.

  • Solvia

    REST API · POST · horaire

    Inventaire ex-Banco Sabadell géré par Cerberus. Source principale. ~8 200 actifs.

  • Hipoges

    REST API · quotidien

    Servicer indépendant. 41 portefeuilles bancaires dont Sareb, Cibeles et Tramuntana. ~6 500 actifs — deuxième source par volume.

  • Aliseda

    REST API · GET · horaire

    Banco Santander + Blackstone. Apporte référence cadastrale, coordonnées et état de possession. ~3 100 actifs.

  • Rural Inmobiliario

    JSON POST · quotidien

    Groupe Caja Rural : 7 coopératives (Cajasiete, Banco Cooperativo, Caixa Popular, Caja Viva, CR Jaén, CR Navarra, CR Extremadura). ~2 200 actifs.

  • Servihabitat

    Scraping SSR · quotidien

    Servicer de CaixaBank. Catalogue complet scraped quotidiennement via Railway. ~1 500 actifs.

  • Unicaja Inmuebles

    Listing JSP · quotidien

    Portail REO d'Unicaja Banco. Concentré en Andalousie et Castille-León. Prix sur demande. ~1 800 actifs.

  • Cimenta2

    Salesforce Aura · quotidien

    Cajamar Caja Rural — la plus grande caja rural d'Espagne. 54% terrains issus de portefeuilles post-Sareb. ~1 100 actifs.

  • Altamira

    REST API · POST · horaire

    doValue (multi-banque). Enchères extrajudiciaires avec données d'entité propriétaire et enrichissement de prix. ~1 100 actifs.

  • BOE

    Scraping HTML + LLM

    Enchères judiciaires du Bulletin Officiel de l'État. Texte légal parsé avec LLM → phase procédurale, créancier, dépôt, occupant vulnérable. ~760 actifs.

  • Diglo

    Drupal SSR · quotidien

    Spin-off de Banco Santander / Yera. ~700 actifs résidentiels avec prix.

  • Escogecasa

    JSP iframe · quotidien

    Portail REO d'ABANCA. Focus sur le nord-ouest de l'Espagne : Galice et Asturies représentent 42% du catalogue. ~92 actifs.

Score 0–100

Cinq composantes, pondérations fixes, total 100.

Chaque actif reçoit un score entier entre 0 et 100. Les pondérations des composantes somment exactement à 100 ; aucun multiplicateur ni boost caché. Un actif qui ne maximise pas une composante perd littéralement ces points.

ComposantePoidsCe qu'elle mesure
Δ vs zone
30
Différence entre €/m² de l'actif et la médiane €/m² de sa zone (cascade postale→municipale). Pénalise les actifs sur-cotés malgré une décote publiée élevée.
État physique
25
Analyse visuelle des photos par modèle Haiku. États : optimal, habitable, à rénover, en ruine. Pending_vision si pas de photo traitée (placeholder 14/25).
Possession
20
Libre / occupé / cédé / incertain. Signaux source + parsing BOE + données cadastrales croisées.
Liquidité zone
15
Activité de marché dans la zone : nouveaux listings/30j, rotation, demande. Zones haute/moyenne/basse.
Charges légales
10
Hypothèques actives, saisies, annotations marginales. Trois couches (A/B/C) à pondération décroissante.
Total100Somme fixe. Sans boost ni multiplicateur.

Niveaux de score

90100

Exceptionnel

7589

Excellent

6074

Good

4059

Moyen

2039

Sous la moyenne

019

Poor

Cascade zonale

Résolution par niveaux, fallback explicite.

Le prix de zone utilisé pour Δ-zone est résolu en cascade. Chaque niveau n'est tenté que si le précédent manque d'échantillon (par défaut 20 transactions). Le niveau résolu est enregistré dans zoneRefUsed pour audit ultérieur.

  1. 01

    01 · Code postal

    Médiane €/m² du CP exact. Le plus précis mais exige un échantillon suffisant. Source : dataset interne Atalaya.

  2. 02

    02 · Quartier

    Quand le CP manque d'échantillon. Pour les grandes villes, le quartier capte mieux la variance que la commune.

  3. 03

    03 · Commune

    Médiane €/m² communale issue de transactions réelles (pas d'annonces).

  4. 04

    04 · Province

    Dernier niveau du dataset interne lorsque la commune manque d'échantillon.

  5. 05

    05 · MITMA

    Source externe officielle : indices municipaux du Ministère espagnol des Transports. Indépendant du prix bancaire — casse le biais banque-vs-banque. Fallback final.

Parsing légal BOE

Texte judiciaire brut vers champs structurés.

Chaque enchère BOE inclut un texte légal dense. Atalaya extrait avec un pipeline LLM propriétaire les champs clés qu'un investisseur examinerait manuellement : NIF du débiteur, situation possessoire, charges enregistrées, mise à prix, date de clôture. Schema versionné, fallback gracieux si le modèle échoue.

  • Phase procédurale

    Exécution hypothécaire · faillite · exécution monétaire · administrative. Définit le risque procédural et les délais.

  • Type de créancier

    Banque · servicer · administration · particulier. Indique le profil du processus et la prédisposition à négocier.

  • Dépôt légal

    Montant du dépôt requis pour participer à l'enchère et délais associés.

  • Occupant vulnérable

    Drapeau d'occupation protégée (famille avec mineurs, personne dépendante). Risque réglementaire significatif.

Computer vision

État physique inféré depuis les photos du listing.

Pour les actifs avec photos traitées, un sous-agent Haiku évalue : cuisine, salles de bain, peinture, sols, extérieur. Sortie structurée avec quality score, observations et drapeau d'alertes. Sans photo disponible ou si le traitement n'a pas encore tourné, l'actif est marqué pending_vision avec score physique placeholder 14/25 — visible et traçable, jamais masqué.

Versionnage

Traçabilité par actif, sans réécriture silencieuse.

Chaque score porte la promptVersion du modèle qui l'a généré. Quand le modèle change, les scores antérieurs ne sont pas réécrits silencieusement : l'historique est préservé et le nouveau calcul est étiqueté avec la nouvelle version. L'historique est auditable depuis le détail de chaque actif.

Commencez avec des données auditables, pas avec des promesses.