Comment nous construisons chaque score, sans boîte noire.
Cette page documente les sources, transformations et pondérations qui produisent l'Atalaya Score. Si une décision d'investissement repose sur un nombre, ce nombre doit être auditable. Voici le modèle complet.
Modèle · heuristic-v2026.04.23 · vision-v1
Sources
Onze sources, ingérées directement.
Nous ne revendons pas de listings. Chaque actif est ingéré depuis la source originale, normalisé vers un schéma unique et exposé avec traçabilité par actif. Aucune donnée sans provenance. Couverture : ~37 000 actifs actifs dans toute l'Espagne.
Solvia
REST API · POST · horaire
Inventaire ex-Banco Sabadell géré par Cerberus. Source principale. ~8 200 actifs.
Hipoges
REST API · quotidien
Servicer indépendant. 41 portefeuilles bancaires dont Sareb, Cibeles et Tramuntana. ~6 500 actifs — deuxième source par volume.
Aliseda
REST API · GET · horaire
Banco Santander + Blackstone. Apporte référence cadastrale, coordonnées et état de possession. ~3 100 actifs.
Rural Inmobiliario
JSON POST · quotidien
Groupe Caja Rural : 7 coopératives (Cajasiete, Banco Cooperativo, Caixa Popular, Caja Viva, CR Jaén, CR Navarra, CR Extremadura). ~2 200 actifs.
Servihabitat
Scraping SSR · quotidien
Servicer de CaixaBank. Catalogue complet scraped quotidiennement via Railway. ~1 500 actifs.
Unicaja Inmuebles
Listing JSP · quotidien
Portail REO d'Unicaja Banco. Concentré en Andalousie et Castille-León. Prix sur demande. ~1 800 actifs.
Cimenta2
Salesforce Aura · quotidien
Cajamar Caja Rural — la plus grande caja rural d'Espagne. 54% terrains issus de portefeuilles post-Sareb. ~1 100 actifs.
Altamira
REST API · POST · horaire
doValue (multi-banque). Enchères extrajudiciaires avec données d'entité propriétaire et enrichissement de prix. ~1 100 actifs.
BOE
Scraping HTML + LLM
Enchères judiciaires du Bulletin Officiel de l'État. Texte légal parsé avec LLM → phase procédurale, créancier, dépôt, occupant vulnérable. ~760 actifs.
Diglo
Drupal SSR · quotidien
Spin-off de Banco Santander / Yera. ~700 actifs résidentiels avec prix.
Escogecasa
JSP iframe · quotidien
Portail REO d'ABANCA. Focus sur le nord-ouest de l'Espagne : Galice et Asturies représentent 42% du catalogue. ~92 actifs.
Score 0–100
Cinq composantes, pondérations fixes, total 100.
Chaque actif reçoit un score entier entre 0 et 100. Les pondérations des composantes somment exactement à 100 ; aucun multiplicateur ni boost caché. Un actif qui ne maximise pas une composante perd littéralement ces points.
| Composante | Poids | Ce qu'elle mesure |
|---|---|---|
| Δ vs zone | Différence entre €/m² de l'actif et la médiane €/m² de sa zone (cascade postale→municipale). Pénalise les actifs sur-cotés malgré une décote publiée élevée. | |
| État physique | Analyse visuelle des photos par modèle Haiku. États : optimal, habitable, à rénover, en ruine. Pending_vision si pas de photo traitée (placeholder 14/25). | |
| Possession | Libre / occupé / cédé / incertain. Signaux source + parsing BOE + données cadastrales croisées. | |
| Liquidité zone | Activité de marché dans la zone : nouveaux listings/30j, rotation, demande. Zones haute/moyenne/basse. | |
| Charges légales | Hypothèques actives, saisies, annotations marginales. Trois couches (A/B/C) à pondération décroissante. | |
| Total | 100 | Somme fixe. Sans boost ni multiplicateur. |
Niveaux de score
90–100
Exceptionnel
75–89
Excellent
60–74
Good
40–59
Moyen
20–39
Sous la moyenne
0–19
Poor
Cascade zonale
Résolution par niveaux, fallback explicite.
Le prix de zone utilisé pour Δ-zone est résolu en cascade. Chaque niveau n'est tenté que si le précédent manque d'échantillon (par défaut 20 transactions). Le niveau résolu est enregistré dans zoneRefUsed pour audit ultérieur.
- 01
01 · Code postal
Médiane €/m² du CP exact. Le plus précis mais exige un échantillon suffisant. Source : dataset interne Atalaya.
- 02
02 · Quartier
Quand le CP manque d'échantillon. Pour les grandes villes, le quartier capte mieux la variance que la commune.
- 03
03 · Commune
Médiane €/m² communale issue de transactions réelles (pas d'annonces).
- 04
04 · Province
Dernier niveau du dataset interne lorsque la commune manque d'échantillon.
- 05
05 · MITMA
Source externe officielle : indices municipaux du Ministère espagnol des Transports. Indépendant du prix bancaire — casse le biais banque-vs-banque. Fallback final.
Parsing légal BOE
Texte judiciaire brut vers champs structurés.
Chaque enchère BOE inclut un texte légal dense. Atalaya extrait avec un pipeline LLM propriétaire les champs clés qu'un investisseur examinerait manuellement : NIF du débiteur, situation possessoire, charges enregistrées, mise à prix, date de clôture. Schema versionné, fallback gracieux si le modèle échoue.
Exécution hypothécaire · faillite · exécution monétaire · administrative. Définit le risque procédural et les délais.
Banque · servicer · administration · particulier. Indique le profil du processus et la prédisposition à négocier.
Montant du dépôt requis pour participer à l'enchère et délais associés.
Drapeau d'occupation protégée (famille avec mineurs, personne dépendante). Risque réglementaire significatif.
Computer vision
État physique inféré depuis les photos du listing.
Pour les actifs avec photos traitées, un sous-agent Haiku évalue : cuisine, salles de bain, peinture, sols, extérieur. Sortie structurée avec quality score, observations et drapeau d'alertes. Sans photo disponible ou si le traitement n'a pas encore tourné, l'actif est marqué pending_vision avec score physique placeholder 14/25 — visible et traçable, jamais masqué.
Versionnage
Traçabilité par actif, sans réécriture silencieuse.
Chaque score porte la promptVersion du modèle qui l'a généré. Quand le modèle change, les scores antérieurs ne sont pas réécrits silencieusement : l'historique est préservé et le nouveau calcul est étiqueté avec la nouvelle version. L'historique est auditable depuis le détail de chaque actif.