Descubriendo exoplanetas con Fuzzy Logic y XAI: una nueva forma de entender los tránsitos de Kepler

Gabriel Marín
16 nov 2025
3 min de lectura

Imágenes de la Luna captadas con el Seestar S50

Durante más de una década, la misión Kepler de la NASA analizó millones de curvas de luz para buscar uno de los fenómenos más sutiles del universo: el tránsito de un exoplaneta frente a su estrella. Este proceso genera pequeñas disminuciones periódicas de brillo que, si se interpretan correctamente, pueden revelar mundos ocultos a cientos o miles de años luz.

Pero el camino entre una detección automática y la confirmación de un planeta no es nada trivial. El catálogo de Kepler está lleno de señales ambiguas, ruido instrumental, eclipse por estrellas binarias, variabilidad estelar y casos fronterizos.

Por eso en el trabajo se ha desarrollado FAS-XAI, un marco metodológico que combina tres pilares:

Fuzzy clustering, capturando incertidumbre y solapamientos entre señales.
Aprendizaje supervisado (XGBoost), reproduciendo patrones y de esta forma clasificar candidatos.
Explicabilidad (XAI: SHAP, LIME, ELI5), e intentar entender las decisiones del modelo y relacionarlas con física real.

El resultado es un nuevo método de análisis de tránsitos exoplanetarios, combinando el uso del aprendizaje automático con el objetivo de detectar y clasificar patrones, y explicar dichos patrones a través de XAI.

El problema: señales ambiguas en el catálogo de Kepler

Kepler genera dos niveles de información:

TCE (Threshold Crossing Events): detecciones automáticas que superan un umbral.
KOI (Kepler Objects of Interest): señales revisadas manual y automáticamente, clasificadas como:
- Confirmed
- Candidate
- False Positive

Entre ambos catálogos se encuentra la parte más complicada, determinar si una señal tenue es un planeta, un falso positivo o algo que no es ni una cosa ni otra (a medias).

Aquí es donde la lógica difusa (Fuzzy C-Means) se vuelve especialmente útil.

Fuzzy clustering: porque las señales no se pueden clasificar de forma absoluta

En lugar de forzar a cada TCE a pertenecer a una sola categoría, se aplica Fuzzy C-Means, de forma que se asigna a cada señal un grado de pertenencia a varios clústeres simultáneamente.

El análisis muestra tres grandes grupos:

C0, corto y poco profundo. Señales pequeñas, rápidas y de bajo contraste.
C1, largo y profundo. Tránsitos largos, marcados y compatibles con órbitas amplias.
C2, intermedio e intenso. Señales moderadas pero con alto SNR.

Lo interesante es que estos clústeres no son etiquetas absolutas, sino regiones que reflejan transiciones físicas entre distintos tipos de tránsitos.

Validación con aprendizaje supervisado (XGBoost)

Para comprobar que los clústeres realmente existen en los datos, se entronó un modelo XGBoost para predecir a qué clúster pertenece cada TCE.

Los resultados fueron muy buenos, claramente se distinguen los clústers y la definición de cada uno de ellos:

Accuracy global ≈ 0.99
Accuracy = 1.00 en zonas “core” del clúster
Y solo cae ligeramente en las zonas fronterizas (como es natural)

Esto demuestra que la estructura difusa es estable, reproducible y físicamente coherente.

XAI (SHAP, LIME, ELI5): entender por qué los modelos deciden lo que deciden

Los modelos de aprendizaje automático, caja negra como XGBoost, proporcionan información que es necesario interpretar. De ahí, la incorporación de tres técnicas XAI:

SHAP (explicación global y local)

Mostró qué variables explican mejor cada clúster:

período
duración
profundidad
SNR

Cada clúster tiene una “firma física” clara.

LIME

Explicó casos individuales, sobre todo señales ambiguas, y cómo pequeños cambios afectan la asignación a un clúster.

ELI5

Deconstruyó el modelo árbol por árbol, dejando ver la contribución de cada parámetro.

Gracias a XAI, el modelo deja de ser una caja negra: podemos ver qué parámetros físicos hay detrás de cada decisión.

Validación física con parámetros estelares (Kepler DR25)

Para comprobar que los clústeres no eran sólo patrones estadísticos, calculamos:

el radio planetario estimado
la profundidad del tránsito
la anomalía de duración
la distancia orbital normalizada

El resultado confirma las apreciaciones anteriores, estableciendo una coherencia física impresionante:

C0, planetas terrestres, tránsitos casi centrales
C1, órbitas largas, eventos con alto impacto y posibles excentricidades
C2, señales intensas, mezcla de planetas reales y falsos positivos astrofísicos

Es decir, los clústeres fuzzy sí representan regímenes físicos reales.

KOI + Fuzzy + IA = una visión continua del proceso de validación

Cuando cruzamos las membresías fuzzy con las clasificaciones KOI:

Confirmed, se inclinan hacia C2
False Positive, dispersos
Candidates, exactamente donde deben estar: zonas de transición

Esto demuestra que FAS-XAI modela el proceso de validación de Kepler como un continuo, no como una decisión binaria.

Conclusión: hacia una IA transparente para descubrir mundos

FAS-XAI constituye un puente entre la IA y la física, diseñado para:

capturar incertidumbre
explicar decisiones
respetar la interpretación científica
y guiar futuras detecciones exoplanetarias

En un mundo donde los catálogos de tránsitos crecerán con misiones como TESS, PLATO y CHEOPS, este tipo de IA explicable será esencial para:

priorizar señales
reducir falsos positivos
entender límites del modelo
y acelerar el descubrimiento de nuevos exoplanetas

En definitiva, FAS-XAI demuestra que el uso de modelos predictivos puede ser preciso, interpretable y científicamente responsable.

Descubriendo exoplanetas con Fuzzy Logic y XAI: una nueva forma de entender los tránsitos de Kepler

El problema: señales ambiguas en el catálogo de Kepler

Fuzzy clustering: porque las señales no se pueden clasificar de forma absoluta

Validación con aprendizaje supervisado (XGBoost)

XAI (SHAP, LIME, ELI5): entender por qué los modelos deciden lo que deciden

SHAP (explicación global y local)

LIME

ELI5

Validación física con parámetros estelares (Kepler DR25)

KOI + Fuzzy + IA = una visión continua del proceso de validación

Conclusión: hacia una IA transparente para descubrir mundos

Entradas recientes

Comentarios