DF2: Distribution-Free Decision-Focused Learning: Decision-Based training con su correspondiente repositorio acá.
Decision-focused fine-tuning of time series foundation models for dispatchable feeder optimization
Rubric-Based Rewards for RL: Proponen un método para aplicar recompensas basadas en rúbricas en modelo de aprendizaje por refuerzo para ayudar a los LLM a validar sus respuestas en entornos no verificables.
Optimización basada en decisiones (LOKAD): No totalmente machine learning, pero da una buena intro sobre como utilizar modelos predictivos para toma de decisiones.
Introduction to ggml: un post presentando un nuevo paquete de deep learning, aparentemente mas minimalista que PyTorch y TensorFlow.