Leandro Latorre España

Ingeniero Informático | Arquitecto de IA y Soluciones | Software Engineer
s1 Test-Time Scaling Performance

s1: Escalando el Razonamiento con Solo 1,000 Ejemplos y 'Budget Forcing'

📄 Paper de la Semana: s1 (Simple Test-Time Scaling) Paper: s1: Simple test-time scaling Autores: Muennighoff et al. (simplescaling) Publicación: Enero 2026 GitHub: simplescaling/s1 🎯 ¿Por qué es relevante? Mientras todos persiguen datasets masivos y clusters de entrenamiento gigantescos, s1 llega con una premisa rompedora: puedes lograr capacidades de razonamiento de vanguardia (SOTA) con solo 1,000 ejemplos de entrenamiento cuidadosamente curados. Este paper desafía la noción de que el razonamiento avanzado es una propiedad emergente exclusiva de modelos entrenados con RL a gran escala (como DeepSeek-R1 o OpenAI o1). En su lugar, demuestran que un modelo fuerte (Qwen2.5-32B) puede “desbloquear” estas capacidades mediante: ...

January 31, 2026 · Leandro Latorre
Evolución de los Agentes

Agentic World: ¿Son los Agentes una Amenaza o una Revolución?

Un análisis crítico sobre cómo los agentes autónomos redefinen nuestra relación con la tecnología, más allá del código.

January 25, 2026 · Leandro Latorre
DeepSeek-R1 Benchmark Comparison

DeepSeek-R1: Revolucionando el Razonamiento en LLMs con Reinforcement Learning Puro

📄 Paper Destacado: DeepSeek-R1 Paper: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning Autores: DeepSeek-AI Publicación: 22 de enero, 2025 GitHub: deepseek-ai/DeepSeek-R1 ⭐ 91.8k stars 🎯 ¿Por qué es importante este paper? DeepSeek-R1 representa un hito fundamental en el desarrollo de modelos de razonamiento. Por primera vez, se demuestra que un LLM puede desarrollar capacidades de razonamiento robustas sin necesidad de supervised fine-tuning inicial, utilizando únicamente reinforcement learning (RL) a gran escala. ...

January 24, 2026 · Leandro Latorre
Agentic RAG Framework Overview

Agentic RAG: La Nueva Generación de Búsqueda Aumentada

Adiós al RAG estático. Los agentes autónomos llegan para razonar, planificar y usar herramientas antes de responder.

January 17, 2026 · Leandro Latorre
OpenForecaster Pipeline

OpenForecaster: Prediciendo el Futuro con Razonamiento Abierto

Un modelo de 8B parámetros que desafía a los gigantes en predicción de eventos futuros mediante razonamiento estructurado.

January 10, 2026 · Leandro Latorre
DeepSeek-V3 Architecture

DeepSeek-V3: La Eficiencia Extrema Llega a los Modelos de Frontera

671B parámetros, pero solo 37B activos. DeepSeek redefine lo que significa entrenar un modelo SOTA con un presupuesto ajustado.

January 3, 2026 · Leandro Latorre
o1 Safety Scorecard

o1 System Card: Abriendo la Caja Negra del Razonamiento Seguro

El informe técnico que revela cómo el ‘Chain of Thought’ oculto mejora la seguridad pero introduce nuevos riesgos de engaño.

December 20, 2025 · Leandro Latorre
PaliGemma Architecture

PaliGemma 2: Google Redefine la Visión-Lenguaje Ligera

Modelos VLM pequeños pero matones. Google demuestra que no necesitas 100B parámetros para entender imágenes a nivel experto.

December 13, 2025 · Leandro Latorre
OpenScholar Retrieval Process

OpenScholar: IA que Realmente Sabe Investigar Ciencia

Un sistema RAG diseñado específicamente para la ciencia, capaz de superar a GPT-4o respondiendo preguntas académicas complejas.

December 6, 2025 · Leandro Latorre