Cómo Leer un Estudio de Suplementos: Financiación, Resultados, Tamaño de Muestra y Tamaño del Efecto (2026)

Una guía práctica de alfabetización científica para leer investigaciones sobre suplementos. Jerarquía de estudios, resultados sustitutos vs finales, sesgo de financiación industrial, p-hacking, trampas de subgrupos y tamaño del efecto vs significancia estadística.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

La mayoría de la publicidad de suplementos cita estudios. Sin embargo, muchos de esos estudios no respaldan realmente la afirmación. La diferencia entre "un estudio mostró" y "la evidencia respalda" es donde se mueve la industria de los suplementos. Aprender a leer un estudio toma menos de una hora de trabajo conceptual y sus beneficios son eternos. Necesitas conocer cinco aspectos: dónde se sitúa el estudio en la jerarquía de evidencia, qué resultado midió, cuántas personas se inscribieron y por cuánto tiempo, quién lo financió y si el tamaño del efecto fue clínicamente significativo o solo estadísticamente significativo. Esta guía te llevará a través de cada uno de ellos.

La alfabetización científica no es cientificismo. No necesitas descartar cada estudio no aleatorizado ni rechazar cada artículo financiado por la industria. Debes calibrar tu confianza. Un solo ensayo pequeño con un resultado sustituto y un patrocinador de la industria te mueve un poco. Un meta-análisis Cochrane de múltiples RCT bien diseñados con resultados finales te mueve mucho.

La jerarquía de la evidencia

De más débil a más fuerte

Tipo de estudio Propósito típico Errores comunes Peso en decisiones
Informe de caso Describir un evento raro u observación novedosa No generalizable; sin control Solo genera hipótesis
Transversal Instantánea de prevalencia/asociación No puede establecer tiempo; confusores Bajo — exploratorio
Caso-control Comparación retrospectiva Sesgo de recuerdo; sesgo de selección Bajo-moderado
Cohorte prospectiva Seguir grupos hacia adelante Confusores no medidos; larga duración Moderado
Ensayo controlado aleatorizado (RCT) Probar efecto causal Muestras pequeñas; corta duración; resultados sustitutos Alto, si está bien ejecutado
Meta-análisis / revisión sistemática Agrupar múltiples RCT Heterogeneidad; sesgo de publicación Alto
Revisión Cochrane Revisión sistemática rigurosamente protocolizada Alcance de pregunta limitado Máximo disponible para suplementos

Lo que esto significa en la práctica

Si un suplemento está respaldado principalmente por estudios transversales y un par de RCT pequeños, estás viendo una señal, no una conclusión. Si una revisión Cochrane ha agrupado los RCT y ha encontrado un efecto pequeño o nulo, eso pesa más que cualquier nuevo ensayo de tamaño similar que lo contradiga.

Resultados: sustitutos vs finales

Definiciones

Un resultado final es un resultado clínicamente significativo: mortalidad, accidente cerebrovascular, infarto, fractura, hospitalización, diagnóstico de una enfermedad.

Un resultado sustituto es un biomarcador que se cree que refleja un resultado final: colesterol LDL, presión arterial, HbA1c, densidad mineral ósea, marcadores inflamatorios.

Por qué la distinción es importante

Los resultados sustitutos se miden más rápido y son más baratos que los finales, pero no siempre se traducen. La historia de la medicina está llena de medicamentos que mejoraron un sustituto sin reducir la mortalidad (el ensayo CAST sobre antiarrítmicos es un ejemplo clásico). Los ensayos de suplementos casi siempre utilizan sustitutos porque los resultados finales requieren estudios grandes, largos y costosos.

Cuando un anuncio de suplemento cita "clínicamente probado para reducir el LDL", la traducción es: "un biomarcador mejoró en un estudio". Si ese cambio en el biomarcador produce una vida más larga o más saludable es una pregunta aparte.

Tamaño de muestra y duración del estudio

Por qué el tamaño de muestra es el primer número a verificar

Un estudio de 20 personas no puede detectar de manera confiable nada más que un efecto masivo. La mayoría de los suplementos no producen efectos masivos. Los ensayos con muestras pequeñas son propensos a la "maldición del ganador": un efecto real pero pequeño se estima demasiado grande por azar y luego se reduce en replicaciones.

Cálculos de potencia

Un estudio creíble informa un cálculo de potencia preespecificado: "Inscribimos a 180 participantes para tener un 80% de potencia para detectar una diferencia del 10% con un alfa de 0.05." Los estudios que no informan cálculos de potencia, o que ajustan el tamaño de muestra después de mirar los datos, deben ser leídos con escepticismo adicional.

Duración

Muchos resultados de suplementos requieren al menos de 8 a 12 semanas para medir. Los ensayos de seis semanas sobre elasticidad de la piel, recuperación del cartílago o rendimiento cognitivo a menudo subestiman efectos que necesitan más tiempo. Por otro lado, los ensayos largos que comienzan a informar resultados en un análisis interino temprano pueden exagerar los efectos a corto plazo.

Financiación y conflictos de interés

La investigación financiada por la industria tiende a ser positiva

Lesser y colegas (BMJ 2007) encontraron que los estudios de nutrición financiados por la industria eran más propensos a informar resultados favorables al patrocinador que los estudios financiados de manera independiente. Trabajos posteriores sobre financiación de la industria farmacéutica y alimentaria han replicado repetidamente este patrón.

Esto no significa que la investigación financiada por la industria esté fabricada. Significa que las elecciones de diseño del estudio, la selección de resultados y la publicación selectiva inclinan ligeramente los hallazgos. Un solo ensayo positivo financiado por la industria debería actualizarte menos que uno independiente de tamaño similar.

Divulgaciones de conflictos de interés

Revistas reputadas requieren que los autores divulguen fuentes de financiación y conflictos. Lee la sección de divulgación antes de leer el resumen. Si el autor correspondiente es un consultor pagado por el patrocinador y el estudio es positivo, calibra tu interpretación en consecuencia.

P-hacking y múltiples resultados

Cómo se ve el p-hacking

Un estudio mide 20 resultados. Uno alcanza p < 0.05 por azar. El artículo destaca ese hallazgo. Esto se llama "comparaciones múltiples" o "el jardín de caminos bifurcados", y aumenta los falsos positivos.

Señales de alerta

  • El resultado primario listado en el registro (ver ClinicalTrials.gov) difiere del resultado primario en el artículo publicado.
  • El resumen enfatiza un análisis secundario o de subgrupo.
  • No se aplica corrección (Bonferroni, Benjamini-Hochberg) para comparaciones múltiples.
  • Se informan resultados significativos solo para subgrupos (por ejemplo, "en hombres mayores de 55 con bajo nivel de vitamina D").

Análisis de subgrupos

Los hallazgos de subgrupos deben ser tratados como generadores de hipótesis, no concluyentes, a menos que el estudio estuviera preespecificado para probar ese subgrupo con suficiente potencia.

Tamaño del efecto vs significancia estadística

Por qué "estadísticamente significativo" no es suficiente

Un valor p te dice cuán improbable sería observar los datos si la hipótesis nula fuera cierta. No te dice cuán grande es el efecto o si tiene relevancia clínica.

Un estudio bien diseñado con 5,000 participantes puede detectar un efecto trivialmente pequeño como estadísticamente significativo. La pregunta correcta es: ¿cuán grande es el efecto y tiene importancia?

Medidas útiles del tamaño del efecto

  • d de Cohen: diferencia estandarizada entre dos medias. d = 0.2 es pequeño, 0.5 es moderado, 0.8 es grande.
  • Razón de riesgo / razón de probabilidades: cuán más (o menos) probable es un resultado en el grupo de tratamiento.
  • Número necesario para tratar (NNT): cuántas personas deben tomar el suplemento para que una persona adicional se beneficie. Un NNT de 10 es fuerte; un NNT de 500 es trivial para la mayoría de las personas sanas.
  • Reducción del riesgo absoluto: cambio porcentual real, no relativo. Una caída del 2% al 1% es una reducción relativa del 50% pero solo una reducción absoluta de 1 punto porcentual.

Las reducciones de riesgo relativas se utilizan a menudo en marketing porque suenan más grandes de lo que son.

Replicación

Un estudio es una hipótesis

No importa cuán bien diseñado esté, un solo estudio es un punto de partida. La replicación —idealmente en diferentes poblaciones por diferentes grupos de investigación— es lo que convierte un hallazgo en evidencia. Los suplementos con ensayos positivos únicos que no logran replicarse (por ejemplo, el resveratrol para la longevidad en humanos) deben ser considerados con cautela.

Pre-registro

Verifica si el ensayo fue pre-registrado (ClinicalTrials.gov, ISRCTN o un registro de revista). El pre-registro reduce la oportunidad de cambiar resultados y de reportes selectivos.

Cinco preguntas para hacer a cualquier estudio de suplementos

  1. ¿Quién pagó? El patrocinio industrial es un factor de calibración, no un descalificador.
  2. ¿Qué tamaño? Tamaño de muestra y potencia preespecificada.
  3. ¿Cuánto tiempo? ¿Coincide con la biología del efecto reclamado?
  4. ¿Qué resultado? ¿Resultado final o marcador sustituto?
  5. ¿Replicado? ¿Hay un meta-análisis o revisión Cochrane sobre esta cuestión?

Si puedes responder a estas cinco preguntas, puedes leer la mayoría de la investigación sobre suplementos de manera más crítica que la mayoría de los departamentos de marketing que la citan.

Nutrola y elecciones basadas en evidencia

Nutrola se basa en el seguimiento de evidencia en lugar de en afirmaciones de marketing. La aplicación rastrea más de 100 nutrientes, la ingesta de suplementos y los cambios en biomarcadores por €2.50 al mes sin anuncios, para que los usuarios puedan realizar su propio n de 1 junto con la evidencia publicada. Nutrola Daily Essentials ($49/mes, probado en laboratorio, certificado por la UE, 100% natural) se posiciona en torno a ingredientes con apoyo de múltiples RCT o nivel Cochrane en lugar de la moda de un solo ensayo.

Nutrola tiene una calificación de 4.9 estrellas en 1,340,080 reseñas.

Preguntas Frecuentes

¿Es un RCT siempre mejor que un estudio de cohorte?

Para preguntas causales sobre efectos de tratamiento, sí — un RCT bien ejecutado es más fuerte que un estudio de cohorte de tamaño similar. Pero los estudios de cohorte son esenciales para resultados a largo plazo (mortalidad, enfermedades crónicas) que los RCT rara vez miden. Ambos tipos de estudio se complementan.

¿Qué es un tamaño de efecto clínicamente significativo?

Depende del resultado. Una caída de 3 mmHg en la presión arterial sistólica es modesta individualmente pero significativa a nivel poblacional. Una mejora de 1 punto en una escala de sueño de 100 puntos generalmente no es significativa. Siempre pregunta qué magnitud importa para el resultado específico.

¿Debería confiar en un estudio financiado por la industria?

Puedes leerlo, pero dale menos peso. Los estudios financiados por la industria son más propensos a informar hallazgos favorables. Un solo ensayo positivo financiado por la industria no debería superar una revisión Cochrane que muestre nulo.

¿Cuál es la diferencia entre una revisión sistemática y un meta-análisis?

Una revisión sistemática es una búsqueda y resumen estructurado y protocolizado de la literatura. Un meta-análisis agrupa cuantitativamente los resultados de múltiples estudios. Las revisiones Cochrane son ambas.

¿Cómo puedo averiguar si un suplemento tiene buena evidencia?

Comienza con las hojas informativas de la Oficina de Suplementos Dietéticos de los NIH, revisiones Cochrane y principales meta-análisis en revistas indexadas. Los sitios web de empresas de suplementos no son bases de evidencia; son materiales de venta que citan evidencia de manera selectiva.

¿Por qué Nutrola enfatiza la lectura de estudios?

Porque la brecha entre la evidencia publicada y las afirmaciones de marketing es la mayor fuente de dinero desperdiciado en esta categoría. Enseñar a los usuarios cómo leer un estudio es más barato y duradero que darles una lista de productos aprobados.

Descargo de responsabilidad médico

Este artículo es solo para fines educativos y no constituye asesoramiento médico. La interpretación de estudios para decisiones de salud personal debe hacerse idealmente con un clínico calificado. No inicies, detengas o cambies un suplemento o medicamento basándote únicamente en un solo estudio.

Referencias

  1. Lesser LI, et al. Relación entre la fuente de financiación y la conclusión entre artículos científicos relacionados con la nutrición. PLoS Med / BMJ.
  2. Higgins JPT, et al. Manual Cochrane para Revisiones Sistemáticas de Intervenciones.
  3. Ioannidis JPA. Por qué la mayoría de los hallazgos de investigación publicados son falsos. PLoS Med.
  4. Chan AW, et al. Declaración SPIRIT 2013: definiendo los elementos estándar del protocolo para ensayos clínicos. Ann Intern Med.
  5. Schulz KF, et al. Declaración CONSORT 2010: pautas actualizadas para la presentación de ensayos paralelos aleatorizados. BMJ.
  6. Fleming TR, DeMets DL. Resultados sustitutos en ensayos clínicos: ¿nos están engañando? Ann Intern Med.
  7. Head ML, et al. La extensión y consecuencias del p-hacking en la ciencia. PLoS Biol.

¿Listo para transformar tu seguimiento nutricional?

¡Únete a miles que han transformado su viaje de salud con Nutrola!

Cómo Leer un Estudio de Suplementos: Una Guía de Alfabetización Científica | Nutrola