El cuestionario en investigación: del Literary Digest fiasco de 1936 a la escala Likert, NPS y la era post-respuesta de 2026
El cuestionario explicado con la profundidad que merece: el fiasco del Literary Digest en 1936 versus la encuesta de Gallup, la escala Likert (1932), el NPS de Reichheld (HBR 2003), la realidad de la caída de tasas de respuesta (de 80% en 1979 a menos del 10% hoy), y cómo diseñar cuestionarios honestos en 2026 con herramientas como SurveyMonkey, Typeform y Qualtrics.
El equipo detrás de Polimake. Exploramos la intersección entre tecnología, creatividad y automatización.
Un cuestionario es un instrumento de investigación que consta de un conjunto estructurado de preguntas dirigidas a obtener información de un grupo de personas de forma sistemática. Es probablemente la herramienta más antigua y más usada en investigación social, marketing, salud pública, gestión empresarial y ciencias políticas. Su simplicidad aparente esconde una disciplina rigurosa: hay un siglo de teoría sobre cómo diseñar buenas preguntas, cómo seleccionar muestras, cómo evitar sesgos, y cómo interpretar resultados que parecen claros pero pueden estar capturando ruido.
Este artículo cubre la historia intelectual del campo, los conceptos fundamentales que cualquier persona que diseña cuestionarios debe conocer, y los desafíos específicos del momento actual donde las tasas de respuesta se han desplomado y la calidad de muchas encuestas comerciales es discutible.
El nacimiento de la encuesta científica: 1935-1936
La historia de la encuesta moderna como disciplina rigurosa tiene un caso fundacional que sigue siendo el ejemplo canónico que se enseña en cualquier curso de metodología.
En las elecciones presidenciales estadounidenses de 1936, dos organizaciones intentaron predecir el resultado: la revista Literary Digest y el recién creado American Institute of Public Opinion de George Gallup.
Literary Digest envió 10 millones de papeletas de encuesta a una lista construida a partir de directorios telefónicos, registros de propietarios de automóviles y suscriptores de la revista. Recibieron aproximadamente 2,4 millones de respuestas. Con esa muestra masiva —enorme para los estándares de la época, e impensable hoy— predijeron que Alf Landon ganaría a Franklin D. Roosevelt con un 57% del voto.
George Gallup, en cambio, había fundado el American Institute of Public Opinion en 1935 con un enfoque metodológico distinto: en lugar de muestras gigantes de fuentes sesgadas, usó muestreo aleatorio estratificado con apenas 50.000 encuestados representativos de la población votante. Predijo que FDR ganaría con un 56%.
Roosevelt ganó con el 60,8%. Gallup había acertado con una muestra 200 veces menor que Literary Digest, porque su muestra era representativa mientras la de Literary Digest estaba sesgada hacia votantes con teléfono y coche —demografías que en plena Gran Depresión sobre-representaban a los más prósperos, que tendían a votar republicano—.
El fiasco hundió a Literary Digest, que cerró en 1938. Y consagró el principio fundacional de la encuesta científica: el tamaño de la muestra importa menos que su representatividad. Una encuesta con muestra pequeña pero bien seleccionada predice mejor que una gigantesca pero sesgada.
Este caso se enseña ya que ilustra un error que sigue cometiéndose en 2026 en innumerables estudios y encuestas comerciales: confundir volumen con representatividad. Una encuesta a tu lista de email genera muestra grande, pero no necesariamente representativa de tu mercado objetivo.
La escala Likert: 1932
Antes incluso del fiasco Literary Digest, en 1932, el psicólogo social Rensis Likert publicó en Archives of Psychology su tesis doctoral titulada "A Technique for the Measurement of Attitudes". En ese trabajo presentó lo que ahora se conoce universalmente como escala Likert —la herramienta que permite medir actitudes y opiniones con un sistema gradual de respuesta.
La escala Likert clásica tiene cinco puntos:
- Totalmente en desacuerdo
- En desacuerdo
- Ni de acuerdo ni en desacuerdo
- De acuerdo
- Totalmente de acuerdo
Likert descubrió empíricamente que esta gradación capturaba mucha más información matiz que las preguntas binarias (sí/no) y permitía análisis estadístico sofisticado de actitudes.
Variantes posteriores han usado escalas de 7 puntos (más sensibilidad), escalas de 4 puntos sin punto medio (forzando posicionamiento, evitando la respuesta neutral por evasión), y escalas de 10 puntos (especialmente para satisfacción de cliente). Cada variante tiene argumentos a favor; el consenso académico es que la consistencia dentro de un mismo cuestionario es más importante que el número exacto de puntos.
La escala Likert sigue siendo, casi un siglo después, el formato dominante para preguntas sobre actitudes, opiniones, satisfacción y acuerdo en cuestionarios serios.
NPS: Fred Reichheld, HBR, 2003
El siglo XX terminó y el XXI introdujo otra contribución metodológica importante. En diciembre de 2003, Fred Reichheld publicó en Harvard Business Review el artículo "The One Number You Need to Grow", donde proponía que una sola pregunta podía predecir el crecimiento de una empresa mejor que cualquier batería compleja de satisfacción.
La pregunta es:
"En una escala de 0 a 10, ¿qué probabilidad hay de que recomiende [empresa/producto] a un amigo o colega?"
Las respuestas se clasifican:
- 9-10: Promotores (clientes leales, dispuestos a recomendar).
- 7-8: Pasivos (satisfechos pero no entusiastas).
- 0-6: Detractores (insatisfechos, posibles fuente de mala palabra).
El NPS (Net Promoter Score) se calcula:
NPS = % Promotores − % Detractores
Reichheld trabajaba en Bain & Company y había desarrollado el modelo en colaboración con la empresa de software Satmetrix. La metodología patentada se popularizó rapidísimo: para 2010, el NPS era ya métrica estándar en miles de empresas del Fortune 500.
La crítica académica ha sido considerable: estudios académicos posteriores (Keiningham, Aksoy y otros) han mostrado que el NPS no predice crecimiento de manera más fiable que otras medidas de satisfacción. Pero la utilidad práctica del NPS reside en su simplicidad: una métrica fácil de comunicar a directivos no técnicos y comparable entre empresas y períodos. Esa virtud práctica —comunicabilidad— ha mantenido al NPS popular incluso ante crítica metodológica.
Para una empresa, decidir entre NPS, CSAT (Customer Satisfaction Score), CES (Customer Effort Score) u otras métricas no es trivial. La elección depende de qué se quiere medir: lealtad y advocacy (NPS), satisfacción puntual (CSAT), facilidad de la experiencia (CES).
El gran problema de 2026: el desplome de las tasas de respuesta
Hay un cambio fundamental en la realidad de los cuestionarios que las teorías clásicas no anticipaban: las tasas de respuesta se han desplomado en los últimos 50 años.
Datos del Pew Research Center y otros estudios metodológicos documentan la caída:
Años 70 (encuestas telefónicas): tasa de respuesta del 80% o superior. Cuando llamaba el encuestador, la mayoría de la gente atendía y participaba.
Años 90: tasa cayó a aproximadamente 40%.
Años 2000-2010: 20-30%.
2020-2026: en encuestas telefónicas comerciales, las tasas suelen estar por debajo del 10%, y en muchos contextos por debajo del 5%. Para encuestas online no incentivadas (no panel pagado), las tasas pueden ser del 1-3% del envío inicial.
Esta caída tiene varias causas convergentes: saturación (la gente recibe muchas más solicitudes de encuesta), spam call fatigue (rechazar números desconocidos por defecto), pérdida de confianza en cómo se usan los datos personales, y proliferación de encuestas comerciales de baja calidad que han devaluado la categoría.
Las consecuencias para investigación honesta son significativas:
Sesgo de no respuesta amplificado. Si solo el 5% responde, las características de quienes responden pueden ser muy distintas de las del 95% que no, y la muestra deja de ser representativa.
Costes de campo subieron. Llegar a una muestra representativa requiere muchas más llamadas/envíos por respuesta obtenida, encareciendo significativamente la investigación rigurosa.
Crecimiento de paneles online pagados. Plataformas como Prolific, CloudResearch (anteriormente TurkPrime), Cint, Toluna, Lucid ofrecen acceso a panelistas pagados que sí responden. Esto resuelve el problema de respuesta pero introduce nuevo sesgo: los panelistas son una subpoblación específica.
Dependencia creciente de modelos predictivos. Para compensar la baja representatividad, las casas serias usan modelado estadístico (post-stratification, Multilevel Regression with Poststratification) para corregir sesgos conocidos. Pero estos modelos solo corrigen sesgos que se anticipan.
Para una empresa que diseña encuestas comerciales (no estudios académicos rigurosos), las implicaciones prácticas son:
- Una encuesta a "tu base de email" no es representativa de tu mercado, solo de tus clientes actuales.
- Una encuesta abierta en redes sociales captura a quien le importa lo suficiente como para responder, no a la audiencia general.
- Una encuesta con incentivo sesga hacia quienes valoran el incentivo.
- Las conclusiones honestas requieren reconocer estas limitaciones explícitamente, no presentar resultados como si fueran representativos cuando no lo son.
Las herramientas modernas y su realidad operativa
El mercado de software de encuestas en 2026 está dominado por algunas plataformas notables:
SurveyMonkey se fundó en 1999 por Ryan y Chris Finley en Portland. Fue durante años el líder indiscutido y sigue siendo una de las plataformas más usadas, especialmente para encuestas comerciales sencillas.
Typeform se fundó en Barcelona en 2012 por David Okuniev y Robert Muñoz. Su diferenciador fue el diseño de la experiencia (una pregunta a la vez, transiciones fluidas, formato más conversacional) que mejoró significativamente las tasas de finalización en encuestas online. Es uno de los unicornios SaaS españoles. Ha sido adquirida en operaciones de capital privado en años recientes.
Qualtrics, fundada en 2002 en Provo, Utah, se especializó en investigación rigurosa para enterprise y academia. Salió a bolsa en 2018, fue adquirida por SAP en 2018 por 8.000 millones de dólares, y nuevamente fue privatizada (en 2023) tras transición de propiedad.
Google Forms es la opción gratuita más usada para encuestas internas, sencillas y no críticas. Cero coste, integración con Google Workspace, suficiente para necesidades básicas.
Tally, Jotform, Formstack, Microsoft Forms son alternativas con posicionamientos específicos.
Para investigación cualitativa específicamente: Dovetail, Hotjar, Lookback ofrecen capacidades de análisis y entrevista que complementan las encuestas con investigación más profunda.
La elección de herramienta importa menos que la metodología. Una encuesta mal diseñada en Qualtrics produce datos basura tanto como una mal diseñada en Google Forms.
Cómo diseñar un cuestionario que produce datos útiles
Las prácticas que distinguen cuestionarios rigurosos de los que generan ruido bonito:
Define la decisión que vas a tomar antes de redactar preguntas. Si tras los resultados no vas a tomar ninguna decisión distinta, no hagas la encuesta. Cualquier pregunta cuya respuesta no cambie nada es ruido.
Limita la longitud agresivamente. Las tasas de finalización caen exponencialmente con la longitud. Encuestas de 5 minutos terminan; de 15 minutos, no. Cada pregunta extra debe justificar su coste en abandono. Si dudas de si incluir una pregunta, no la incluyas.
Empieza con preguntas fáciles, deja las difíciles para el medio. Preguntas de demografía al principio o final (no en medio para evitar fatiga). Preguntas controvertidas o íntimas en el medio cuando hay compromiso pero antes de la fatiga.
Evita preguntas dobles. "¿Te parece nuestro producto rápido y fácil de usar?" mezcla dos atributos. Sepáralos.
Cuida el lenguaje sin sesgar. "¿Estás de acuerdo con que nuestro innovador producto resuelve tu problema?" contiene varias asunciones (que es innovador, que tienes el problema). Pregúntalo neutralmente.
Ofrece opción para "no aplica" o "no sé". Forzar respuesta cuando no se tiene opinión genera datos falsos.
Aleatoriza orden de opciones cuando aplique. El orden afecta selección (efecto primacy/recency). Aleatorizar evita sesgo sistemático.
Pre-prueba con 5-10 personas antes de lanzar. Encontrarán problemas que tú no ves.
Sé transparente sobre uso de datos. Privacidad, anonimización, propósito. La confianza en cómo se usan los datos influye en honestidad de respuestas.
Combina abiertas con cerradas. Las cerradas dan números agregables; las abiertas dan matiz que no anticipabas. Pocas abiertas (1-3 por cuestionario) son suficiente.
Errores comunes en cuestionarios
Hacer encuesta sin objetivo claro. Más común de lo que parece. La gente lanza encuestas porque tocaba, no porque hubiera decisión que tomar.
Confundir muestra con audiencia. Quienes responden representan a quienes responden, no a tu audiencia general.
Preguntar sobre intención futura. "¿Pagarías por X?" es la pregunta más mentirosa. La gente sobreestima dramáticamente lo que haría hipotéticamente. Pregunta por comportamiento pasado, no futuro.
Asumir representatividad. Una encuesta a clientes actuales muestra a clientes actuales. Si quieres saber sobre prospects o no clientes, los métodos son diferentes.
Sobre-interpretar diferencias pequeñas. Si NPS subió de 32 a 35, no significa que algo grande cambió. La variabilidad estadística suele ser mayor que las pequeñas diferencias.
Ignorar tasas de no respuesta. Si publicas resultado sin reportar tasa de respuesta, estás escondiendo información crítica para la interpretación.
Mal uso de NPS o métricas estándar. NPS funciona como tendencia interna. Comparar tu NPS con el de otra industria, otra empresa, otra geografía suele ser engañoso porque los baselines son distintos.
No actuar sobre los resultados. Un cuestionario que produce hallazgos que no se aplican es cuestionario decorativo. Cierra el bucle.
Cuestionarios y operaciones creativas
Para una marca que quiere alimentar producción creativa con investigación de cliente, los cuestionarios son input crítico para casi todas las decisiones: qué contenido producir, qué mensaje funciona, qué falla en el embudo. Pero solo son útiles cuando los resultados viajan al equipo creativo y se traducen en decisiones. Un informe que se archiva no afecta a nada.
Esa traducción es disciplina de operaciones creativas: los hallazgos del cuestionario alimentan el calendario editorial (qué temas atender), la matriz de empatía (qué motivaciones documentar), los KPIs creativos (qué medir como éxito post-cambio).
En Polimake los inputs de investigación —incluyendo resultados de cuestionarios— viven idealmente en Media accesibles, Studio coordina la producción derivada, y Studio ejecuta los cambios. Sin ese circuito, los cuestionarios producen presentaciones bonitas que nadie aplica.
Si lideras investigación, marketing, producto o estrategia y has llegado aquí buscando una respuesta sobre cuestionarios, lo más útil que puedes llevarte de este artículo es probablemente la combinación de tres ideas: el tamaño de muestra importa menos que la representatividad (lección de Gallup vs Literary Digest, vigente noventa años después), las tasas de respuesta han caído tanto que muchas encuestas comerciales no son representativas de nada (5-10% típico hoy versus 80% en los 70), y un cuestionario sin decisión asociada es trabajo perdido. Diseñar una encuesta seria es trabajo metodológico, no solo redacción de preguntas.
Para complementar, técnicas de investigación comercial cubre el contexto más amplio donde el cuestionario es una herramienta entre varias, matriz de empatía cubre cómo se traducen hallazgos a perfil de cliente, y investigación comercial cubre la disciplina general.
Referencias rápidas
- Técnicas de investigación comercial — el contexto más amplio.
- Investigación comercial — la disciplina general.
- Matriz de empatía — cómo traducir hallazgos a perfil de cliente.
- Escucha activa en redes sociales — el método cualitativo complementario.
- Análisis competitivo — investigación distinta pero adyacente.