Polimake

Google Analytics: de la adquisición de Urchin en 2005 a la migración GA4 de 2023, y cómo configurarlo bien sin sobrecomplicarlo

Google Analytics explicado con su historia real: Urchin Software fundada en 1995 y adquirida por Google en marzo de 2005, lanzamiento de Google Analytics el 14 de noviembre de 2005, llegada de Universal Analytics en 2013, GA4 en octubre de 2020, y la transición forzada del 1 de julio de 2023 cuando UA dejó de procesar datos. Cómo configurarlo bien y los errores más comunes.

· Platform

El equipo detrás de Polimake. Exploramos la intersección entre tecnología, creatividad y automatización.

Publicado:

Google Analytics es la herramienta de Google para medir tráfico, comportamiento de usuarios y conversiones en sitios web y aplicaciones. Es probablemente la plataforma de analítica web más usada del mundo y, también, una de las que más confusión genera entre profesionales del marketing por la cantidad de cambios técnicos que ha sufrido en los últimos cinco años. Quien aprendió Google Analytics antes de 2020 está prácticamente usando una herramienta diferente a la actual; entender por qué es así requiere conocer la historia.

Esta guía cubre el origen de la herramienta, los cambios fundamentales que la han transformado, qué mide realmente en su versión vigente (GA4) y cómo configurarla bien sin caer en los errores que han producido a tantas empresas dashboards inservibles.

El origen: Urchin Software, 1995-2005

La historia de Google Analytics empieza fuera de Google. Urchin Software Corporation fue fundada en San Diego, California, en 1995 por Brett Crosby, Paul Muret y otros. La empresa desarrollaba Urchin On Demand, una solución de análisis de logs web que en 2003-2004 había crecido hasta ser una de las opciones serias del mercado, especialmente para sitios medianos que necesitaban algo más que estadísticas básicas pero no podían pagar el coste de Omniture (entonces el líder de analítica enterprise).

El código y la metodología de Urchin se basaban en el análisis de archivos de log del servidor web. Cuando un usuario visitaba una página, el servidor registraba la petición, y Urchin procesaba esos archivos de log periódicamente para construir reportes. Era un modelo distinto al que se popularizaría después con tags JavaScript, pero tenía ventajas (no perdía datos por bloqueadores, capturaba bots y crawlers identificables).

En marzo de 2005, Google adquirió Urchin Software por una cantidad no revelada públicamente, aunque se estimó en aproximadamente 30 millones de dólares. La motivación de Google era clara: integrar capacidades de analítica web con sus servicios de publicidad (AdWords, AdSense), permitiendo a anunciantes medir el rendimiento de sus campañas de manera unificada.

Google Analytics: noviembre de 2005

Apenas ocho meses después de la adquisición, el 14 de noviembre de 2005, Google lanzó Google Analytics como producto gratuito al público. La oferta era radical: una herramienta de analítica web profesional, sin coste, accesible para cualquier sitio. Para empresas que pagaban miles o decenas de miles de dólares al año por Omniture u otros, el lanzamiento de GA gratuito fue evento sísmico en la industria.

La demanda inicial fue tan alta que Google tuvo que cerrar nuevas suscripciones temporalmente durante la primera semana porque sus servidores no podían procesar los datos. Reabrieron en enero de 2006 con capacidad ampliada. Es uno de los pocos casos documentados de una herramienta gratuita siendo víctima de su propio éxito en lanzamiento.

Las primeras versiones (2005-2008) seguían usando código heredado de Urchin. La transición progresiva hacia infraestructura nativa de Google y la introducción de funcionalidades nuevas marcaron los siguientes años: integración con AdWords (2006), data sampling para sitios grandes, segmentación avanzada (2008-2010), Real-Time reporting (2011), Multi-Channel Funnels (2011).

Urchin como producto independiente continuó vendiéndose hasta que Google lo discontinuó oficialmente en 2012, decisión que enfureció a muchos clientes empresariales que valoraban su modelo on-premise sin envío de datos a Google.

Universal Analytics: 2013

En octubre de 2012, Google anunció Universal Analytics, y la versión salió de beta en abril de 2013. Universal Analytics representaba una reescritura significativa con cambios importantes:

Cross-device tracking. Por primera vez podías rastrear al mismo usuario across dispositivos si se autenticaba (vía User ID).

Custom dimensions y metrics. Capacidad de inyectar datos personalizados (categoría de producto, tipo de cliente, valor de pedido) más allá de las dimensiones predefinidas.

Server-side tracking via Measurement Protocol. Posibilidad de enviar datos a GA desde fuera del browser, útil para tracking de POS físicos, apps móviles, IoT.

Modelo de sesión revisado. Definiciones de sesión y usuario más sofisticadas, con timeouts configurables.

UA fue durante diez años el estándar de facto en analítica web. La cantidad de tutoriales, certificaciones, libros, cursos, y mejores prácticas que se desarrollaron alrededor de UA es enorme. Para muchos profesionales del marketing, "Google Analytics" significa específicamente UA.

GA4: octubre de 2020 y la transición forzada de julio de 2023

En octubre de 2020, Google lanzó Google Analytics 4 (inicialmente llamado App + Web durante su fase beta desde 2019). GA4 representaba una reescritura desde cero con un modelo de datos completamente diferente.

Los cambios fundamentales:

Modelo basado en eventos, no en sesiones. En UA, todo se organizaba en jerarquía de Sesiones → Pageviews → Events. En GA4, todo es un evento (incluida la pageview, que es un tipo de evento llamado page_view). Esta diferencia parece técnica pero tiene impacto profundo en cómo se construyen y interpretan reportes.

Web + App unificado. Una propiedad GA4 puede recoger datos tanto de web como de apps móviles, permitiendo análisis cross-platform que UA hacía con dificultad.

Modelado predictivo con machine learning. GA4 incluye predicciones (probabilidad de compra, probabilidad de abandono, ingreso predicho) generadas por modelos ML de Google.

Más restricciones de privacidad nativas. GA4 está diseñado para funcionar con menos cookies, soporta consent mode, y tiene controles más finos sobre datos personales.

Eliminación de métricas familiares. El cambio más doloroso para quien venía de UA: métricas como bounce rate se redefinieron drásticamente (en GA4 se calculaba inicialmente como inverso de "engaged session rate"). Otras como exit rate desaparecieron de los reportes estándar (cubierto en detalle en tasa de salida).

Nueva interfaz. El layout, los reportes preconfigurados, las capacidades de exploración cambiaron. Quien dominaba UA tuvo que aprender la nueva herramienta prácticamente desde cero.

Durante 2020-2022, GA4 coexistió con UA. Muchas empresas mantenían UA como su sistema principal y GA4 en paralelo para empezar a familiarizarse. Google fue empujando progresivamente la migración con anuncios y notificaciones.

Y entonces, el 1 de julio de 2023, Universal Analytics dejó de procesar nuevos datos para todas las propiedades estándar (la versión gratuita). Las versiones 360 (de pago) tuvieron una extensión hasta julio de 2024, pero también acabaron migradas. Empresas que no habían configurado GA4 antes de esa fecha perdieron su capacidad de medir tráfico nuevo hasta que se migraron.

La migración no fue automática. Configurar GA4 desde cero requería decisiones técnicas (qué eventos custom enviar, cómo mapear conversiones, cómo configurar audiencias) que muchos sitios no hicieron bien. El resultado: hay miles de instalaciones de GA4 en producción que están mal configuradas, recogiendo datos incompletos o erróneos. Los datos históricos de UA siguen accesibles para consulta hasta el 1 de julio de 2024, cuando Google eliminó el acceso a esas propiedades.

Esa transición forzada de UA a GA4 es probablemente el cambio más disruptivo en la analítica web en los últimos quince años, y todavía hay empresas en 2026 que no han completado bien la migración.

Qué mide GA4 realmente

En su forma actual, GA4 captura cinco tipos de información que merecen entenderse:

Adquisición. De dónde llegan los usuarios a tu sitio. Fuentes (Google, Facebook, email, directo), medios (organic search, paid social, referral), campañas (con UTMs específicas). Es la respuesta a "¿cómo me encuentran?".

Engagement. Qué hacen una vez en el sitio. Páginas visitadas, eventos disparados, tiempo de permanencia, scroll, clics en enlaces, descargas. Es la respuesta a "¿qué hacen?".

Demografía y tecnología. Quiénes son y con qué tecnología. País, idioma, ciudad, dispositivo, sistema operativo, navegador. Es la respuesta a "¿quiénes son?".

Conversiones. Acciones específicas que has marcado como objetivos. Compras, registros, descargas, contactos. En GA4 se llaman "key events" desde marzo de 2024 (anteriormente "conversions"). Es la respuesta a "¿qué acciones valiosas completan?".

Audiencias. Grupos de usuarios definidos por reglas (compradores, abandonadores, etc.) que se pueden usar para segmentación de reportes y para activación en Google Ads. Es la respuesta a "¿qué tipos de usuarios tengo?".

GA4 por defecto recoge eventos básicos (page_view, scroll, click, file_download, video_start) y captura mucha información sin configuración. Pero para que sea útil, casi siempre hace falta configuración adicional: eventos custom específicos del negocio, key events bien marcados, parámetros relevantes asociados a eventos.

Cómo configurar GA4 bien (sin sobrecomplicarlo)

Para una empresa que quiere usar GA4 productivamente, hay un orden razonable de configuración:

Instalar el código correctamente. Vía Google Tag Manager (recomendado para flexibilidad) o vía gtag.js directo. Verificar que la instalación funciona en todas las páginas con la extensión GA Debugger u otras herramientas.

Configurar parámetros básicos del stream de datos. Filtrado de tráfico interno, ajustes de retención, conexiones con Google Ads, Search Console, BigQuery (para empresas que quieren datos crudos exportables).

Definir los key events que importan al negocio. No todos los eventos son conversiones. Compras, leads cualificados, registros, son típicamente key events. Page views generales no.

Configurar UTMs en todas las campañas externas. Si lo que ves en GA4 viene de campaña marcada con UTMs, puedes atribuir bien. Si las campañas no se marcan, todo aparece como direct o referral sin información útil.

Crear audiencias relevantes. Compradores, abandonadores de carrito, usuarios recurrentes, segmentos clave del negocio. Esto permite reportes más útiles y activación en Ads.

Construir reportes propios o explorations. Los reportes preconfigurados de GA4 son limitados. Casi cualquier análisis serio requiere construir reportes específicos.

Conectar con BigQuery si el sitio tiene volumen alto. La capacidad de exportar datos a BigQuery (gratuita en GA4) permite análisis con SQL sin limitaciones de la interfaz, y supera los límites de muestreo que aplican en exploraciones grandes.

Sin esos pasos, GA4 instalado con configuración por defecto recoge datos pero produce reportes que no responden a las preguntas del negocio.

Las limitaciones reales de GA4 en 2026

Es importante ser honesto sobre lo que GA4 hace bien y lo que no:

Lo que hace bien. Captura básica de tráfico, fuentes, conversiones simples; integración con Google Ads; análisis de funnels simples; reportes en tiempo real; modelado predictivo automático; coste cero.

Lo que hace regular. Atribución multi-touch (los modelos disponibles son limitados), análisis de cohortes (existen pero son básicos comparados con herramientas dedicadas), capacidad de personalización avanzada (algunas cosas que UA permitía requieren ahora más esfuerzo).

Lo que hace mal o no hace. Análisis avanzado de funnel con steps complejos (Mixpanel, Amplitude lo hacen mejor); A/B testing nativo (Optimize fue discontinuado, hace falta otra herramienta); replays de sesión y heatmaps (Hotjar, FullStory); análisis de calidad cualitativa de tráfico; tracking server-side robusto (requiere configuración técnica significativa).

Para empresas con necesidades analíticas serias, GA4 es una herramienta entre varias, no una solución completa. La combinación típica en 2026:

  • GA4 como sistema de medición principal y conexión con Google Ads.
  • Hotjar o Microsoft Clarity para grabaciones de sesión y heatmaps.
  • Mixpanel o Amplitude para análisis profundo de producto y funnel.
  • Looker Studio o Power BI para visualización y dashboards ejecutivos.
  • BigQuery + SQL para análisis ad-hoc sin restricciones.
  • Plausible, Fathom o similares como alternativas privacy-first para sitios pequeños que no necesitan la complejidad de GA4.

Errores comunes en GA4

No filtrar tráfico interno. El equipo navegando el sitio inflará métricas si no se excluye su tráfico (por IP o por uso de bloqueador interno). Distorsiona todos los reportes.

No marcar conversiones / key events. Sin esto, GA4 mide tráfico pero no resultados. Es como tener un velocímetro pero no saber a dónde vas.

No usar UTMs en campañas externas. Sin UTMs, no puedes atribuir tráfico a campañas específicas. Es uno de los hábitos básicos que más empresas siguen haciendo mal.

Confundir bounce rate de UA con bounce rate de GA4. Las definiciones cambiaron. Comparar números entre versiones produce conclusiones falsas.

Tomar decisiones con datos pequeños. Si tu sitio tiene 500 visitas mensuales, las métricas tienen ruido alto y diferencias pequeñas no son significativas. GA4 muestra los números pero no advierte sobre confianza estadística.

Ignorar muestreo (sampling). En propiedades grandes, GA4 puede aplicar muestreo en exploraciones complejas. Los datos mostrados son extrapolaciones, no censo. La interfaz lo indica pero muchos usuarios lo ignoran.

No actualizar configuración. Sitios cambian (nuevas páginas, nuevos productos, nuevos canales). Si la configuración inicial de GA4 no se actualiza, los reportes envejecen.

Reportar a dirección sin contexto. "El tráfico bajó 15% este mes" sin mencionar la estacionalidad, el cambio de algoritmo de Google, o la campaña que terminó es información sin contexto que produce decisiones equivocadas.

Confiar 100% en atribución de plataforma. Como cubrió publicidad directa, la atribución multi-canal de GA4 (y de cualquier plataforma) es aproximación. Para decisiones de inversión grandes hace falta combinarla con otras fuentes.

No revisar privacy settings. GA4 envía datos a Google y los procesa. Para cumplir con RGPD y otros marcos, hace falta consent mode bien configurado, retención de datos adecuada, anonimización de IP. Sin eso, hay riesgo legal real.

La realidad de privacidad y alternativas privacy-first

Algo que merece párrafo propio: GA4 es producto gratuito de Google que se sostiene económicamente por el valor que los datos agregados aportan a Google. Para empresas con preocupaciones serias de privacidad —especialmente en mercados europeos con autoridades de protección de datos activas—, GA4 ha generado controversia.

Varias autoridades europeas (Austria en enero de 2022, Italia en junio de 2022, Francia en febrero de 2022, entre otras) emitieron decisiones declarando que el uso de Google Analytics (en su forma estándar, sin medidas adicionales) violaba el RGPD porque transfería datos personales a Estados Unidos sin garantías equivalentes a las europeas. Tras la entrada en vigor del nuevo marco UE-EE.UU. de transferencia de datos en julio de 2023 (EU-US Data Privacy Framework), parte de esa controversia se atenuó, aunque persisten interpretaciones legales conservadoras.

En este contexto han crecido alternativas privacy-first:

  • Plausible Analytics (fundada en Estonia, 2018) — analytics simple, sin cookies, GDPR-compliant nativo.
  • Fathom Analytics (Canadá, 2018) — similar enfoque, datos en infraestructura propia.
  • Matomo (anteriormente Piwik, fundado 2007) — open source, self-hostable.
  • Simple Analytics, Cloudflare Web Analytics, Pirsch y otras alternativas con modelos similares.

Para empresas pequeñas o con preocupaciones específicas de privacidad, estas alternativas son opción viable. Para empresas grandes con integración profunda en el ecosistema Google Ads, salir de GA4 es decisión más compleja.

Google Analytics y operaciones creativas

Para una marca que produce contenido y campañas regularmente, GA4 (o cualquier herramienta de analítica) es el sistema de retroalimentación que cierra el bucle entre producción creativa y resultado. Sin ese feedback, el equipo creativo opera a ciegas; con feedback bien estructurado, las decisiones de qué producir más, qué optimizar, qué descartar se basan en señal real.

Esa conexión es disciplina de operaciones creativas: los KPIs creativos se sostienen sobre datos que típicamente vienen de GA4 (entre otras fuentes), el calendario editorial se ajusta basado en lo que la analítica revela funciona, los aprendizajes documentados sobre qué tipo de contenido rinde mejor influyen en la siguiente generación de piezas.

En Polimake esa lógica vive en tres superficies: Studio integra aprendizajes analíticos en planificación, Studio refleja patrones validados en producción, Media documenta qué activos rindieron históricamente para que esa información esté accesible al producir nuevas piezas.


Si gestionas marketing, contenido, producto o cualquier rol que requiere medir resultados digitales y has llegado aquí buscando una respuesta sobre Google Analytics, lo más útil que puedes llevarte de este artículo es probablemente la combinación de tres ideas: GA4 es una herramienta diferente a UA (no asumas que tu conocimiento previo se transfiere directamente), una instalación por defecto recoge datos pero rara vez produce decisiones (la configuración consciente es donde está el valor), y GA4 es una entre varias herramientas de analítica honesta (combinarla con grabaciones de sesión, herramientas de producto y validación independiente produce mejores conclusiones que confiar solo en ella).

Para complementar, tasa de salida cubre una métrica específica que cambió mucho con la migración GA4, Google Trends cubre la herramienta complementaria sobre tendencias generales, y funnel de conversión cubre el concepto que GA4 mide pero no inventa.

Referencias rápidas