¿En qué formato me entregan el video?
Qué formato pedir para un video según el destino: contenedores, codecs, masters, exportaciones por canal, subtítulos y errores que invalidan la entrega.
El equipo detrás de Polimake. Exploramos la intersección entre tecnología, creatividad y automatización.
"¿En qué formato me lo entregan?" es la pregunta que separa una entrega de video bien gestionada de una pesadilla. Suena trivial, pero detrás se juegan decisiones que determinan si la pieza se puede emitir, editar más tarde, archivar, recomprimir para redes o pasar a un cliente sin problemas.
La mayoría de las disputas que terminan en correos cruzados —"esto no abre," "se ve pixelado," "pesa demasiado para subirlo," "queremos cambiar el subtítulo y no podemos"— se resuelven en el momento de pedir el formato, no en el de recibir el archivo. Esta guía explica qué pedir, en qué orden, y por qué.
Contenedor y codec no son lo mismo
El primer error de vocabulario, y el que produce más confusión, es tratar "MP4" o "MOV" como si fueran formatos de video. No lo son. Son contenedores —cajas que envuelven uno o varios flujos de datos.
El codec es lo que vive dentro: el algoritmo que comprime el video y el audio. Un mismo archivo MP4 puede contener vídeo H.264, H.265 o AV1; audio AAC, MP3 o Opus. Un archivo MOV puede llevar H.264 o ProRes. Cuando alguien dice "necesito un MP4," lo que importa entender es: con qué codec interno, a qué bitrate, en qué resolución.
Los contenedores principales y para qué sirven:
-
MP4 (oficialmente MPEG-4 Part 14, ISO/IEC 14496-14, estandarizado en 2003): el más universal. Funciona en prácticamente todos los reproductores, navegadores y plataformas. Es la opción por defecto para entregas digitales, redes sociales y publicación web. Casi siempre con codec H.264 o H.265.
-
MOV (QuickTime, formato propietario de Apple desde 1991): flexible, soporta más tipos de codecs y metadatos profesionales. Es el contenedor habitual en flujos de edición —ProRes, codecs intermedios, archivos con varias pistas de audio. Reproduce sin problema en macOS y Windows con codecs apropiados, pero algunas plataformas web no lo aceptan directamente.
-
MKV (Matroska, 2002): contenedor abierto, muy capaz —soporta múltiples pistas de audio, subtítulos embebidos, capítulos. Popular en distribución y archivo, menos en entrega comercial porque no todas las plataformas lo aceptan.
-
WebM (Google, 2010): contenedor abierto orientado a web, suele llevar VP9 o AV1. Útil para servir video en sitios propios cuando se controla el reproductor; no funciona como entrega genérica porque algunos contextos no lo soportan.
-
AVI (Microsoft, 1992): legacy. Aparece en archivos antiguos pero no se usa para entregas profesionales modernas.
La regla operativa: pedir MP4 cuando el destino es publicación digital genérica; MOV cuando hay edición posterior, retoque o flujo profesional; WebM solo cuando se publica en un reproductor propio que lo soporta; MKV para archivo personal de alta capacidad. Lo demás suele ser legacy.
Masters, intermedios y entregas: tres cosas distintas
Una de las confusiones más caras es no distinguir entre master, intermedio y entrega final. Las tres son archivos de video, pero tienen funciones distintas y formatos distintos.
Master es el archivo de máxima calidad del que se generan todas las versiones. Vive en el archivo del estudio para siempre. No se publica nunca. Si dentro de tres años necesitas una nueva versión —subtítulos en otro idioma, recorte vertical, ajuste de duración— vas al master.
Lo razonable para un master es un codec con poca o ninguna compresión perceptiva: ProRes 422 HQ o ProRes 4444 (este último si hay canal alpha o gráficos críticos), de Apple, lanzado en 2007 para sustituir flujos de cinta en edición profesional; o DNxHR HQ/HQX, de Avid, equivalente funcional usado sobre todo en flujos Avid Media Composer. Ambos producen archivos pesados —un minuto de ProRes 422 HQ a 1080p ronda 1.2 GB, en 4K sube a 5-7 GB— pero ese peso es deliberado: es lo que hace que sobrevivan a recompresiones futuras sin degradación visible.
Intermedio es lo que circula entre fases del flujo. Material para color, para corrección de sonido, para revisión interna. También suele ser ProRes o DNxHR, eventualmente uno más ligero (ProRes Proxy, ProRes LT) si el ancho de banda es un problema.
Entrega final es lo que llega al destino —canal, plataforma, cliente. Aquí cambia todo: la prioridad ya no es preservar calidad para reedición, sino producir un archivo de tamaño razonable que reproduzca bien en el destino. MP4 con H.264 sigue siendo la elección segura para casi cualquier destino comercial; H.265 aporta peso menor a igual calidad pero con compatibilidad ligeramente más limitada.
Pedir "el archivo final" sin especificar para qué lleva a malentendidos. Lo correcto es:
- "Necesito el master archivable en ProRes 422 HQ" (para mi archivo).
- "Necesito la entrega para YouTube en MP4 H.264" (para publicar).
- "Necesito una versión limpia sin gráficos finales para futuras adaptaciones" (para reediciones).
Estas tres son entregas distintas. Pedir "el archivo final" sin más detalle obliga al productor a adivinar.
Qué pedir según destino
Esta es la parte operativa: qué formato concreto se pide para cada destino habitual en 2026.
YouTube. MP4, codec H.264 o H.265, resolución 1080p o 4K, frame rate idéntico al rodaje (24, 25, 30, 50 o 60 fps; nunca convertir frame rates), audio AAC estéreo o 5.1, bitrate según las recomendaciones de YouTube (alrededor de 8 Mbps para 1080p30, 12 Mbps para 1080p60, 35-45 Mbps para 4K30). YouTube recomprime todo lo que sube: subir un master sin comprimir es perder tiempo de subida sin ganar calidad final.
Vimeo. Acepta calidad superior a YouTube y mantiene mejor la fuente. MP4 H.264 con bitrate más alto (10-20 Mbps para 1080p), audio AAC. Para flujos de revisión profesional, soporta también H.265 y archivos más generosos.
Meta (Facebook e Instagram). MP4 H.264, audio AAC. Recomprime de manera agresiva, así que conviene subir versiones ya optimizadas al tamaño correcto: 1080×1080 para feed cuadrado, 1080×1350 para feed vertical, 1080×1920 para Reels y Stories.
TikTok. MP4 H.264, vertical 9:16, 1080×1920 idealmente, audio AAC. Subir directamente desde la app suele recomprimir más que subir desde escritorio o programar a través del API de gestión.
LinkedIn. MP4 H.264, 16:9 o 1:1, audio AAC, máximo 5 GB y 10 minutos para anuncios. Subtítulos quemados o como archivo SRT separado.
X (Twitter). MP4 H.264, máximo 512 MB y 140 segundos en cuenta estándar (más en cuentas verificadas), audio AAC.
Email marketing. Idealmente, no se incluye video como adjunto. Se sube a una página propia o YouTube/Vimeo y se enlaza. Si hay que adjuntar, MP4 H.264 al peso más bajo posible (rara vez por encima de 5 MB).
Pantalla de evento o digital signage. Depende del soporte. Lo habitual: MP4 H.264 a la resolución nativa de la pantalla, audio si la pantalla lo reproduce. Algunos sistemas de signage usan formatos propios (JPEG2000, MXF) y conviene confirmar antes.
Web propia. MP4 H.264 como respaldo universal; idealmente WebM con AV1 o VP9 como fuente principal por menor peso, con etiquetas <source> ofreciendo ambos al navegador. Para fragmentos cortos en bucle de fondo, H.264 sigue siendo el camino más seguro.
TV broadcast. Formato definido por la cadena. Habitual: MXF (Material eXchange Format, estandarizado por SMPTE en 2004) con XDCAM HD 50, IMX o ProRes 422. Loudness EBU R128 (-23 LUFS en Europa, -24 LKFS en EE.UU. con CALM Act). Cada cadena publica sus especificaciones técnicas; pedir cumplir un broadcast sin esa especificación es garantizar rechazos.
Cine/proyección. DCP (Digital Cinema Package), MXF con JPEG 2000, formato muy específico que se prepara con software dedicado. Casi siempre se externaliza a casas de mastering DCP.
Subtítulos: la decisión más subestimada
Cómo se entregan los subtítulos cambia mucho la utilidad del archivo más adelante.
Subtítulos quemados (burned-in). Forman parte de la imagen, no se pueden quitar ni traducir. Ventaja: garantizan que se ven en cualquier reproductor, incluso en redes sociales que reproducen sin sonido por defecto (más del 80% del consumo en feed). Desventaja: producir versiones en otros idiomas requiere re-renderizar el video entero. Para Reels, TikTok, Shorts, son la opción correcta —sirven al consumo silencioso por diseño. Para YouTube en escritorio, no son ideales: bloquean los subtítulos automáticos de YouTube y la traducción.
Subtítulos como archivo separado (sidecar). Llegan en archivos independientes:
- SRT (SubRip): el más universal. Texto plano, soportado por casi todo. Limitado en estilizado.
- VTT/WebVTT: estándar W3C para HTML5 video, soporta más estilizado y posicionamiento.
- ASS/SSA: formato avanzado con estilos detallados, popular en distribución.
- CEA-608/708: closed captions para broadcast, embebidos en el flujo.
Para entregas digitales, SRT y VTT cubren la mayoría de los casos. Para broadcast, hay que cumplir CEA-708.
La práctica que mejor envejece: pedir siempre SRT separado del archivo, incluso si también se entrega una versión con subtítulos quemados. El SRT permite traducciones, ediciones de texto y reuso. La versión quemada cubre los canales que no leen subtítulos externos (Reels, TikTok, Stories).
Resolución, frame rate y color: tres constantes que conviene fijar
Tres parámetros más que no son contenedor ni codec, pero condicionan la entrega.
Resolución. Habitual hoy: 1920×1080 (Full HD), 3840×2160 (4K UHD). 8K (7680×4320) existe pero rara vez es destino real. La regla: rodar a la resolución más alta razonable y entregar a la que el canal use. Bajar resolución es trivial; subirla, imposible sin perder calidad.
Frame rate. En Europa la base tradicional es 25 fps (heredada del PAL); en mercados NTSC, 30 (técnicamente 29.97). Para cine, 24 fps. Para movimiento rápido —deportes, gaming— 50 o 60 fps. La regla operativa más importante: no convertir frame rate entre fuente y entrega. Si la cámara grabó a 25 fps, entregar a 25. Si rodó a 24, entregar a 24. Las conversiones forzadas (24→30) producen artefactos de movimiento visibles ("judder").
Espacio de color. Para entrega web y broadcast HD, Rec.709 (BT.709) sigue siendo el estándar. Para 4K HDR, Rec.2020 con HDR10, Dolby Vision o HLG. Entregar un archivo masterizado en Rec.2020 a un destino que solo soporta Rec.709 produce colores apagados y desaturados; lo contrario produce colores fuera de gamut. Confirmar el espacio antes de exportar evita un rechazo silencioso —donde el archivo "se ve" pero los colores están mal.
Audio. Para entrega digital, AAC estéreo a 192-320 kbps o 5.1 si el destino lo justifica. Para masters, PCM (no comprimido) a 48 kHz, 24 bits. Loudness ajustado al canal: -23 LUFS para broadcast europeo, -14 LUFS para streaming, -16 LUFS para podcast.
La nomenclatura como entrega
Lo último que parece importar y lo que termina importando más a los seis meses: cómo se nombran los archivos. Una entrega de quince versiones llamadas Final_v3_aprobado_REAL_FINAL2.mp4, final-final.mov, Sin_titulo.mp4 es una entrega que en seis meses nadie sabe usar.
Una nomenclatura razonable incluye, en orden: marca, campaña, pieza, versión, idioma, formato, resolución, fecha. Por ejemplo: polimake-launch-spot-30s-es-mp4-1080p-2026-05-05.mp4. Es feo de leer pero filtrable, ordenable y entendible meses después.
El detalle se vuelve crítico cuando hay versiones múltiples por canal: 30s/15s/6s, horizontal/vertical/cuadrado, con subtítulos/sin subtítulos. Una sola pieza puede generar quince archivos legítimos. Sin nomenclatura, son imposibles de gestionar.
Errores que invalidan entregas
Pedir "el archivo final" sin especificar. Sin definir master, intermedio o entrega, el productor adivina. La adivinación correcta el 50% de las veces sigue siendo un 50% de entregas mal hechas.
Recomprimir sobre entregas ya comprimidas. Tomar un MP4 H.264 que YouTube comprimió y volver a exportarlo a MP4 H.264 acumula artefactos. Cada generación pierde calidad. Si hay que reeditar, ir al master, no al archivo descargado del canal.
Confundir compresión con calidad. "Pesa poco, debe ser malo" no es siempre cierto: H.265 a 8 Mbps puede verse mejor que H.264 a 12 Mbps. "Pesa mucho, debe ser bueno" tampoco: un master mal renderizado puede pesar 10 GB y verse peor que un MP4 de 100 MB bien hecho.
Subir 4K a destinos que solo sirven 1080p. Algunos canales recomprimen 4K a 1080p de manera más agresiva que un 1080p ya optimizado por el productor. Para Instagram, TikTok y similares en 2026, subir directamente al tamaño nativo del feed produce mejores resultados que subir 4K y dejar que la plataforma decida.
No grabar mastering loudness. Un spot mezclado a -10 LUFS suena enorme en redes pero será rechazado por broadcast (que exige -23). Uno mezclado a -23 sonará anémico en Instagram. Hay que mezclar y exportar versiones por canal, o al menos dos masters de loudness distintos.
Olvidar la versión limpia. La "versión limpia" es la pieza sin gráficos finales, sin subtítulos quemados, sin texto sobreimpreso —solo imagen y voz. Es la base sobre la que se construyen futuras versiones (otros idiomas, otros mercados, otras duraciones). Quien no la pide en la entrega original tiene que renegociar tres meses después.
Cómo encaja en el flujo
Pedir bien los formatos no es solo precisión técnica. Es lo que permite que la pieza sobreviva a su primer ciclo de uso. Una entrega bien hecha incluye, como mínimo:
- Master archivable (ProRes/DNxHR).
- Versión limpia sin gráficos finales.
- Entrega final por canal con codec y bitrate ajustados.
- Subtítulos en SRT separado.
- Versión quemada para canales de consumo silencioso.
- Nomenclatura coherente.
Esto multiplica los archivos pero divide los problemas. La alternativa —entregar solo "el final"— produce ahorro inmediato y dolor a medio plazo.
Operaciones creativas es el sistema que hace que esta multiplicidad no se descontrole. En Polimake, Studio define qué formatos pide cada producción según destino, Media ejecuta la exportación y archiva los masters, Studio coordina las solicitudes de adaptaciones futuras para que no se conviertan en encargos urgentes.
Esto se relaciona con la decisión de bitrate por canal, con la elección entre MP4 y MOV en flujos profesionales y con cuándo conviene subtitular un video en lugar de quemar texto.
Para cerrar
"¿En qué formato me entregan el video?" es realmente cinco preguntas: qué contenedor, qué codec interno, qué resolución y frame rate, qué tipo de archivo (master, limpio, final), y qué versiones por canal. Resolver las cinco antes de exportar evita que la entrega se convierta en una negociación que dura semanas.
La diferencia entre un equipo que entrega bien y uno que no, no es talento técnico —ambos saben exportar. Es disciplina al pedir y disciplina al archivar. Quien tiene esa disciplina puede recuperar una pieza vieja, traducirla, recortarla, refrescarla. Quien no, vuelve a producir desde cero cada vez que algo cambia.
Referencias rápidas
- Master: ProRes 422 HQ o DNxHR HQ. Pesado pero archivable.
- Entrega genérica digital: MP4 H.264, audio AAC.
- Resolución: la nativa del canal; nunca subir resolución artificialmente.
- Frame rate: el de rodaje; no convertir.
- Color: Rec.709 para HD; Rec.2020 solo si el destino acepta HDR.
- Subtítulos: SRT separado siempre, quemados solo para canales de consumo silencioso.
- Loudness: -23 LUFS broadcast, -14 LUFS streaming.
- Versión limpia siempre: sin gráficos finales, base para futuras adaptaciones.
- Nomenclatura: marca-campaña-pieza-versión-idioma-formato-resolución-fecha.
- Pedir entregas múltiples, no "el final."