pág. 6221
LA CÁMARA COMO INSTRUMENTO
ETNOGRÁFICO: ESTRATEGIAS TÉCNICAS Y
ESTÉTICAS EN LA DOCUMENTACIÓN DE
CANTOS AGRÍCOLAS ANENT DE LA
NACIONALIDAD SHUAR EN LA AMAZONÍA
ECUATORIANA
THE INVESTIGATION OF FEMICIDE IN MEXICO: INSTITUTIONAL
DEFICIENCIES AND LEGAL CONSEQUENCES
Andrés Eduardo Albuja Donoso
Universidad Técnica de Cotopaxi

pág. 6222
DOI: https://doi.org/10.37811/cl_rcm.v10i2.23633
LA CÁMARA COMO INSTRUMENTO ETNOGRÁFICO:
ESTRATEGIAS TÉCNICAS Y ESTÉTICAS EN LA DOCUMENTACIÓN
DE CANTOS AGRÍCOLAS ANENT DE LA NACIONALIDAD SHUAR
EN LA AMAZONÍA ECUATORIANA
Andrés Eduardo Albuja Donoso1
andres.albuja7951@utc.edu.ec
https://orcid.org/0000-0002-1269-0198
Universidad Técnica de Cotopaxi
RESUMEN
Este artículo analiza las estrategias técnicas y estéticas empleadas en la documentación audiovisual de
cantos agrícolas Anent en comunidades Shuar amazónicas, examinando cómo las decisiones sobre el
equipamiento, encuadre, iluminación, captura de audio, montaje y diseño sonoro configuran la
representación etnográfica resultante. Basado en la producción de un documental de 43 minutos, una
exposición fotográfica de 35 imágenes y un paisaje sonoro interactivo, el estudio reflexiona críticamente
sobre la relación entre el audiovisual y el contenido etnográfico, argumentando que las elecciones
técnicas no son neutrales sino profundamente epistemológicas: determinan qué aspectos de la realidad
cultural se hacen visibles o audibles, qué permanece oculto, y cómo se construyen las relaciones entre
realizador, sujetos filmados y audiencias. El análisis documenta tensiones específicas de la
documentación audiovisual etnográfica: entre la observación no intrusiva y la obtención del material
técnicamente óptimo, entre espontaneidad y control compositivo, entre priorizar la dimensión visual
versus sonoridad, entre representación "auténtica" y narración cinematográficamente efectiva. Los
hallazgos demuestran que privilegiar la dimensión sonora en documentación de expresiones acústicas
culturalmente significativas requiere estrategias específicas de captura multicanal, diseño sonoro
espacial, y montaje que subordine ritmos visuales a estructuras acústicas. El estudio propone un modelo
de "documentación expandida transmedia" donde diferentes plataformas (video lineal, fotografía, audio,
web interactiva) se complementan para representar aspectos diversos de fenómenos culturales
complejos. Las conclusiones enfatizan que la antropología visual debe desarrollar mayor reflexividad,
reconociendo que las herramientas, técnicas y estéticas empleadas no solo registran sino que construyen
activamente el conocimiento etnográfico.
Palabras clave: antropología visual, etnografía audiovisual, documentación sonora, técnicas
cinematográficas, diseño sonoro etnográfico, fotografía documental, transmedia, paisaje sonoro
1 Autor principal
Correspondencia: andres.albuja7951@utc.edu.ec

pág. 6223
THE CAMERA AS AN ETHNOGRAPHIC TOOL: TECHNICAL AND
AESTHETIC STRATEGIES IN THE DOCUMENTATION OF
AGRICULTURAL SONG TRADITIONS AMONG THE SHUAR PEOPLE
IN THE ECUADORIAN AMAZON
ABSTRACT
This article analyzes the technical and aesthetic strategies employed in the audiovisual documentation
of Anent agricultural songs in Amazonian Shuar communities, examining how decisions regarding
equipment, framing, lighting, audio capture, editing, and sound design shape the resulting ethnographic
representation. Based on the production of a 43-minute documentary, a photographic exhibition of 35
images, and an interactive soundscape, the study critically reflects on the relationship between the
audiovisual medium and ethnographic content, arguing that technical choices are not neutral but deeply
epistemological: they determine which aspects of cultural reality become visible or audible, what
remains hidden, and how relationships between the filmmaker, filmed subjects, and audiences are
constructed. The analysis documents specific tensions inherent in ethnographic audiovisual
documentation: between non-intrusive observation and the acquisition of technically optimal material,
between spontaneity and compositional control, between prioritizing the visual dimension versus sound,
and between “authentic” representation and cinematographically effective storytelling. The findings
demonstrate that prioritizing the auditory dimension in the documentation of culturally significant
acoustic expressions requires specific strategies for multichannel recording, spatial sound design, and
editing that subordinates visual rhythms to acoustic structures. The study proposes a model of “expanded
transmedia documentation” in which different platforms (linear video, photography, audio, interactive
web) complement one another to represent diverse aspects of complex cultural phenomena. The
conclusions emphasize that visual anthropology must develop greater reflexivity, recognizing that the
tools, techniques, and aesthetics employed not only record but actively construct ethnographic
knowledge.
Keywords: visual anthropology, audiovisual ethnography, sound documentation, cinematographic
techniques, ethnographic sound design, documentary photography, transmedia, soundscape
Artículo recibido 02 febrero 2026
Aceptado para publicación: 27 febrero 2026

pág. 6224
1. INTRODUCCIÓN
1.1. La técnica como epistemología
En antropología visual, existe la tendencia a privilegiar discusiones sobre contenidos, relaciones éticas,
o marcos teóricos, relegando consideraciones técnicas a apéndices metodológicos. Sin embargo, como
argumenta MacDougall (2006), "las decisiones técnicas sobre qué cámara usar, cómo encuadrar, cuándo
cortar, o cómo diseñar el sonido no son simplemente instrumentales sino profundamente
epistemológicas: determinan qué conocimiento se produce y cómo" (p. 3).
Un plano general que muestra una mujer Shuar trabajando en su chacra transmite información diferente
de un primer plano de sus manos manipulando semillas, capturar el audio con un micrófono direccional
enfocado en su voz produce una representación distinta al de un audio que incluye el paisaje sonoro
completo. Un montaje que fragmenta acciones en múltiples tomas genera percepción diferente al de un
plano secuencia que sigue el trabajo de manera continua.
Este artículo examina críticamente las estrategias técnicas y estéticas empleadas en la documentación
audiovisual de cantos agrícolas Anent de mujeres Shuar, reflexionando sobre cómo estas decisiones
configuraron la representación etnográfica resultante. El objetivo no es simplemente describir qué
equipos se usaron o cómo se editó, sino analizar la relación constitutiva entre técnica audiovisual y
producción de conocimiento antropológico.
1.2. El desafío de documentar lo sonoro
Documentar expresiones culturales primariamente acústicas presenta desafíos específicos para medios
audiovisuales que históricamente han privilegiado lo visual. Como señala Grimshaw y Ravetz (2009),
"el cine etnográfico ha sido fundamentalmente ocularcéntrico, tratando el sonido como elemento
secundario que acompaña pero no protagoniza" (p. 547).
Los cantos Anent que las mujeres Shuar dedican a sus cultivos son expresiones donde la dimensión
sonora es primaria: melodías, ritmos, timbres, textos, y su integración en paisajes acústicos más amplios.
¿Cómo documentar esto audiovisualmente sin subordinar lo sonoro a lo visual? ¿Qué estrategias
técnicas permiten que la dimensión acústica protagonice la representación?

pág. 6225
Este proyecto se planteó deliberadamente el desafío de "privilegiar lo sonoro", invirtiendo jerarquías
convencionales del documental. Esto requirió estrategias específicas en captura de audio, diseño sonoro,
y relación entre imagen y sonido en el montaje.
1.3. Documentación expandida transmedia
El proyecto no se limitó a producir un documental lineal sino que generó múltiples productos en
diferentes plataformas:
• Documental de 43 minutos: Narrativa audiovisual lineal
• Exposición fotográfica de 35 imágenes: Representación visual estática contemplativa
• Paisaje sonoro interactivo de 12 minutos: Experiencia exclusivamente acústica espacial
• Creación de 7 piezas musicales: Interpretadas a partir de los cantos Anent registrados.
• Plataforma web: Integración multimedia interactiva
Esta aproximación transmedia responde a comprensión de que diferentes medios poseen affordances
específicas (Gibson, 1979): capacidades y limitaciones que los hacen apropiados para representar ciertos
aspectos de fenómenos complejos. El video lineal permite narrativa temporal, la fotografía facilita
contemplación pausada, el audio espacial ofrece inmersión acústica, la web posibilita navegación no-
lineal.
Como propone Jenkins (2006), "la narrativa transmedia no es simplemente reproducir el mismo
contenido en múltiples plataformas sino diseñar experiencias complementarias donde cada medio
contribuye únicamente a la comprensión del todo" (p. 98).
1.4. Objetivos del análisis
Este artículo persigue cuatro objetivos principales:
1. Documentar y analizar críticamente las estrategias técnicas empleadas en captura de video,
audio, fotografía, y su postproducción, reflexionando sobre cómo estas decisiones configuraron la
representación etnográfica.
2. Examinar distintas tensiones específicas de la documentación audiovisual etnográfica: entre
observación y control, espontaneidad y composición, autenticidad y efectividad narrativa.
3. Proponer estrategias para privilegiar la dimensión sonora en documentación audiovisual de
expresiones acústicas culturalmente significativas.

pág. 6226
4. Reflexionar sobre el modelo de documentación expandida transmedia como aproximación a la
complejidad de fenómenos culturales.
2. MARCO TEÓRICO
2.1. Antropología visual: de la observación a la construcción
La antropología visual ha evolucionado desde concepciones del cine como "registro objetivo" de
realidades culturales hacia comprensiones más sofisticadas sobre el carácter constructivo de la
representación audiovisual.
Paradigma observacional: Jean Rouch y el cinema verité de los años 1960 propusieron que cámaras
livianas y equipos reducidos permitirían capturar "la vida tal como es", minimizando interferencia del
realizador (Rouch, 2003). Sin embargo, como reconoció el propio Rouch, la presencia de la cámara
inevitablemente transforma situaciones documentadas.
Paradigma reflexivo: Autores como David MacDougall (1998) y Jay Ruby (2000) argumentan que los
documentales no "capturan" realidades preexistentes sino que "construyen" representaciones mediante
decisiones sobre qué filmar, cómo encuadrar, cómo editar. La reflexividad implica hacer visibles estos
procesos constructivos.
Paradigma sensorial: El Sensory Ethnography Lab de Harvard (Castaing-Taylor y Paravel),
específicamente en su obra Leviathan, propone que la "etnografía sensorial" privilegia la experiencia
fenomenológica sobre la explicación didáctica, usando recursos audiovisuales para generar inmersión
más que información (Grimshaw y Ravetz, 2009).
Este proyecto se ubica en intersección de paradigmas reflexivos y sensoriales: reconociendo el carácter
constructivo de la representación mientras busca generar experiencias inmersivas que comuniquen
dimensiones sensoriales y afectivas, difícilmente accesibles mediante aproximaciones puramente
discursivas.
2.2. La imagen técnica y sus determinaciones
Flusser (2001) propone el concepto de "imagen técnica" para referirse a imágenes producidas mediante
aparatos (cámaras, computadoras) que poseen sus propias lógicas inscritas en hardware y software. Estas
lógicas determinan qué es posible registrar y cómo.
Determinaciones del aparato fotográfico/cinematográfico:

pág. 6227
• Limitaciones de sensibilidad ISO que determinan qué niveles de luz son registrables
• Características de lentes que configuran perspectiva, profundidad de campo, distorsiones
• Velocidades de obturación que deciden qué movimientos se congelan o difuminan
• Resolución que establece qué nivel de detalle es capturable
• Rango dinámico que define qué contrastes entre luces y sombras se preservan
Determinaciones del software de edición:
• Interfaces que facilitan ciertos tipos de operaciones (cortes, transiciones) mientras dificultan
otros
• Algoritmos de procesamiento que "optimizan" automáticamente según criterios programados
• Formatos de exportación que comprimen información según estándares específicos
Reconocer estas determinaciones técnicas es fundamental para comprender que las representaciones
audiovisuales no son "ventanas transparentes" a realidades culturales sino mediaciones
tecnológicamente configuradas.
2.3. Sonido y audición en antropología
Aunque la antropología ha sido históricamente ocularcéntrica, existe una tradición emergente de
"antropología sonora" o "antropología de la audición" (Feld, 1996; Erlmann, 2004) que examina cómo
sociedades diferentes organizan sus mundos acústicos.
Paisaje sonoro: Murray Schafer (1977) introduce el concepto de "soundscape" (paisaje sonoro) para
referirse al entorno acústico completo tal como es percibido. Feld (1996) aplica este concepto
etnográficamente, documentando cómo el pueblo Kaluli de Papua Nueva Guinea construye su identidad
cultural en relación con sonidos del bosque.
Ecología acústica: Truax (2001) propone examinar paisajes sonoros como ecologías donde diferentes
sonidos interactúan, creando texturas acústicas específicas. En contextos rurales amazónicos, esto
implica atender a sonidos de animales, agua, viento, herramientas, voces humanas, y cómo se entrelazan.
Acusmática y escucha reducida: Schaeffer (1966) distingue entre "escucha causal" (identificar fuentes
de sonidos) y "escucha reducida" (atender a cualidades acústicas puras). La documentación etnográfica
requiere navegar entre ambas: capturar la riqueza acústica mientras mantiene una inteligibilidad de
fuentes.

pág. 6228
2.4. Fotografía documental y verdad
La fotografía documental ha enfrentado debates persistentes sobre su relación con "la verdad". Desde
concepciones positivistas que asumen que fotografías "prueban" realidades hasta posturas
construccionistas que enfatizan su carácter mediado (Tagg, 1988).
Sontag (1977) argumenta que las fotografías poseen "autoridad peculiar" derivada de su origen causal
(luz reflejada por objetos reales), pero que esta autoridad es engañosa y según cómo se presenta genera
distintos significados.
En cuanto a la fotografía etnográfica, Edwards (1992) documenta cómo fotografías coloniales
construyeron "tipos raciales" mediante poses específicas, iluminación controlada, y contextos
descontextualizados. La crítica postcolonial demanda reflexividad sobre cómo varias fotografías
antropológicas representan a sus sujetos.
Este proyecto enfrentó tensión entre capturar "momentos auténticos" y crear composiciones
fotográficamente efectivas. ¿Cómo equilibrar espontaneidad con calidad técnica? ¿Cuándo intervenir
compositivamente y cuándo dejar que las situaciones se desarrollen naturalmente?
2.5. Montaje como construcción de sentido
Eisenstein (1949) propone que el montaje no simplemente conecta planos sino que genera significados
que no existen en planos individuales mediante su yuxtaposición. Esta comprensión del montaje como
construcción activa de sentido es fundamental para la antropología visual.
Montaje observacional: Prioriza planos largos con mínimos cortes, sugiriendo continuidad temporal
(MacDougall, 1998)
Montaje expresivo: Usa ritmo de cortes, yuxtaposiciones, y efectos para generar experiencias
emocionales o sensoriales (Marks, 2000)
Este proyecto empleó montaje híbrido: secuencias observacionales largas durante trabajo agrícola,
montaje expresivo en momentos de inmersión sensorial, estructura narrativa general que sigue ciclo
agrícola completo.

pág. 6229
2.6. Transmedia y documentación expandida
Jenkins (2006) define a la narrativa transmedia como aquella donde "los elementos de una ficción se
dispersan sistemáticamente a través de múltiples canales de distribución con el propósito de crear una
experiencia de entretenimiento unificada y coordinada" (p. 98).
La documentación expandida transmedia permite:
• Usar diferentes medios según sus affordances específicas
• Alcanzar audiencias diversas que prefieren diferentes formatos
• Profundizar comprensión mediante perspectivas complementarias
• Generar participación activa (interactividad web) versus consumo pasivo
Sin embargo, también presenta desafíos: coherencia entre plataformas, riesgo de fragmentación,
mayores demandas de producción.
3. METODOLOGÍA TÉCNICA
3.1. Estrategia general de producción
El proyecto adoptó una aproximación de "documentación multimodal" que combinaba:
• Video documental: Narrativa audiovisual lineal como producto principal
• Fotografía documental: Registro complementario con mayor detención contemplativa
• Audio espacial: Captura de paisajes sonoros completos y construcción de piezas sonoras
• Notas de campo: Registro escrito de contextos y reflexiones
Esta multiplicidad respondió a la comprensión de que ningún medio captura completamente la
complejidad de fenómenos culturales. Cada técnica ofrece perspectivas parciales complementarias.
3.2. Equipamiento de video
Cámara principal: Sony FX30
• Sensor: APS-C (23.3mm x 15.6mm)
• Resolución: 4K (3840 x 2160 píxeles) a 25fps
• Profundidad de color: 10 bits 4:2:2
• Formato de grabación: XAVC-S (codec H.264)
• ISO nativo: 800/2500 (dual native ISO)

pág. 6230
Justificación: La FX30 ofrece un balance óptimo entre calidad de imagen, tamaño compacto (crucial
para movilidad en terrenos difíciles), y rango dinámico suficiente para condiciones de luz variables de
la Amazonía.
El dual native ISO permitió trabajar en condiciones de luz baja (interior de chacras densas) sin
degradación excesiva de la imagen. La profundidad de color de 10 bits preservó detalles en gradaciones
tonales sutiles.
Lentes:
Sony E 24mm f/1.8: Gran angular para contextos amplios. El campo de visión de 84° (equivalente a
36mm en full frame) permitió capturar espacios de chacras mostrando relaciones entre mujeres, plantas,
y entornos. La apertura f/1.8 facilitó trabajo en condiciones de luz baja.
Sony E 24-105mm f/4 G OSS: es una óptica versátil para encuadres medios y cerrados. El rango focal
permitió una adaptación rápida a distancias variables sin cambiar lentes. La estabilización óptica (OSS)
compensó movimientos de mano durante tomas dinámicas.
Decisión crítica: Se optó por no usar telefotos largos (70-200mm, 100-400mm) aunque ofrecen
capacidad de capturar desde distancias que minimizan intrusión. La razón: la distancia excesiva entre
cámara y sujetos contradecía el espíritu colaborativo del proyecto. Se prefirió una proximidad respetuosa
antes que una distancia voyeurística.
Soporte y estabilización:
Trípode Manfrotto 055XPRO3: Para entrevistas y planos estáticos. Altura máxima 170cm, carga 9kg,
cabeza fluida MVH502A para movimientos panorámicos inclinados y suaves.
Tensión técnica: Trípodes garantizan estabilidad pero limitan espontaneidad. Frecuentemente se
enfrentó la decisión entre obtener un plano técnicamente óptimo (montar trípode) versus capturar
momentos espontáneos (cámara en mano)
Resolución adoptada: Priorizar espontaneidad sobre perfección técnica cuando existía tensión. Es
preferible capturar momentos auténticos con ligera inestabilidad que perder momentos únicos por
configurar equipos.

pág. 6231
3.3. Equipamiento de audio
El audio fue considerado como un elemento coprotagonista. Esto requirió un sistema de captura
multicanal:
Micrófonos inalámbricos: Rode Wireless Go II
• 2 transmisores lavalier
• Receptor dual
• Rango de transmisión: 200m
• Formato: 24-bit/48kHz
Uso: Colocados discretamente en protagonistas durante el trabajo y entrevistas. Capturaban voces
(incluyendo cantos) con claridad, minimizando sonidos ambientales.
Grabadora Zoom 360: Ambisonic VR Recorder
• 4 micrófonos capsulares
• Grabación ambisonic de primer orden (formato A)
• Formato: 24-bit/48kHz
• Post-producción: Conversión a formatos binaural o multicanal
Uso: Captura de paisajes sonoros espaciales completos. Colocada en chacras, grababa 360° de espacio
acústico.
Desafío: Audio ambisonic requiere post-procesamiento para convertir el formato A (4 canales) a
formatos reproducibles (estéreo). Esto exigió una curva de aprendizaje significativa en el software Zoom
Ambisonics Player y plugins especializados.
3.4. Equipamiento fotográfico
Cámara: Canon 6D
• Sensor: Full frame (35.8mm x 23.9mm)
• Resolución: 20.2 MP
• Rango ISO: 100 a 800
• Formato: RAW de 14-bit

pág. 6232
Justificación: El sensor full frame con excelente desempeño en luz baja es fundamental para interiores
de chacras sombreadas. El formato RAW preservaba una máxima información para el procesamiento
posterior.
Lentes:
Tamron 70-200mm f/2.8 Di VC USD: Telefoto para retratos con compresión de fondo y aislamiento de
sujetos. La apertura f/2.8 permitía profundidades de campo reducidas que separaban protagonistas de
fondos.
Tokina 16-28mm f/2.8 AT-X Pro FX: Es un gran angular para paisajes y contextos amplios. Su campo
de visión de 107° a 16mm capturaba ampliamente los entornos amazónicos.
Estrategia de captura:
• Formato RAW para máxima flexibilidad en postproducción
• Exposición para preservar highlights (recuperar sombras en post es más viable que recuperar
highlights)
• Balance de blancos manual basado en una carta gris (la luz amazónica tiene dominantes
verdes/azules complejas)
Tensión ética y estética en fotografía:
La fotografía presenta un dilema particular: requiere detención, encuadre cuidadoso, frecuentemente
múltiples tomas. Esto es más intrusivo que el video puesto que puede rodar continuamente.
Estrategia adoptada: Mezcla de fotografía "robada" (sujetos inconscientes de cámara) y fotografía
dirigida (sujetos conscientes, cooperando con composición). La segunda requirió solicitar permiso,
explicar intenciones, y mostrar resultados inmediatamente en la pantalla LCD de la cámara para
validación.
3.5. Iluminación
Decisión fundamental: No usar iluminación artificial
Aunque llevar luces (LED panels, reflectores) habría permitido control sobre iluminación, se decidió
trabajar exclusivamente con luz natural por tres razones:
1. Ética de no-intrusión: La iluminación artificial transforma radicalmente espacios, haciendo
presencia de equipo de filmación imposible de ignorar

pág. 6233
2. Autenticidad visual: Las chacras se experimentan con luz natural. Iluminarlas artificialmente crearía
estética "televisiva" incongruente con la representación buscada
3. Limitaciones logísticas: Trabajar con luces artificiales requiere generadores o baterías pesadas, lo
que se convierte en un recurso compicado de manipular en terrenos de dificil acceso.
Consecuencias:
Positivas:
• Estética naturalista coherente con aproximación observacional
• Una menor intrusión facilitó comportamientos espontáneos
• La luz natural amazónica (filtrada por doseles, reflejada por vegetación) creó atmósferas
específicas del lugar
Negativas:
• Se obtuvieron rangos dinámicos extremos (cielo brillante vs. sombras profundas) que desafiaron
las capacidades de las cámaras
• Trabajo limitado a horas con luz suficiente (generalmente de 6am a 5pm)
• Algunos interiores quedaron subexpuestos
Estrategias de compensación:
• Exposición para preservar highlights, recuperar sombras en post
• Uso de ISO altos donde fuera necesario (FX30 maneja bien el ISO hasta 6400)
• Ubicación estratégica esperando que sujetos se movieran a zonas mejor iluminadas
• Uso ocasional de reflectores naturales (colocando telas blancas para rebotar luz suavemente)
3.6. Protocolo de grabación en campo
Configuración típica para un día de rodaje:
5:30 AM: Reunión con protagonista del día, conversación informal mientras preparaba herramientas
6:00 AM: Inicio de traslado a chacra. Documentación del camino
6:30-10:00 AM: Trabajo en chacra. Múltiples setups:
• Planos generales con 24mm en trípode estableciendo contexto espacial
• Planos medios y cerrados con 24-105mm siguiendo acciones específicas
• Audio con lavaliers en protagonista dirigido según acción + 360 capturando el sonido ambiente

pág. 6234
• Fotografías intercaladas según oportunidades (luz interesante, composiciones fuertes,
momentos significativos)
10:00-10:30 AM: Descanso. Equipos apagados, conversación informal (no grabada)
10:30 AM-1:00 PM: Continuación de trabajo
1:00-2:00 PM: Almuerzo, descanso
2:00-4:00 PM: Entrevista formal. Setup:
• Cámara en trípode
• 24-105mm a 50mm (distancia 2m para perspectiva natural)
• f/4 para profundidad de campo que separara sujeto de fondo sin excesivo blur
• Dos lavaliers
• Ubicación en exteriores o interiores con luz suave
4:00-5:00 PM: "Hora dorada". Prioridad a fotografías con luz cálida baja
Gestión de datos en campo:
• Respaldo diario de todas las tarjetas a dos discos duros portátiles
• Verificación de integridad de archivos
• Etiquetado meticuloso: fecha, ubicación, protagonista, descripción breve
Total capturado:
• Video: 22 horas en 15 días de rodaje
• Audio multicanal: 25 horas
• Fotografías: 2,100 imágenes en formato RAW
4. ESTRATEGIAS ESTÉTICAS Y NARRATIVAS
4.1. Privilegiar lo sonoro: invirtiendo jerarquías audiovisuales
El desafío central era hacer que la dimensión sonora protagonizara la obra sin producir un "video
musical" o un "paisaje sonoro con imágenes decorativas". Se buscaba una integración donde la imagen
y el sonido tuvieran peso equivalente, con momentos donde el audio liderara narrativamente.

pág. 6235
Estrategias implementadas:
4.1.1. Montaje subordinado a estructuras acústicas
Convencionalmente, el montaje audiovisual parte de una estructura visual (secuencias de imágenes)
sobre la cual se añade sonido. Se invirtió este proceso: se partió de estructuras acústicas (secuencias de
cantos, paisajes sonoros) sobre las cuales se construyó la narrativa visual.
Proceso concreto:
1. Audición repetida de todo el material de audio sin imagen
2. Identificación de cantos completos con mejor calidad acústica y contenido significativo
3. Transcripción y traducción de textos de cantos
4. Construcción de un "esqueleto acústico" del documental: qué cantos en qué orden
5. Búsqueda de imágenes que acompañaran (no que reemplazaran) estos momentos acústicos
La duración de planos (entre 35 y 50 segundos) es significativamente mayor que promedio del
documental contemporáneo (3-5 segundos). Esto respeta temporalidad del canto, permitiendo que
espectadores se sumerjan en su ritmo sin interrupciones visuales constantes.
4.1.2. Diseño sonoro espacial y profundidad acústica
Inspirado en conceptos de arqueología sonora (Miyazaki, 2020), se diseñaron paisajes sonoros con
profundidad espacial:
Primer plano acústico: Voces de protagonistas, cantos, sonidos de herramientas cercanas (capturados
con lavaliers)
Plano medio acústico: Sonidos de actividad en proximidad (niños jugando, animales domésticos, agua
de quebrada cercana)
Plano de fondo acústico: Texturas ambientales (viento en árboles, cantos de aves distantes, sonido
general del bosque)
Esta estratificación crea experiencias inmersivas donde los espectadores perciben espacios acústicos
tridimensionales, no planos.

pág. 6236
4.2. Estrategias de encuadre y composición visual
Aunque privilegiando el sonido, la dimensión visual requería cuidado estético propio:
4.2.1. Encuadres abiertos versus cerrados
Planos generales (30% del metraje): Establecen relaciones espaciales entre mujeres, plantas, y
entornos. Comunicando que la agricultura Shuar no es actividad aislada sino una práctica situada en
ecosistemas específicos.
Composición: Siguiendo la regla de tercios pero con frecuentes improvisaciones deliberadas. Las
mujeres raramente centradas, permitiendo que la vegetación circundante ocupe una porción significativa
dentro del encuadre. Esto contrarresta el antropocentrismo visual típico.
Planos medios (40% del metraje): Foco en acciones y gestos específicos. Distancia que permite ver
expresiones faciales y movimientos corporales completos sin excesivo aislamiento de contextos.
Primeros planos (30% del metraje): Manos manipulando semillas, herramientas, plantas. Rostros
cantando (con especial atención a capturar movimientos de labios sincronizados con audio). Texturas
de hojas, tierra, tubérculos cosechados.
4.2.2. Movimientos de cámara
Estáticos (trípode): 60% del material. Establece una contemplación pausada, permite que las acciones
se desarrollen dentro del encuadre sin seguimiento intrusivo.
Panorámicas tilts suaves: 25%. Siguiendo movimientos de protagonistas o revelando espacios
gradualmente. Velocidades deliberadamente lentas (de 2 a 3 segundos para panorámicas de 90°).
Movimientos dinámicos (handheld): 15%. Reservados para:
• Seguir traslados (caminar a chacras)
• Crear sensación de inmersión en vegetación densa
• Momentos de energía (cosecha abundante)
Decisión estética crítica: Se evitaron movimientos de cámara "expresivos" (crash zooms, whip pans,
movimientos circulares dramáticos) comunes en documentales contemporáneos. Estas técnicas llaman
la atención sobre el virtuosismo del camarógrafo, distrayendo la atención de los sujetos.
Se preferio la invisibilidad de técnica: movimientos tan suaves y motivados que espectadores no los
noten conscientemente.

pág. 6237
4.2.3. Profundidad de campo como elección narrativa
La profundidad de campo (qué porción del encuadre está en foco) es una decisión cargada de
significados:
Profundidad de campo reducida: Aísla al sujeto, focaliza la atención, crea estética "cinematográfica".
Lograda mediante aperturas amplias (f/1.8-f/2.8) y distancias focales largas (70-200mm).
Uso: Retratos íntimos, momentos de concentración intensa, enfatiza emociones faciales.
Profundidad de campo extendida: Preserva contextos, muestra relaciones espaciales complejas, crea
estética "documental realista". Lograda mediante aperturas cerradas (f/8-f/11) y focales cortas (16-
24mm).
Uso: Planos de contexto, muestra interacciones entre múltiples elementos (mujer, plantas, herramientas,
entorno).
Tensión: Una profundidad reducida es estéticamente atractiva pero puede ser percibida como una
manipulación que artificialmente embellece. La profundidad extendida es "honesta" pero puede resultar
visualmente plana.
Resolución: Exisitió una mezcla estratégica según momentos. Profundidad reducida para momentos
íntimos y emocionales. Profundidad extendida para establecer contextos y relaciones espaciales.
4.3. Fotografía documental: contemplación
La fotografía presenta una temporalidad diferente del video: invita a la contemplación pausada de
momentos congelados.
4.3.1. Tipologías fotográficas empleadas
Retratos ambientales: Sujetos en sus entornos de trabajo. Composición que balancea presencia humana
con contextos que revelan actividades, identidades, relaciones con territorios.
Influencias estéticas: Sebastião Salgado (dignidad de trabajadores), Graciela Iturbide (fotografía
antropológica poética), documentalismo social latinoamericano.
Estrategia técnica:
• Focal 70-100mm para compresión que integra fondos sin distorsiones de perspectiva
• f/4-f/5.6 para separación sutil de fondo sin excesivo bokeh
• Luz natural suave (hora dorada, sombra abierta)

pág. 6238
• Contacto visual directo entre sujeto y cámara estableciendo relación de reconocimiento mutuo
Paisajes contextuales: Espacios sin presencia humana, chacras vistas desde distancia, caminos hacia
cultivos, ríos cercanos, vegetación.
Función: Establecer una referencia geografíca, clima, ecología. Comunicar que las prácticas culturales
no ocurren en espacios vacíos sino en territorios específicos.
Estrategia técnica:
• Focal 16-24mm para amplitud
• f/11-f/16 para profundidad extendida
• Trípode para exposiciones más largas que capturan movimiento de hojas, agua
Naturalezas muertas culturales: Composiciones de objetos: canastos con tubérculos cosechados,
herramientas dispuestas, semillas preparadas para la siembra.
Detalles corporales: Manos, pies descalzos en tierra, gestos. Sin mostrar rostros completos, focalizando
la atención en fragmentos corporales que revelan trabajo físico, edad, experiencia.
Justificación: El trabajo agrícola es profundamente corporal. Manos de Monica (68 años), marcadas por
décadas de trabajo, cuentan historias que rostros no revelan completamente.
Acción congelada: Momentos de movimiento capturados con velocidades de obturación rápidas (1/500-
1/1000s): tierra volando, machete golpeando el suelo, agua salpicando, hojas agitadas por viento.
Función: La fotografía puede congelar momentos imperceptibles al ojo humano, revelando belleza en
instantes cortos.
4.3.2. Post-procesamiento fotográfico
Flujo de trabajo en Adobe Lightroom:
1. Ajuste de exposición: Recuperación de highlights, apertura de sombras, optimización de rango
dinámico
2. Balance de blancos: Corrección de dominantes de color preservando calidez o frialdad natural
de la luz
3. Contraste y claridad: Ajuste sutil para definición de volúmenes
4. Curva tonal: Refinamiento de distribución de tonos para drama controlado

pág. 6239
5. Desaturación selectiva: Reducción leve de saturación en verdes (dominantes en contextos
amazónicos) para evitar apariencia de "hipersaturación"
6. Nitidez y reducción de ruido: Optimización para impresión
Estética resultante: Estilo naturalista pero refinado. Colores ricos pero no exagerados. Contraste
suficiente para impacto visual pero no dramático estilo HDR.
4.4. Montaje y estructura narrativa
4.4.1. Del material bruto al corte final
Material inicial: 22 horas de video, 2.100 fotografías, 25 horas de audio
Primer corte: 55 minutos (después de aproximadamente 80 horas de trabajo de edición)
Versión final: 43 minutos (después de aproximadamente 40 horas de refinamiento)
Proceso de reducción:
• Eliminación de material técnicamente deficiente (desenfoques, audio distorsionado)
• Remoción de redundancias (múltiples tomas de acciones similares)
• Ajuste de ritmo narrativo (secuencias que se alargaban excesivamente)
• Respuesta a retroalimentación de protagonistas (secuencias que solicitaron remover)
4.4.2. Estructura narrativa general
El documental sigue estructura de "ciclo completo": desde preparación de tierra hasta
consumo/comercialización de productos, pasando por siembra, mantenimiento, y cosecha.
Esta estructura:
• Es culturalmente apropiada (refleja cómo mujeres Shuar conceptualizan la agricultura)
• Permite introducir diferentes tipos de cantos en momentos correspondientes
• Crea un arco narrativo con inicio, desarrollo, y cierre
• Se refleja que la agricultura es un proceso cíclico continuo, no una serie de eventos aislados
Escaleta con 10 secciones temáticas
1. Ubicación espacial: Mapas, planos de paisajes, establecimiento geográfico
2. Presentación de personajes: Breves autointroducciones de protagonistas
3. Significado de cantos: Testimonios sobre qué representan, por qué cantan
4. Cronología agrícola: Explicación del proceso completo

pág. 6240
5. Camino al aja: Trayecto hacia las chacras, reflexiones durante caminata
6. Importancia cultural: Transmisión intergeneracional, fortalecimiento identitario
7. Cosmovisión: Relación con Nunkui, plantas como sujetos, reciprocidad
8. Preservación: Desafíos actuales, amenazas a continuidad
9. Futuro: Reflexiones sobre perspectivas, esperanzas, incertidumbres
10. Cierre: Retratos en movimiento con música basada en Anent
4.4.3. Ritmo de montaje
Tempo variable según función narrativa:
Secuencias contemplativas (trabajo agrícola, paisajes): Planos largos (20-60 segundos), cortes suaves
mediante fade o dissolve, ritmo pausado que invita a inmersión.
Secuencias informativas (explicaciones, testimonios): Planos medios (8-15 segundos), cortes directos,
ritmo moderado que mantiene atención sin apresuramiento.
Secuencias de transición (traslados, cambios de ubicación/temporada): Planos breves (3-8 segundos)
frecuentemente con música, ritmo más dinámico.
Los cantos dictan temporalidad; respetarla requiere paciencia visual.
4.5. Diseño sonoro: de la captura a la mezcla final
4.5.1. Organización de material acústico
El audio capturado se organizó en categorías:
Cantos Anent (protagonistas absolutos):
• Clasificados por: tipo (siembra/deshierbe/cosecha), protagonista, planta mencionada
Testimonios/diálogos:
• 18 entrevistas formales
• Numerosas conversaciones informales durante trabajo
Sonidos laborales:
• Herramientas (machete cortando, azadón golpeando tierra, canastos siendo llenados)
• Manipulación de plantas (arrancar, cortar, desgajar)
• Movimiento de cuerpos (pasos en tierra/barro, respiraciones de esfuerzo)

pág. 6241
Paisajes sonoros ambientales:
• Texturas de bosque (hojas movidas por viento, quebradas, lluvia)
• Fauna (aves, insectos, ocasionalmente mamíferos distantes)
• Actividades comunitarias distantes (voces, animales domésticos, motores ocasionales)
4.5.2. Procesamiento de cantos
Los cantos requirieron un procesamiento cuidadoso para optimizar la inteligibilidad, preservando su
carácter natural.
4.5.3. Transcripción y adaptación musical
El productor musical asumió la tarea compleja de transcribir los cantos Anent (originalmente no
concebidos para notación occidental) a partituras musicales.
Desafíos:
• Melodías que no siempre se ajustan a escalas occidentales (microtonalidad ocasional)
• Ritmos libres (no metronomizados) que fluctúan según la respiración y el trabajo físico
• Ornamentaciones vocales (vibrato, portamentos) difíciles de anotar
Basándose en estas transcripciones, se crearon piezas instrumentales (guitarra, flauta, percusión suave)
que reinterpretan melodías desde una sensibilidad mestiza.
Uso en documental: Estas composiciones se utilizan en secuencias de transición y créditos, mo
reemplazando los cantos originales en las secuencias principales.
4.6. Plataformas complementarias: fotografía y paisaje sonoro interactivo
4.6.1. Exposición fotográfica
Formato: 35 imágenes impresas en A4 (21cm x 29.7cm) en papel fine art (Epson Premium Glossy,
255g/m²)
Diseño curatorial: Organización en cinco núcleos temáticos montados en secuencia:
1. Territorios (paisajes, contextos geográficos)
2. Mujeres (retratos ambientales)
3. Plantas (detalles botánicos, relaciones humano-vegetal)
4. Trabajo (acciones, gestos, herramientas)
5. Productos (cosechas, preparaciones, comercialización)

pág. 6242
Función: Complementar al documental permitiendo una contemplación pausada de momentos que en
video pasan rápidamente. Las fotografías invitan a detención, observación cuidadosa de detalles y una
reflexión.
4.6.2. Paisaje sonoro interactivo
Formato: Composición de audio espacial de 12 minutos accesible mediante web
Contenido: Integración de:
• Cantos Anent originales (fragmentos de 30 a 90 segundos)
• Sonidos ambientales procesados (texturas extendidas de bosque, agua, fauna)
• Composiciones instrumentales
• Silencio estratégico (pausas que crean respiración)
Interactividad: La plataforma web permite:
• Navegación no-lineal (seleccionar qué segmentos ver y escuchar)
• Información contextual sobre cada canto (quién canta, qué planta, qué momento del ciclo)
Función: Ofrecer experiencia puramente acústica para quienes prefieren enfocarse exclusivamente en
dimensión sonora sin estímulos visuales.
5. DISCUSIÓN
5.1. Tensiones técnicas y resoluciones adoptadas
5.1.1. Calidad técnica versus espontaneidad
Tensión: Obtener un material técnicamente óptimo (foco perfecto, exposición ideal, audio limpio)
frecuentemente requiere control, preparación, repeticiones. Pero esto contradice captura de momentos
espontáneos auténticos.
Ejemplos concretos:
Situación 1: Monica comienza a cantar espontáneamente mientras deshierba. La cámara está guardada
en la mochila (acababa de tomar descanso). ¿Interrumpir para sacar la cámara (perdiendo momento) o
dejar pasar (sin registro visual)?
Resolución: Se determinó que los cantos eran coprotagonistas, el audio podía capturarse (Zoom 360
estaba grabando continuamente), la imagen no era esencial para cada canto. Se dejó pasar el momento
visualmente.

pág. 6243
Reflexión posterior: Esta decisión privilegió la autenticidad (un canto espontáneo no performado para
cámara) sobre la completitud del registro. El audio resultante fue integrado en el documental con
imágenes de contexto similares de otro día de grabación.
Situación 2: Durante entrevista, Nancy habla sobre significados de cantos con profunda emoción. Sin
embargo, el sol ha bajado y su rostro está subexpuesto. ¿Detener para reposicionarla hacia mejor luz
(interrumpiendo flujo emocional) o continuar con una imagen subóptima?
Resolución: Se continuó grabando. En postproducción, se recuperaron las sombras digitalmente. La
imagen resultante tiene ruido visible pero la emoción auténtica del momento se preservó.
Principio general adoptado: Priorizar la autenticidad de momentos sobre la perfección técnica cuando
existía conflicto. Sin embargo, esto requería equipos (FX30 con buen rango dinámico) que permitieran
"rescatar" en postproducción el material capturado en condiciones subóptimas.
5.1.2. Observación versus participación
Tensión: Aproximación observacional (distancia, no-intervención) genera estética de "realidad no
mediada" pero puede ser percibida como voyeurística. Una Participación activa (interacción,
colaboración) es éticamente preferible pero hace visible la mediación.
Reflexión teórica: Siguiendo a Ruby (2000), la reflexividad etnográfica requiere reconocer en qué
documentales son válidos los encuentros entre personas. Hacer visible este encuentro es éticamente y
epistemológicamente preferible a simular lo invisible.
5.1.3. Visual versus sonoro: jerarquías en medios "audiovisuales"
Tensión estructural: El término mismo "audiovisual" prioriza a lo visual (aparece primero).
Históricamente el cine privilegió la imagen, tratando al sonido como un complemento.
Invertir esto requirió decisiones conscientes que contradicen varias convenciones:
Convención: Cortar una imagen según un ritmo visual óptimo y ajustar el audio para conformarse
Inversión aplicada: Cortar la imagen según una estructura acústica, permitiendo que los planos visuales
se extiendan más de lo "cinematográficamente óptimo" con esto se respeta la temporalidad de los cantos
5.2. Affordances y limitaciones de diferentes plataformas
5.2.1. Video lineal

pág. 6244
Affordances:
• Narrativa temporal controlada (realizador determina secuencia, ritmo)
• Integración de múltiples dimensiones (visual, acústica, textual mediante subtítulos)
• Proyección colectiva que facilita la experiencia compartida
Limitaciones:
• Unidireccionalidad (espectadores no controlan la navegación)
• Compresión temporal (43 minutos no puede capturar 15 días de experiencia)
• Reproducción imperfecta de espacialidad acústica en sistemas estéreo convencionales
Apropiado para: Introducir a audiencias a cantos Anent mediante una narrativa accesible que
contextualiza, explica, y ejemplifica
5.2.2. Fotografía estática
Affordances:
• Contemplación pausada sin presión de tiempo
• Detalle visual mayor que video (20MP vs 4K)
• Materialidad física (impresiones tangibles) versus virtualidad de video digital
• Aislamiento de momentos que permite un enfoque concentrado
Limitaciones:
• Congelación que elimina la dimensión temporal
• Ausencia de sonido (fotografías son necesariamente mudas)
• Fragmentación (momentos aislados sin conexiones narrativas explícitas)
Apropiado para: Revelar detalles visuales, rostros, gestos, texturas que en video pueden pasar
rápidamente. Invitar a una observación cuidadosa.
5.2.3. Paisaje sonoro interactivo
Affordances:
• Experiencia puramente acústica sin distracciones visuales
• Interactividad (usuarios navegan según intereses)
• Duración extendida sin presión narrativa (usuarios determinan cuánto tiempo escuchan)

pág. 6245
Limitaciones:
• Ausencia de contexto visual (usuarios no ven espacios o protagonistas)
• Requiere disposición de escucha activa (no consumo pasivo)
• Acceso limitado a quienes tienen conexión web y audífonos apropiados
Apropiado para: Audiencias con interés específico en dimensiones acústicas, permitiendo una
inmersión profunda en paisajes sonoros.
5.2.4. Plataforma web integrada
Affordances:
• Integración de múltiples formatos en espacio unificado
• Navegación no lineal (usuarios eligen qué explorar)
• Actualizacines y expansiones posibless (contenido añadido posteriormente)
• Accesibilidad global (versus exposición física limitada geográficamente)
Limitaciones:
• Requiere conectividad y dispositivos apropiados
• Experiencia fragmentada (menos inmersiva que proyección en sala)
• Preservación digital problemática a largo plazo
Apropiado para: Archivo accesible, herramienta educativa, plataforma para usuarios que desean
explorar profundamente según intereses específicos
5.3. Ética de la representación visual
5.3.1. Poder de la imagen y responsabilidad
Las imágenes fotográficas y cinematográficas poseen un poder particular: condensan identidades,
circulan ampliamente, persisten temporalmente, afectan percepciones.
Como advierte Tagg (1988), "las fotografías no son espejos neutrales sino instrumentos que han servido
históricamente a proyectos de vigilancia, clasificación, y control" (p. 63). La fotografía antropológica
colonial construyó "tipos raciales", objetificó sujetos colonizados y facilitó su dominación.
¿Cómo evitar reproducir estas dinámicas en la fotografía etnográfica contemporánea?

pág. 6246
Estrategias implementadas:
Control compartido: Mostrar imágenes inmediatamente a protagonistas, solicitando aprobación.
Respetar solicitudes de no inclusión.
Dignidad visual: Evitar composiciones que exoticen, infantilicen, o victimicen. Buscar
representaciones que comuniquen conocimiento y una humanidad compleja.
Contextualización: Acompañar imágenes con información que previene de lecturas
descontextualizadas.
5.3.2. Estetización versus documentación
Tensión: Buscar una belleza formal puede distraer la atención en los contenidos y reducir a los sujetos
a objetos estéticos. Al contrario, un rechazo total de la estética puede generar imágenes "pobres" que
inadvertidamente comunican pobreza de sujetos.
Ejemplo concreto: Retrato de Monica Tiwi durante hora dorada, luz cálida iluminando su rostro desde
ángulo lateral, fondo de vegetación levemente desenfocado.
Argumentos pro-estetización: La imagen es visualmente hermosa. Comunica dignidad, sabiduría,
conexión con la tierra. Captura la calidez emocional del momento.
Argumentos contra-estetización: La belleza formal puede "romantizar" la pobreza material. El
desenfoque de fondo elimina contexto informativo. La composición cuidadosa revela una
"manipulación" artística.
Posición adoptada: Buscar belleza pero no a costa de honestidad. Se consigue una estética que respeta
la integridad de sujetos y contextos. Belleza que emerge de respeto, no de manipulación.
5.4. Documentación expandida: ¿fragmentación o complementariedad?
El modelo transmedia presenta un riesgo de fragmentación: audiencias que consumen solo un formato
obtienen una comprensión parcial. Sin embargo, también ofrece la posibilidad de complementariedad:
diferentes formatos revelando diferentes dimensiones.
Evaluación del proyecto:
Complementariedad lograda:
• El video ofrece una narrativa accesible e introductoria
• Las fotografías profundizan en aspectos visuales específicos

pág. 6247
• El paisaje sonoro permite una inmersión acústica
• La web integra todos estos elementos, proporcionando una navegación flexible
Fragmentación residual:
• Cada formato es consumible independientemente, potencialmente sin acceso a otros
• No existe narrativa que explícitamente guíe audiencias a través de formatos múltiples
• La coherencia conceptual depende de que los usuarios accedan a múltiples formatos
Aprendizaje: Futuros proyectos deberían diseñar más explícitamente "caminos narrativos" que guíen
audiencias a través de plataformas, sugiriendo órdenes de consumo o conexiones entre formatos.
5.5. Límites de la representación audiovisual
Es crucial reconocer qué elementos técnicos y narrativos no capturan con fidelidad la realidad o las
representaciones de ella:
Dimensiones inaccesibles a cámaras y micrófonos:
• Sensaciones corporales (calor, humedad, cansancio físico, textura de tierra en manos)
• Olores (tierra húmeda, plantas, sudor)
• Sabores (productos cosechados)
• Conocimientos tácitos no verbalizados
• Memorias personales que protagonistas asocian a lugares o actividades
• Afectos y emociones que no se expresan conductualmente
• Dimensiones espirituales que trascienden lo perceptible
Temporalidades incompatibles:
• La repetición cotidiana durante años que es fundamental para aprendizaje
• Ciclos estacionales completos
• Transformaciones lentas (erosión de tierra, crecimiento de árboles)
• Historias de vida completas
Complejidades sociales:
• Tensiones y conflictos que no se manifiestan durante visitas breves
• Divisiones internas de comunidades
• Negociaciones de poder sutiles

pág. 6248
Reconocer estos límites no invalida el ejercicio documental pero exige humildad: las representaciones
son necesariamente parciales, incompletas, mediadas. No "preservan" culturas sino que generan
representaciones específicas útiles para ciertos propósitos.
6. CONCLUSIONES
6.1. Síntesis de hallazgos
Este artículo ha analizado las estrategias técnicas y estéticas empleadas en documentación la audiovisual
de cantos Anent Shuar, reflexionando sobre cómo decisiones sobre equipamiento, captura, y
postproducción configuran el conocimiento etnográfico producido.
Hallazgos principales:
1. Las elecciones técnicas son profundamente epistemológicas, no simplemente instrumentales. ¿Qué
cámara usar?, ¿cómo encuadrar?, ¿cómo procesar el audio?, ¿cómo montar? determina qué aspectos de
fenómenos culturales se hacen visibles, audibles y qué permanece oculto.
2. Privilegiar la dimensión sonora en documentación audiovisual requiere una inversión
consciente de jerarquías convencionales: subordinar ritmos visuales a estructuras acústicas, extender
duraciones de planos para respetar temporalidades de cantos, diseñar paisajes sonoros con profundidad
espacial.
3. La documentación etnográfica enfrenta tensiones estructurales entre calidad técnica y
espontaneidad, observación y participación, autenticidad y efectividad narrativa. No existen
resoluciones perfectas sino navegaciones caso por caso que priorizan diferentes valores según los
contextos del momento.
4. El modelo de documentación expandida transmedia permite representar complejidades usando
affordances específicas de diferentes medios, aunque presenta riesgos de fragmentación que requieren
de un diseño cuidadoso.
5. La reflexividad técnica hace visibles los procesos constructivos de representación reconociendo
que los documentales no "capturan" sino "construyen" conocimiento.

pág. 6249
6.2. Contribuciones metodológicas
Para la documentación de expresiones acústicas culturales:
Este proyecto ofrece un modelo replicable para privilegiar una dimensión sonora mediante:
• Captura multicanal con equipos especializados (lavaliers + ambisonic)
• Procesamiento que optimiza inteligibilidad, preservando la naturalidad
• Montaje subordinado a estructuras acústicas
• Diseño sonoro espacial que crea inmersión
Para fotografía etnográfica:
Estrategias para equilibrar dignidad de sujetos con una calidad estética:
• Control compartido (mostrar imágenes, solicitar aprobación)
• Evitar la exotización de los personajes
• Post-procesamiento que respeta integridad de las escenas
Para producción transmedia:
Protocolos para integración coherente de múltiples formatos:
• Diseño desde inicio (no añadir formatos posteriormente)
• Complementariedad estratégica (cada formato revela dimensiones únicas)
• Coherencia estética que unifica productos
• Plataforma integradora (web) que conecta formatos
6.3. Implicaciones teóricas
Sobre antropología visual:
La disciplina debe desarrollar una mayor sofisticación técnica, no relegando consideraciones sobre
equipos, técnicas, y estéticas a apéndices metodológicos sino reconociéndolas como dimensiones
constitutivas de producción de conocimientos.
Los programas de formación en antropología visual deberían incluir:
• Entrenamiento técnico robusto (no solo teoría)
• Reflexión crítica sobre relaciones entre técnica y epistemología
• Práctica con equipos diversos para comprender affordances y limitaciones
• Análisis de cómo decisiones técnicas configuran representaciones

pág. 6250
6.5. Recomendaciones para futuros proyectos
Sobre equipamiento:
Priorizar la captura del audio: Invertir proporcionalmente más en equipos de audio que en cámaras.
Audio deficiente es más difícil de "rescatar" en post que video imperfecto.
Sistemas de respaldo: Redundancia en captura (grabación dual de audio, respaldo de video) es
fundamental en contextos donde repetir tomas es imposible o éticamente problemático.
Formatos abiertos: Preferir codecs y formatos que faciliten preservación a largo plazo sobre aquellos
que optimizan flujos de trabajo inmediatos.
Sobre procesos:
Tiempo suficiente: No apresurarse. Establecer relaciones genuinas requiere tiempo. Esperar momentos
apropiados requiere paciencia.
Validación continua: Mostrar materiales regularmente a protagonistas, no solo al final. Esto permite
correcciones tempranas.
Documentación de proceso: Mantener diarios detallados sobre decisiones técnicas, desafíos
enfrentados, resoluciones adoptadas. Esta metadata es valiosa para la comprensión de productos finales.
Sobre ética:
Transparencia total: Explicar qué hace cada equipo técnico, mostrar cómo funcionan, permitir que
protagonistas experimenten con ellos si desean.
Control compartido real: No simbólico. Esto implica la disposición a no usar el material si los
protagonistas lo solicitan, incluso si técnicamente es excelente.
Compromisos de largo plazo: Establecer desde el inicio relaciones que se extienden más allá de
proyectos específicos.
6.6. Reflexión final: La técnica al servicio del respeto
En última instancia, la maestría en técnica audiovisual debe servir objetivos éticos de representación
respetuosa. La pregunta no es "¿cómo obtener la imagen más bella?" sino "¿cómo representar a estas
personas de manera que honre su dignidad y conocimientos?"
Como expresó Nancy Ayuí al ver el documental terminado: "Me veo bonita aquí, pero más importante,
me veo como soy realmente. Gracias por no hacer que parezca otra persona".

pág. 6251
Las cámaras, micrófonos, software, y técnicas son herramientas poderosas. Usadas crítica y éticamente,
pueden generar conocimientos antropológicos ricos y representaciones que fortalecen la dignidad de
personas representadas. Pero requieren de una constante vigilancia para que no reproduzcan
inadvertidamente dinámicas de objetificación, exotización, o extractivismo. La antropología visual del
siglo XXI debe ser técnicamente sofisticada y éticamente rigurosa. Ni la una sin la otra.
REFERENCIAS BIBLIOGRÁFICAS
Castaing-Taylor, L., & Paravel, V. (2012). Leviathan [Film]. Cinema Guild.
Edwards, E. (1992). Anthropology and Photography 1860-1920. Yale University Press.
Eisenstein, S. (1949). Film Form: Essays in Film Theory. Harcourt Brace.
Erlmann, V. (Ed.). (2004). Hearing Cultures: Essays on Sound, Listening and Modernity. Berg
Publishers.
Feld, S. (1996). Waterfalls of song: An acoustemology of place resounding in Bosavi, Papua New
Guinea. In S. Feld & K. Basso (Eds.), Senses of Place (pp. 91-135). School of American
Research Press.
Flusser, V. (2001). Una filosofía de la fotografía. Síntesis.
Gibson, J. J. (1979). The Ecological Approach to Visual Perception. Houghton Mifflin.
Grimshaw, A., & Ravetz, A. (2009). Observational Cinema: Anthropology, Film, and the Exploration
of Social Life. Indiana University Press.
Haraway, D. (1988). Situated knowledges: The science question in feminism and the privilege of partial
perspective. Feminist Studies, 14(3), 575-599.
Jenkins, H. (2006). Convergence Culture: Where Old and New Media Collide. NYU Press.
MacDougall, D. (1998). Transcultural Cinema. Princeton University Press.
MacDougall, D. (2006). The Corporeal Image: Film, Ethnography, and the Senses. Princeton University
Press.
Marks, L. (2000). The Skin of the Film: Intercultural Cinema, Embodiment, and the Senses. Duke
University Press.
pág. 6252
Miyazaki, S. (2020). Algorhythmics: Understanding micro-temporal structures of computational audio
processes. In M. Cobussen, V. Meelberg, & B. Truax (Eds.), The Routledge Companion to
Sounding Art (pp. 231-244). Routledge.
Nichols, B. (1991). Representing Reality: Issues and Concepts in Documentary. Indiana University
Press.
Rouch, J. (2003). Ciné-Ethnography. University of Minnesota Press.
Ruby, J. (2000). Picturing Culture: Explorations of Film and Anthropology. University of Chicago
Press.
Schaeffer, P. (1966). Traité des objets musicaux. Seuil.
Schafer, R. M. (1977). The Soundscape: Our Sonic Environment and the Tuning of the World. Destiny
Books.
Sontag, S. (1977). On Photography. Farrar, Straus and Giroux.
Tagg, J. (1988). The Burden of Representation: Essays on Photographies and Histories. University of
Minnesota Press.
Truax, B. (2001). Acoustic Communication (2nd ed.). Ablex Publishing.