أدرك صناع السينما أن عليهم انتقاء الأصوات المستخدمة في الفيلم وتسجيلها طبقاً لوظيفتها في مشهد بعينه , لذلك فالأصوات البشرية والموسيقي والمؤثرات الصوتية يجب الاحتفاظ بها بالنظر لأهميتها بالنسبة للحدث الدرامي , وحذف كل صوت لاينطبق عليه هذا في حجرة المونتاج .
وتعتبر إمكانيات التنوع الصوتي في الفيلم السينمائي لا نهائية , حيث يمكن تسجيل كل من مكونات شريط الصوت - الحوار ,و التعليق , والموسيقي , والمؤثرات - علي حدة ثم مزجها معاً .
فعلي سبيل المثال : يمكن تسجيل الحوار في ظروف مثالية تسمح بالتحكم في منظور الصوت والحركة , ثم تسجيل الموسيقي بعد ذلك في أفضل ظروف التسجيل أيضاً لتتماشي مع التصوير والمونتاج , وبعد ذلك يتم إضافة المؤثرات التي تُخلق هي الأخري في أكثر الظروف شبهاً بالواقع . ويتم في المرحلة التالية مزج هذه الأصوات في الاستوديو باستخدام كل إمكانيات تنقية وتحسين الصوت المتاحة وتحويلها إلي شريط صوت واحد . ويمكن التحكم من خلال جهاز مزج الأصوات sound mixer في نسبة وكثافة كل صوت عند نقطة تمثل حدثاً درامياً بعينه . فرغم سيطرة العناصر البصرية علي الوسيط السينمائي , فإن التأثير العاطفي هو نتاج تناغم الصوت والصورة معاً , بشرط أن يأخذ كل عنصر صوتي فرصته في الاندماج مع الصورة ليصبح ذو أهمية خاصة في لحظة معينة من الفيلم. ويعتمد قرار تقديم أحد العناصر الصوتية عن العنصرين الآخرين علي مدي ملائمة المزيج الصوتي لجو اللقطة التي يصاحبها