פעמים רבות צפייה בתכנים ויזואליים מלווה במוזיקת רקע. למוזיקה תפקידים רבים בהקשר הפסיכולוגי של הצפייה- היא כלי נוסף של התוכן האינטגרטיבי שמטרתו להכניס את הצופה לעולם התוכן המוצג על המסך. המוזיקה מפעילה את הרגשות של הצופה, ומייצרת הקשר בין שני החושים, השמיעה והראייה.
על פי אחת התיאוריות המוכרות בפסיכולוגיה קוגניטיבית, ניתן להסביר את האופן שבו משפיעה מוזיקה על הרגשות כלפי התוכן הויזואלי היא באמצעות "אפקט גרנר" (Garner & Felfoldy, 1970). על פי התיאוריה של גרנר, ניתן לחלק את הממדים של אובייקטים חיצוניים (כגון חפצים) ופנימיים (כגון רגשות) לממדים נפרדים וממדים "מלוכדים". כאשר הממדים הם נפרדים, בני אדם מסוגלים להפנות את קשבם לעבר כל אחד מהאובייקטים בנפרד. למשל, בניסויים של גרנר נמצא כי בני אדם יכולים לתפוס בנפרד צורה וצבע של אובייקט מסוים. לעומת זאת, כאשר האובייקטים מתאפיינים בממדים מלוכדים, בני אדם אינם מסוגלים להפריד ביניהם בתפיסה, אלא הם תופסים אותם כדבר אחד שלם. כך למשל, ממדים של גוון ובהירות אינם נתנים להפרדה (Garner & Felfoldy, 1970). באופן דומה לאובייקטים חיצוניים אשר דורשים תפיסה של ממדים שונים כגון צורה וצבע, צפייה בתוכן ויזואלי אשר מלווה בתוכן אידיטורי דורש אינטגרציה של מידע ונשאלת השאלה האם מידע זה יכול להיתפס בנפרד או רק ביחד?
ההשערה במחקר הנוכחי היא כי בדומה לתפיסה של אובייקטים בעלי ממדים "מלוכדים", התפיסה של תוכן רגשי אודיטורי וויזואלי היא "מלוכדת" – כלומר, בני אדם אינם מסוגלים לתפוס בנפרד את הרגש של הסרטון ואת הרגש של המוזיקה אלא רק כ"שלם" אחד. כתוצאה מתפיסה מלוכדת זו, ניתן לצפות כי הרגש השלם יהיה חזק יותר, מכיוון שהוא מורכב משני מקורות רגש המתלכדים לאחד.