Piosenka lub utwór może zainicjować popis i wtedy akcja filmu zatrzymuje się, na czas jej trwania. Tak dzieje się w Deszczowej piosence z piosenką Moses. Pretekstem do jej rozpoczęcia jest powtarzany tekst ćwiczenia. Dzieje się tak zawsze, jeżeli oglądamy występ sceniczny czy próbę (sceny operowe w Amadeuszu, koncerty zespołu Dżem w Skazanym na bluesa).
Czas trwania piosenek może być wykorzystywany do opowiadania akcji metodą teledysków. Tak się dzieje (Chopin. Pragnienie miłości, reż. J. Antczak, 2001), kiedy w czasie występu F. Liszta grającego Etiudę rewolucyjną, F. Chopin wspomina swoje życie w Polsce, a w czasie swojego pożegnalnego koncertu marzy o szczęśliwych chwilach spędzonych z G. Sand i Solange. Jest to szczególnie efektowny sposób opowiadania, jeżeli tekst utworu może skomentować pokazywaną akcję (jak często dzieje się np. w wspomnianym już filmie Skazany na bluesa, reż. J. Kidawa-Błoński). Do moich ulubionych scen należą Tap Dancing Around the Witness komentujący mowę obrońcy w sądzie i When You’re Good to Mama komentujący warunki panujące w więzieniu z filmu Chicago oraz Roxane z filmu Moulin Rouge. W tym przypadku akcja toczy się na trzech warstwach: tekstu piosenki, sytuacji pomiędzy dwójką tancerzy i sytuacji w jakiej znalazła się Satin podczas kolacji z księciem. W filmie Amadeusz scena pisania Requiem, przeplata się z powrotem żony kompozytora i jej konstrukcja wspaniale stopniuje zarówno dramaturgię filmu, jak i prezentuje powstający utwór.
Stąd już tylko krok do komedii romantycznych i melodramatów, których akcja siłą rzeczy jest prosta, a o zainteresowaniu widzów decyduje wykwintne opakowanie: bezstresowa rozrywka, oczywiście z mnóstwem muzyki. W starszych filmach za klasyka uchodzi C. Lelouch (Un homme et une femme/Kobieta i mężczyzna, 1966; Un home qui me plait/Mężczyzna, który mi się podoba, 1969), który wprowadził do filmu sceny, w których zamiast dialogu słyszymy muzykę, a wtedy każdy może wyobrazić sobie jego treść (dialogi a’la Leluch). Obecnie muzykę w wielu scenach zastępują piosenki, z reguły aktualne hity, których po kilku latach nikt nie pamięta, lub evergreeny, których popularność nie budzi wątpliwości (Tylko mnie kochaj reż. R. Zatorski 2006: Nine Milion Bicycles – K. Melua, You’re Beatutiful – J. Blunt, Dziewczyna mojego chłopaka – M.Brodka, ale także How a wonderfull World – L. Armstrong, Preatty Woman – R. Charles, czy Prowadź mnie – K. Kowalska).
Zdarza się jednak, że to właśnie za sprawą filmu piosenki stają się popularne, lub zyskują nowe życie (Pulp Fiction, reż. Q. Tarantino, 1994 – Misirlou, Lonesome Town, Son of a Preacher Man, You Never can Tell, Gir, You’ll be a Woman Soon).
Tak również się stało, kiedy do montażu scen w filmie Kiler (reż. J. Machulski, 1997) wykorzystaliśmy utwory K. Sienkiewicza z płyty Na krzywy ryj. Nasza płyta (ułożona z dialogów i piosenek wykorzystanych w filmie) po kilku miesiącach pobiła rekord sprzedaży oryginału. Trudno mówić o takich produkcjach, że są to filmy muzyczne, ale trudno zaprzeczyć, że konstrukcja wielu scen bez muzyki nie miałaby sensu. W Kilerze piosenki najczęściej pozostają w kontrapunkcie do toczącej się akcji (Ona jest pedałem i transport Kilera do innego więzienia), opowiadają równolegle niezwiązaną z filmem historię. Inny sposób to songi Kazika nadające filmowi L. Wosiewicza Rozdroże cafe (2005) charakter ballady.
Kolejna forma audiowizualna podporządkowana muzyce to teledysk. Jest to próba wizualizacji muzyki. Już w 1923 r. L. De Forest przedstawił kilka krótkich scen muzycznych i śpiewanych zapisanych systemem Phonofilm, jako dodatek do seansu filmu niemego z P. Negri. De Forest współpracował z T.W. Case i E.I. Sponable i do 1927 r. nakręcił ponad 1000 krótkich filmów dźwiękowych. Były to m.in Taniec umierającego łabędzia z Jeziora łabędziego P. Czajkowskiego i sceny muzyczne. Powstawały też wizualizacje m.in. do Tańców węgierskich J. Brahmsa (1929), Komposition in Blau (reż. O. Fischinger) i Nocy na Łysej Górze M. Musorgskiego (reż. A. Aleksiejew, 1933), a w 1935 r. pierwszy barwny film abstrakcyjny do muzyki. Takie wizualizacje powstają cały czas, ale ich ilość jest marginalna. Najczęściej są to krótkie filmy animowane. Wizualizacją są formy multimedialne i pokazy typu Światło i dźwięk i figury, automatycznie wyzwalane w programach komputerowych, jeżeli odtwarzamy muzykę. Przez wiele lat telewizja realizowała programy muzyczne właśnie taką metodą. Prezentowała wykonawcę, a obraz urozmaicała, studyjną dekoracją, lub obrazami wykorzystywanymi jako tło. Często materiały dla telewizji wykonywano techniką filmową. Tak zrealizowane są filmy Kwiaty polskie (reż. S. Mroczkowski, 1986), Ulice wielkiej kolędy (reż. Z. Dzięgiel, 1992) i Oczarowanie Fryderyka (reż. I. Cywińska, 1999).
Do tej grupy można też zaliczyć zrealizowany z polskim udziałem, film animowany Peter&the Wolf / Piotruś i wilk (reż. S. Templeton, 2006). Im bardziej współczesne teledyski tym więcej elementów abstrakcyjnych. Większy nacisk położony na atrakcyjność obrazu i często dalekie odejście od osoby wykonawcy. Jeszcze na przełomie XX i XXI w. całe programy, (MTV, VIVA itp.) nakierowane były na prezentację teledysków, co można porównać do programu prywatnych stacji radiowych nadających wyłącznie piosenki. Obecnie moda ta, przynajmniej w telewizji, już minęła.