De groei van de Amerikaanse filmindustrie is nauw verweven met de bredere economische ontwikkeling van de Verenigde Staten, maar de aard van deze relatie is complex en veelzijdig. Om deze dynamiek beter te begrijpen, is het nodig om verder te kijken dan een oppervlakkige beschouwing van beide fenomenen en een diepere analyse te maken, waarbij we ook verschillende externe factoren in overweging nemen. Beleidsmaatregelen van de overheid, internationale handel, technologische vooruitgangen en culturele trends spelen allemaal een rol in hoe zowel de economie als de filmindustrie zich ontwikkelen. Een uitgebreide benadering van deze vraag zou niet alleen de groei van de filmindustrie zelf onderzoeken, maar ook de bredere context waarin deze zich bevindt.
De relatie tussen de groei van de filmindustrie en de economische ontwikkeling van de VS is niet eenvoudig te meten. Het is belangrijk om te begrijpen dat de filmindustrie niet alleen economisch is, maar ook sociaal en cultureel van aard. Het is daarom noodzakelijk om factoren zoals de veranderende voorkeuren van het publiek, technologische innovaties in filmproductie en de impact van buitenlandse markten te onderzoeken. Zo heeft de opkomst van streamingdiensten de manier waarop films worden geconsumeerd drastisch veranderd, wat weer invloed heeft op de productie en distributie van films. Dit voorbeeld benadrukt de noodzaak om het geheel te begrijpen, niet alleen de economische groei van de filmindustrie op zichzelf.
In dit opzicht kan data-analyse een waardevol hulpmiddel zijn. Door gebruik te maken van statistische technieken en de juiste tools voor datamanipulatie kunnen we trends in de filmindustrie blootleggen die niet onmiddellijk zichtbaar zijn. Tools zoals de “tidyverse” in R kunnen bijvoorbeeld helpen om datasets te verwerken en te analyseren die betrekking hebben op Amerikaanse films, van IMDb-beoordelingen tot de meest populaire genres en de relatie tussen filmgenres en economische factoren. Met behulp van dergelijke tools kan men patronen ontdekken die anders moeilijk te herkennen zouden zijn.
Wat verder onderzocht moet worden, is hoe succes in de filmindustrie in verband kan worden gebracht met veranderingen in de algemene economie. Het lijkt aannemelijk dat bepaalde genres in bepaalde economische periodes populairder zijn, afhankelijk van de culturele en economische context van dat moment. Denk bijvoorbeeld aan de opkomst van films over oorlogsvoering tijdens perioden van politieke instabiliteit, of de bloei van feel-good films in tijden van economische voorspoed. Dit soort nuances zijn essentieel om de groei van de filmindustrie in relatie tot de bredere economische context te begrijpen.
Daarnaast is het belangrijk om te begrijpen hoe filmstudio’s en producenten reageren op economische veranderingen. De filmindustrie is een markt waar risico’s vaak hoog zijn, maar waar tegelijkertijd enorme economische voordelen te behalen vallen. Het succes van een film kan grote gevolgen hebben voor de werkgelegenheid en de belastinginkomsten in verschillende staten, en beïnvloedt tevens de bredere culturele uitstraling van de VS in de wereld. Het is daarom noodzakelijk om, naast de financiële cijfers, ook de culturele impact van de filmindustrie in de analyse op te nemen.
Bij het analyseren van de gegevens kan de toepassing van geavanceerde visualisatietechnieken cruciaal zijn om patronen en verbanden duidelijker te maken. Door gebruik te maken van de kracht van “ggplot2” in R, kunnen onderzoekers visuele representaties creëren die niet alleen de trends in de filmindustrie zichtbaar maken, maar ook het verband met de economische situatie in de VS. Deze visuele hulpmiddelen helpen om de complexiteit van de data beter te begrijpen en kunnen inzicht verschaffen in de dynamiek die de filmindustrie aandrijft.
Het is niet alleen belangrijk om de cijfers te bekijken, maar ook te begrijpen waarom bepaalde trends opkomen en hoe deze trends door de tijd heen veranderen. Door zowel historische als actuele gegevens te combineren, kan men dieper inzicht krijgen in de processen die de filmindustrie aandrijven. Dit stelt ons in staat om niet alleen de invloed van de economie op de filmindustrie te begrijpen, maar ook de manieren waarop culturele verschuivingen en technologische innovaties de manier waarop films worden geproduceerd, gepromoot en geconsumeerd beïnvloeden.
Hoe schalen en thema's de visualisatie van gegevens verbeteren
In veel gevallen wil je een categorische variabele, zoals “genre”, weergeven met een andere kleur voor elke waarde. Dataframes slaan genre-waarden echter meestal op als tekst, niet als kleuren. Hier komt het concept van schalen om de hoek kijken. Schalen fungeren als vertalers tussen de gegevens die je wilt weergeven en de esthetische eigenschappen van je grafiek. Ze bieden een set regels die "ggplot2" gebruikt om specifieke visuele eigenschappen, zoals kleuren, vormen of groottes, toe te wijzen aan de waarden binnen je gegevens. Bijvoorbeeld, een schaal kan "rap" toewijzen aan de kleur blauw, "rock" aan rood en "jazz" aan groen. Deze toewijzingen zijn niet willekeurig; schalen worden ontworpen om zowel de esthetische aantrekkingskracht als de interpretatie van de grafiek te maximaliseren.
In "ggplot2" worden schalen automatisch toegepast via een reeks redelijke standaardinstellingen. Deze automatische schaaltoepassing is een groot voordeel—het stelt gebruikers in staat snel informatieve visualisaties te genereren zonder zich in te laten met de complexiteit van kleurtheorie of ontwerpkeuzes. Naarmate men meer vertrouwd raakt met de grammatica van grafieken, kan het begrijpen en benutten van schalen leiden tot verfijndere en meer gepersonaliseerde visuele resultaten. De mogelijkheid om schalen handmatig aan te passen stelt je ook in staat om de toegankelijkheid van je grafieken te waarborgen, bijvoorbeeld door kleurblinde-vriendelijke paletten te gebruiken. Hoewel de standaardinstellingen geschikt zijn voor verkennende analyses, kan een doordachte toepassing van schalen de helderheid en effectiviteit van je visuele communicatie verhogen, waardoor je gegevens niet alleen visueel aantrekkelijker worden, maar ook nauwkeurig en ethisch worden gepresenteerd.
Je kunt schalen handmatig aanpassen met behulp van schaalfuncties. Bijvoorbeeld, zoals weergegeven in Figuur 4.27, kun je de functie scale_color_brewer() of scale_fill_brewer() gebruiken, met een argument voor het palet dat je wilt gebruiken en een type dat aangeeft of je een sequentiële, differentiële of divergerende schaal wilt toepassen.
Voor elke esthetische mapping, zoals vorm en vulling, bestaat er een bijbehorende schaal. Toch wordt aanbevolen om te blijven werken met de standaard schalen die bij "ggplot2" horen of met de themas die we later zullen behandelen. Vaak denken we bij schalen vooral aan de geometrische objecten zelf, maar de x- en y-assen worden ook gecontroleerd met schalen. Bijvoorbeeld, we moeten vaak logtransformaties uitvoeren, vooral wanneer we werken met genres zoals "meditatie" waarvan we weten dat de “arousal tags” meestal erg laag zijn. Zoals te zien in Figuur 4.28, kunnen we de logaritme van de x-variabele nemen om de scheefheid aan te passen door de functie scale_x_continuous() te gebruiken met de waarde "log10" voor het trans-argument.
Omdat logtransformaties vaak worden gebruikt, zijn er sneltoetsen die hetzelfde effect bereiken, zoals scale_x_log10() en scale_y_log10():
Het is belangrijk te begrijpen dat sommige gebruikers de schaalfunctie ook gebruiken om in te zoomen op een plot, vergelijkbaar met hoe we coord_cartesian() gebruiken. Dit kan verwarrend zijn, omdat de resultaten erg op elkaar lijken. Het probleem bij het gebruik van schalen om een grafiek te beperken, is dat het de berekeningen van de gegevens buiten de opgegeven limieten verwijdert. Dit kan problematisch zijn voor bepaalde grafieken waar deze gegevens nog steeds nodig zijn voor de berekening. Gebruik in dat geval coord_cartesian() wanneer je wilt inzoomen op een plot.
Hoewel niet oorspronkelijk opgenomen in de formulering van Wickham, zijn “thema's” een veelgebruikte laag geworden in de ggplot2-framework. Deze regelen alle niet-gegevensgeoriënteerde elementen die op een grafiek verschijnen. Het is belangrijk te begrijpen dat de grammatica van grafieken, zoals geformuleerd door zowel Wilkinson als Wickham, niet is ontworpen om zich te richten op esthetische keuzes en grafiekontwerpen, maar om een algemeen kader te bieden waarmee elke grafiek kan worden gemaakt. Thema’s stellen ons in staat om substantiële wijzigingen aan te brengen in hoe onze grafieken eruitzien, zonder ons zorgen te maken over de wiskundige juistheid van de grafiek.
"ggplot2" zelf komt met een paar ingebouwde thema’s die we kunnen gebruiken door een laag toe te voegen die theme-() aanroept, zoals te zien is in Figuur 4.29. Als je merkt dat je telkens hetzelfde thema gebruikt, kan het makkelijker zijn om de functie theme_set() te gebruiken. Er zijn ook extra thema’s die je online kunt vinden, zoals het pakket “ggthemes”, dat thema’s biedt die lijken op die van populaire software, zoals Excel, en publicaties zoals The Wall Street Journal en The Economist.
Als je net begint, wordt aangeraden om vast te houden aan een van de standaardthema’s of die van "ggthemes". In de toekomst kun je thema’s aanpassen indien nodig. Het belangrijkste is echter eerst te begrijpen hoe alle onderdelen van de grammatica van grafieken werken, voordat je je bezighoudt met visuele aantrekkingskracht.

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский