LastFMAnalysis

Diplomarbeit

Bearbeitet von: Jennifer Büttgen

Betreuer: Dominikus Baur

Aufgabenstellung

Die Klassifizierung von Musikhörern ist eine beliebte Beschäftigung von Psychologen und Soziologen. Gefundene Typen beziehen sich dabei meist auf Hintergrundwissen (z.B. Adorno "Typen musikalischen Verhaltens") oder Einkaufsverhalten (z.B. Musicload Studie). Ein anderer Aspekt der oft außen vor bleibt ist die Reihenfolge von Liedern: Hört die Person lieber komplette Alben oder schaltet einfach nur Shuffle ein? Baut sie gar komplette Playlisten? Oder packt sie nur ihr aktuelles Lieblingslied in die Playlist und hört es bis zum Erbrechen? Last.FM bietet zu genau diesem Aspekt sehr detaillierte Daten für Millionen von Menschen. In dieser Arbeit soll untersucht werden, ob es tatsächlich eine Reihe von Hörertypen bezogen auf Musiksequenzen gibt und wie diese aussehen.

Konkrete Aufgaben

  • Erstellung einer Literaturliste von verwandten/relevanten wissenschaftlichen Arbeiten (auch aus der Musikpsychologie)
  • Erstellung einer ausführlichen Dokumentation im Medieninformatik-Wiki
  • Erstellung eines repräsentativen Datensets (z.B. aus Last.FM)
  • Finden von relevanten Hypothesen und Bestätigung/Widerlegung derselben basierend auf den Daten
  • Erstellung einer mindestens 80-seitigen Ausarbeitung, die den Hintergrund, die Implementierung und die Ergebnisse beschreibt und sich an diese Vorgaben (http://www.medien.ifi.lmu.de/lehre/arbeiten/richtlinien.xhtml) hält
  • Halten je eines Zwischen- und Abschlußvortrags im Oberseminar

Zeitplan

Beginn: 22.2.2010 (1.3.2010)

Monat 1:

  • Literaturrecherche
  • Einarbeiten in die Last.FM-API
  • Erstellung des Datensets

Monat 2:

  • Erstellen der Liste der Attribute + Berechnungen
  • Implementierung der Algorithmen
  • Erste Analyse der berechneten Attribute (Korrelationen und PCA)

Monat 3:

  • 5.000-User Grenze erreicht
  • Auswertung der PCA aus User-Sicht
  • Vorbereitung der Analyse aus Lieder-Sicht (Attribute & Berechnungen)

Monat 4:

  • Erste Statistiken aus dem Dataset
  • PCA aus Lied-Sicht
  • Antrittsvortrag

Monat 5:

  • PCA aus Session-Sicht
  • PCA aus User-Sicht nochmal neu nachrechnen
  • PCA aus User-SIcht in drei Subgroups aufteilen
  • Vergleich der Listening Histories (Countries/ Age / Gender)

Monat 6:

  • Schreiben der Ausarbeitung

Gliederung

  1. Introduction
  2. Related Work
    1. What communication theorists state about media consumption
      1. Uses and Gratifications Approach (incl. escapism)
      2. Mood management theory
      3. Opinion leaders and the diffusion of innovations
    2. What Psychologists found out about the uses of music
      1. The role of music in one's everyday life
      2. Music preferences and personality
      3. Emotional effects of music
    3. How HCI researchers apply these findings
      1. Music Information Retrieval and Music Organisation
      2. Shuffling and Skipping Behaviour
      3. How genres can be defined
      4. Cross-cultural similarities and differences of music
  3. The Dataset
    1. Last.fm internet radio (short introduction)
    2. Method
      1. Last.fm API
      2. Algorithm
      3. Limitations/Decisions
    3. The final dataset
      1. Description / outline of the dataset
      2. Shortcomings / weaknesses of the data
      3. Representativeness of the dataset
  4. Analysis from the view of the individual user
    1. Attribute selection and preprocessing
    2. Principal component analyses
      1. Subgroup1: users who provided demographic information
      2. Subgroup2: users who are active users for at least one year
      3. Subgroup3: long-term users
  5. Analysis from the view of the songs
    1. Attributes
    2. Principal component analysis
    3. Preliminary findings
  6. Analysis from the view of sessions
    1. Attributes
    2. Principal component analysis
    3. Preliminary findings
  7. Demographic comparison of daily listening activity
    1. Countries
    2. Age
    3. Gender
  8. Conclusion / Discussion / Outloik / Future Work

Datenset

  • Entscheidung: Abschneiden der Listening Histories oberhalb von 25.000 Tracks (10.000 Tracks).

(a) Analyse aus User-Sicht

Attribute / Variablen
Attribute direkt aus DB

  • Demographic information
    • gender (categorical)
    • genderAvalaible (binary)
    • age
    • ageAvailable (binary)
    • country
    • countryAvailable (binary: country-Angabe ja/nein)
  • User activities on Last.fm
    • Subscriber (binary)
    • Registered / time of activity
      • berechnet aus Register-Datum bis heute bis zum letzten gespielten Song in der History
    • Playcount
    • Playlists
    • Friends
    • Shouts
    • ==> bis auf "subscriber" alle normalisiert mittels: (wert_i - wert_min) / (wert_max - wert_min)

Berechnete Attribute

(alle Werte normalisiert (wie oben), außer berechneter Wert ist bereits in [0,1])

  • General listening habits
    • Tracks per day
      • #playcount / #Tage seit Registrierung.
    • Length of a song
      • average der duration der songs in user's history (ausgenommen Werte <=0 oder NULL).
    • Length of a session (songs per session)
      • Definition Session: Eine Session dann wenn User eine Stunde lang (oder länger) nichts gehört hat.
      • playcount / #sessions
      • außerdem: letzte Session wird nicht mehr mitgezählt, da evtl. "abgeschnittene" Session
    • Length of a session (actual duration)
      • Session wie oben
      • total duration aller gehörter tracks / #sessions
      • hier: falls duration eines tracks NULL oder <=0 --> nehme average-Wert des Users (="Length of a song"), sonst würde Länge einer Session zu sehr verfälscht werden.
      • außerdem: letzte Session wird nicht mehr mitgezählt, da evtl. "abgeschnittene" Session
    • distinct songs
      • beschreibt wie divers die History des Users ist, bezogen auf die Anzahl unterschiedlicher Lieder
      • #distinct songs / #playcount
    • distinct albums
    • distinct artists

  • Order and shuffle
    • In-order listening of albums’ songs
      • Skips spielen hier keine Rolle, auch nicht ob das Album ganz oder nur zum Teil gehört wurde
      • nur Alben, bei denen Tracknummern vorhanden, können in Betracht gezogen werden.
      • bei jedem Song in History prüfen ob
        • (mind. ein) nächster Song vom gleichen Album und
        • ob Tracknr. vorhanden, und
        • innerhalb einer Session
      • falls ja:
        • zähle ein "album-listening-event" hoch, und
        • prüfe ob Tracknummern in aufsteigender Reihenfolge (Lücken/Skips egal).
          • falls ja: zähle ein "in-order-listening-event". Sonst tue nichts.
      • fahre fort mit nächstem gehörten Album in History. (nicht einfach nächstem Song!)
      • zum Schluss: #in-order-listening-events / #album-listening-events
    • In-order listening of artists’ albums
      • Skips spielen hier keine Rolle, auch nicht ob die Alben ganz oder nur zum Teil gehört wurden
      • nur Alben, bei denen Tracknummern vorhanden, können in Betracht gezogen werden.
      • wenn in User's History mind. 2 Songs eines Albums in aufsteigender Reihenfolge der Tracknr. gehört wurden (siehe vorheriges Attribut):
        • zähle ein "artist-listening-event" hoch, und
        • prüfe, ob das nächste Album vom gleichen Artist und mit aufsteigendem Releasedate.
          • falls ja: zähle auch ein "in-order"-event hoch.
      • fahre fort mit nächstem gehörten Album
      • zum Schluss: #in-order-events / #artist-listening-events
    • Listening to complete albums (and in order)
      • hier werden Skips und Vollständigkeit berücksichtigt
      • nur Alben, bei denen Tracknummern vorhanden, können in Betracht gezogen werden.
      • bei jedem Song prüfen ob mind. nächster Song auf selbem Album und innerhalb einer Session
      • falls ja:
        • zähle ein "album-listening" event
        • falls dann noch Tracknummern in aufsteigender Reihenfolge und vom ersten bis letzten Titel: zähle ein "complete-album" event
      • zum Schluss: #complete albums / #album-listening events
    • Skipping songs
      • beschreibt in welchem Ausmaß Lieder innerhalb in-order-Sequenzen (innerhalb Alben, msiehe oben) übersprungen werden
      • funktioniert nur bei Liedern/Alben mit bekannten Tracknummern
      • immer drei aufeinanderfolgende Lieder müssen betrachtet werden um Skips eindeutig identifizieren zu können.
      • bei jedem Song aus History wird überprüft ob die nächsten zwei Lieder die folgenden Bedingungen erfüllen:
        • alle drei Lieder müssen vom selben Album sein;
        • mit aufsteigenden Tracknummern (aber nicht notwendigerweise direkt aufeinanderfolgend);
        • alle drei wurden innerhalb einer Session gehört.
      • falls alle 3 Bedingungen erfüllt:
        • Lied3 - Lied1 - 2 = #Skips
        • nehme übernächstes Lied (Lied an Stelle 3) als nächste Song und betrachte die nächsten drei etc...
      • sonst tue nichts, und nehme nächstes Lied (Lied an Stelle 2) und betrachte die nächsten drei etc...
      • zum Schluss: #skips / #testsequences
    • Shuffling albums
      • (nur Alben mit bekannten track numbers)
      • suchen nach Sequenzen, bei denen (innerhalb einer Session) mind. 3 Songs des selben Albums hintereinander gehört wurden --> zähle eine "album-sequence"
      • wenn Track numbers in aufsteigender Reihenfolge, mit weniger als 2 Skips pro 3-song-sequence, wird angenommen, dass ein gewisses "geordnetes Hören" vorliegt.
      • wenn nicht, dann Annahme, dass innerhalb des Albums geshuffelt wurde --> zähle ein “album-shuffled”-event.
      • zum Schluss: #album sequences shuffled / #album sequences gesamt
    • Shuffling artists
      • suchen nach Sequenzen, bei denen (innerhalb einer Session) mind. 3 (???) Songs hintereinander vom selben Künstler und von mind. 2 versch. Alben --> zähle eine "artist-sequence"
      • wenn Alben durcheinander gehört wurden, dann Annahme, dass innerhalb des Artists geshuffelt wurde --> zähle ein “artist-shuffled”-event.
      • zum Schluss: #artist sequences shuffled / #artist sequences gesamt
    • Song permanence (Repeating songs)
      • beschreibt wie häufig Songs wiederholt werden (relativ)
      • bei jedem Song aus History wird überprüft, ob nächster Song der gleiche --> "song repeat"
      • #song repeats / #playcount
    • Album permanence
      • beschreibt wie häufig Songs vom selben Album hintereinander gehört werden.
      • bei jedem Song der History wird überprüft, ob der folgende Song vom selben Album stammt
      • #songs of same album sequences / #playcount
    • Artist permanence
      • beschreibt wie häufig Songs vom selben Artist hintereinander gehört werden.
      • bei jedem Song der History wird überprüft, ob der folgende Song vom selben Artist stammt
      • #songs of same artist sequences / #playcount
    • Intro-songs
      • beschreibt ob es Lieder gibt, die ein User häufiger am Anfang einer Session hört
      • Nach jeder Pause von mind. 1 Stunde (Definition einer Session), merke den ersten Song.
      • Zähle nur die Songs, die mind. 2 mal als Introsong vorkommen ("repeated intro-songs")
      • Dann: #repeated intro-songs / #sessions

  • Time-based attributes
    • monatl. Anteil an Gesamt-Playcount* --> 12 Attribute, + Max und Min-Attribut
      • Bedingung: nur bei Usern ermittelbar, die mind. 1 Jahr dabei
      • dabei immer nur für ganze Jahre berechnen, (d.h. die letzten Monate ggf. weglassen)
      • falls keine country-Angabe nehme UTC+0, da Schwankungen von max. 12 Stunden zw. Monaten vernachlässigbar
      • Playcount pro Monat / Playcount gesamt
    • Anteil der einzelnen Wochentage am Gesamt-Playcount* --> 7 Attribute, + Max und Min-Attribut
      • falls keine country-Angabe nehme UTC+0, da Schwankungen von max. 12 Stunden zw. Wochen noch vernachlässigbar
      • Playcount pro Wochentag / Playcount gesamt
    • stündlicher Anteil am Gesamt-Playcount* --> 24 Attribute (vielleicht auch zusammenfassbar in z.B. 3-4-Stunden-Sequenzen), + Max und Min-Attribut
      • das gleiche wie oben nur mit 24 Stunden;
      • User ohne Country-Angabe: NULL
    • Seasonal-dependent genre preferences
      • sind eigtl. insgesamt 4 Attribute, die aussagen, inwieweit sich die Genres des Users von Jahreszeit zu Jahreszeit unterscheiden:
        • Distance(Spring-Summer)
        • Distance(Summer-Autumn)
        • Distance(Autumn-Winter)
        • Distance(Winter-Spring)
      • Vorbedingung: Die Genres sind jeweils die Top-Tags der Lieder, wenn nicht gegeben des Albums, dann des Artists. Folgende Genre-Tags werden nicht berücksichtigt da keine richtigen "Genres": ‘seen live’, ‘awesome’, ‘favorite’, ‘favorites’, ‘favourite’, ‘favourites’. (kommen wohl noch welche dazu...)
      • Anhand der timestamps werden jeweils die Top 100 25 Genres für jede Season erstellt.
      • Die Distanzen werden jeweils berechnet anhand:
        • Vergleich der Top 100 25 Listen (z.B. Spring vs. Summer).
        • Pro Genre:
          • Wenn Genre xy in season A nicht in season B --> Distanz für dieses genre = 1 (max. Distanz).
          • Wenn Genre xy in season A auch in season B --> Distanz = Anzahl der moves geteilt durch 25.
        • Dann die Einzeldistanzen der einzelnen Genres summieren, und die Gesamtdistanz nochmal durch 25 teilen.
      • Beispiel: Spring=[rock, pop, classic, whatever] und Summer=[pop, rock, alternative, whatever]
          • Distanz(Spring-Summer) = (1/4 + 1/4 + 1 + 0/4) / 4 = 0,375
      • genau "0" würde bedeuten, die gehörten genres sind genau gleich (auch die Platzierungen)
      • genau "1" würde bedeuten, keines der Genres ist gleich. Der User hätte komplett andere Genres gehört.
    • Daytime-dependent genre preferences
      • Definition Daytaime und Nighttime:
        • Daytime = 6:00h to 18:00h (bzw. 17:59h);
        • Nighttime = 18:00h to 6:00h.
      • Distanz(Day-Night) wird dann wie obenb berechnet, allerdings nur mit den Top 20 Genres.
      • User ohne Country-Angabe: Attribut = NULL
    • playcount-balance year
      • berechnet anhand der Standardabweichung.
      • berechneter Wert entspricht quasi dem Variationskoeffizienten (=relative Standardabweichung = Standardabweichung geteilt durch Mittelwert)
      • nur berechenbar für User, die mind. 1 Jahr aktiv und berechnet wird immer für ganze Jahre
      • falls keine country-Angabe UTC+0 als Timezone angenommen
    • playcount-balance week
      • wie oben, aber User müssen nicht ein ganzes Jahr dabei sein und Berechnung jeweils für ganze Wochen
    • playcount-balance day
      • wie oben, aber User müssen nicht ein ganzes Jahr dabei sein und Berechnung jeweils auf 24h-Grenzen
    • Seasonal-dependent balance of artist preference
      • ähnlich zu genre-preferences nur mit artists, und keine Beschränkung auf Top xx
      • Ermitteln, welcher Artist zu welcher Jahreszeit gehört wurde --> jeweils eine Liste pro Season mit den gehörten Artists.
      • Vergleichen der Listen untereinander:
        • Für jeden Artist zählen wie oft Artist in den anderen 3 Seasons auftaucht.
        • also 0 mal --> nur in einer Season gehört ... 3 mal --> in allen 4 Seasons, also ganzjährig gehört
        • Wert für die entsprechende Season teilen durch 3 (für 3 Vergleiche) und teilen durch Anzahl Artists
      • Zum Schluss die 4 Werte der Seasons addieren und durch 4 teilen (Mittelwert bilden)
    • Daytime-dependent balance of artist preference
      • wie oben nur mit Tageszeiten: Day vs. Night. Also mit nur 2 Listen für Vergleich...
    • genre-loyalty (long-term)
      • Voraussetzung: User muss mind. 2 Jahre dabei sein, sonst "long-term" nicht ermittelbar
      • berechnet wieder auf ganze-Jahres-Grenzen
      • Erstellen jeweils einer Liste pro Jahr mit allen gehörten Genres in dem Jahr
      • Vergleich jeweils letztes Jahr mit folgendem Jahr (daher auch mind. 2 Jahre aktiv notwendig)
        • Anzahl der Genres aus letztem Jahr, die auch im folgenden Jahr vorhanden sind "geteilt durch" Anzahl Genres gesamt in Liste vom letzten Jahr
    • artist-loyalty (long-term)
      • wie genre-loyality nur mit artists

  • Using Last.fm’s features
    • Online radio listening
      • Zähle Anzahl der Sequenzen in History, bei denen innerhalb einer Session mind. 10 Songs hintereinander "streamable" sind
      • Gesamtzahl solcher "streamed Songs" / playcount
    • [Community users] (wird erst nach PCA eingebaut)
      • --> Behauptung: User erfahren Last.fm dann als eine Community, wenn eine Funktion aus Anzahl Freunde und Anzahl Shouts ein vorgegebenes Limit überschreitet, z.B.:
      • "communityUse"=
        • 1, wenn (#friends + 1/4*#shouts > limit) (erst mal nur als Beispiel)
        • 0, sonst.

  • Special listening habits / events
    • One-time songs
      • falls ein song kein zweites Mal in der History auftaucht: One-time song
      • one-time songs / #playcount
    • Artist discovery
      • beschreibt ob User nach längerem Hören eines Albums später auch ältere Alben des Künstlers hören.
      • Bei jedem neuen Artist in User's History wird geprüft, ob es ältere Alben des Artists gibt
        • falls nicht ignorieren, da ein "artist discovery" nicht möglich.
        • sonst: falls eines dieser früheren Alben in User's History: "artist discovery"-event
      • #artist-discoveries / #artists in history mit älteren Alben

Neue Definition/Berechnung für genre-dependent und artist-dependent preferences:

    • Unique Genres ...
      • seasonal (4 Variablen)
      • halbjährlich (2 Variablen)
      • day vs. night (2 Variablen)

    • Unique artists ...
      • seasonal (4 Variablen)
      • halbjährlich (2 Variablen)
      • day vs. night (2 Variablen)

    • --> Berechnung jeweils:
      • alle genres/artists der einzelnen Seasons/ Halbjahre/ Halbe Tage in einer Liste speichern
      • dann schauen wieviel % der genres/artists der aktuellen Liste NICHT in den anderen drei Listen (seasonal) / der anderen Liste (Halbjahr/Tag) sind
      • = "Unique genres / artists"
      • (Prozentsatz z.B. oftmals höher für Winter)


Rausgeschmissene Attribute:
  • users who listen to songs from artists of their home country more often
    • --> zu wenig Angaben (nur ~16-17% der User im dataset geben country an!)
    • --> weder last.fm, noch musicbrainz haben Artist-Herkunft in ihrer Datenbank
  • Propagation of (new) songs/albums through the contacts of a user. Identify "early adopters" and "opinion leaders"?
    • --> keine Netzwerke in Datenbank
  • Rapid changes of artists / many new artists at once when user was at a concert/festival
    • --> schwer allumfassend Daten über solche Events zu bekommen
  • Can we find out when a user was sitting in front of his computer?
    • --> don't think so...
  • Are there "personal Evergreens" die nicht den alt bekannten / believed Evergreens entsprechen?
    • --> kA wie das messbar wäre...
  • Skipping forward within a song (listening to certain regions/parts of a song)
    • --> Tracks werden erst nach 30 Sekunden gescrobbelt. Skips können erst ab 30 Sekunden hören berechnet werden, wenn überhaupt zuverlässich
  • Sources? Where do the songs come from? Active choice? Last.fm radio?
    • --> schwer herausfindbar wie/worüber Musik gehört wurde
  • Accuracy of logging: How precise are users? Are songs added later by hand? Mobile devices?
    • --> darüber keine Daten
  • Genre-Treue
    • --> Schwierig, da User unterschiedlich lange dabei & zu wenig long-term Daten vorhanden
  • "Over Exposure" z.B. durch charts oder TV commercials
    • Umfasst einfach zu viele Aspekte. Um das richtig zu messen könnte man schon fast eine eigene Studie anfertigen, wenn man es richtig machen will. So halbscharig wird das wohl als eigenes Attribut nicht viel bringen...

PCA und erste Ergebnisse (user-view)

  • Entscheidung: PCA wird drei mal durchgeführt, jeweils auf Subgroups, mit teils unterschiedlichen Variablen.

(b) Analyse aus Lied-Sicht

Attribute
  • General data
    • Listeners = total amount of users in database who listened to this song
    • Listeners percentage = percentage of total users in database who listened to this song
    • total plays = total number of times the song was played in histories (User-unabhängig)
  • Probability of listening to song concerning time
    • prob_morning = Wahrscheinlichkeit, dass Song morgens gehört wird (=Prozentsatz)
    • prob_weekend = Wahrscheinlichkeit, dass Song am Wochenende gehört wird (=Prozentsatz)
    • prob_halfyear = Wahrscheinlichkeit, dass Song in den ersten 6 Monaten gehört wird (=Prozentsatz)
    • --> alles anhand UTC-Zeit berechnet
  • Probability of song followers
    • prob_sameSng = Wahrscheinlichkeit, dass auf Song das gleiche Lied nochmal folgt / wiederholt wird
    • prob_sameAlb = Wahrscheinlichkeit, dass auf Song ein Lied aus dem gleichen Album folgt
    • prob_sameArt = Wahrscheinlichkeit, dass auf Song ein Lied des gleichen Künstlers folgt
    • prob_sameGnr = Wahrscheinlichkeit, dass auf Song ein Lied des gleichen Genres folgt
    • prob_break = Wahrscheinlichkeit, dass auf Song eine Pause folgt / Session zu Ende ist
    • prob_stream = Wahrscheinlichkeit, dass auf Song ein Lied folgt, dass auf Last.fm streamable ist
  • Top 3 following songs and probability
    • topfollow_sng1 = ID des Lieds, das am meisten auf Song folgt
    • prob_sng1 = Prozentsatz , wie oft das Lied auf Song folgt
    • topfollow_sng2
    • prob_sng2
    • topfollow_sng3
    • prob_sng3

PCA und erste Ergebnisse (track-view)

(b) Analyse aus Session-Sicht

Attribute
  • General data
    • Number of songs
    • Length of session (in seconds)
    • Length of break after session (until next session, in seconds)
  • Session listener info
    • country
    • age
    • gender
    • subscriber
  • Session music patterns
    • Percentage of streamable songs
    • Percentage of Distinct songs
    • Percentage of Distinct albums
    • Percentage of Distinct artists
    • Percentage of Repeats of songs
    • Percentage of Repeats of albums
    • Percentage of Repeats of artists
    • Percentage of tracks listened to by ascending tracknumbers (of same album)
  • Session occurrence in time
    • morning (binary): 1 if session began in the morning hours between 1:00AM and 1:00PM
    • weekend (binary): 1 if session began on a Saturday or Sunday
    • halfyear (binary): 1 if session began between January and June

PCA und erste Ergebnisse (session-view)

Demographic comparison of daily listening activity

Literatur

Vorgegeben:

Data sets:

Playlists:

Music in everyday life (psychology):

Music in everyday life (HCI):

Clustering:

-- DominikusBaur - 22 Feb 2010

Eigene Recherche:

Some background information about last.fm:

Psychology & Music Perception:

  • Krumhansl: Music: A link between cognition and emotion
  • Cross: Musicality and the human capacity for culture
    • http://www.mus.cam.ac.uk/~ic108/PDF/IRMC_MS07_2.pdf
    • Interpretation und Bedeutungszuweisung von Musik über verschiedene Kulturen hinweg; sehr ausfürhlich und mit netten Beispielen für unterschiedliche Wirkungen von Musik; gute Quelle für Related Work
  • Rentfrow: The Do Re Mi’s of Everyday Life: The Structure and Personality Correlates of Music Preferences
  • Schwartz (2003): Music Preferences, Personality Style, and Developmental Issues of Adolescents
    • http://www.familywise.ca/documents/MusicPreferencesPersonalityStyle.pdf
    • Studie mit Schülern zwischen 12–19 Jahren über den Zusammenhang von Musikpräferenzen und Persönlichkeit; sehr psychologisch und stereotypisierend; bezieht sich überwiegend auf sehr alte Quellen! (80er/90er); evtl. trotzdem für Erklärungen des Datasets nutzbar, falls Genres mehr in den Vorderhrund geraten sollten
  • Stålhammar, B. (2003). Music–Their Lives: The experience of music and view of music of a number of Swedish and English young people.
  • Grewe: Listening to music as a re-creative process: Physiological, psychological, and psychoacoustical correlates of chills and strong emotions
  • Koelsch: Towards a neural basis of music perception
  • North: Lifestyle Correlates of Musical Preference
    • große 3-teilige Studie über den Zusammenhang von Musikgeschmack und Lifestyle. Geht für die DA vielleicht schon ein bisserl zu weit;

Human Computer Interaction:

  • Leong: Choice: Abdicating or exercising (CHI)
  • Kallinen: The Effects of Background Music on Using a Pocket Computer in a Cafeteria: Immersion, Emotional Responses, and Social Richness of Medium:
  • Vignoli F. Digital music interaction concepts: a user study
  • Baccigalupo: Uncovering Affinity Of Artists To Multiple Genres From Social Behaviour Data
  • Baumann: Towards A Socio-Cultural Compatibility Of Mir Systems
    • http://ismir2009.ismir.net/proceedings/PS2-1.pdf
    • Studie über Ähnlichkeitsempfinden von Musik, basierend auf Kombination aus 3 Faktoren: timbral similarity, similarity of lyrics and cultural similarity; Identifiziert 3 Usertypen (wohl weniger interessant für die DA); Legt Wert darauf keine Laborstudie zu sein, sondern ""everyday activities" zu studieren
  • Cunningham: “The Pain, The Pain”: Modelling Music Information Behavior And The Songs We Hate
    • http://ismir2005.ismir.net/proceedings/2124.pdf
    • Hintergründe über das Mögen/Nichtmögen von bestimmter Musik; bestimmte Faktoren/Effekte etc.; Evtl. nützlich als Grundlage für weitere Hypothesen und Related Work; z.B. These bzgl. "over-exposure": Kommt es vor, dass User Titel/Alben über einen gewissen Zeitraum ausgiebig hören, und ab einem bestimmten Zeitpunkt plötzlich nicht mehr? Wird dieses "Dauerhören" später vielleicht wieder aufgenommen?; Sind Lieder aus Charts und Werbung seltener unter den Liedern, die "dauergehört" werden?
  • Laplante: Everyday Life Music Information-Seeking Behaviour of Young Adults
    • http://ismir2006.ismir.net/PAPERS/ISMIR06132_Paper.pdf
    • Survey darüber wie Leute nach neuer Musik suchen; ähnlich zu: Lee & Downie, "Survey of music information needs, uses, and seeking behaviours: preliminary findings,"; evtl. verwendbar in Related Work; Result u.a.: "Internet is the most popular source, more specifically music-related websites" (unter bestimmten Bedingungen); Music Information Seeking as a Non-Goal Oriented Activity / Browsing over Searching / Eher aus Spaß als aus der Notwendigkeit heraus / Verbringen oft aus eigener Sicht sogar zu viel Zeit damit
  • Bergstra: Predicting genre labels for artists using FreeDB
  • Taheri-Panah: Music Information Retrieval systems: why do individuals use them and what are their needs?
  • McEnnis: Sociology And Music Recommendation Systems
  • Bainbridge: How People Describe Their Music Information Needs: A Grounded Theory Analysis Of Music Queries
  • Baur/Butz: Pulling Strings from a Tangle: Visualizing a Personal Music Listening History
    • gut als Überblick
  • Petersen: Modeling Emotional Context From Latent Semantics

Communication science / theories:

  • Kunczik, Michael; Zipfel, Astrid (2005): Publizistik. Ein Studienhandbuch. Köln. [Chapter V: "Wirkungsforschung"]
  • Pürer, Heinz (2003): Publizistik- und Kommunikationswissenschaft. Ein Handbuch. Konstanz.
  • Katz, Elihu; Blumler, Jay G.; Gurevitch Michael (1974): Utilization of mass communicxation by the individual. In: Blumler, Jay G.; Katz, Elihu (eds.): The uses of mass communications. Current perspectives on gratifications research. Beverly Hills, p. 19-32.
  • Zillmann, Dolf (1988): Mood management through communication choices. American Behavioral Scientist, 31 (3), p. 327-340.
  • Rogers, Everett M. (1995): Diffusion of Innovations. 4th ed., New York.
  • Ruggiero: Uses and Gratifications Theory in the 21st Century

Clustering in HCI-related fields:

  • Gargi: Modeling and Clustering of Photo Capture Streams

  • Harper: Supporting Social Recommendations with Activity-Balanced Clustering
  • Capocci: Statistical Properties of Inter-arrival Times Distribution in Social Tagging Systems
  • Celma: From hits to niches? or how popular artists can bias music recommendation and discovery
    • http://doi.acm.org/10.1145/1722149.1722154
    • Vergleich verschiedener Recommendation-Algorithmen; Fand heraus dass last.fms Recommendation-Typ eher auf allgemein populäre Künstler baut und Finden unbekannterer Künstler schwieriger macht; Trotzdem wohl eher weniger interessant für DA;
  • Bonnin: A Low-Order Markov Model integrating Long-Distance Histories for Collaborative Recommender Systems
    • http://doi.acm.org/10.1145/1502650.1502662
    • Kapitel "Related Research" gibt einen nicht sehr ausführlichen aber gut beschriebenen Überblick über Clusteringkonzelte im Zusammenhang mit sequentiellen Datenstreams. (Prediction-Ansätze für DA nicht relevant);
  • Anglade: Complex-Network Theoretic Clustering for Identifying Groups of Similar Listeners in P2P Systems

Literature about PCA:

  • Karl Pearson: On lines and planes of closest fit to a system of points in space. In: The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science. Series 6, 2, S. 559–572 (1901)
  • Smith: A tutorial on Principal Components Analysis
  • Jonathon Shlens: A Tutorial on Principal Component Analysis.
  • Kaiser, H.F. (1970) A second generation Little Jiffy. Psychometrika, 35, 401-413.
  • Backhaus, Erichson, Plinke, Weiber : Multivariate Analysemethoden: Eine anwendungsorientierte Einführung. Springer. 2006, 11. Auflage
  • Brosius, Felix: SPSS 8 Professionelle Statistik unter Windows, International Thomson Publishing, mitp Verlag, 1. Auflage, 1998.
Topic revision: r36 - 03 Aug 2010, JenniferBuettgen
 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Medieninformatik-Wiki? Send feedback