Frage:
Visualisieren Sie die Beziehungen zwischen Film und Schauspieler
Dachande663
2011-04-01 16:54:19 UTC
view on stackexchange narkive permalink

Zunächst einmal bin ich Programmierer, aber meine Erfahrung mit echten Statistiken endete auf A-Level. Ich bitte Sie alle um Hilfe bei einem kleinen Nebenprojekt, an dem ich herumgebastelt habe.

Zu Hause verwende ich Plex Media Center, um alle meine Filme anzuzeigen. Ich habe dafür ein Export-Tool erstellt, um eine HTML-Datei mit Informationen zu Ihrer Bibliothek zu generieren, damit andere sie online anzeigen können. Nachdem ich dieses Tool erstellt hatte, wurde mir klar, dass ich jetzt Zugriff auf eine Fülle von Daten über Filme und die Schauspieler in ihnen hatte. Und hier kommen Sie (und Mädels) hoffentlich ins Spiel.

Ich möchte die Beziehungen zwischen Schauspielern und Filmen irgendwie visualisieren. Anfangs habe ich nur eine Knotendiagrammbibliothek verwendet, um alle Schauspieler, die in mehr als einem Film mitgewirkt haben, allen ihren Filmen zuzuordnen. Am Ende war dies: http://www.flickr.com/photos/dachande663/5574979625/ [Abschnitt eines 5000x2500px-Bildes]

Das Problem ist, dass bei mehr als 250 Filmen nur ein Durcheinander von Spaghetti entsteht, dem man nicht folgen kann. Ich habe mich mit Bogendiagrammen befasst, denke aber, dass dies nur noch verwirrender wäre.

Meine Frage lautet daher: Wie visualisiere ich das? Die Größe ist kein allzu großes Problem, da ich dies gerne auf einer großen Leinwand ausdrucken und tatsächlich aufhängen würde. Außerdem werde ich den Text eventuell durch Bilder der jeweiligen Filme und Schauspieler ersetzen. Ich versuche zu vermeiden, dass sich überall eine Million Zeilen schlängeln. Ich habe versucht, die wichtigsten Filme zu finden und sie zentraler zu platzieren, aber im Moment ist das mehr Rätselraten als die eigentliche Logik.

Gibt es Bibliotheken, die dies besser oder sogar besser machen können? Art der Anzeige der Daten (Löschen von Akteuren als Knoten und Hinzufügen dieser als Kantenbeschriftungen)? Ich verwende derzeit ein Dracula-Diagramm, das einen guten Startpunkt bietet, sich aber nach Bedarf ändern kann.

Jede Eingabe wird sehr geschätzt. Prost.

Bei selbst mittelgroßen Diagrammen sagt Ihnen eine Kanten-Scheitelpunkt-Diagrammvisualisierung viel mehr über den Layoutalgorithmus als über die Daten selbst.
@cardinal Das gilt für allgemeine Diagramme, aber dies ist ein besonderer Typ: Es ist zweiteilig. Dies ermöglicht einige potenziell effektive und aufschlussreiche Layouts.
@whuber, Ich stimme zu, dass es hilfreich ist, dass dieses Diagramm zweiteilig ist. Andererseits habe ich selbst bei der relativ geringen Größe, die das OP in Betracht zieht, keine überzeugenden Grafikvisualisierungen für sie gesehen. Wenn Sie Dinge aus einem modernen Datensatz mit Millionen (oder Hunderten von Millionen) Eckpunkten in jedem Teil auf ein zweigeteiltes Diagramm bringen, gehen solche Methoden wirklich aus dem Fenster, denke ich. Ich bin jedoch bereit, mich als falsch zu erweisen.
Vier antworten:
#1
+6
cardinal
2011-04-01 18:58:06 UTC
view on stackexchange narkive permalink

NB : Dies war zuvor ein (langer) Kommentar, den ich in eine Antwort konvertiert habe. Hoffentlich kann ich in ein oder zwei Tagen ein Beispiel für das veröffentlichen, was ich unten beschreibe.

Warum nicht so etwas wie eine Heatmap ausprobieren? Haben Sie Filme als Zeilen und Schauspieler als Spalten. Sortieren Sie jeden von ihnen nach der Anzahl der Schauspieler im Film und der Anzahl der Filme, in denen jeder Schauspieler war. Färben Sie dann jede Zelle aus, in der eine Übereinstimmung vorliegt. Dies ist im Grunde eine Visualisierung der Adjazenzmatrix . Die vorgeschlagene Sortierung sollte einige interessante Muster ergeben, und die richtige Verwendung von Farben könnte sie sowohl künstlerisch als auch informativer machen. Möglicherweise Farbe nach Filmtyp oder Netflix-Bewertung oder Verhältnis von männlichen zu weiblichen Schauspielern (oder Zuschauern!) Usw.

Sehr interessante Idee, ich nehme an, Sie meinen etwas Ähnliches wie http://en.wikipedia.org/wiki/James_Cameron#Casting? Meine einzige Sorge ist, ein Spaltenraster von 1000 x 2500 zu haben, aber für eine Teilmenge könnte es definitiv funktionieren. Danke für den Vorschlag!
Die Idee ist ähnlich, obwohl ich denke, dass Sie die Visualisierung viel schöner machen könnten. Es sieht so aus, als ob die Reihenfolge chronologisch ist, was auch einige interessante Merkmale hervorhebt.
Die Bestellung nach Erscheinungsjahr und Schauspieler DOB könnte einen schönen visuellen Zeitleistenfluss liefern. Danke noch einmal :)
Ich denke, es wäre schwierig, diese Visualisierung * mehr * Platz in Anspruch zu nehmen als beispielsweise jede (lesbare) Kanten-Scheitelpunkt-Graph-Visualisierung. Vergleichsweise scheint eine Heatmap recht kompakt zu sein.
#2
+5
Seb
2011-05-04 18:50:39 UTC
view on stackexchange narkive permalink

checkout Gephi, diese Software verfügt über einige sehr gute Layout-Algorithmen, um das Spaghetti-Problem zu lösen: http://gephi.org/features/

Probieren Sie insbesondere das ForceAtlas-Layout aus : http://forum.gephi.org/viewtopic.php?f=26&t=926 Mit der Software können Sie die Parameter in Echtzeit steuern und die Knoten manuell verschieben.

(Disclamer: Ich bin Teil dieser Community)

Ich stimme zu, das sieht nach einem großartigen Werkzeug aus. Ich habe es mit einem Lesezeichen versehen, wenn ich nach Hause komme.
#3
+3
GaBorgulya
2011-04-01 17:10:44 UTC
view on stackexchange narkive permalink

Graphviz kann das Layout optimieren, siehe hier.

Ich habe mit Graphviz einen kurzen Versuch mit dem von Ihnen vorgeschlagenen Beispiel gemacht und es funktioniert perfekt, abgesehen von einem kleinen Problem. Es ist derzeit sehr kurz und breit, da es die Filme auf die Schauspieler legt und nicht verbreitet. Gibt es überhaupt eine Möglichkeit, Graphviz dazu zu bringen, eine quadratischere Anordnung zu erstellen? Prost auf die Empfehlung!
Das von Ihnen verwendete graphviz-Tool macht einen Unterschied. Graphvizs sfdp oder twopi könnten eine gute Wahl sein. Sie können auch die Positionen einiger Knoten angeben oder überschreiben, wenn Sie in die Punktdatei eintauchen.
#4
+1
osknows
2011-04-01 19:30:19 UTC
view on stackexchange narkive permalink

Ich würde nicht wissen, wie Sie dies konstruieren würden, aber mir hat die Methode mit hyperbolischer Geometrie gefallen.

http://www.newscientist.com/data/images/ns/ cms / dn19420 / dn19420-1_800.jpg

http://www.newscientist.com/article/dn19420-escherlike-internet-map-could-speed-online-traffic .html

Schauspieler am inneren Ring und Filme am äußeren vielleicht? Könnte eine interessante Mischung sein, Prost.
Ich denke, Schauspieler in der Mitte und Filme außerhalb sind logischer. Ich bin froh, dass du Film und nicht Film sagst :) Filme könnten entweder chronologisch oder nach Bruttogewinn / Budget geordnet sein. Möglicherweise Schauspieler in den meisten Filmen (gut verbunden) näher am Zentrum, aber es gibt verschiedene Möglichkeiten, verschiedene Versionen zu präsentieren, die Schauspieler mit Regisseuren usw. verbinden. Theoretisch könnte man die Länder nach außen lassen und die Filmindustrie nach Ländern vertreten, aber ich vermute mehr als 2 Abmessungen werden dann benötigt?


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 2.0-Lizenz, unter der er vertrieben wird.
Loading...