Frage:
Studienwahl für Data Science?
user60305
2014-11-12 04:18:32 UTC
view on stackexchange narkive permalink

Ich beende gerade einen B.S. in Mathematik und möchte eine Graduiertenschule (ein Master-Abschluss für Anfänger mit der Möglichkeit einer anschließenden Promotion) mit Blick auf den Einstieg in die Datenwissenschaft besuchen. Ich interessiere mich auch besonders für maschinelles Lernen.

Welche Studienabschlüsse würden mich dahin bringen, wohin ich gehen möchte?

Gibt es einen Konsens darüber, ob ein Absolvent Ein Abschluss in angewandter Mathematik, Statistik oder Informatik würde mich in eine bessere Position bringen, um in den Bereich der Datenwissenschaft einzusteigen?

Vielen Dank für die Hilfe, dies ist eine große Wahl für mich und jede Eingabe ist sehr geschätzt. Normalerweise stelle ich meine Fragen zu Mathematics Stack Exchange, aber ich dachte, hier zu fragen würde mir eine breitere und abgerundete Perspektive geben.

Möglicherweise möchten Sie den Data Science-Stack-Austausch für dieses Q ausprobieren.
@JeremyMiles: Das ist eine großartige Idee. Ich habe mich erst kürzlich dort angemeldet, also werde ich es versuchen.
Fünf antworten:
#1
+11
Frank Harrell
2014-11-12 05:29:47 UTC
view on stackexchange narkive permalink

Wenn Sie einen MS in angewandter Statistik (gefolgt von einem Doktortitel) und einen sehr starken Computerhintergrund haben, werden Sie nichts falsch machen. Ein MS oder PhD in Biostatistik führt zu einer großartigen Job-Pipeline. Wenn Sie am Ende keine biomedizinische oder pharmazeutische Forschung mögen, qualifizieren Sie sich dennoch für ein nicht medizinisch angewandtes statistikbezogenes Gebiet.

Danke für diesen Rat.Seit Ihrer Stelle habe ich mich mehr mit Biostatistik-Abteilungen befasst. Besonders ansprechend ist das Biostatistik-Programm der Indiana University an der IUPUI (da es in Teilzeit abgeschlossen werden kann und ich während des Besuchs Berufserfahrung sammeln kann).Machen Sie viele Statistiken / Biostatistik Ph.D.Programme bieten die Möglichkeit, Teilzeit zu besuchen, oder ist dies eine relative Seltenheit?
Soweit ich weiß, ist es selten.
#2
+11
StasK
2014-11-12 10:41:25 UTC
view on stackexchange narkive permalink

Die erschreckende Realität ist, dass Statistiker nicht als Datenwissenschaftler anerkannt werden. Während Sie einen Abschluss in Statistik machen, sind Sie auf jeden Fall gut für die Datenwissenschaft gerüstet, aber Sie erhalten möglicherweise nicht so viele Möglichkeiten, wie Sie denken würden, dass der Name des Majors dies implizieren würde.

Ich habe keine Dosen Antworten für Sie (und niemand tut es ... außer Hal Varian, und Sie möchten möglicherweise direkt mit ihm sprechen - wenn Sie seine Kontaktinformationen nicht googeln können, sollten Sie keine Karriere in der Datenwissenschaft in Betracht ziehen :)). Meine zwei Cent, die Sie berücksichtigen sollten, wären:

  1. Ein Programm in Informatik mit einem Nebenfach in Statistik. Ein Computer-Abschluss an sich wird Sie meiner Meinung nach nicht gut in der Datenwissenschaft ausstatten, da Statistiker in der "Datenwissenschaft ohne Statistik" sehen, dass Datenwissenschaftler am Ende die Statistik neu erfinden. Daher ist es besser, wenn Sie es zunächst richtig lernen.
  2. Ein Professional Science Master-Programm in Analytik ( Rutgers, NC State - nicht das Ich unterstütze diese, gebe Ihnen nur Beispiele. Die -Programme des Professional Science Master kombinieren etwa 60% der Kreditstunden aus dem naturwissenschaftlichen Lehrplan mit etwa 40% aus dem betriebswirtschaftlichen Lehrplan. Ich wünschte, ich hätte die Möglichkeit, diesen Abschluss zu machen, als ich in der Graduiertenschule war. Dies setzt natürlich voraus, dass Sie es sich leisten können - Sie können zu den meisten Doktoranden gehen. Programme und erhalten volle finanzielle Unterstützung, aber Sie müssen für einen Master-Abschluss selbst bezahlen.
  3. ol>

    Durchsuchen Sie Academia.SE nach weiteren Hinweisen, wie Sie strukturieren können Ihre postgraduale Ausbildung und welche Art von Abschluss Sie vielleicht wollen oder nicht. Interessanterweise befindet sich Data Science.SE derzeit (November 2014) in einem Beta-Status und kaum eine glückliche gesunde Beta.

Warum keine Erwähnung der Wirtschaft, @stask?
Das OP fragte nach [irgendeiner Art] * Wissenschaft *.Wirtschaft ist keine * Wissenschaft * ... obwohl es definitiv ein gut bezahlter Beruf ist :)
Es scheint mir zu hart zu sagen, dass "Wirtschaft keine Wissenschaft ist".Ich stimme jedoch zu, dass einige Teile der Wirtschaft weniger wissenschaftlich sind als andere.
+1 für beide Punkte.Viele meiner Mitarbeiter haben das NC State-Programm durchlaufen.Ich würde hinzufügen, dass ein Informatiker M.S.In einem Programm, das maschinell lernintensiv ist, wäre dies ebenfalls eine gute Option - vorausgesetzt, das OP verfügt über ausreichende Programmierkenntnisse, die es ohnehin als "Data Scientist" benötigt.Ich denke, die Tendenz gegenüber Statistikern ist das Stereotyp, dass sie theoretischer sind oder dass sie Stata usw. verwenden, um an kleineren Problemen zu arbeiten.In wirtschaftlicher Hinsicht muss ich sagen, dass meine Lieblingsstatistik-Blogger Ökonomen sind.
Wayne, es ist lustig zu sagen, dass Statistiker Stata verwenden.R ist besser geeignet, um mit Daten seltsamer Strukturen zu arbeiten, und SAS kann große Datenmengen lesen und schreiben, ohne die Syntax zu ändern, aber Stata ist kein schlechteres Werkzeug als diese beiden.Ich bin jedoch voreingenommen, obwohl ich dachte, dass es in meinen Beiträgen offensichtlich war.In Bezug auf Kuhns Struktur der wissenschaftlichen Revolutionen hat sich Gung angesichts der heftigen Debatte in der Wirtschaft nicht ganz als Wissenschaft formiert.
@Wayne: Heute und in der Vergangenheit waren sowohl SAS als auch R / S-PLUS bei Statistikern viel beliebter als Stata (ich bin selbst Stata-Benutzer).Die S-Sprache, aus der R und S-PLUS stammen, war außerhalb von Statistikkreisen fast unbekannt, ist aber heutzutage sehr beliebt geworden (R).Leider gibt es eine große Verzerrung dessen, was Statistiker tun, geschweige denn die Werkzeuge, die sie verwenden.
@StasK: Ich mag Stata sehr - ich habe es letztes Jahr gekauft - und wollte es oder seine Benutzer nicht kritisieren.Es ist bei Ökonomen beliebter als bei Statistikern, würde ich vermuten.Der Punkt, den ich ansprechen wollte, ist, dass das Stereotyp, das "Statistiker" von "Data Science" ausschließt, die Wahrnehmung ist, dass es bei Data Science um Big Data (Hadoop, riesiges SQL usw.) geht, das häufig frei formuliert ist (Text Mining)usw.) und erfordert Teams von Datenwissenschaftlern, während Statistiker unabhängig an Experimenten usw. arbeiten. Dies ist natürlich ein Stereotyp.
Die Präsentation von Terry Speed zu Big Data hilft dabei, die vielen Verzerrungen und Stereotypen zu beleuchten: http://vimeo.com/91502942
#3
+8
Aaron Zeng
2014-11-12 09:16:07 UTC
view on stackexchange narkive permalink

BEARBEITEN: Versuchen Sie einfach, weitere Wörter hinzuzufügen.

Als Doktorand in Biostatistik fühle ich mich großartig mit dem, was @ Frank-Harrell gesagt hat. Und das ist ganz richtig !!! Studenten unserer Abteilung haben nach dem Abschluss großartige Praktika.

Auf der anderen Seite zitierte @StasK den Artikel " Sind wir nicht Data Science?", betitelte ihn aber als " Statistiker werden nicht als Datenwissenschaftler anerkannt ". Das ist etwas irreführend für mich. Statistiker werden möglicherweise nicht als Datenwissenschaftler bezeichnet. Aber wer kann das noch förmlich behaupten? Jedenfalls heißt es in dem Artikel, zumindest für mich, dass Statistiken das große Potenzial haben, zur Datenwissenschaft beizutragen. Das Hauptproblem, das die Statistik zur Förderung der Datenwissenschaft behindert, besteht darin, dass die Mitarbeiter der Statistik nicht gut für umfangreiche Berechnungen und effiziente Programmierung ausgebildet sind. Aus diesem Artikel zitiert folgt.

Und zu Statistiken. Die Statistik hat ein enormes Potenzial, zur Datenwissenschaft beizutragen. Es gibt offene Forschungsprobleme, die erfordern, dass klassische statistische Methoden in Bezug auf Stichproben, Design und kausale Inferenz „vergrößert“ werden, um mit massiven Datensätzen machbar zu sein. Nur wenige Informatiker und andere, die die datenwissenschaftliche Landschaft dominieren, sind mit diesen Konzepten vertraut, und viele betrachten die Datenanalyse als „algorithmisch“. Die Datenwissenschaft erfordert statistisches Denken und neue grundlegende Rahmenbedingungen. Wie groß ist beispielsweise die „Bevölkerung“, wenn man mit den von Google generierten Big Data konfrontiert wird?

Tatsächlich beginnen viele Unternehmen, Daten prospektiv für interne Tests zu sammeln und Validierung, und es gibt wenig Verständnis für die Kraft der Designprinzipien. Statistiker könnten durch die Entwicklung eines „experimentellen Designs für das 21. Jahrhundert“ große Fortschritte erzielen!

Man kann wohl sagen, dass die Informatik in einer besseren Position ist, aber es fehlt ihnen nur das statistische Denken. Aber für mich betrachte ich die beiden Hauptkomponenten als "Gehirn" und "Hände"! Wenn das Experimentdesign am Anfang fehlerhaft ist oder wenn die Schlussfolgerung ganz am Ende voreingenommen ist, werden wir am Ende eine völlig andere Geschichte über die Schlussfolgerung und die Geschäftsstrategie haben.

Um es einfach auszudrücken Alles, was ich hier vermitteln möchte, ist, dass Praktiker der Datenwissenschaft wirklich sowohl großartiges statistisches Denken als auch Programmierung benötigen.

END EDIT:

Um zu entscheiden, welchen Abschluss Sie anstreben, müssen Sie diesen erwerben um zu wissen, welche Fähigkeiten Sie für die Arbeit im Bereich Data Science qualifizieren. Basierend auf dem, was ich weiß, wenn Sie in den Bereich der Datenwissenschaft einsteigen möchten, sind "harte" Fähigkeiten , die Sie ausrüsten möchten, im Grunde zweierlei: die starken analytischen Fähigkeiten sowie die gute Berechnung und Programmierung Kompetenzen. Sie können zu Quora gehen und nach "Data Science", "Data Scientist" usw. suchen, um ein Gefühl dafür zu bekommen, wie das Feld aussieht und was Sie für diesen Bereich vorbereiten müssen. Hier sind zwei Fragen von Quora, die Sie möglicherweise beantworten möchten:

  1. Was ist Data Science?
  2. Wie werde ich ein Datenwissenschaftler?
  3. ol>

    Einige Fragen wie diese verstehen Sie.

    (Die Soft Skills , wie mündlich und Schriftliche Kommunikationsfähigkeiten und Teamfähigkeit sind ebenfalls sehr wichtig. Unter bestimmten Umständen sogar wichtiger als Ihre analytischen Fähigkeiten. Aber sicherlich ist die Diskussion über Soft Skills für Ihre Fragen sicherlich nicht zum Thema.)

    Nun zurück zu Ihren Fragen.

    Welche Studienabschlüsse würden mich dahin bringen, wo ich hin möchte?

    Wenn Sie eine klare Vision haben und tief darüber nachdenken, was Sie lernen müssen, sollten Sie in der Lage sein, dies selbst zu beantworten. Mein Vorschlag wäre Informatik, Angewandte Mathematik oder Statistik, Biostatistik, Physik, Ingenieurwesen oder andere Abschlüsse, die sich stark mit Analytik und Berechnung befassen. Im Wesentlichen wird ein interdisziplinärer Abschluss, der Ihnen hilft, sowohl Datenanalyse als auch Programmierung zu trainieren, Ihnen definitiv eine hervorragende Position für die Arbeit im Bereich der Datenwissenschaft verschaffen.

    Gibt es einen Konsens darüber, ob ein Abschluss in Bewerbung vorliegt Mathematik oder Statistik würden mich in eine bessere Position bringen, um in den Bereich der Datenwissenschaft einzusteigen?

    Mir ist nicht bekannt, ob es einen solchen Konsens gibt, der von akademischen Forschern oder Industriepraktikern offiziell anerkannt wird, aber ich kann Ihnen einige Nachrichten / Berichte von Websites geben, die zeigen, wie die Statistik im Verlauf der "Ära der Big Data" eine große Rolle spielen wird. Ich glaube, diese Artikel geben Ihnen zumindest das Vertrauen, dass Statistiken eine gute Wahl sein sollten.

    1. Für den heutigen Absolventen nur ein Wort: Statistik
    2. Wie kann die statistische Wissenschaft Big-Data-Forschungsprojekte vorantreiben?
    3. Entdeckung mit Daten: Nutzung von Statistiken mit Informatik zur Transformation von Wissenschaft und Gesellschaft
    4. Wir sind Data Science
    5. [Die Ära der Big Data] Artikel über Big Data müssen gelesen werden
    6. Der letzte stammt aus meinem Blog, in dem ich einige wichtige Artikel aus Medien und berühmten Websites wie NYTimes, Forbes, McKinsey, Harvard Business Review usw. gesammelt habe. Sie finden einige, die die Zukunft des datenwissenschaftlichen Bereichs beschreiben. und die Fähigkeiten, die man für dieses Gebiet benötigt. Hier ist zum Beispiel das Zitat von NYTimes, die Worte von Hal Varian.

      „Ich sage immer wieder, dass der sexy Job in den nächsten 10 Jahren Statistiker sein werden“, sagte Hal Varian, Chefökonom bei Google. "Und ich mache keine Witze."

      In den meisten Artikeln wird ausführlich dargelegt, dass das Feld Statistik als Disziplin, die Daten untersucht - "die Wissenschaft der Daten" - an diesem historischen Punkt boomt. Wenn es also einen Konsens gibt, sind diese Artikel die Anzeichen dafür.

      Zuletzt, wie es Ihnen scheinen mag, überzeuge ich Sie, einen Abschluss in Statistik oder Biostatistik zu machen, ich nicht habe diese Absicht, obwohl sie eine gute Wahl sind, wie ich zuvor angedeutet habe. Alle Abschlüsse, die Ihren Interessen entsprechen (wie maschinelles Lernen in den Informatikwissenschaften), sollten berücksichtigt werden, sofern Sie wissen, dass Sie Ihre Analyse- und Rechenfähigkeiten vorbereiten. Sie können diese Fähigkeiten sogar selbst in offenen Kursen auf Coursera erlernen.

(+1) Absolventen in Physik oder Ingenieurwissenschaften sollten sicherlich nicht davon abgehalten werden, in die Datenwissenschaft einzusteigen, aber ich bin mir nicht sicher, ob ich das Lesen dieser Fächer zu den direktesten Wegen zählen würde, damit jemand, der sich auf den Weg macht, sich darauf einlässtes.
+1 Beachten Sie, dass die Aussage "Das Hauptproblem, das die Statistik zur Förderung der Datenwissenschaft behindert, besteht darin, dass Personen aus der Statistik nicht gut für umfangreiche Berechnungen und effiziente Programmierung geschult sind" die implizite Annahme macht, dass Datenwissenschaft = Big Data ist.Ich würde argumentieren, dass viele (die meisten?) Probleme entweder nicht in der Lage sind, Daten in Milliardenhöhe zu generieren, oder dass die erhöhte Stichprobengröße - die allzu oft für die Bevölkerung verwirrt ist - wenig zur Lösung eines Problems beiträgt und möglicherweise die Fähigkeit des Analytikers zur Erkennung beeinträchtigtein Signal.
Gute Punkte, @ThomasSpeidel.Tatsächlich sind viele wissenschaftliche oder industrielle Probleme von geringer Stichprobengröße, wie Experimente in Pharmaunternehmen und viele andere, die Menschen als Subjekte benötigen.In solchen Situationen sind definitiv "Big Data" -Techniken weniger anwendbar.Der Aufstieg von Big Data ist wirklich das Ergebnis der Revolution des mobilen Internets und der sozialen Medien im Internet.Die meisten Big-Data-Anwendungen beziehen sich jedoch auf den IT-Bereich.Aus diesem Grund dominieren die Informatiker heute das sogenannte Big-Data-Zeitalter.
#4
+4
Randy Bartlett
2014-11-15 22:57:19 UTC
view on stackexchange narkive permalink

Wenn Sie bereits einen BS in Mathematik haben und Daten vor Ort analysieren möchten, kann ein MS in Statistik viel mehr als einen zweiten Mathematikabschluss leisten. Nur Statistik, Biostat und OP (nicht so sicher) vermitteln die zugrunde liegenden statistischen Annahmen für Statistikprobleme. In der Statistik wird bereits mehr Mathematik gelehrt, als Sie für die Analyse von Daten benötigen, z. B. Maßtheorie und Theorie großer Stichproben.

Auch das statistische maschinelle Lernen ist fest im Statistikbereich verankert. Dies sind die Werkzeuge in ML, mit denen wir Daten analysieren. Die anderen Tools dienen zur Verwaltung von Daten.

#5
-1
Nisha Dhiman
2019-07-15 14:23:11 UTC
view on stackexchange narkive permalink

Entscheiden Sie sich für PG in Data Science.Dies ist hauptsächlich an US-amerikanischen Universitäten und in Europa verfügbar.Und ich weiß, dass sie sehr teuer werden.Warum entscheiden Sie sich nicht für einen Online-Abschluss in Data Science and Engineering, der maschinelles Lernen umfasst?Ich denke an eines: Great Learning-PG in Data Science and Engineering



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...