This page is not created by, affiliated with, or supported by Slack Technologies, Inc.
2018-11-19
Channels
- # announcements (5)
- # beginners (68)
- # boot (1)
- # cider (27)
- # clara (11)
- # cljdoc (10)
- # clojure (129)
- # clojure-europe (2)
- # clojure-italy (16)
- # clojure-nl (15)
- # clojure-spec (74)
- # clojure-uk (31)
- # clojurescript (62)
- # core-async (17)
- # cursive (28)
- # datomic (22)
- # duct (29)
- # emacs (10)
- # fulcro (65)
- # hoplon (2)
- # hyperfiddle (16)
- # instaparse (3)
- # kaocha (2)
- # lein-figwheel (3)
- # leiningen (1)
- # mount (1)
- # nrepl (21)
- # off-topic (23)
- # re-frame (59)
- # reitit (18)
- # ring-swagger (2)
- # shadow-cljs (2)
- # spacemacs (16)
- # timbre (2)
- # tools-deps (22)
Giorno
Qualcuno di voi ha mai dovuto fare roba "seria" su Spark? Sono indeciso se usare Clojure al posto di scala abbia senso...
@justalanm non so se sia pertinente, noi stiamo studiando Onyx (http://www.onyxplatform.org/) per la distributed computation
@mdallastella eh magari, purtroppo Spark è dato nel senso che abbiamo un cluster già montato e dobbiamo fare con quello che c'è (fra l'altro Spark 1.6...). Però a proposito di Onyx, mi pareva di aver capito che non c'è praticamente niente lato machine learning giusto?
In effetti no, sarebbe da accoppiare con qualche altra libreria (tipo la tua)
Onyx dà solo "l'infrastruttura" distribuita, poi la parte di calcolo devi un po' arrangiarti
Per quello che abbiamo visto finora, ovviamente
oh madonna… pensavo a Clojure su Sun Sparc Station e dicevo azz ma Java ci gira ancora? :rolling_on_the_floor_laughing:
Prima o poi troverò il tempo di provare Onyx che mi sembra molto più "leggero" di Spark (che effettivamente è un macchinone assurdo), ma ad ogni modo sono almeno riuscito a convincere i coworkers a lasciar perdere Python (PySpark), ma Flambo (https://github.com/yieldbot/flambo) mi sembra comunque molto macchinoso e non un miglioramento enorme rispetto all'API Scala
Io ho usato solo pyspark che a suo tempo era lento rispetto a scala ma adesso mi dicono che è migliorato molto
E non so dipende magari dal resto del codice che scrivete
Se avete gente di data science che sa python userei quello
Se siete clojuristi usa clojure