This page is not created by, affiliated with, or supported by Slack Technologies, Inc.
2017-11-29
Channels
- # aws (1)
- # aws-lambda (2)
- # bangalore-clj (3)
- # beginners (26)
- # boot (25)
- # braveandtrue (1)
- # cider (5)
- # cljsrn (7)
- # clojure (144)
- # clojure-android (2)
- # clojure-czech (1)
- # clojure-greece (3)
- # clojure-italy (17)
- # clojure-poland (5)
- # clojure-russia (25)
- # clojure-spec (9)
- # clojure-uk (100)
- # clojurescript (85)
- # core-async (42)
- # cursive (11)
- # datascript (2)
- # datomic (25)
- # duct (3)
- # emacs (5)
- # figwheel (2)
- # fulcro (49)
- # graphql (16)
- # hoplon (8)
- # klipse (10)
- # leiningen (10)
- # lumo (9)
- # off-topic (12)
- # om (14)
- # onyx (25)
- # planck (34)
- # portkey (6)
- # re-frame (43)
- # reagent (4)
- # remote-jobs (2)
- # ring (36)
- # ring-swagger (1)
- # rum (1)
- # shadow-cljs (187)
- # specter (25)
- # sql (5)
- # unrepl (75)
Anni fa erano chiamati Master DB
Prima ancora Data Warehouse
Penso che il cambio di nome derivi dal fatto che i “data lakes” sono praticamente delle “discariche di dati”, dove tutta l’organizzazione dovrebbe scaricare i propri dati
In maniera molto unstructured, schemaless, etc
Poi viene dato tutto in pasto ai Data Scientist, che fanno le magie col Machine Learning™ sui Big Data™
(Molto probabilmente nel Cloud)
Mentre il Data Warehousing è sostanzialmente SQL, con un’interfaccia amichevole per gli analisti business non tecnici
In conclusione, penso che sia semplicemente un trenino al quale le aziende medio-grandi vogliono attaccarsi per dire che anche loro fanno l’intelligenza artificiale e i big data, e che è facile da vendere per le consulenze
immaginavo che ci fosse parecchia fuffa in giro... in pratica se sbatto dei zipponi del traffico ngnix su S3 ho i "data lakes"
Quasi…il punto penso sia che deve essere un repo centralizzato per tutta l’azienda, in modo da poter fare cross-referencing tra le diverse fonti di dati
E.g. noi uploadiamo tutti i nostri dati su BigQuery, cosí che gli analisti possono fare cross-referencing e tirare fuori dashboard in modo abbastanza facile - però non lo chiamiamo data lake
Nice 🙂 Penso sia pratica abbastanza diffusa infatti
Buzzword del momento direttamente da re:Invent: data lake, schema on read, serverless. Enjoy!
“schema on read” continua a farmi orrore
qualcuno viene a clojure exchange settimana prossima?