互聯(lián)網(wǎng)時(shí)代,大數(shù)據(jù)、云計(jì)算的興起,不僅改變了人們的生活方式,也同時(shí)改變了人們的消費(fèi)習(xí)慣,企業(yè)們也都在思考如何通過大數(shù)據(jù)來達(dá)到品牌宣傳的目的呢?今天就來小編一起學(xué)習(xí)一下吧!以下是小編為你整理的大數(shù)據(jù)要學(xué)哪些內(nèi)容 ?
品牌數(shù)字化 ?
針對(duì)品牌的不同用戶群體,可采取數(shù)據(jù)細(xì)分,通過數(shù)據(jù)的各方面整個(gè),出現(xiàn)用戶畫像,根據(jù)這些可以合理對(duì)整個(gè)營銷計(jì)劃作出合理的調(diào)整。
?
媒體優(yōu)選化 ?
在海量的媒體資源中,根據(jù)行業(yè)的需求,選擇一些與行業(yè)相關(guān)的媒體資源,這樣也方便有針對(duì)性地營銷宣傳,進(jìn)而提升企業(yè)運(yùn)營成本。 ?
營銷數(shù)據(jù)分析 ?
對(duì)于日常的一些營銷數(shù)據(jù),一定要采取全面數(shù)據(jù)整合手段,通過這些數(shù)據(jù)的整合,可以分析更多的消費(fèi)市場(chǎng)狀況,也方便及時(shí)做出方案的調(diào)整。 ?
營銷效果時(shí)刻監(jiān)控 ?
對(duì)于每個(gè)平臺(tái)以及每個(gè)手段的營銷效果,都要做到實(shí)時(shí)的監(jiān)控,同時(shí)段的對(duì)比,才能夠分析出更多的營銷手段和點(diǎn)子。 ?
營銷應(yīng)用場(chǎng)景 ?
在營銷的過程中,通過一系列的營銷應(yīng)用場(chǎng)景,能夠?qū)⒖蛻艉芎玫厝谌脒M(jìn)來,讓他們放松地享受品牌帶來的價(jià)值,進(jìn)而促進(jìn)一定的銷售額。 ?
科學(xué)決策營銷 ?
在營銷的過程中,總會(huì)遇到很多突發(fā)的狀況需要作出決策,合理的市場(chǎng)分析,能夠幫助營銷者合理的、科學(xué)的作出決策。 ?
? ?
轉(zhuǎn)型數(shù)據(jù)分析,早期技能綜述 ?
數(shù)據(jù)分析在我看來是個(gè)無底洞,越做越覺得技能欠缺——文科生可能尤其如此,因?yàn)樗麄儙缀趿慊A(chǔ);這如果不令他們陷入迷茫,就很可能令他們陷入知識(shí)獲取的癲狂狀態(tài)。深淺遠(yuǎn)近的知識(shí)一起吃未必不好,不過我還是建議入門早期首先關(guān)注三個(gè)方面:1、統(tǒng)計(jì)學(xué)基礎(chǔ)基本的統(tǒng)計(jì)學(xué)原理和簡(jiǎn)單的幾種分布的概念。可能在工作中都用不到分布,但這是后續(xù)升級(jí)的基礎(chǔ)。推薦書目深入淺出數(shù)據(jù)分析 (豆瓣)深入淺出統(tǒng)計(jì)學(xué) (豆瓣)愛上統(tǒng)計(jì)學(xué) (豆瓣)后兩本有所重合,隨意看一本即可?!尽稅凵辖y(tǒng)計(jì)學(xué)》我有pdf電子版,需要的話可以留郵箱?!窟€有網(wǎng)絡(luò)課程:Statistical Thinking and Data Analysis ?
業(yè)務(wù)邏輯就是業(yè)務(wù)邏輯,公司與公司不同,崗位與崗位不同。業(yè)務(wù)邏輯包括數(shù)據(jù)指標(biāo)和計(jì)算方法,還有一些特殊的時(shí)間點(diǎn)、事件帶來的例外情況。可以學(xué)習(xí)一下市場(chǎng)營銷的課程,或者看一本入門教材,了解一下marketing的大致方法論。如市場(chǎng)營銷原理 (豆瓣)另參考《如何在一周內(nèi)摸清一個(gè)行業(yè)》:網(wǎng)站分析公會(huì)的微博 新浪微博 ?
excel,SPSS至少一種最基本的數(shù)據(jù)處理和制圖用工具。一些基礎(chǔ)函數(shù)和數(shù)據(jù)透視表是最最基礎(chǔ)的技能。可參考誰說菜鳥不會(huì)數(shù)據(jù)分析 (豆瓣)另外可以關(guān)注一些網(wǎng)絡(luò)視頻課程。 ?
數(shù)據(jù)采集中的性能技巧 ?
數(shù)據(jù)采集是各種來自不同數(shù)據(jù)源的數(shù)據(jù)進(jìn)入大數(shù)據(jù)系統(tǒng)的*步。這個(gè)步驟的性能將會(huì)直接決定在一個(gè)給定的時(shí)間段內(nèi)大數(shù)據(jù)系統(tǒng)能夠處理的數(shù)據(jù)量的能力。 ?
數(shù)據(jù)采集過程基于對(duì)該系統(tǒng)的個(gè)性化需求,但一些常用執(zhí)行的步驟是 - 解析傳入數(shù)據(jù),做必要的驗(yàn)證,數(shù)據(jù)清晰,例如數(shù)據(jù)去重,轉(zhuǎn)換格式,并將其存儲(chǔ)到某種持久層。 ?
? ?
涉及數(shù)據(jù)采集過程 ?
來自不同數(shù)據(jù)源的傳輸應(yīng)該是異步的??梢允褂梦募韨鬏?、或者使用面向消息的(MoM)中間件來實(shí)現(xiàn)。由于數(shù)據(jù)異步傳輸,所以數(shù)據(jù)采集過程的吞吐量可以大大高于大數(shù)據(jù)系統(tǒng)的處理能力。 異步數(shù)據(jù)傳輸同樣可以在大數(shù)據(jù)系統(tǒng)和不同的數(shù)據(jù)源之間進(jìn)行解耦。大數(shù)據(jù)基礎(chǔ)架構(gòu)設(shè)計(jì)使得其很容易進(jìn)行動(dòng)態(tài)伸縮,數(shù)據(jù)采集的峰值流量對(duì)于大數(shù)據(jù)系統(tǒng)來說算是安全的。 ?
如果數(shù)據(jù)是直接從一些外部數(shù)據(jù)庫中抽取的,確保拉取數(shù)據(jù)是使用批量的方式。 ?
如果數(shù)據(jù)是從feed file解析,請(qǐng)務(wù)必使用合適的解析器。例如,如果從一個(gè)XML文件中讀取也有不同的解析器像JDOM,SAX,DOM等。類似地,對(duì)于CSV,JSON和其它這樣的格式,多個(gè)解析器和API是可供選擇。選擇能夠符合需求的性能*的。 ?
優(yōu)先使用內(nèi)置的驗(yàn)證解決方案。大多數(shù)解析/驗(yàn)證工作流程的通常運(yùn)行在服務(wù)器環(huán)境(ESB /應(yīng)用服務(wù)器)中。大部分的場(chǎng)景基本上都有現(xiàn)成的標(biāo)準(zhǔn)校驗(yàn)工具。在大多數(shù)的情況下,這些標(biāo)準(zhǔn)的現(xiàn)成的工具一般來說要比你自己開發(fā)的工具性能要好很多。 ?
類似地,如果數(shù)據(jù)XML格式的,優(yōu)先使用XML(XSD)用于驗(yàn)證。
?
使解析器或者校等流程使用自定義的腳本來完成,例如使用java優(yōu)先還是應(yīng)該使用內(nèi)置的函數(shù)庫或者開發(fā)框架。在大多數(shù)的情況下通常會(huì)比你開發(fā)任何自定義代碼快得多。 ?
盡量提前濾掉無效數(shù)據(jù),以便后續(xù)的處理流程都不用在無效數(shù)據(jù)上浪費(fèi)過多的計(jì)算能力。 ?
大多數(shù)系統(tǒng)處理無效數(shù)據(jù)的做法通常是存放在一個(gè)專門的表中,請(qǐng)?jiān)谙到y(tǒng)建設(shè)之初考慮這部分的數(shù)據(jù)庫存儲(chǔ)和其他額外的存儲(chǔ)開銷。 ?
如果來自數(shù)據(jù)源的數(shù)據(jù)需要清洗,例如去掉一些不需要的信息,盡量保持所有數(shù)據(jù)源的抽取程序版本一致,確保一次處理的是一個(gè)大批量的數(shù)據(jù),而不是一條記錄一條記錄的來處理。一般來說數(shù)據(jù)清洗需要進(jìn)行表關(guān)聯(lián)。數(shù)據(jù)清洗中需要用到的靜態(tài)數(shù)據(jù)關(guān)聯(lián)一次,并且一次處理一個(gè)很大的批量就能夠大幅提高數(shù)據(jù)處理效率。 ?
數(shù)據(jù)去重非常重要這個(gè)過程決定了主鍵的是由哪些字段構(gòu)成。通常主鍵都是時(shí)間戳或者id等可以追加的類型。一般情況下,每條記錄都可能根據(jù)主鍵進(jìn)行索引來更新,所以*能夠讓主鍵簡(jiǎn)單一些,以保證在更新的時(shí)候檢索的性能。 ?
? ?
數(shù)據(jù)層:采集和處理數(shù)據(jù) ?
傳統(tǒng)采集數(shù)據(jù)的過程一般是有限的、有意識(shí)的、結(jié)構(gòu)化的進(jìn)行數(shù)據(jù)采集,例如問卷調(diào)研的形式。你能采集到的數(shù)據(jù)一定是你能設(shè)想到的情況。數(shù)據(jù)的結(jié)構(gòu)化較好。一般的數(shù)據(jù)庫Mysql甚至Excel就能滿足數(shù)據(jù)處理過程。 ?
業(yè)務(wù)層:建模分析數(shù)據(jù) ?
使用的數(shù)據(jù)分析模型,例如基本統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、例如數(shù)據(jù)挖掘的分類、聚類、關(guān)聯(lián)、預(yù)測(cè)等算法,傳統(tǒng)數(shù)據(jù)和大數(shù)據(jù)的做法差別不大,例如銀行、通信運(yùn)營商、零售商早已成熟運(yùn)用消費(fèi)者的屬性和行為數(shù)據(jù)來識(shí)別風(fēng)險(xiǎn)和付費(fèi)可能性。但是由于數(shù)據(jù)量的極大擴(kuò)增,算法也獲得極大優(yōu)化提升的空間。 ?
應(yīng)用層:解讀數(shù)據(jù) ?
數(shù)據(jù)指導(dǎo)營銷最重要的是解讀。 ?
傳統(tǒng)一般是定義營銷問題之后,采集對(duì)應(yīng)的數(shù)據(jù),然后根據(jù)確定的建?;蚍治隹蚣埽瑪?shù)據(jù)進(jìn)行分析,驗(yàn)證假設(shè),進(jìn)行解讀。解讀的空間是有限的。 ?
而大數(shù)據(jù)提供了一種可能性,既可以根據(jù)營銷問題,封閉性地去挖掘?qū)?yīng)數(shù)據(jù)進(jìn)行驗(yàn)證,也可以開放性地探索,得出一些可能與常識(shí)或經(jīng)驗(yàn)判斷完全相異的結(jié)論出來??山庾x的點(diǎn)變得非常豐富。 ?
來自多個(gè)源接收的數(shù)據(jù)可以是不同的格式。有時(shí),需要進(jìn)行數(shù)據(jù)移植,使接收到的數(shù)據(jù)從多種格式轉(zhuǎn)化成一種或一組標(biāo)準(zhǔn)格式。 ?
和解析過程一樣,我們建議使用內(nèi)置的工具,相比于你自己從零開發(fā)的工具性能會(huì)提高很多。 ?
數(shù)據(jù)移植的過程一般是數(shù)據(jù)處理過程中最復(fù)雜、最緊急、消耗資源最多的一步。因此,確保在這一過程中盡可能多的使用并行計(jì)算。 ?
一旦所有的數(shù)據(jù)采集的上述活動(dòng)完成后,轉(zhuǎn)換后的數(shù)據(jù)通常存儲(chǔ)在某些持久層,以便以后分析處理,綜述,聚合等使用。 ?
多種技術(shù)解決方案的存在是為了處理這種持久(RDBMS,NoSQL的分布式文件系統(tǒng),如Hadoop和等)。 ?
謹(jǐn)慎選擇一個(gè)能夠*限度的滿足需求的解決方案。 ?