大數(shù)據(jù)是現(xiàn)在很多企業(yè)發(fā)展中必不可少的工具,它究竟對企業(yè)會有什么作用呢?從傳統(tǒng)企業(yè)的運行流程來看,大數(shù)據(jù)主要能夠在了解用戶、鎖定資源、規(guī)劃生產(chǎn)、做好運營、開展服務等方面,那么大數(shù)據(jù)在這些方面又是怎么做的呢?以下是小編為你整理的想學大數(shù)據(jù)怎么樣去學 ?
客戶是企業(yè)重要的數(shù)據(jù)源,當數(shù)量龐大的客戶處于同一個平臺上時,就會產(chǎn)生無數(shù)個數(shù)據(jù)源,而企業(yè)通過大數(shù)據(jù)的整合分析,對這些數(shù)據(jù)源進行分析,探碼大數(shù)據(jù)客流分析通過對人群熱力指數(shù)計算潛力圖,競品分布,大數(shù)據(jù)識別城市生活消費功能區(qū),用戶畫像反映出商場附近客流情況以及客流潛力。將會總結出一套新的規(guī)律,從而幫助企業(yè)了解客戶,為企業(yè)的確定更準確的發(fā)展方向。
?
今天的客戶和以往有很大不同。大數(shù)據(jù)的興起使他們能夠在購買一個產(chǎn)品之前徹底和孜孜不倦地研究它,并了解他們的消費情況。通過運用大數(shù)據(jù),將客戶、用戶和產(chǎn)品進行有機串聯(lián),對用戶的產(chǎn)品偏好,客戶的關系偏好進行個性化定位,生產(chǎn)出用戶驅(qū)動型的產(chǎn)品,提供客戶導向性的服務。并從數(shù)據(jù)中發(fā)掘出適應企業(yè)發(fā)展環(huán)境的社會和商業(yè)形態(tài),用數(shù)據(jù)對用戶和客戶對待產(chǎn)品的態(tài)度,進行挖掘和洞察,準確發(fā)現(xiàn)并解讀客戶及用戶的諸多新需求和行為特征, ?
通過大數(shù)據(jù)技術,使企業(yè)在運營過程中,對運營所需資源的挖掘、具體情況和儲量分布等,企業(yè)都可以進行搜集分析,形成基于企業(yè)的資源分布可視圖,就如同“電子地圖”一般,將各種優(yōu)勢點,進行“點對點”的數(shù)據(jù)化、圖像化展現(xiàn),讓企業(yè)的管理者可以更直觀地面對自己的企業(yè),更好地利用各種已有和潛在資源。如果沒有大數(shù)據(jù),將很難發(fā)現(xiàn)曾經(jīng)認為是完全無關行為間的相互關聯(lián)性,就如同外媒曾經(jīng)提到的“啤酒”與“尿片”之間的關聯(lián)營銷一樣,如果沒有大數(shù)據(jù)這將是一種幾乎不可能的事情。 ?
選擇模型/自定義模型 ?
基于業(yè)務基礎來決定選擇模型的形態(tài),比如,如果要預測產(chǎn)品銷量,則可以選擇數(shù)值預測模型。(可采用回歸模型,時序預測) ?
之所以叫模型,因為每個模型大致的模式是固定的,但其中還會有一些不確定的變量在里面,這樣模型才會有通用性,而訓練模型的意思就是找到最合適的參數(shù),一旦找到*參數(shù),模型就基本可用了! ?
也即是字面意思,但一個模型的好壞是需要放在其特定的業(yè)務場景下來評估的。 ?
評價模型質(zhì)量的常用指標有:平均誤差率、判定系數(shù)R2 ?
評估分類預測模型質(zhì)量的常用指標(如下圖所示):正確率、查全率、查準率、ROC曲線和AUC值等 ?
第四步:應用模型 ?
評估測量完成后,就要將此模型應用于業(yè)務基礎的實踐中去,用于解決工作中的業(yè)務問題的,比如預測客戶行為,比如劃分客戶群。 ?
第五步:優(yōu)化模型,一般發(fā)生在兩種情況下: ?
1.在評估模型中,如果發(fā)現(xiàn)模型欠擬合,或者過擬合,說明這個模型待優(yōu)化; ?
2.在真實應用場景中,定期進行優(yōu)化,或者當發(fā)現(xiàn)模型在真實的業(yè)務場景中效果不好時,也要啟動優(yōu)化; ?
數(shù)據(jù)存儲層 ?
數(shù)據(jù)存儲層主要用于數(shù)據(jù)的存儲。目前采用MongoDB存儲結果數(shù)。 ?
通過Storm處理后的數(shù)據(jù),首先緩存到Redis中,每隔一定得時間間隔,將數(shù)據(jù)批量轉(zhuǎn)存到MongoDB中。 ?
MongoDB是一個高性能、易部署、易使用的分布式數(shù)據(jù)存儲系統(tǒng),介于結構化數(shù)據(jù)庫和非結構化數(shù)據(jù)庫之間,數(shù)據(jù)存儲格式不固定,可以非常方便的進行擴充。
?
04數(shù)據(jù)處理層 ?
數(shù)據(jù)處理層主要采集一些數(shù)據(jù)挖掘算法對數(shù)據(jù)進行挖掘,或者進行實時計算。 ?
數(shù)據(jù)挖掘主要借助于統(tǒng)計學方法、機器學習方法、神經(jīng)網(wǎng)絡方法等對數(shù)據(jù)進行知識挖掘,發(fā)掘潛在的價值。 ?
比如利用線性回歸算法,預測車輛的停留時間。利用k-means算法對位置臨近的出租車做聚類分析,從而發(fā)現(xiàn)最有可能搭載乘客的熱點區(qū)域。根據(jù)速度將軌跡數(shù)據(jù)進行分段,從而分析某個時間段的道路暢通狀況等。 ?
數(shù)據(jù)分析層 ?
數(shù)據(jù)分析層主要是數(shù)據(jù)的展示和分析。 ?
比如將GPS數(shù)據(jù)加載到地圖上,利用抓路算法將GPS數(shù)據(jù)和地圖數(shù)據(jù)進行融合,對分段的軌跡進行不同顏色的顯示,可以讓調(diào)度人員對當前時間段的道路通行情況一目了然,輔助車輛的調(diào)度。 ?
我秀*不斷提高自身數(shù)據(jù)處理能力,就是為了給您提供更快速、更精準、更豐富的數(shù)據(jù)分析功能。 ?
利用消費記錄來進行評分 ?
大會數(shù)據(jù)風控除了可以識別出壞人,還可以評估貸款人的還款能力。過去傳統(tǒng)金融依據(jù)借款人的收入來判斷其還款能力,但是有些客戶擁有工資以外的收入,例如投資收入、顧問咨詢收入等。另外一些客戶可能從父母、伴侶、朋友那里獲得其他的財政支持,擁有較高的支付能力。 ?
按照傳統(tǒng)金融的做法,在家不工作照顧家庭的主婦可能還款能力較弱。無法給其提供貸款,但是其丈夫收入很高,家庭日常支出由其太太做主。這種情況,就需要消費數(shù)據(jù)來證明其還款能力了。 ?
常用的消費記錄由銀行卡消費、電商購物、公共事業(yè)費記錄、大宗商品消費等。還可以參考航空記錄、手機話費、特殊會員消費等方式。例如頭等艙乘坐次數(shù),物業(yè)費高低、高爾夫球俱樂部消費,游艇俱樂部會員費用,奢侈品會員,豪車4S店消費記錄等消費數(shù)據(jù)可以作為其信用評分重要參考。 ?
互聯(lián)網(wǎng)金融的主要客戶是屌絲,其電商消費記錄、旅游消費記錄、以及加油消費記錄都可以作為評估其信用的依據(jù)。有的互聯(lián)金融公司專門從事個人電商消費數(shù)據(jù)分析,只要客戶授權其登陸電商網(wǎng)站,其可以借助于工具將客戶歷史消費數(shù)據(jù)全部抓取并進行匯總和評分。 ?