任何組織或個(gè)人只要搶先一步掌握大數(shù)據(jù), 就會(huì)奠定至關(guān)重要的競(jìng)爭(zhēng)優(yōu)勢(shì), 就像在小數(shù)
據(jù)時(shí)代占據(jù)先機(jī)進(jìn)行數(shù)據(jù)分析的人能在競(jìng)爭(zhēng)者中脫穎而出一樣。
因此,數(shù)據(jù)分析師將會(huì)成為一個(gè)黃金職業(yè)。
步驟1 從識(shí)別問題開始
一位定量分析師所做的工作始于認(rèn)識(shí)一個(gè)問題或決策, 然后才開始解決問題。
如果你不能針對(duì)下面的大部分問題給出肯定的回答, 那你的項(xiàng)目可能從一開始就會(huì)陷入困境:
- 哪些高管和定量分析項(xiàng)目的成功息息相關(guān)?
- 他們是否對(duì)存在的問題和問題的解決方案有一個(gè)大概的了解?
- 他們是否有能力提供必要的資源? 是否有能力推進(jìn)定量分析項(xiàng)目成功所必須的業(yè)務(wù)變革?
- 他們是否都支持在決策制定過程中使用分析和數(shù)據(jù)?
- 你所推薦的分析案例和交流方式是否與他們常用的思維與決策方式相一致?
- 你是否計(jì)劃向他們提供定期反饋和階段性成果報(bào)告?
步驟2 回顧之前的問題
一旦問題被識(shí)別, 就應(yīng)該對(duì)所有與之相關(guān)的之前的發(fā)現(xiàn)進(jìn)行調(diào)查。 回顧之前的發(fā)現(xiàn)仍然屬于分析( 構(gòu)建問題) 的*階段中的一個(gè)步驟, 因?yàn)檎{(diào)查之前的發(fā)現(xiàn)能幫助分析師和決策者思考他們想解決的問題到目前為止是如何被構(gòu)建的, 以及這個(gè)問題可能以何種不同的方式被概念化。
你可以嘗試問如下問題:
- 你已經(jīng)很好地構(gòu)建問題了嗎?
- 你是否已經(jīng)定義了一個(gè)清晰的問題或機(jī)會(huì)來解決企業(yè)里非常重要的問題?
- 你是否已經(jīng)考慮了多種選擇方式來解決問題?
- 你是否已經(jīng)識(shí)別出這個(gè)問題的利益相關(guān)者, 且針對(duì)這個(gè)問題你已經(jīng)和這些利益相關(guān)者進(jìn)行了廣泛的交流?
- 剛開始時(shí), 你對(duì)問題是否有一個(gè)較廣泛的定義, 到后來縮小到一個(gè)需要解決、 需要應(yīng)用數(shù)據(jù)以及明確可能出現(xiàn)的結(jié)果的非常確切的問題?
步驟3 簡(jiǎn)化數(shù)據(jù)模型
" 簡(jiǎn)化" 是要我們必須舍棄所有非必須的和無(wú)關(guān)緊要的細(xì)節(jié), 并保留*重要的、 *有效的、 *關(guān)鍵的且會(huì)造成影響的特征。
每當(dāng)你建立一個(gè)模型時(shí), 都必須是有選擇性的。 你必須識(shí)別現(xiàn)實(shí)世界中與這個(gè)模型相關(guān)的因素, 并忽略其他不相關(guān)的因素。 你必須建立一個(gè)簡(jiǎn)化的模型世界, 它能讓你聚焦于當(dāng)下設(shè)法解決的問題。
你可以嘗試問如下問題:
- 我們需要同時(shí)分析多少變量? 分析一個(gè)變量( 單變量模型) 、 兩個(gè)變量( 雙變量模型) 還是三個(gè)或更多變量( 多變量模型) 的概率。
- 我們需要得到描述性或推論性問題的答案嗎? 描述統(tǒng)計(jì)學(xué)( Descriptive Statistics) 簡(jiǎn)單地描述了你擁有的數(shù)據(jù), 均值、 中值和標(biāo)準(zhǔn)差是描述統(tǒng)計(jì)學(xué)的典型案例。
- 在感興趣的變量中, 什么樣的測(cè)量水平是可行的?
步驟4 收集與測(cè)量數(shù)據(jù)
測(cè)量變量的4種方式為:
二元變量: 這種變量只有兩個(gè)值, 并且根據(jù)統(tǒng)計(jì)分析的目的, 通常*好是把它們身上存在或缺失某種東西的值定義為1或0。 這樣的例子可以是你要么是女性要么是男性( 沒有女
性特征被記錄為0, 女性則被記錄為1) , 或者你是否是美國(guó)公民。
分類( 或者稱為名義) 變量: 對(duì)于這種變量的值, 存在多種可能的分類, 比如眼睛的顏色、 冰激凌的口味。 因?yàn)檫@些因素很難被轉(zhuǎn)變成增加或減少會(huì)產(chǎn)生意義差別的數(shù)字, 所以針對(duì)分類數(shù)據(jù)有一類特殊的統(tǒng)計(jì)數(shù)據(jù)。
序變量: 這些變量有一些分配給它們的數(shù)字, 并且數(shù)字越大就意味著相應(yīng)的變量存在的越多。 然而, 1和2之間的差別可能與5和6之間的差別不盡相同。
數(shù)值( 間隔和比率) 變量: 這些變量擁有標(biāo)準(zhǔn)的數(shù)值單位,比如以磅或千克計(jì)量的重量, 或以英尺或厘米計(jì)量的高度。數(shù)值越大就意味著相應(yīng)的變量存在的越多。 另外, 數(shù)值變量
非常適用于像相關(guān)分析和回歸分析這樣的普通統(tǒng)計(jì)方法。
步驟5 數(shù)據(jù)分析
數(shù)據(jù)分析需要找到恒定的模式; 換言之, 就是蘊(yùn)含在數(shù)據(jù)中的變量之間的關(guān)系。 當(dāng)你看到模式浮現(xiàn)出來時(shí), 解釋數(shù)字就會(huì)變得更加容易。 當(dāng)你從變量中提煉出這些模式時(shí), 解決問題就會(huì)變得更加容易。
分析的維度有如下3種:
兩個(gè)數(shù)值型數(shù)據(jù)變量: 如果你只是想將兩件能夠進(jìn)行數(shù)值測(cè)量的事情聯(lián)系起來, 那么你很可能想要使用某種類型的相關(guān)分析。 這是你可以執(zhí)行的*簡(jiǎn)單的統(tǒng)計(jì)分析中的一種。
兩個(gè)或幾個(gè)類別變量: 如果你正在使用調(diào)查數(shù)據(jù), 而且你的數(shù)據(jù)來自名詞定類變量( 比如, 男性/女性, 或者青年/中年/老年) , 那么你將需要使用一系列方法來進(jìn)行分類數(shù)據(jù)分析。 這種分析類型的結(jié)果常常用表格的方式呈現(xiàn)。
兩個(gè)以上的數(shù)值型數(shù)據(jù)變量: 將相關(guān)分析擴(kuò)展應(yīng)用到擁有數(shù)值型變量的兩個(gè)以上的變量上就是回歸分析。 有時(shí)候, 它被稱為多元線性回歸分析( 因?yàn)槟闶褂昧硕嘣兞縼斫忉屃硪?br class="sysbr" style="display: inline;"/>個(gè)變量的價(jià)值) 或者線性回歸分析( 因?yàn)樽兞恐g的關(guān)系在整個(gè)變量范圍中保持相似) 。
步驟6 采取行動(dòng)
你可嘗試按照如下的6個(gè)維度提供你數(shù)據(jù)的分析結(jié)果:
- 1. 對(duì)這個(gè)商業(yè)問題的理解;
- 2. 如何估量它的商業(yè)影響力;
- 3. 哪些數(shù)據(jù)是可以用的;
- 4. *初的解決方案;
- 5. *終的解決方案;
- 6. 該解決方案的商業(yè)影響力。
基于數(shù)據(jù)、 分析的分析性思維會(huì)在商業(yè)和社會(huì)中扮演越來越重要的角色。 我們需要很多慣于使用分析性思維的管理人員和專業(yè)人員,希望你也可以成為數(shù)據(jù)分析師。