1.3 游戲數(shù)據(jù)分析的流程
游戲數(shù)據(jù)分析整體的流程將分為幾個(gè)階段,這幾個(gè)階段則是反映了不同企業(yè)數(shù)據(jù)分析的水平,從另一個(gè)角度,也是在解析作為一名數(shù)據(jù)分析人員究竟該如何參與到游戲數(shù)據(jù)分析業(yè)務(wù)中,與之有關(guān)的游戲數(shù)據(jù)分析師的工作我們將在1.4節(jié)重點(diǎn)闡述。
如圖1-2所示,對(duì)于游戲數(shù)據(jù)分析系統(tǒng)及數(shù)據(jù)的利用,我們分為了五個(gè)階段,方法論、數(shù)據(jù)加工、統(tǒng)計(jì)分析,提煉演繹、建議方案。從工程技術(shù)、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘以及用戶營(yíng)銷幾個(gè)方面進(jìn)行了覆蓋和研究。
圖1-2游戲數(shù)據(jù)分析流程
1.3.1方法論
方法論是數(shù)據(jù)分析的靈魂,是解決問題的普遍原則,貫穿分析始終的思想指導(dǎo)。這個(gè)階段決定了我們?nèi)绾温顸c(diǎn)數(shù)據(jù),如何設(shè)計(jì)分析指標(biāo),如何采集,如何組織數(shù)據(jù)。
方法論多數(shù)是將業(yè)務(wù)進(jìn)行了抽象,形成了一套可以解決若干業(yè)務(wù)問題的思路。就游戲業(yè)務(wù)來說,從游戲數(shù)據(jù)分析角度,目前已經(jīng)存在幾套方法論,比如游戲早期市場(chǎng)提及的是PRARA,在進(jìn)入移動(dòng)游戲領(lǐng)域,以TalkingData的AARRR模型則提及得最多,這套方法論綜合了PRARA、網(wǎng)站分析、社交網(wǎng)絡(luò)分析等諸多分析的特色,結(jié)合移動(dòng)游戲市場(chǎng)的情況,加以整理并提出的。在后續(xù)的章節(jié)中,我們會(huì)重點(diǎn)介紹AARRR模型。
方法論存在的意義就是要去解決問題,是對(duì)于問題、目標(biāo)、方法和工具的概述。一方面解決業(yè)務(wù)問題,另一方面則是分析思維的指導(dǎo)。在后續(xù)有關(guān)游戲數(shù)據(jù)分析師的描述中,我們強(qiáng)調(diào)對(duì)分析思想的鍛煉及方法的駕馭,學(xué)會(huì)基于不同角度和領(lǐng)域去看待業(yè)務(wù)問題,這需要高度的抽象和概括能力。從圖1-2我們也可以看到,方法論的確立,決定了我們?cè)谟螒驍?shù)據(jù)分析方向上要解決的問題、采取的方法和使用的工具等。
當(dāng)我們?nèi)鄙龠@樣的體系支撐時(shí),即使我們確立目標(biāo),但是在實(shí)踐操作時(shí)將會(huì)變得非常緩慢,效率低下。因?yàn)樵谡麄(gè)的過程中,我們要完成游戲數(shù)據(jù)分析的工作,需要開發(fā)人員、設(shè)計(jì)人員和運(yùn)營(yíng)人員的參與,當(dāng)大家無法在統(tǒng)一的思想和方法的指導(dǎo)下,就無法進(jìn)行有效地任務(wù)分配和需求理解,進(jìn)而導(dǎo)致今天我們看到這種現(xiàn)象:在很多的游戲公司,運(yùn)營(yíng)人員與開發(fā)人員的溝通中頻頻會(huì)出現(xiàn)各種數(shù)據(jù)標(biāo)準(zhǔn)理解的不統(tǒng)一,分析功能開發(fā)得南轅北轍。這些問題的出現(xiàn)不僅僅是溝通的問題,更是對(duì)于游戲數(shù)據(jù)分析的體系和思想未形成一致的認(rèn)識(shí)造成的。在方法論的階段有如下的兩點(diǎn)是需要重點(diǎn)關(guān)注和解決的。
(1)業(yè)務(wù)需求
方法論是對(duì)業(yè)務(wù)需求的 層級(jí)的抽象,涉及具體業(yè)務(wù)時(shí),在方法論的指導(dǎo)下,我們需要對(duì)業(yè)務(wù)需求進(jìn)行拆解,而這個(gè)階段,從數(shù)據(jù)分析的角度來看,就是該如何進(jìn)行數(shù)據(jù)埋點(diǎn)。
數(shù)據(jù)埋點(diǎn)就是通過客戶端或者服務(wù)端,通過在某些游戲位置追蹤玩家游戲行為而得到的相關(guān)數(shù)據(jù)。這些位置則是未來對(duì)特定業(yè)務(wù)分析的基礎(chǔ)數(shù)據(jù)支撐。比如,我們?cè)谶M(jìn)行用戶注冊(cè)分析時(shí),需要在用戶注冊(cè)的相關(guān)代碼和邏輯位置進(jìn)行數(shù)據(jù)采集點(diǎn)的設(shè)計(jì),這樣當(dāng)游戲有玩家參與時(shí),我們就可以通過采集到的數(shù)據(jù),進(jìn)行整理,形成可計(jì)算的指標(biāo)。
…過長(zhǎng)期的發(fā)展后,基本上已經(jīng)形成了一些特定的數(shù)據(jù)指標(biāo),而這些指標(biāo)也可以涵蓋大部分的業(yè)務(wù)數(shù)據(jù)分析。多數(shù)時(shí)候,我們常常會(huì)苦惱于如何進(jìn)行數(shù)據(jù)埋點(diǎn),如何進(jìn)行基礎(chǔ)的數(shù)據(jù)分析,實(shí)際上,我們通過一些行業(yè)通用的數(shù)據(jù)指標(biāo)白皮書就可以在短時(shí)間內(nèi)明確該如何進(jìn)行數(shù)據(jù)的埋點(diǎn)和基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)分析,這方面可以參考TalkingData在2012年發(fā)布的《移動(dòng)游戲運(yùn)營(yíng)數(shù)據(jù)指標(biāo)白皮書》。
(2)指標(biāo)體系
當(dāng)我們形成了基本的數(shù)據(jù)指標(biāo)后,我們要形成完整的指標(biāo)體系,并且要建立在方法論的指導(dǎo)基礎(chǔ)之上。在多數(shù)情況下,指標(biāo)具有很強(qiáng)的業(yè)務(wù)導(dǎo)向性和監(jiān)測(cè)作用。比如在我們進(jìn)行數(shù)據(jù)日?qǐng)?bào)的制作過程中,我們就需要按照一定的邏輯組織我們的數(shù)據(jù),用戶類數(shù)據(jù),收益類數(shù)據(jù),渠道數(shù)據(jù)等等。與此同時(shí),在這些指標(biāo)基礎(chǔ)之上,數(shù)據(jù)分析人員可根據(jù)需要,進(jìn)一步加工和變換指標(biāo),從而完成深度分析,比如我們對(duì)于新增付費(fèi)用戶的研究,用戶生命周期價(jià)值的探討等,就需要在基礎(chǔ)數(shù)據(jù)的指引下,進(jìn)一步建立新的數(shù)據(jù)規(guī)劃和指標(biāo)拆解。
這部分指標(biāo)工作看似是最基礎(chǔ)的部分,但是最重要。理清了業(yè)務(wù)需求,我們需要基于目標(biāo)驅(qū)動(dòng)構(gòu)建指標(biāo)體系,在類似AARRR模型的指導(dǎo)下,整體構(gòu)建并不會(huì)有太多的特殊性,但重要的一點(diǎn)是,所構(gòu)建的指標(biāo)體系需要能夠和業(yè)務(wù)匹配起來,比如更具業(yè)務(wù)需要,重點(diǎn)予以關(guān)注的指標(biāo)數(shù)據(jù),或者關(guān)鍵業(yè)務(wù)的評(píng)估需要微型的指標(biāo)體系來實(shí)施。這一類是在方法論指導(dǎo)原則下完成的。
在指標(biāo)體系中,指標(biāo)重在理解和標(biāo)準(zhǔn)化,如果在構(gòu)建指標(biāo)體系階段,定義的指標(biāo)標(biāo)準(zhǔn)不夠清晰,那么在具體的開發(fā)實(shí)施階段,就會(huì)產(chǎn)生很多問題,最終造成了類似統(tǒng)計(jì)數(shù)據(jù)不準(zhǔn)確等問題。此外,在此階段定義的指標(biāo)不是越多越好,所以要加深對(duì)于指標(biāo)的深入理解,借助數(shù)據(jù)分析來解決問題,而不是羅列數(shù)據(jù),在構(gòu)建的指標(biāo)體系內(nèi),每一個(gè)指標(biāo)都將具備實(shí)際的分析價(jià)值和能夠反映特定的問題,并且當(dāng)問題得以解決時(shí),我們還可以從該指標(biāo)或者幾個(gè)指標(biāo)的組合中評(píng)估效果。
1.3.2數(shù)據(jù)加工
對(duì)數(shù)據(jù)進(jìn)行處理使其最終變成信息,這個(gè)階段統(tǒng)稱為數(shù)據(jù)加工,具體要經(jīng)歷如圖1-3所示的流程。
圖1-3游戲數(shù)據(jù)加工流程
在數(shù)據(jù)加工階段,我們重點(diǎn)要去解決的問題有兩點(diǎn)。
(1)業(yè)務(wù)理解
系統(tǒng)最終是需要技術(shù)開發(fā)的,在選定技術(shù)和工具之前,最重要的是要充分理解需求和標(biāo)準(zhǔn)定義。在開發(fā)人員完成開發(fā)后,如果發(fā)現(xiàn)其數(shù)據(jù)處理的結(jié)果并非是分析師或者業(yè)務(wù)人員所需要的,那么就浪費(fèi)了很多的時(shí)間和資源,因此是否形成一直的指標(biāo)定義認(rèn)識(shí),是否明確統(tǒng)一需求,需要分析師、業(yè)務(wù)人員與開發(fā)團(tuán)隊(duì)共同商議,形成統(tǒng)一的認(rèn)識(shí),否則將面臨重復(fù)開發(fā),需求更改等等一系列的問題。在所有人員在這些問題達(dá)成一致后,接下來就要解決的是技術(shù)開發(fā)問題。
(2)技術(shù)開發(fā)
確立使用什么技術(shù)和架構(gòu)來完成整體的數(shù)據(jù)分析平臺(tái)的建設(shè),這是需要技術(shù)人員去評(píng)估的,而評(píng)估的一個(gè)重要參考就是前一個(gè)階段所確立的內(nèi)容,技術(shù)人員對(duì)于業(yè)務(wù)分析需要的理解,決定了未來構(gòu)建的數(shù)據(jù)平臺(tái)的很多因素,比如高安全性、高效性、高可靠性、高可用性、高可擴(kuò)展性和可管理性,等等。
在數(shù)據(jù)采集層級(jí),我們需要解決數(shù)據(jù)的發(fā)送機(jī)制、采集內(nèi)容和存儲(chǔ)方式等。就目前的移動(dòng)互聯(lián)網(wǎng)游戲來說,主要采取在游戲客戶端植入統(tǒng)計(jì)分析SDK的方式來完成數(shù)據(jù)的采集,當(dāng)然,在部分公司中,也采取了游戲服務(wù)器端完成數(shù)據(jù)的采集。兩種方式各自具備優(yōu)勢(shì),通過SDK植入游戲客戶端的采集方式,在有關(guān)游戲用戶終端設(shè)備的信息,用戶會(huì)話時(shí)間等方面具備優(yōu)勢(shì),而通過服務(wù)器端的數(shù)據(jù)采集,則在游戲內(nèi)諸如等級(jí)分析、關(guān)卡任務(wù)分析方面具備優(yōu)勢(shì),但是對(duì)于游戲用戶在客戶端設(shè)備上一些行為則無法做到采集和分析。比如,如圖1-4所示,在移動(dòng)游戲客戶端的錯(cuò)誤日志中,多數(shù)情況下無法通過服務(wù)器端獲得的寶貴數(shù)據(jù)。
圖1-4游戲客戶端錯(cuò)誤日志
而這些數(shù)據(jù),經(jīng)過采集后,則是可以快速了解目前產(chǎn)品的問題,比如新增用戶很多,但是活躍時(shí)間和留存質(zhì)量很低,分析錯(cuò)誤日志則是一個(gè)很好的方式。這一點(diǎn)在移動(dòng)游戲數(shù)據(jù)分析方面是非常必要的,因?yàn)橐苿?dòng)游戲環(huán)境和嘲的多樣性,使得我們必須重視解決看似很小的問題。
在數(shù)據(jù)處理層級(jí)要對(duì)采集到的原始數(shù)據(jù)進(jìn)行抽取、清洗和加載,對(duì)雜亂的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、映射、排重以及糾錯(cuò)等操作,最終將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中。在這個(gè)階段需要完成的工作量是非常龐大的,尤其是在移動(dòng)游戲領(lǐng)域,當(dāng)用戶終端的設(shè)備變得更加多樣,地域更加分散后,數(shù)據(jù)的處理工作相比之前的端游和頁(yè)游,變得更加的重要,依賴程度更高。移動(dòng)游戲需要更加快速的響應(yīng)和迭代能力,當(dāng)我們通過數(shù)據(jù)發(fā)現(xiàn)了游戲在某些設(shè)備上存在問題時(shí)就要迅速的進(jìn)行解決,而此時(shí),關(guān)鍵任務(wù)在于我們?nèi)绾伟l(fā)現(xiàn)這些問題并進(jìn)行分析。如圖1-5所示,我們需要依托設(shè)備的標(biāo)準(zhǔn)化和糾錯(cuò)去發(fā)現(xiàn)不同用戶群的設(shè)備分布情況。在同樣情況下,我們也可以分析比如付費(fèi)用戶更加傾向哪些分辨率的手機(jī),或者使用iPhone5的付費(fèi)用戶的ARPPU是多少,這些分析都要依托于強(qiáng)大的數(shù)據(jù)處理能力才能夠?qū)崿F(xiàn)。
圖1-5游戲設(shè)備排行信息
在數(shù)據(jù)計(jì)算層級(jí),要進(jìn)行實(shí)時(shí)的運(yùn)算,定義多維數(shù)據(jù)模型、業(yè)務(wù)模型,比如基于時(shí)間維度、地域維度、用戶群維度、區(qū)服維度和渠道維度等,按照小時(shí)、日計(jì)算任務(wù),根據(jù)業(yè)務(wù)要求進(jìn)行數(shù)據(jù)運(yùn)算,并把結(jié)果集數(shù)據(jù)輸入到數(shù)據(jù)庫(kù)中。
在業(yè)務(wù)信息層級(jí),則需要將經(jīng)過采集、處理并計(jì)算的數(shù)據(jù)最后經(jīng)過接口變成可被查詢的信息,如果從開發(fā)層面解釋,就是龐大的報(bào)表系統(tǒng),即直接面向最終分析師的數(shù)據(jù)產(chǎn)品。
實(shí)際上數(shù)據(jù)加工階段的最終目的就是將數(shù)據(jù)轉(zhuǎn)化為可用的信息。從這點(diǎn)來看,第三階段的統(tǒng)計(jì)分析則是與業(yè)務(wù)信息階段是結(jié)合非常緊密的,統(tǒng)計(jì)分析要基于已經(jīng)加工好的數(shù)據(jù),進(jìn)一步深入地透過更加多元的數(shù)據(jù)或者信息分析方法,挖掘特征。
1.3.3統(tǒng)計(jì)分析
統(tǒng)計(jì)分析包含了統(tǒng)計(jì)和分析。統(tǒng)計(jì)分析是商業(yè)智能的一方面,商業(yè)智能應(yīng)用還包括決策支持系統(tǒng)(DSS)、查詢和報(bào)告、在線分析處理(OLAP)、預(yù)測(cè)和數(shù)據(jù)挖掘,統(tǒng)計(jì)分析則是整理數(shù)據(jù)和分析數(shù)據(jù)的綜合。
此前我們需要收集數(shù)據(jù),但是目的都是整理數(shù)據(jù)且最終要進(jìn)行分析數(shù)據(jù),數(shù)據(jù)向信息轉(zhuǎn)化的過程。為此需要描述數(shù)據(jù)的性質(zhì)和研究數(shù)據(jù)關(guān)系,并通過一定的模型來變換角度解析數(shù)據(jù)內(nèi)在的聯(lián)系,而如果整體系統(tǒng)的開發(fā)度更高,則可以就模型本身進(jìn)行有效性的驗(yàn)證。在部分公司提供的統(tǒng)計(jì)分析系統(tǒng)上,我們已經(jīng)能夠看到部分的預(yù)測(cè)分析,這也是向下個(gè)階段提煉演繹的重要過渡。
對(duì)于游戲數(shù)據(jù)分析師來說,我們需要學(xué)習(xí)的更多的統(tǒng)計(jì)的思想、方法和解題思路。統(tǒng)計(jì)分析最關(guān)鍵的就是要分析數(shù)據(jù),因?yàn)閷?duì)于經(jīng)過整理和加工的數(shù)據(jù),如何提煉有用的決策信息,一方面是依托于系統(tǒng)的數(shù)據(jù)采集和整理,另一方面則需要分析師最終進(jìn)行分析才會(huì)發(fā)揮價(jià)值。分析師的最大要求就是理解每一個(gè)方法背后的原則、范圍和思想。統(tǒng)計(jì)學(xué)的思維將我們對(duì)于事物的解讀能力提升到了一個(gè)更高的層次。
在進(jìn)行一些游戲數(shù)據(jù)分析時(shí)經(jīng)常使用集中趨勢(shì)或者離散程度的指標(biāo),而這些指標(biāo)所代表的不只是一個(gè)計(jì)算方式,更重要的是在最初誕生時(shí),就是為了解決某一類問題而設(shè)計(jì)的解決辦法,這是我們?cè)诜治龌谟?jì)算方法下分析數(shù)據(jù)所最需要關(guān)心的事情,比如在描述統(tǒng)計(jì)分析中,我們經(jīng)常使用集中趨勢(shì),它反映的是一組數(shù)據(jù)所有具有的共同趨勢(shì)。
統(tǒng)計(jì)分析階段對(duì)分析師來說是非常重要的考驗(yàn),尤其是基本的分析能力。當(dāng)然,作為一名分析師只具備在挖掘數(shù)據(jù)特征和分析數(shù)據(jù)方面的能力還不足以證明分析師的價(jià)值,數(shù)據(jù)分析本身是輔助決策的,因此,能夠挖掘提煉和演繹,與業(yè)務(wù)有效結(jié)合,形成結(jié)論則是非常重要的。所有的分析師不是為了分析數(shù)據(jù)而分析數(shù)據(jù),崇尚數(shù)據(jù),信仰數(shù)據(jù),但不要盲目。
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問川北在線:http://sanmuled.cn/