審查互聯網行業(yè)數據造假,還(hái)互聯網行業(yè)一片晴空
發布時(shí)間(jiān):2019-08-06 來(lái)源:原數據
信息化(huà)時(shí)代,新的(de)科(kē)技(jì)給人(rén)們帶來(lái)便利的(de)同時(shí),信息紛繁複雜(zá),也存在一些不良現(xiàn)象,良莠不齊,魚目混珠,甚至造假手段更是層出不窮,手段五花(huā)八門,面對(duì)反造假,更是道(dào)高(gāo)一尺魔高(gāo)一丈。
原數據團隊主要面向投資機(jī)構和(hé)監管機(jī)構提供信息數據盡職調查服務,針對(duì)互聯網行業(yè)普遍存在的(de)數據造假現(xiàn)象,究其原因,拆其伎倆,防止各投資機(jī)構中招。
一、 數據造假的(de)利益鏈
天下(xià)熙熙皆為(wèi)利來(lái),天下(xià)攘攘皆為(wèi)利往。任何經濟行為(wèi),背後都(dōu)有(yǒu)利益邏輯在。對(duì)于互聯網産品,我們可以從(cóng)投資方、運營方、用戶三方,分析各自(zì)的(de)利益,你(nǐ)會發現(xiàn),數據造假之所能存在,是有(yǒu)利益鏈條在裏邊的(de)。而且在不同時(shí)期,各方追求的(de)利益關系不同,甚至會從(cóng)對(duì)立變為(wèi)統一。
在運營方融資前,為(wèi)了吸引用戶來(lái)關注、注冊和(hé)使用産品或平台,通(tōng)常會采用,注冊、邀請獎勵、贈送會員(yuán)、優惠券等手段,這(zhè)其實是一種買粉的(de)形式。甚至為(wèi)了順利拿(ná)到較多融資,也會常用一些非常手段,比如,自(zì)動用戶注冊,自(zì)動評論等軟件(jiàn)添加虛假數據,給投資方一種用戶多而或活躍的(de)感覺,從(cóng)而提高(gāo)企業(yè)估值。
還(hái)有(yǒu)為(wèi)用戶引流的(de)一些廣告服務商,按流量收費(fèi),也會存在虛假點擊的(de)現(xiàn)象,給廣告投放(fàng)用戶帶來(lái)經濟損失,這(zhè)是直接傷害用戶的(de)欺詐行為(wèi)。
因此,在投資或并購過程中,作(zuò)為(wèi)投資機(jī)構,如果隻是查看(kàn)運營方的(de)提供的(de)數據和(hé)報表,難免陷入“誤區(qū)”,尋求專業(yè)的(de)數據盡職調查團隊的(de)幫助,是至關重要的(de)。
二、 數據造假的(de)方式手段
互聯網經濟是眼球經濟,用戶為(wèi)王,這(zhè)也是為(wèi)什麽很(hěn)多新創公司,不惜燒錢,用免費(fèi)、優惠手段,來(lái)吸引用戶。從(cóng)用戶活躍度角度,包括用戶量、用戶活動量(點擊量、閱讀量、發帖量、回複量)、用戶價值(充值、訂單量、訂單額)等運營KPI。不惜一切代價來(lái)提高(gāo)這(zhè)些數據的(de)原因隻有(yǒu)一個(gè):吸引投資機(jī)構,并給予較好(hǎo)的(de)估值和(hé)條件(jiàn)
除了因為(wèi)注冊、邀請獎勵,等帶來(lái)的(de)一些新用戶,經過一段時(shí)間(jiān)自(zì)然形成的(de)僵屍用戶,更多大量虛假的(de)僵屍用戶,是由自(zì)動化(huà)注冊軟件(jiàn)帶來(lái)的(de),用戶信息是按照(zhào)一定的(de)規則,随機(jī)組合生(shēng)成,再短時(shí)間(jiān)內(nèi)快速插入,成本極低(dī)。技(jì)術手段較高(gāo)的(de),可能會使用動态ip、設置時(shí)間(jiān)間(jiān)隔來(lái)注冊,以掩人(rén)耳目。甚至,有(yǒu)些軟件(jiàn)推廣者,通(tōng)過插件(jiàn)的(de)方式在,用戶不注意的(de)情況下(xià),在用戶電(diàn)腦上(shàng)默認勾選,自(zì)動安裝,不是木馬也算(suàn)流氓軟件(jiàn)。
直銷電(diàn)商運營者也通(tōng)過刷單、退貨(或返現(xiàn)),充值、退錢,充斥着虛假的(de)訂單和(hé)評論。在電(diàn)商平台運營早期,平台為(wèi)了吸引商家(jiā)入駐,不收取平台服務費(fèi)和(hé)銷售額的(de)分成,有(yǒu)些商家(jiā)為(wèi)了周轉資金(jīn),創建虛假訂單,用信用卡支付套現(xiàn)。電(diàn)商消費(fèi),信用卡支付占據了最高(gāo)的(de)比例,即使很(hěn)小(xiǎo)套現(xiàn)比例,總量也是不小(xiǎo)。
在2018 年(nián)“馬蜂窩事(shì)件(jiàn)”中,備受質疑的(de)一個(gè)數據造假“套路(lù)”是,不少用戶在其他(tā)平台的(de)旅行攻略、點評內(nèi)容,通(tōng)過爬蟲程序,被搬運到馬蜂窩上(shàng)。實際上(shàng),此類做法并不新鮮。生(shēng)活社區(qū)小(xiǎo)紅書(shū)通(tōng)過官方微(wēi)博指責大衆點評大量抄襲其用戶的(de)內(nèi)容。具體(tǐ)做法是批量建立虛假賬号,抄襲及搬運用戶在小(xiǎo)紅書(shū)發布的(de)原創內(nèi)容。據小(xiǎo)紅書(shū)估計(jì),抄襲的(de)數量在百萬條量級。
2015年(nián),有(yǒu)業(yè)內(nèi)技(jì)術人(rén)員(yuán)在知名社區(qū)“知乎”上(shàng)爆料,通(tōng)過反向編譯蜻蜓FM安卓版本軟件(jiàn),他(tā)發現(xiàn)蜻蜓FM軟件(jiàn)中隐藏有(yǒu)名為(wèi)“普羅米修斯”和(hé)“宙斯”的(de)強行自(zì)啓代碼。前者可以在用戶不知情的(de)情況下(xià),在手機(jī)後台啓動無窗口透明(míng)界面,後者則可以自(zì)主觸發廣告商的(de)廣告,并回傳給第三方數據公司,從(cóng)而完成“用戶自(zì)主點擊廣告”的(de)操作(zuò)。
因為(wèi)安卓系統的(de)開(kāi)放(fàng)性,破解系統權限後,一台平闆電(diàn)腦設備上(shàng)甚至可以裝十多個(gè)同樣的(de)App,配合不需實名制的(de)虛拟運營商電(diàn)話(huà)卡,可以形成十多個(gè)看(kàn)似真實、獨立,實則批量化(huà)虛假的(de)用戶。而且,由于虛拟運營商的(de)手機(jī)号可以包月(yuè)使用,這(zhè)樣的(de)造假手法成本得以進一步降低(dī)。
三、 數據造假的(de)分析和(hé)判讀
如果你(nǐ)關注互聯網行業(yè)的(de)投資機(jī)會,你(nǐ)很(hěn)可能對(duì)此深惡痛絕但(dàn)束手無策。原數據團隊分享以下(xià)幾點數據造假判别方法,希望能對(duì)你(nǐ)有(yǒu)所幫助。
首要的(de)是,我們要建立綜合考察互聯網公司的(de)運營指标體(tǐ)系,不能隻用單一的(de)指标來(lái)衡量。比如,從(cóng)用戶量,我們不能隻重視(shì)用戶量,還(hái)要分析活躍用戶、高(gāo)價值用戶比例。從(cóng)現(xiàn)金(jīn)價值角度,不能隻看(kàn)訂單金(jīn)額,還(hái)要關注單用戶消費(fèi)額,看(kàn)是否超出數值常理(lǐ)範圍,營業(yè)額也可以結合第三方支付平台和(hé)稅收來(lái)驗證。
其次,我們不能隻關注數據結果,還(hái)要審查追蹤數據。比如,現(xiàn)有(yǒu)用戶量,用了多久發展起來(lái)的(de),快速增長(cháng)期的(de)速度如何。充值類賬戶,是否有(yǒu)大量退款現(xiàn)象。商品消費(fèi)類訂單,物(wù)流信息是否都(dōu)真實存在。
具體(tǐ)從(cóng)技(jì)術層面,作(zuò)為(wèi)投資機(jī)構,可以要求取得目标公司的(de)一定數據權限,通(tōng)過數據庫的(de)安裝、運行、數據日(rì)志(zhì)上(shàng)的(de)信息,可以初步确定數據庫是否異常改動現(xiàn)象。對(duì)用于用戶注冊信息,我們可以通(tōng)過分析是否存在注冊ip集中、注冊時(shí)間(jiān)集中,賬号、賬戶名(昵稱)存在異常,是否存在大量注冊虛拟手機(jī)号,ip和(hé)手機(jī)号地(dì)域信息不匹配的(de)情況。訂單、充值附近(jìn)時(shí)間(jiān)是否有(yǒu)登陸、浏覽記錄等。
基于以上(shàng)三點,雖然能夠判别出一些造假信息,但(dàn)是需要專業(yè)數據盡調團隊撰寫多種算(suàn)法和(hé)模型,進行驗證,才能給出相(xiàng)對(duì)準确的(de)結論。
要杜絕解決互聯網行業(yè)數據造假現(xiàn)象,需要行業(yè)從(cóng)業(yè)者、投資機(jī)構、用戶、市(shì)場(chǎng)監管機(jī)構等多方共同努力,從(cóng)轉變觀念開(kāi)始,建立誠信為(wèi)本、健康可持續的(de)發展觀,相(xiàng)關部門也會制訂出台相(xiàng)應的(de)法規,并推行如區(qū)塊鏈、第三方數字認證等防數據篡改技(jì)術應用,相(xiàng)信未來(lái)會形成健康的(de)互聯網産業(yè)環境。(原數據團隊,微(wēi)信Robot_Volke)