南京大學(xué)僑聯(lián)成立三十周年系列慶祝活動舉行
伴隨著互聯(lián)網(wǎng)的深度覆蓋和計算機(jī)技術(shù)的飛速發(fā)展,人類社會迅速進(jìn)入到一個全新的信息化時代,“大數(shù)據(jù)”無疑成為當(dāng)今互聯(lián)網(wǎng)世界中的“新寵”。從數(shù)據(jù)特征來看,大數(shù)據(jù)具有常見的5V特征,即容量大(Volume)、類型多(Variety)、時效性高(Velocity)、準(zhǔn)確性高(Veracity)和價值密度低(Value)。這些全新的數(shù)據(jù)特征使得業(yè)界對大數(shù)據(jù)的研究應(yīng)用增長迅速,衍生出機(jī)器學(xué)習(xí)、人工智能等若干領(lǐng)域,并在消費(fèi)者行為偏好等領(lǐng)域?qū)崿F(xiàn)較為成熟的應(yīng)用。
挑戰(zhàn)傳統(tǒng)量化研究思路
目前,社會科學(xué)領(lǐng)域?qū)Υ髷?shù)據(jù)的研究還處于起步和成長階段。相較于大數(shù)據(jù)在商業(yè)領(lǐng)域的數(shù)據(jù)特征,在社會科學(xué)研究層面,大數(shù)據(jù)具有兩方面的顯著特征:一是全數(shù)據(jù)特征。大數(shù)據(jù)采集效率高,能夠直接獲取總體數(shù)據(jù),區(qū)別于傳統(tǒng)有限規(guī)模的抽樣調(diào)查數(shù)據(jù)。二是非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)形式,區(qū)別于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),更為豐富的過程數(shù)據(jù)、文本數(shù)據(jù)都可以進(jìn)入研究的范疇。這兩個特征極大地挑戰(zhàn)了傳統(tǒng)社會科學(xué)量化研究的思路,同時也給未來社會科學(xué)研究的突破性發(fā)展帶來了新機(jī)遇。
在社會科學(xué)各學(xué)科中,政治學(xué)是較早應(yīng)用大數(shù)據(jù)方法的學(xué)科之一,這與其學(xué)科特征緊密關(guān)聯(lián)。作為引領(lǐng)政治學(xué)方向的美國政治學(xué)研究向來注重量化研究方法,對新技術(shù)的應(yīng)用總是走在各學(xué)科前沿;而政治現(xiàn)象的復(fù)雜性和一定程度上的顯學(xué)特征,也使得政治學(xué)界對新技術(shù)的出現(xiàn)和應(yīng)用充滿期待。因此,大數(shù)據(jù)在政治學(xué)領(lǐng)域的應(yīng)用相對走在社會科學(xué)各學(xué)科前沿,在宏觀的社會運(yùn)動研究和微觀的大眾研究層面都收獲了許多具有典型意義的成果,推動了政治學(xué)方法論的更新和進(jìn)步。
改變宏觀微觀研究范式
社會運(yùn)動等宏大主題是政治學(xué)經(jīng)常關(guān)注的話題,但對這一議題的研究卻常常受到數(shù)據(jù)采集難度大、空間結(jié)構(gòu)分析困難等因素的影響,使得研究受到局限。尤其是隨著網(wǎng)絡(luò)政治的興起,對網(wǎng)絡(luò)社會運(yùn)動的研究和分析還很不足。大數(shù)據(jù)帶來的數(shù)據(jù)采集和分析方法上的進(jìn)步,使得政治學(xué)對社會運(yùn)動更為精確的研究和預(yù)測變得可能。在分析方法上,大數(shù)據(jù)所推動的大規(guī)模社會網(wǎng)絡(luò)分析、自動文本分析、情感分析、機(jī)器學(xué)習(xí)等方法的運(yùn)用和普及,使得對社會運(yùn)動研究過程的刻畫更為精細(xì),研究角度也更為多元。
利用大數(shù)據(jù)的這種優(yōu)勢,當(dāng)前已有不少研究探討了社會事件的起因和結(jié)構(gòu)。這些研究拓展了對社會運(yùn)動的研究方式,增進(jìn)了政治學(xué)對社會運(yùn)動尤其是網(wǎng)絡(luò)社會運(yùn)動議題的研究,在理論和應(yīng)用層面都發(fā)揮了重要作用。
傳統(tǒng)的大眾研究往往以調(diào)查數(shù)據(jù)為基礎(chǔ),以標(biāo)準(zhǔn)化的問卷獲取大眾的政治傾向、政治參與、政治滿意度等信息。受制于調(diào)查問卷的規(guī)模和高額的調(diào)查成本,樣本規(guī)模和問卷內(nèi)容都非常有限。而無論是面對面的直接訪問還是電話調(diào)查或者是網(wǎng)絡(luò)調(diào)查,數(shù)據(jù)不可避免地要受到調(diào)查質(zhì)量以及受訪者的社會意愿偏差、記憶偏差等因素的影響,使得數(shù)據(jù)結(jié)果容易受到質(zhì)疑。
大數(shù)據(jù)方法的出現(xiàn),刷新了傳統(tǒng)的數(shù)據(jù)獲取方式和所能獲得的數(shù)據(jù)類型。這使得數(shù)據(jù)庫可以突破抽樣的限制,數(shù)據(jù)規(guī)模大為擴(kuò)展,便利了對事實(shí)的描述分析;更為豐富的數(shù)據(jù)類型也使得政治學(xué)研究能夠更進(jìn)一步探測民眾的政治偏好、政治行為、情感取向以及政治互動等多方面的情況。當(dāng)前,已有不少這類研究出現(xiàn),比如有西方學(xué)者利用機(jī)器學(xué)習(xí)和社會網(wǎng)絡(luò)分析,來推測微博用戶的黨派身份,并分析他們的政黨同質(zhì)性水平;也有中國學(xué)者通過對政府網(wǎng)絡(luò)留言板上的發(fā)帖內(nèi)容分析,探究公民網(wǎng)絡(luò)訴求的表達(dá)策略等。
政治學(xué)方法論:跨學(xué)科趨勢
從政治學(xué)方法論角度來看,“量化”已經(jīng)是政治科學(xué)研究方法中的主要成分,而大數(shù)據(jù)進(jìn)一步推動了量化方法的升級和擴(kuò)展,這使傳統(tǒng)的量化方法重點(diǎn)——因果推論上也取得了諸多進(jìn)展。首先,就因果推論中常用的匹配法而言,傳統(tǒng)的匹配方法容易受到樣本規(guī)模的極大制約,尤其是對于小規(guī)模群體而言,匹配方法在傳統(tǒng)樣本規(guī)模下很難實(shí)現(xiàn);而大數(shù)據(jù)在數(shù)據(jù)規(guī)模上的優(yōu)勢,使得小規(guī)模群體的數(shù)量規(guī)模也相應(yīng)變大,使匹配成為可能。其次,就因果推論中的實(shí)驗(yàn)方法而言,大數(shù)據(jù)也展現(xiàn)出其優(yōu)勢:傳統(tǒng)的調(diào)查實(shí)驗(yàn)和田野實(shí)驗(yàn)方法成本高且實(shí)施難度較大,而大數(shù)據(jù)方法多借助于計算機(jī)技術(shù)和互聯(lián)網(wǎng),實(shí)驗(yàn)干預(yù)手段相對便捷,成本也更為低廉,一定程度上打破了實(shí)驗(yàn)設(shè)計的高額成本門檻,提供了探究因果關(guān)系的新選擇。
大數(shù)據(jù)帶來的數(shù)據(jù)開發(fā)和研究前景使得政治學(xué)與自然科學(xué)各學(xué)科的結(jié)合更為緊密,使得政治學(xué)向科學(xué)的方向更進(jìn)一步。傳統(tǒng)意義上,文本挖掘、機(jī)器學(xué)習(xí)、編程等概念似乎是自然科學(xué)中才會涉及的概念和方法,與社會科學(xué)有著較遠(yuǎn)的距離。但大數(shù)據(jù)時代的到來,很大程度上打破了這種文理界限,不僅要求社會科學(xué)學(xué)者具備一定的計算機(jī)技能,而且能夠應(yīng)對網(wǎng)絡(luò)情況下的數(shù)據(jù)采集和分析方式。這對政治學(xué)者的挑戰(zhàn)是巨大的:政治學(xué)者關(guān)注的對象是更為抽象的政治話題,要處理的是更為復(fù)雜的文本、話語、情感等數(shù)據(jù),需要掌握和開發(fā)“非本專業(yè)”的數(shù)據(jù)處理方法。這使得政治學(xué)者面臨著技能上的極大挑戰(zhàn),而主動學(xué)習(xí)和跨學(xué)科合作研究則是必由之路。
此外,在政治學(xué)研究中,也要審慎使用大數(shù)據(jù)。大數(shù)據(jù)帶來的強(qiáng)大數(shù)據(jù)采集和分析能力,以及學(xué)界對大數(shù)據(jù)方法的不斷開發(fā)利用,使得大數(shù)據(jù)的開發(fā)和應(yīng)用方法不斷成熟,并處于不斷前進(jìn)的過程,為政治學(xué)的發(fā)展提供了新引擎,帶動了傳統(tǒng)研究的更新進(jìn)步,也開拓了新的研究領(lǐng)域。但是,伴隨著政治學(xué)研究的進(jìn)一步科學(xué)化,也要警惕大數(shù)據(jù)應(yīng)用中存在的風(fēng)險。當(dāng)前,在政治學(xué)的應(yīng)用中,大數(shù)據(jù)方法是實(shí)驗(yàn)干預(yù)的重要方式。但這種方式往往有著較大的人群影響規(guī)模,使得實(shí)驗(yàn)效果有可能突破研究的范疇,對現(xiàn)實(shí)的政治和社會運(yùn)行帶來一定的影響。因此,對大數(shù)據(jù)實(shí)驗(yàn)手段的使用,要充分考慮到可能的現(xiàn)實(shí)不利影響而對其審慎使用。
上述新聞由“讀研網(wǎng)政策部”轉(zhuǎn)自中國社會科學(xué)網(wǎng),如您有政治學(xué)在職研究生方面的疑惑,可以在線咨詢我們的老師。