南京大學僑聯成立三十周年系列慶祝活動舉行
伴隨著互聯網的深度覆蓋和計算機技術的飛速發展,人類社會迅速進入到一個全新的信息化時代,“大數據”無疑成為當今互聯網世界中的“新寵”。從數據特征來看,大數據具有常見的5V特征,即容量大(Volume)、類型多(Variety)、時效性高(Velocity)、準確性高(Veracity)和價值密度低(Value)。這些全新的數據特征使得業界對大數據的研究應用增長迅速,衍生出機器學習、人工智能等若干領域,并在消費者行為偏好等領域實現較為成熟的應用。
挑戰傳統量化研究思路
目前,社會科學領域對大數據的研究還處于起步和成長階段。相較于大數據在商業領域的數據特征,在社會科學研究層面,大數據具有兩方面的顯著特征:一是全數據特征。大數據采集效率高,能夠直接獲取總體數據,區別于傳統有限規模的抽樣調查數據。二是非結構化和半結構化的數據形式,區別于傳統的結構化數據,更為豐富的過程數據、文本數據都可以進入研究的范疇。這兩個特征極大地挑戰了傳統社會科學量化研究的思路,同時也給未來社會科學研究的突破性發展帶來了新機遇。
在社會科學各學科中,政治學是較早應用大數據方法的學科之一,這與其學科特征緊密關聯。作為引領政治學方向的美國政治學研究向來注重量化研究方法,對新技術的應用總是走在各學科前沿;而政治現象的復雜性和一定程度上的顯學特征,也使得政治學界對新技術的出現和應用充滿期待。因此,大數據在政治學領域的應用相對走在社會科學各學科前沿,在宏觀的社會運動研究和微觀的大眾研究層面都收獲了許多具有典型意義的成果,推動了政治學方法論的更新和進步。
改變宏觀微觀研究范式
社會運動等宏大主題是政治學經常關注的話題,但對這一議題的研究卻常常受到數據采集難度大、空間結構分析困難等因素的影響,使得研究受到局限。尤其是隨著網絡政治的興起,對網絡社會運動的研究和分析還很不足。大數據帶來的數據采集和分析方法上的進步,使得政治學對社會運動更為精確的研究和預測變得可能。在分析方法上,大數據所推動的大規模社會網絡分析、自動文本分析、情感分析、機器學習等方法的運用和普及,使得對社會運動研究過程的刻畫更為精細,研究角度也更為多元。
利用大數據的這種優勢,當前已有不少研究探討了社會事件的起因和結構。這些研究拓展了對社會運動的研究方式,增進了政治學對社會運動尤其是網絡社會運動議題的研究,在理論和應用層面都發揮了重要作用。
傳統的大眾研究往往以調查數據為基礎,以標準化的問卷獲取大眾的政治傾向、政治參與、政治滿意度等信息。受制于調查問卷的規模和高額的調查成本,樣本規模和問卷內容都非常有限。而無論是面對面的直接訪問還是電話調查或者是網絡調查,數據不可避免地要受到調查質量以及受訪者的社會意愿偏差、記憶偏差等因素的影響,使得數據結果容易受到質疑。
大數據方法的出現,刷新了傳統的數據獲取方式和所能獲得的數據類型。這使得數據庫可以突破抽樣的限制,數據規模大為擴展,便利了對事實的描述分析;更為豐富的數據類型也使得政治學研究能夠更進一步探測民眾的政治偏好、政治行為、情感取向以及政治互動等多方面的情況。當前,已有不少這類研究出現,比如有西方學者利用機器學習和社會網絡分析,來推測微博用戶的黨派身份,并分析他們的政黨同質性水平;也有中國學者通過對政府網絡留言板上的發帖內容分析,探究公民網絡訴求的表達策略等。
政治學方法論:跨學科趨勢
從政治學方法論角度來看,“量化”已經是政治科學研究方法中的主要成分,而大數據進一步推動了量化方法的升級和擴展,這使傳統的量化方法重點——因果推論上也取得了諸多進展。首先,就因果推論中常用的匹配法而言,傳統的匹配方法容易受到樣本規模的極大制約,尤其是對于小規模群體而言,匹配方法在傳統樣本規模下很難實現;而大數據在數據規模上的優勢,使得小規模群體的數量規模也相應變大,使匹配成為可能。其次,就因果推論中的實驗方法而言,大數據也展現出其優勢:傳統的調查實驗和田野實驗方法成本高且實施難度較大,而大數據方法多借助于計算機技術和互聯網,實驗干預手段相對便捷,成本也更為低廉,一定程度上打破了實驗設計的高額成本門檻,提供了探究因果關系的新選擇。
大數據帶來的數據開發和研究前景使得政治學與自然科學各學科的結合更為緊密,使得政治學向科學的方向更進一步。傳統意義上,文本挖掘、機器學習、編程等概念似乎是自然科學中才會涉及的概念和方法,與社會科學有著較遠的距離。但大數據時代的到來,很大程度上打破了這種文理界限,不僅要求社會科學學者具備一定的計算機技能,而且能夠應對網絡情況下的數據采集和分析方式。這對政治學者的挑戰是巨大的:政治學者關注的對象是更為抽象的政治話題,要處理的是更為復雜的文本、話語、情感等數據,需要掌握和開發“非本專業”的數據處理方法。這使得政治學者面臨著技能上的極大挑戰,而主動學習和跨學科合作研究則是必由之路。
此外,在政治學研究中,也要審慎使用大數據。大數據帶來的強大數據采集和分析能力,以及學界對大數據方法的不斷開發利用,使得大數據的開發和應用方法不斷成熟,并處于不斷前進的過程,為政治學的發展提供了新引擎,帶動了傳統研究的更新進步,也開拓了新的研究領域。但是,伴隨著政治學研究的進一步科學化,也要警惕大數據應用中存在的風險。當前,在政治學的應用中,大數據方法是實驗干預的重要方式。但這種方式往往有著較大的人群影響規模,使得實驗效果有可能突破研究的范疇,對現實的政治和社會運行帶來一定的影響。因此,對大數據實驗手段的使用,要充分考慮到可能的現實不利影響而對其審慎使用。
上述新聞由“讀研網政策部”轉自中國社會科學網,如您有政治學在職研究生方面的疑惑,可以在線咨詢我們的老師。