轉帖|行業資訊|編輯:我只采一朵|2017-06-01 11:26:42.000|閱讀 266 次
概述:正所謂“外行看熱鬧,內行看門道”,作為數據分析愛好者的筆者,自然想從數據的角度去解讀這部熱播劇的方方面面,包括輿情傳播、網絡口碑、人物社交網絡分析及,以及小說內容的文本分析。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
作為數據分析愛好者,本文作者將想從數據的角度去解讀《歡樂頌2》這部熱播劇的方方面面,包括輿情傳播、網絡口碑、人物社交網絡分析及,以及小說內容的文本分析。
5月11日,讓眾多安迪粉期待已久的《歡樂頌》第二季終于播出。相比首季,《歡樂頌2》在造型和場景上顯得更為精致時尚,且其中每個角色的造型卻都是遵從的其身份和背景,并不突兀。
在筆者進行分析的過程中,會用到一些常用的(大)數據分析工具,以及環環相扣的數據分析討論,雖然對于常規的數據運營并無直接的幫助,但“他山之石,可以攻玉”,分析的思路卻可以作為參考,以期應用到其他實際的場景中。
在第一部分中,筆者選取了2017.05.07~2017.05.29期間關于《歡樂頌2》的全網輿情數據作為數據分析對象,利用新浪微輿情的“信息監測”和“全網事件分析”作為數據采集、數據分析和可視化的工具。
以下分別從《歡樂頌2》的全網傳播概況及傳播趨勢兩方面進行分析。
(1)全網傳播走勢
上圖是《歡樂頌2》在這段時間內信息傳播走勢圖,自開播之日起,該劇的全網聲量出現了明顯的提升,而且里面出現了幾個信息傳播的“波峰”,說明當日全網關于該劇的討論(包括媒體和網民個體)較多。尤其需要注意的是,本劇開播當日(5-11)的波峰峰值是該時間段內最大的一個,這是不是一個巧合呢?不要急,筆者會在后面為各位小伙伴解開謎底。
(2)全網正負面信息占比
從上圖中可以看到,這段時間內,全網關于《歡樂頌2》的信息量有5,564,016條,其中負面信息的占比達到152,315條,占到總信息量的2.74%。
同時,在總體上,負面信息隨著時間的推移又不斷增長的趨勢。
結合二者來看,如此這般的負面信息占比和發展情形對于該劇來說不太有利,說明全網關于該劇的負面口碑評價比較顯著,需要引起制片方的重視,筆者會在接下來的分析中,探明到底出現了哪些負面口碑,以及它們出現的原因。
(3)全網關注度來源
因為在影視劇的傳播聲量中,微博這塊占據較大的比重,所以筆者在排除微博這一信息來源后,對余下的信息來源TOP10進行了統計,如下圖所示:
從上圖可以看出,除開微博外,微信、今日頭條這兩大社會化媒體平臺上關于本劇的信息量貢獻最多,尤其微信在近日推出了「微信實驗室」,通過新增加的“搜一搜”和“看一看”這兩個入口,使用戶能夠主動搜索關鍵詞,能夠瀏覽熱點資訊、好友關注的資訊以及自己感興趣的文章,這樣的動作加上數年的優質內容沉淀,使得微信在社會化媒體內容生產方面的重要性日漸突出。
(4)全網信息地域分布
有點意外,全網關注度(關于這部劇的全網信息量)排名榜首的是江蘇,竟然不是北京和上海這兩大年輕白領云集的現代化的都市,尤其是上海,關于本劇的信息量分布在TOP10中墊底,難道上海的網民和媒體絕大部分都棄劇了?或者說是本劇的口碑極差?
對于此種疑問,筆者將會在第二部分進行分析。
因為關于本劇的探討,微博(主要是新浪微博)占據大頭,所以筆者選取該平臺上的人群作為分析對象。
(1) 性別分布
毫無疑問,女生是該劇的忠實擁簇,他們對該劇的狂熱絕對超過男生。
(2) 年齡分布
從下圖中可以看出,19-34這個年齡區間占據關注人群的70%左右,也就是說青年群體對該劇很感興趣。
(3) 興趣圖譜
下圖給出了關注該劇的人群的興趣標簽TOP5,可以看出,這部分人群比較追星,熱愛生活,都是一些極具年輕人特質的興趣愛好。
(4)用戶情感狀態
根據關注《歡樂頌2》的微博用戶給自己打的情感類別標簽,可以得知此類用戶的情感狀態分布情況:
由此可以看到,大部分用戶(80.75%)處于情感空白/開窗期(“單身”和“求交往”狀態),再次是“戀愛中”,結合前面的年齡分布,說明關注人群大都是未婚青年。
(5)用戶學歷分布
毫無疑問,這類都市情感劇的受眾以受過高等教育的人群為主,因為該劇講述的是高學歷白領在大城市工作生活和戀愛的故事。
(6)用戶城市類型
有點出乎意料的是,4線及以下城市的關注人群所占比重最高,為30.26%,其次是2線和3線城市,而一線城市的關注人群則僅為14.41%,難道是一線城市的人群對本劇比較挑剔?
結合前面的信息地域分布,關注《歡樂頌2》的主體是一群熱愛生活、熱衷于追星的高學歷青年女性,她們生活在一線城市開外,情感狀態多為單身。
一般來說,對于文本的深入挖掘往往能實現“知其然并知其所以然”的效力,因為文本不像數字那般空洞和抽象,內容往往能直接揭示出原因。
這部分的數據主要有:
豆瓣電影是中國最大與最權威的電影分享與評論社區,收錄了百萬條影片和影人的資料,有2500多家電影院加盟,更匯聚了數千萬熱愛電影的人,因而這里關于影視劇的評論具有一定的代表性和公信力,可以在很大程度上反映一部影視劇作品的口碑狀況。所以,筆者抓取豆瓣上《歡樂頌》一二季的影評作為口碑分析的依據。
(1)評價星級
從總評分來看,《歡樂頌》第二季要明顯遜色于第一季,前者拿到了7.3的高分,而后者僅獲得了5.2的評分。
從第一季和第二季的評價星級占比可以看出,出現第二季總評分低于第一季的原因在于:第二季在中高分區間“4星”和“3星”中的占比要小于第一季,而在低分區間“2星”和“1星”中的比重要高于第一季。
(2)《歡樂頌2》的豆瓣影評情感傾向分析
由于第一季的口碑要好于第二季,所以筆者接下來著重分析一下第二季的豆瓣影評的“情感傾向”。
這里的“情感傾向”是以一個介于0~1之間的“情感極性值”來表征—如果某條評論的情感極性值越接近于0,說明它的負面情感傾向越明顯,越接近于1,說明它的正面情感傾向越明顯,而取值在0.5左右徘徊,這說明這種情感傾向不明顯,是為“中性”。筆者將情感傾向值的取值區間0~1細分為3個子區間,分別對應不同的情感傾向:
豆瓣影評具有獨特的語言風格—反諷,貶義褒用,不像商品評論那般直白外露,它的語義往往含蓄且幽默。所以在分析之前,筆者找到大量有標注的豆瓣影評語料,利用機器學習進行情感語義模型訓練,以期達到良好的情感正負面判斷效果。初步結果如下:
經情感傾向標簽映射處理,得到如下結果:
從上圖可以看到,第一季和第二季的情感傾向的最大差異在于正負面情感的比重不同:第一季的評論正負面情感占比旗鼓相當,而第二季的負面情感明顯占據主導地位,正面占比大幅壓縮,這也是本劇豆瓣評分不高的原因之一。
再看一下情感傾向隨時間發展的走勢情況,筆者選取的分析時間段是3.31~5.22,也就是該劇播出前一個多月和播出后一段時間的情感傾向走勢。這里采用的是情感傾向值累加的數值,越高說明口碑評價越好,這也兼顧了評論數量上的增減情況(豆油愿意參與評分,哪怕是負面評分,也說明對本劇有一定的關注度)。由此得到下圖:
可以看出,在本劇播出次日,情感傾向值達到高峰,隨后一路下降,結合這段時間內的總體情感傾向占比可知,豆油們對于該劇播出后的劇集的關注度和口碑評價都呈現出下降的趨勢。
那么,究竟是什么原因讓廣大豆油們對該劇如此嫌棄呢?請接著往下看。
(5)“五美”人物點評詞云
綜合豆油們關于《歡樂頌》第一季和第二季關于劇中“五美”的評論,筆者制作出安迪、曲筱綃、樊勝美、關雎爾和邱瑩瑩的個性化評論關鍵詞詞云。
不消筆者多說,小伙伴們就能看出這些人物關鍵詞詞云,主要反映了豆油們對于“五美”的人物印象及其主要的關聯人物。對于這五個人的性格特征,由上述關鍵詞詞云可以總結為:
原文很長,如有需要請點擊閱讀原文
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn