轉帖|行業資訊|編輯:我只采一朵|2017-06-30 14:16:31.000|閱讀 353 次
概述:百家姓大數據,挺有意思的!
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
作者:周寧奕、團支書
最近不知道哪個朋友(是的我的確不知道)搞到了一組脫敏后的天朝公民個人數據,覆蓋1000多萬人,大概占全國人口的1%,信息包括姓氏、年齡、籍貫城市、現居城市等。朋友讓我用這組數據隨便做點啥。
這組數據如此牛逼,可以做的東西太多啦。但是,吸取了前兩次文章被下架的教訓,我決定做一個不那么敏感的話題。就做 “東半球第二有趣的中國姓氏排行榜”吧!
既然是“數據團”出品的姓氏排行榜,必然不能數數人頭就敷衍了事。事實上,我為這個排行榜設計了豐富的內容:普遍指數、抱團指數、奔波指數、裝逼指數、風雅指數等。
下面就開始對這個排行榜進行闡釋吧!(具體排名見文章末尾)
普遍指數=姓氏人口數量
毫無懸念,“王”姓以占據中國人口8.1%的比例、接近1億的人口總數,奪得了中國第一大姓、地球第一大姓、宇宙第一大姓的桂冠。
恭喜隔壁老王!
那么,老王們都在哪里呢?
看起來,隔壁老王雖然說不上無處不在,但也是蔚為壯觀啊!
除了老王,老張、老李也表現不俗,分獲宇宙第二、第三大姓的榮譽。這三大姓加起來,占據中國總人口的22%(由于我們掌握的數據不是完全的隨機抽樣,各個姓氏的排名與比例可能與其它統計結果略有不同)。
總的來說,“王張李劉陳楊趙周吳徐”10大姓占據了中國總人口的43%;20大姓占據56%,而前100的大姓占據了88%!
但是,別看這些大姓多么牛逼,其實都發源于極少數的幾個姓:姬、嬴、姜、媯等。其中,最為古老的可能就是“姬”了——“姬”傳說是黃帝之姓、周朝國姓,并且是10大姓中7個姓的起源。千年過去,姬姓后嗣多已改為他姓,開枝散葉。而還保留著這個古老姓氏的人口,也仍然棲息在古老中華文明的發源地——河南。
從姬姓的例子中我們看到,一些較小的姓氏在空間上的分布是高度集中的。這可能是因為較小姓氏的發源地相對單一吧。
為了探究姓氏的空間集聚問題,我們又設計了第二個指數:
抱團指數=各姓氏在各省分布的基尼系數。
研究結果表明,抱團指數最高、也就是空間集聚度最高的三個姓氏分別為:覃、麥、樸,三姓的基尼系數都在0.82以上,而且三個姓都是相對較小的姓。
先來看覃(qin,第二聲):“覃”的本意為有蓋的酒壇,最早的“覃”人以釀酒和制作酒具形成氏族。先秦時期,覃姓主要在河南活動,后來主力遷入南方,吸收了南方的眾多外來血緣,并分化出譚、潭、鐔(tan)、瞫(shen,第三聲)等多個姓。現今,覃姓主要分布在廣西、廣東、湖南、湖北。
麥姓,起源于春秋時期的麥丘(今山東商河西北),由齊恒公賜姓。麥姓南遷以后,出現在傈傈族、回族、布依族、瑤族、黎族等少數民族中。80%的麥姓人口都分布在廣東。
但是,如果我們仔細看的話,會發現除了廣東,麥姓在北京和上海也有兩片相對集中的區域,其他區域則是一片漆黑。這個專注北上廣的麥姓真是傲嬌啊。
樸的本意為樹皮,也是一個小姓,但大多數讀者都能正確地讀出piao(第二聲)而不是pu,這應該歸功于“宇宙第一大國”的韓國吧。事實上,從空間分布來看,樸也是典型的北方姓氏,也主要分布在宇宙第一大國的輻射地:東北三省。
如果說小姓比較容易呈現出明顯的聚集趨勢,那么人數眾多的大姓是否都是雨露均沾、均勻分布的呢?
在top20的大姓中,絕大多數姓氏的基尼系數都在0.35-0.45范圍內,但有一個姓很特殊,其基尼系數高達0.63—— “林”。
我們來看一下林姓的空間分布:沿著福建、廣東沿海,形成了一條非常明顯的狹窄帶狀區域。
盡管福威鏢局在接班人問題上出現了一些技術障礙,但總體來說,林姓族人仍然堅守故土,并且在海峽兩岸繁衍出了一系列娛樂圈明星,比如:林志玲、林心如、林志穎、林徽因……
然而,并不是每個氏族都像“姬”“林”那樣安土重遷,可能也有一些特別愿意奔波、愿意去遠處尋找夢想的。于是,我們又設計了第三個指數:
奔波指數=姓氏人均遷徙距離。遷徙距離為戶籍地所在地級市與現居住地所在地級市的距離。
在喜歡奔波的姓氏中,首屈一指的就是——樸,人均遷徙距離達到900km。嗯,怎么又是樸?
總的來說,作為北方民族的樸姓非常喜歡南遷。對樸姓而言,最受歡迎的目的地有兩個:山東和廣東。這兩個目的地,一個是北部地區的最南端,一個是天朝的最南端。
奔波指數第二高的是“廉”姓,人均遷徙距離為600km。
廉姓主要分布于河南、山東、陜西等省,對外遷徙的目的地并沒有明顯偏好。但如果我們把廉姓的遷徙路徑與其它姓氏做比較,相較于其它姓氏向經濟發達地區聚集的趨勢,廉姓似乎對新疆、云南、廣西等西部地區等興趣要更強一些。
在20大姓中,奔波指數最高的是“何”,人均遷徙距離在400km左右。
何姓主要分布在四川、廣東兩省。但從遷徙圖上來看,大概是四川太過“安逸”,何姓族人較少從四川遷出;而廣東和長三角地區的何姓則活躍得多。
以上涉及到的姓氏,廉、樸、覃、麥等,都是一些自帶逼格的小姓。似乎在各種排行中,大姓的特點都并不突出。這也難怪,大姓人多,形形色色的人都有,總體來看就比較平均了。
但是,如果已經進入到大姓行列,有沒有辦法提高自己或者是子女名字的逼格呢?當然姓是不能隨便改的,我們就只能在名字上動腦筋了。于是,我們設計了第四個指數:
裝逼指數=名字長度在4字或以上的人口數量占該姓氏人口數量的比例。
嚴格來說,裝逼指數最高的其實是“歐陽”和“諸葛”。但考慮到復姓和少數民族姓氏的逼格并不是裝出來的,我們只好排除掉這些本來就很有逼格的姓氏,只看單字大姓TOP20的裝逼情況:
顯然,“馬”姓的裝逼指數甩第二名的“高”和“周”一大截,這大概歸功于馬姓有天然的裝逼優勢。舉個栗子:如果某國產神劇女主角名字改為“高爾泰•若曦”或者“周爾泰•若曦”,那么男主角還演得下去嗎?
然而,名字長雖然增加逼格,卻會給實際生活增加一些困擾。你能想象“璃瑩殤•安潔莉娜•櫻雪羽晗靈•血麗魑•魅•J•Q•安塔利亞•傷夢薰魅•海瑟薇•薔薇玫瑰淚•羽靈•邪兒•凡多姆海威恩•夏影•琉璃舞•雅•蕾玥璦雅•曦夢月•玥藍•嵐櫻”被罰抄名字時的心情嗎?
因此,想要彰顯名字的獨特,還可以采用另一種方式:采用生僻字或不常見的漢字組合。我們姑且將此類名字形容為“風雅”。
風雅指數=名字中不包括“取名用字頻率TOP1000”的人數占該姓氏總人數的比例。
風雅指數最高的10個姓為:
的確,“程”姓有不少非常風雅的名字:程靈素、程蝶衣。但由于擁有這些名字的主人往往都很難堅持到故事結尾還不領便當,因此一念出來,總會帶著淡淡的憂傷。
為了沖淡這種淡淡的憂傷,我們最后來看看能撐到最后一集的普通人都是怎么取名的呢?
“取名常用字TOP100”請看下表:
好了,就這樣吧。請轉頭看看你身邊的朋友同學同事或者經常給你送快遞的快遞員。hi,小華、小偉、小文、小明、小軍,你們還好嗎?
附:姓氏排行TOP100
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn