祝大家七夕快樂,然后我們來到本期主題:「男人活的不如狗」
作為數(shù)據(jù)背景,讓我們回顧下「泰坦尼克」
1912年4月15日凌晨,泰坦尼克號(hào)沉沒,其中男性乘客總計(jì) 843 人,其中 161 人存活,生還率為19%,低于狗
作為對(duì)比,船上的12只狗中活了3只,生還率為25%
所以啊...男人終究還是活的不如狗
在電影《泰坦尼克》中,窮畫家 Jack 生的機(jī)會(huì)讓給了貴族小姐 Rose,讓世界記住了他們的愛情...
但做了數(shù)據(jù)分析后才發(fā)現(xiàn),Rose 的幸存不單單是因?yàn)閻矍?/p>
這兩天拿到阿里瓴羊"智能小Q"的內(nèi)測(cè)權(quán)限(沒錯(cuò),還沒發(fā)布),我把 OpenML 上的泰坦尼克數(shù)據(jù)集傳了進(jìn)去...結(jié)果發(fā)現(xiàn):
- Jack 的死亡幾乎是注定的:作為三等艙的男性,Jack 的生存率只有 16%
- Rose 的存活也幾乎是必然:作為一等艙的女性,Rose 的生存率高達(dá) 97%
即使他們從未相遇,結(jié)局可能也是一樣的
那么,這些冰冷的數(shù)字背后,隱藏著哪些神奇發(fā)現(xiàn)呢...
有錢人真的“優(yōu)先逃生”嗎?
一等艙的男性生存率是多少?答:34.1%
等等,頭等艙男性才33%的生存率?
我繼續(xù)追問:“三等艙女性的生存率呢?” 答:49%
三等艙女性(49%)的生存率,竟然高于頭等艙男性(33%)
看來,“婦女兒童優(yōu)先”的原則,比“階級(jí)優(yōu)先”更加嚴(yán)格執(zhí)行
“票價(jià)能買命嗎?”
“票價(jià)超過100英鎊的乘客生存率?”71.4%
“票價(jià)在100英鎊以內(nèi)的乘客生存率?”32%
有錢能使鬼推磨,成不我欺
登船港口預(yù)示命運(yùn)
- Cherbourg(法國(guó)):55.6%
- Queenstown(愛爾蘭):35.8%
- Southampton(英國(guó)):33.3%
Cherbourg多是富人度假,艙位等級(jí)高;Queenstown擠滿愛爾蘭移民,大多在三等艙
二等艙男性最慘
拉了下統(tǒng)計(jì),二等艙男性的生存率僅為 14.6,這甚至比三等艙還低
只算成年男性呢... 這一比例則更進(jìn)一步,落到了8.4%
至于為什么?瞎猜一下...
- 頭等艙男性雖要"紳士",但離救生艇近
- 三等艙男性破釜沉舟往上沖
- 二等艙男性?既要照顧婦女兒童,位置又不占優(yōu)勢(shì)
然后,我把泰坦尼克上所有年齡段的存活率,都算了下(已人工校驗(yàn),無誤):
- 老人:30%
- 成年男性:18.5%
- 成年女性:76%
- 少女:82.1%
- 青少年:47.6%
- 兒童:56%
可見:少女>兒童>成年女性>成年男性>老人>男人
對(duì)了,這里漏了寵物狗:25%
所以是:少女>兒童>成年女性>成年男性>老人>狗>男人
淦...
想到了一個(gè)奇怪的ppt
「大數(shù)據(jù)駕駛艙」
為了更明顯的看這些東西,用 Quick BI 做了個(gè)「大數(shù)據(jù)駕駛艙」
(啊啊啊啊啊,這奇怪的名字)
鏈接在這...但似乎只有我自己能訪問(畢竟這產(chǎn)品還沒公開)
https://pre-bi.aliyun.com/token3rd/dashboard/view/pc.htm?pageId=e81333fa-3325-4a92-b8a8-3543c5dee0d4&accessToken=204b4c5a553c5afc4979220b318eddfc&dd_orientation=auto&qbi_version_param=1
然后順道說一下, Quick BI 這東西像啥呢,大概就是偏向 BI 工具的 Big Query ,類似 Power BI和 Tableau
然后不同于這幾個(gè)工具,為了更貼合本土需求, Quick BI 加了很多中國(guó)特色的功能,比如上面的大數(shù)據(jù)駕駛艙,可以用于銷售管理、電商運(yùn)營(yíng)、門店運(yùn)營(yíng)這種總是被老板逼逼的東西
回到最初的問題
Jack真的是因?yàn)楦F才死的嗎?
做了點(diǎn)分析后,發(fā)現(xiàn):不完全是
如果Jack是個(gè)三等艙的女性,生存率49%,比頭等艙男性還高
如果Jack是個(gè)孩子,即使在三等艙也有34%的機(jī)會(huì)
但他都不是,作為15~25歲的三等艙男性,Jack 逃生的幾率只有15.3%
數(shù)據(jù)不煽情,不浪漫,但能告訴你最真實(shí)的信息
然后在有 AI 加持之下,我們找到這些信息會(huì)更簡(jiǎn)單
最后,鳴謝
工具用的是阿里瓴羊的"智能小Q",是阿里巴巴首個(gè)分析Agent,由問數(shù)、解讀和報(bào)告三大核心Agent組成,并將于9月9日正式向外界開放:
數(shù)據(jù)用的是 OpenML 上 Titanic DataSet,包含1309名乘客的完整信息
https://www.openml.org/data/download/16826755/phpMYEkMl
寵物信息,來自維基百科
https://zh.wikipedia.org/wiki/%E9%90%B5%E9%81%94%E5%B0%BC%E8%99%9F%E4%B8%8A%E7%9A%84%E5%8B%95%E7%89%A9
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.