Facebook Pixel Facebook Pixel

出租率增四倍,Airbnb3大數據策略揭祕

2018-01-21
今周刊/黃煒軒
出租率增四倍,Airbnb3大數據策略揭祕
【SmartM解讀】共享經濟的典型案例 Airbnb 把大數據變成企業基因,藉由仔細分析數百萬房源、試算50萬筆資料、推公司資料共享,成功將公司推向住房屆的王座。
「太有趣了!Airbnb就像個糖果店一樣,有源源不絕的驚喜等待發現!」 曾為哈佛大學商學院助理教授、現任Airbnb首席經濟學家暨資料科學團隊主管的彼得.柯爾斯(Peter Coles),在接受本刊專訪時笑著指出。
被《富比世》雜誌譽為「住房界的eBay」,2008年8月成立的Airbnb,與Uber並列為近年全球「共享經濟」的兩大典型代表。成立9年來,房源總數已超過4百萬,遍及全球191個國家、逾6萬5千個城市,數量之驚人,甚至超越全球前三大連鎖飯店業者房間總數。
累計至今,Airbnb已為全球帶來超過2.5億的旅遊人次。而在台灣,僅過去一年,其帶進的國際旅客即逾百萬,占整體入境旅客比率近10%,Airbnb為其股東、知名創投紅杉資本賺得的報酬,更是創下投資以來的新高紀錄,一舉超越Google和聊天服務WhatsApp。
然而,Airbnb驚人的成長動力,除了來自創辦人對房屋共用市場需求的獨到眼光外,另一個較鮮為人知的關鍵,則是來自其大數據團隊所扮演的角色。

分析數百萬房源,擷取三大「關鍵特徵」

Airbnb網站上逾4百萬的房源,每間各具特色,除了房間大小、地址、內部裝潢皆有相當的差異外,房客在接待、飲食或旅遊導覽方面亦有各自的需求,若再考慮季節性因素或各地特有的大型活動,其間排列組合將產生幾近「無窮」的數據。
要從這些巨量的數據洪流中提取有用資訊,在許多傳統企業眼中,光用想的就令人頭皮發麻。然而,Airbnb卻透過一套精緻的「數據工程」,將這一切化為可能。這也是吸引柯爾斯加入Airbnb的一大因素。
「在學術機構,想獲得能夠驗證假說的大量資料,往往需要十足的運氣;但在Airbnb,我卻可以輕易地獲取這些,而伴隨這些巨量資料的,是許多超酷、值得挖掘的有趣問題!」柯爾斯指出。
究竟如何做到?Airbnb數據團隊的第一步,是提取所謂的「關鍵特徵」,在公司演算法發展初期,團隊會先針對房間來源(以下稱房源)的相似性、資料的新舊程度和房源的位置進行分類。相似性的部分比如住房的類型(公寓或城堡)、房間可容納人數、形態(集體宿舍或私人房間)以及既有房客的評論等特徵。
此外,因為房源需求受到季節性因素影響很大,數據團隊因此先將相關性低的資料(例如今年前幾季的數據)排除,僅保留相關性最高的部分;考慮了季節性因素後,最終還有一個令Airbnb頭痛的問題:位置。

50億筆資料試算,為屋主找出最佳推薦價

有別於傳統旅館多成聚落型分布於各城市,Airbnb的房源遍布各處。許多城市的房價分布,除了與市中心的距離有所關聯外,亦與街區特性高度連動;也因此,Airbnb在數據分析初期,動用了許多製圖人員,將各城街區搭配房價,通過地理資訊的分析,如周圍的河流、公路和運輸線,畫出相應的「價格邊界」,再對房源進行分類。
經過逾50億筆歷史資料分析試算後,2015年6月,Airbnb正式推出「價格提示」(price tips)功能。該功能即以前述分類機制作為基礎,進一步納入更多(數百個)房源參數及市場需求因子,並透過分類機器學習模型的方式,對系統進行訓練。
系統會記錄每一次房主的價格選擇,並將之與系統原先的建議價格比較,一旦有所偏離,即會透過動態演算在下一次調整。此外,團隊在一開始設定估價模型時,會先假設一些參數較為重要,也因此會給予其較高的權重,比如說地理條件比有沒有浴缸重要。然而,透過分析哪些價格提示獲得了成功,系統會回頭修正不同房源參數的權重,同時在必要的情況下添加新參數。
「若談到在近年大數據的發展下,Airbnb對全球做了什麼貢獻,『價格媒合』(matching)這一塊算是一個典範。」柯爾斯表示。而一旦採用公司的建議價格,根據Airbnb的分析,房主租出去的機率提升近4倍。
然而,在實務上,由技術人員藉由大量的數據累積及分析建模後所搭建的資料平台,卻常常會出現業務人員不知道如何使用的情況,亦即他們缺乏將巨量資料轉化為「價值」的能力,「這也是現在許多傳統企業在面對大數據浪潮下的困境。」東吳大學巨量資料管理學院助理教授鄭江宇指出。
出租率增四倍,Airbnb3大數據策略揭祕

推公司資料透明共享、員工可調閱全球住宿數據

有別於傳統公司,Airbnb三位創辦人中有兩位是設計出身,公司又是依靠產品起家,對業務開發格外重視,此外,他們亦深刻體認到,Airbnb業務要能快速發展,「資料」必須扮演主力推手的角色。「大數據就是Airbnb的生命之血(lifeblood)。」Airbnb資料科學前總監紐曼(Riley Newman)曾如此比喻。
也因此,在創辦初期,除了在總部的資料科學部門有負責統整資料分析基礎架構的人員外,業務、公共政策等不同的垂直部門,也都會配置專屬的資料科學家,他們因此可針對不同部門需求,預先建立資料模型,或提供專屬的資料服務。目前Airbnb在全球約3千名員工中,資料科學家團隊就超過2百人,相當於每15位員工,就有一位資料科學家,充分顯示出Airbnb對數據驅動業務的高度重視。
另一方面,對「資料民主化」精神的堅持,更是Airbnb內部大數據發展成功的一大關鍵。Airbnb的非IT(資訊科技)部門員工,除了可透過各部門的「營運儀表板(Dashboard)」自行調閱公司在各城市的住宿預訂等相關數據,公司亦開發了一款名叫Superset的開放資料平台,使用者可用來執行複雜的運算及跨部門間快速地傳輸資料,並以顯而易懂的視覺化方式來呈現。「其他的我不敢說,但我們在這一塊的技術應用,已經可與臉書及Google並肩了。」柯爾斯自豪地說。
同時,在內部員工的培訓上,Airbnb亦不遺餘力,除了持續在「營運儀表板」等相關工具投入資源改善可用性外,公司內部亦成立了「數據大學」,從最初階的統計學、SQL(用來從資料庫讀取與儲存資料的電腦語言)到高等計量經濟模型、實驗設計及機器學習,提供一系列完整的「數據人才」養成課程。開辦僅一年多,已有接近半數的公司員工至少在該「大學」修習了一門課程。「不過,目前最多員工修習的仍是入門的初級統計學啦!」柯爾斯大笑。
最終,彷彿回應鄭江宇對台灣企業的憂慮般,「這麼多年來,我們已累積了許多資料,現在其實早已不缺數據,缺的是如何讓更多人能更容易地親近及使用數據,並從中產生出有益的洞察。」柯爾斯語帶提醒地表示。
 
延伸閱讀
原文出處
【超過300本影音說書陪你成就更好的自己】讓大大學院與你共讀,幫助「沒時間讀書」、「讀書速度很慢」、「讀完就忘記」、「抓不到重點」的你,利用18分鐘領略閱讀的樂趣,吸收並帶走鮮明觀點,真正讓知識內涵融會於日常生活。立即點擊加入
大大讀書|全台最大線上影音說書
本網站內容未經允許,不得轉載。歡迎來信投稿、洽談文章授權。

關注職場最新趨勢,為知識學習創造最佳環境

大大學院「全台最大影音說書.知識學習平台」,致力於推廣終生學習、培養職場人士的閱讀習慣。

按讚、追蹤「大大學院」Facebook粉絲團,每天更新最新職場趨勢文章,帶你掌握關鍵資訊。

加入「大大學院|職場趨勢新觀點」,最新、最實用的職場課程都在這,學習資訊不漏接!請用手機點擊「加入Line好友」連結,或是掃描QR Code加入。

處理中