亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 開發 > 綜合 > 正文

100億數據1萬屬性數據架構設計

2024-07-21 02:51:35
字體:
來源:轉載
供稿:網友

對于version + ext方案,說明不僅不是“不可能這么用”,而是大數據,可變屬性,高吞吐場景下的“常用手段”。

 

一、背景描述及業務介紹

問:什么是數據庫擴展的version + ext方案?

使用ext來承載不同業務需求的個性化屬性,使用version來標識ext里各個字段的含義。

例如上述user表:

verion=0表示ext里是passwd/nick

version=1表示ext里是passwd/nick/age/sex

 

優點?

(1)可以隨時動態擴展屬性,擴展性好

(2)新舊兩種數據可以同時存在,兼容性好

不足?

(1)ext里的字段無法建立索引

(2)ext里的key值有大量冗余,建議key短一些

 

問:什么是58同城最核心的數據?

58同城是一個信息平臺,有很多垂直品類:招聘、房產、二手物品、二手車、黃頁等等,每個品類又有很多子品類,不管哪個品類,最核心的數據都是“帖子信息”(業務像一個大論壇?)。

 

問:帖子信息有什么特點?

大家去58同城的首頁上看看就知道了:

(1)每個品類的屬性千差萬別,招聘帖子和二手帖子屬性完全不同,二手手機和二手家電的屬性又完全不同,目前恐怕有近萬個屬性

(2)帖子量很大,100億級別

(3)每個屬性上都有查詢需求(各組合屬性上都可能有組合查詢需求),招聘要查職位/經驗/薪酬范圍,二手手機要查顏色/價格/型號,二手要查冰箱/洗衣機/空調

(4)查詢量很大,每秒幾10萬級別

 

如何解決100億數據量,1萬屬性,多屬性組合查詢,10萬并發查詢的技術難題,是今天要討論的內容。

 

二、最容易想到的方案

每個公司的發展都是一個從小到大的過程,撇開并發量和數據量不談,先看看

(1)如何實現屬性擴展性需求

(2)多屬性組合查詢需求

 

最開始,可能只有一個招聘品類,那帖子表可能是這么設計的:

tiezi(tid,uid, c1, c2, c3)

那如何滿足各屬性之間的組合查詢需求呢?

最容易想到的是通過組合索引:

index_1(c1,c2) index_2(c2, c3) index_3(c1, c3)

 

隨著業務的發展,又新增了一個房產類別,新增了若干屬性,新增了若干組合查詢,于是帖子表變成了:

tiezi(tid,uid, c1, c2, c3, c10, c11, c12, c13)

其中c1,c2,c3是招聘類別屬性,c10,c11,c12,c13是房產類別屬性,這兩塊屬性一般沒有組合查詢需求

但為了滿足房產類別的查詢需求,又要建立了若干組合索引(不敢想有多少個索引能覆蓋所有兩屬性查詢,三屬性查詢)

是不是發現玩不下去了?

 

三、友商的玩法

新增屬性是一種擴展方式,新增表也是一種方式,有友商是這么玩的,按照業務進行垂直拆分:

tiezi_zhaopin(tid,uid, c1, c2, c3)

tiezi_fangchan(tid,uid, c10, c11, c12, c13)

這些表,這些服務維護在不同的部門,不同的研發同學手里,看上去各業務線靈活性強,這恰恰是悲劇的開始:

(1)tid如何規范?

(2)屬性如何規范?

(3)按照uid來查詢怎么辦(查詢自己發布的所有帖子)?

(4)按照時間來查詢怎么辦(最新發布的帖子)?

(5)跨品類查詢怎么辦(例如首頁搜索框)?

(6)技術范圍的擴散,有的用mongo存儲,有的用MySQL存儲,有的自研存儲

(7)重復開發了不少組件

(8)維護成本過高

(9)…

想想看,電商的商品表,不可能一個類目一個表的。

 

四、58同城的玩法

【統一帖子中心服務】

平臺型創業型公司,可能有多個品類,例如58同城的招聘房產二手,很多異構數據的存儲需求,到底是分還是合,無需糾結:基礎數據基礎服務的統一,無疑是58同城技術路線發展roadmap上最正確的決策之一,把這個方針堅持下來,高瞻遠矚的先賢功不可沒,業務線會有“擴展性”“靈活性”上的微詞,后文看看先賢們如何通過一些巧妙的技術方案來解決的。

如何將不同品類,異構的數據統一存儲起來,采用的就是類似version+ext的方式:

tiezi(tid,uid, time, title, cate, subcate, xxid, ext)

(1)一些通用的字段抽取出來單獨存儲

(2)通過cate, subcate, xxid等來定義ext是何種含義(和version有點像?)

(3)通過ext來存儲不同業務線的個性化需求

例如招聘的帖子:

ext : {“job”:”driver”,”salary”:8000,”location”:”bj”}

而二手的帖子:

ext : {”type”:”iphone”,”money”:3500}

 

58同城最核心的帖子數據,100億的數據量,分256庫,異構數據mysql存儲,上層架了一個服務,使用memcache做緩存,就是這樣一個簡單的架構,一直堅持這這么多年。上層的這個服務,就是58同城最核心的統一服務IMC(Imformation Management Center),注意這個最核心,是沒有之一。

 

解決了海量異構數據的存儲問題,遇到的新問題是:

(1)每條記錄ext內key都需要重復存儲,占據了大量的空間,能否壓縮存儲

(2)cateid已經不足以描述ext內的內容,品類有層級,深度不確定,ext能否具備自描述性

(3)隨時可以增加屬性,保證擴展性

 

【統一類目屬性服務】

每個業務有多少屬性,這些屬性是什么含義,值的約束等揉不到帖子服務里,怎么辦呢?

58同城的先賢們抽象出一個統一的類目、屬性服務,單獨來管理這些信息,而帖子庫ext字段里json的key,統一由數字來表示,減少存儲空間。

如上圖所示,json里的key不再是”salary” ”location” ”money” 這樣的長字符串了,取而代之的是數字1,2,3,4,這些數字是什么含義,屬于哪個子分類,值的校驗約束,統一都存儲在類目、屬性服務里。

這個表里對帖子中心服務里ext字段里的數字key進行了解釋:

1代表job,屬于招聘品類下100子品類,其value必須是一個小于32的[a-z]字符

4代表type,屬于二手品類下200子品類,其value必須是一個short

這樣就對原來帖子表ext里的

ext : {“1”:”driver”,”2”:8000,”3”:”bj”}

ext : {”4”:”iphone”,”5”:3500}

key和value都做了統一約束。

 

除此之外,如果ext里某個key的value不是正則校驗的值,而是枚舉值時,需要有一個對值進行限定的枚舉表來進行校驗:

這個枚舉校驗,說明key=4的屬性(對應屬性表里二手,手機類型字段),其值不只是要進行“short類型”校驗,而是value必須是固定的枚舉值。

ext : {”4”:”iphone”,”5”:3500}這個ext就是不合法的(key=4的value=iphone不合法),合法的應該為

ext : {”4”:”5”,”5”:3500}

 

此外,類目屬性服務還能記錄類目之間的層級關系:

(1)一級類目是招聘、房產、二手…

(2)二手下有二級類目二手家具、二手手機…

(3)二手手機下有三級類目二手iphone,二手小米,二手三星…

(4)…

 

協助解釋58同城最核心的帖子數據,描述品類層級關系,保證各類目屬性擴展性,保證各屬性值合理性校驗,就是58同城另一個統一的核心服務CMC(Category Management Center)

 

多提一句,類目、屬性服務像不像電商系統里的SKU擴展服務?

(1)品類層級關系,對應電商里的類別層級體系

(2)屬性擴展,對應電商里各類別商品SKU的屬性

(3)枚舉值校驗,對應屬性的枚舉值,例如顏色:紅,黃,藍

 

解決了key壓縮,key描述,key擴展,value校驗,品類層級的問題,還有這樣的一個問題沒有解決:每個品類下帖子的屬性各不相同,查詢需求各不相同,如何解決100億數據量,1萬屬性的查詢需求,是58同城面臨的新問題。

 

【統一檢索服務】

數據量很大的時候,不同屬性上的查詢需求,不可能通過組合索引來滿足所有查詢需求,怎么辦呢?

58同城的先賢們,從一早就確定了“外置索引,統一檢索服務”的技術路線:

(1)數據庫提供“帖子id”的正排查詢需求

(2)所有非“帖子id”的個性化檢索需求,統一走外置索引

元數據與索引數據的操作遵循:

(1)對帖子進行tid正排查詢,直接訪問帖子服務

(2)對帖子進行修改,帖子服務通知檢索服務,同時對索引進行修改

(3)對帖子進行復雜查詢,通過檢索服務滿足需求

 

這個扛起58同城80%終端請求(不管來自PC還是APP,不管是主頁、城市頁、分類頁、列表頁、詳情頁,很可能這個請求最終會是一個檢索請求)的服務,就是58同城另一個統一的核心服務E-search。

 

對于這個服務的架構,簡單展開說明一下:

為應對100億級別數據量、幾十萬級別的吞吐量,業務線各種復雜的復雜檢索查詢,擴展性是設計重點:

(1)統一的java代理層集群,其無狀態性能夠保證增加機器就能擴充系統性能

(2)統一的合并層C服務集群,其無狀態性也能夠保證增加機器就能擴充系統性能

(3)搜索內核檢索層C服務集群,服務和索引數據部署在同一臺機器上,服務啟動時可以加載索引數據到內存,請求訪問時從內存中load數據,訪問速度很快

(3.1)為了滿足數據容量的擴展性,索引數據進行了水平切分,增加切分份數,就能夠無限擴展性能

(3.2)為了滿足一份數據的性能擴展性,同一份數據進行了冗余,理論上做到增加機器就無限擴展性能

系統時延,100億級別帖子檢索,包含請求分合,拉鏈求交集,從merger層均可以做到10ms返回。

 

58同城的帖子業務,一致性不是主要矛盾,E-search會定期全量重建索引,以保證即使數據不一致,也不會持續很長的時間。

 

五、總結

文章寫了很長,最后做一個簡單總結,面對100億數據量,1萬列屬性,10萬吞吐量的業務需求,58同城的經驗,是采用了元數據服務、屬性服務、搜索服務來解決的。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
亚洲精品国偷自产在线99热| 全色精品综合影院| 中文字幕国产亚洲2019| 日韩精品免费看| 日韩欧美中文字幕在线播放| 国产欧美日韩高清| 欧美一级片久久久久久久| 国产日产欧美精品| 少妇高潮久久久久久潘金莲| 国产亚洲aⅴaaaaaa毛片| 久久久视频精品| 亚洲国产精品高清久久久| 狠狠综合久久av一区二区小说| 国产日韩欧美日韩| 日韩资源在线观看| 日韩av在线网址| 亚洲男人的天堂在线播放| 中文字幕v亚洲ⅴv天堂| 青草热久免费精品视频| 国产亚洲精品久久久久久牛牛| 亚洲视频在线视频| 51久久精品夜色国产麻豆| 日韩中文综合网| 欧美成人免费在线观看| 久久精品青青大伊人av| 91在线观看免费| 97视频色精品| 色www亚洲国产张柏芝| 日韩av在线免费播放| 久久在精品线影院精品国产| 精品久久久久久久大神国产| 欧美夫妻性生活视频| 国产精品精品一区二区三区午夜版| 亚洲欧美一区二区三区情侣bbw| 成人免费淫片视频软件| 777午夜精品福利在线观看| 亚洲成人久久电影| 亚洲91av视频| 中文字幕亚洲激情| 黄色精品一区二区| 亚洲图片在区色| 久久精品视频导航| 久久频这里精品99香蕉| 亚洲一级免费视频| 欧美性jizz18性欧美| 色偷偷噜噜噜亚洲男人的天堂| 亚洲乱码一区二区| 久久精品国产99国产精品澳门| 国产精品嫩草影院久久久| 欧美激情综合亚洲一二区| 成人免费大片黄在线播放| 欧美又大又硬又粗bbbbb| 日韩在线中文视频| 日韩综合中文字幕| 中文日韩在线观看| 精品久久久一区二区| 午夜欧美不卡精品aaaaa| 色av吧综合网| 欧美一区二区三区精品电影| 欧美日韩在线视频一区二区| 57pao成人国产永久免费| 亚洲成人国产精品| 在线色欧美三级视频| 日韩精品在线看| 亚洲精品国产美女| 国产日韩欧美在线观看| 国产精品免费久久久| 国a精品视频大全| 国内精品伊人久久| 欧美视频一二三| 亚洲影视中文字幕| 欧美二区乱c黑人| 黑人巨大精品欧美一区二区一视频| 国产精品狠色婷| 日韩成人网免费视频| 黑人欧美xxxx| 秋霞成人午夜鲁丝一区二区三区| 精品久久久香蕉免费精品视频| 日韩亚洲成人av在线| 成人情趣片在线观看免费| 欧美成人性生活| 日韩一区二区av| 国产日韩欧美成人| 亚洲欧洲一区二区三区在线观看| 第一福利永久视频精品| 国产精品视频免费在线| 久久视频在线看| 欧美激情欧美狂野欧美精品| 国产91露脸中文字幕在线| 亚洲综合在线做性| 午夜精品福利在线观看| 国内精品国产三级国产在线专| 国精产品一区一区三区有限在线| 这里只有精品视频| 久久久国产在线视频| 欧美日韩国产黄| 久久精品小视频| 中国china体内裑精亚洲片| 欧美日韩成人黄色| 91免费看片在线| 亚洲精品国偷自产在线99热| 久久激情视频免费观看| 亚洲美女www午夜| 都市激情亚洲色图| 久久久久久国产精品三级玉女聊斋| 日韩av成人在线观看| 色综合男人天堂| 欧美激情国内偷拍| 欧美精品久久久久久久免费观看| 国产亚洲欧美一区| 亚洲一区二区三区在线视频| 久久久久亚洲精品成人网小说| 一区二区三区www| 91久久久久久| 色诱女教师一区二区三区| 狠狠色狠狠色综合日日五| 91精品国产综合久久香蕉的用户体验| 亚洲欧美日韩一区二区在线| 精品福利在线观看| 欧美极品少妇xxxxⅹ免费视频| 国产福利精品视频| 日韩极品精品视频免费观看| 国产亚洲美女精品久久久| 欧美黑人视频一区| 成人福利视频网| 日韩欧美精品网站| 久久av红桃一区二区小说| 日韩久久免费视频| 亚洲男人天堂手机在线| 欧美国产中文字幕| 亚洲白虎美女被爆操| 91大神在线播放精品| 成人性教育视频在线观看| 国产精品午夜视频| 26uuu亚洲伊人春色| 三级精品视频久久久久| xxxxx91麻豆| 久久久天堂国产精品女人| 亚洲最大的免费| 欧美精品videofree1080p| 久久综合色88| 亚洲女人天堂色在线7777| 亚洲自拍偷拍视频| 亚洲视频欧美视频| 亚洲激情 国产| 亚洲视屏在线播放| 亚洲电影第1页| 91av在线免费观看视频| 亚洲欧洲自拍偷拍| 国产精品美女在线| 菠萝蜜影院一区二区免费| 日韩亚洲成人av在线| 成人午夜在线视频一区| 亚洲香蕉伊综合在人在线视看| 性视频1819p久久| 欧美一区二区三区免费视| 成人黄色在线播放| 久久琪琪电影院| 成人春色激情网| 日韩欧美一区二区三区久久| 亚洲第一中文字幕在线观看| 国产精品99蜜臀久久不卡二区| 国产亚洲免费的视频看| 久久精品国产成人精品|