直播回顧|TDSQL的交付

騰訊云數(shù)據(jù)庫國產(chǎn)數(shù)據(jù)庫專題線上技術(shù)沙龍正在火熱進(jìn)行中,0622畢漢斌的分享已經(jīng)結(jié)束,沒來得及參與的小伙伴不用擔(dān)心,以下就是直播的視頻和文字回顧。

關(guān)注“騰訊云數(shù)據(jù)庫”公眾號,回復(fù)“0622畢漢斌”,即可下載直播分享PPT

1

成都創(chuàng)新互聯(lián)專注于大化網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供大化營銷型網(wǎng)站建設(shè),大化網(wǎng)站制作、大化網(wǎng)頁設(shè)計、大化網(wǎng)站官網(wǎng)定制、微信平臺小程序開發(fā)服務(wù),打造大化網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供大化網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。

直播回顧:https://v.qq.com/x/page/v31023ovs5l.html

前言



整 個部署過程最快僅需9 分鐘, TDSQL全球靈活部署實踐

為幫助開發(fā)者更好地了解和學(xué)習(xí)分布式數(shù)據(jù)庫技術(shù),2020年3月,騰訊云數(shù)據(jù)庫、云加社區(qū)聯(lián)合騰訊TEG數(shù)據(jù)庫工作組特推出為期3個月的國產(chǎn)數(shù)據(jù)庫專題線上技術(shù)沙龍《你想了解的國產(chǎn)數(shù)據(jù)庫秘密,都在這!》邀請數(shù)十位鵝廠資深數(shù)據(jù)庫專家每周二和周四晚上在線深入解讀TDSQL、CDB/CynosDB、TBase三款鵝廠自研數(shù)據(jù)庫的核心架構(gòu)、技術(shù)實現(xiàn)原理和最佳實踐等。本文將帶來直播回顧第七篇,分享TDSQL的部署實踐。

直播回顧 |TDSQL的交付

大家好,我是騰訊云TDSQL DBA畢漢斌。我們本次是圍繞著TDSQL交付的話題分享三個方面內(nèi)容。包括TDSQL曾經(jīng)面臨的交付要求和挑戰(zhàn),以及我們開發(fā)沉淀的自動化交付方案,最后更重要的是這套質(zhì)量保障體系后續(xù)可以如何繼續(xù)在交付后的用戶的全生產(chǎn)流程中為用戶提供全方位質(zhì)量保障。

1


TDSQL交付要求和挑戰(zhàn):快速給、靈活、安全給



首先我們想講的是TDSQL的交付挑戰(zhàn),我們也是以三個方面去展開,第一個我們遇到的挑戰(zhàn)是我們TDSQL產(chǎn)品架 構(gòu)所帶來 的特點:
一是產(chǎn)品化不斷完善帶來的特點——組件多,包括擁有數(shù)據(jù)庫內(nèi)核,任務(wù)分發(fā)、冷備中心、平臺告警、性能診斷等;
二是組件之間的相互依賴的關(guān)系比較復(fù)雜。

1.1 復(fù)雜產(chǎn)品組件交付

直播回顧 |TDSQL的交付

首先我們從層次上把這些組件進(jìn)行劃分:赤兔、監(jiān)控采集、OSS、metacluster、扁鵲、onlineddl等可以劃分為一個角色,叫管理節(jié)點。我們從業(yè)務(wù)層去講的話,對業(yè)務(wù)來說,實際訪問數(shù)據(jù)庫從業(yè)務(wù)層去講的話,的過程是,先是負(fù)載均衡層,然后負(fù)載均衡層會做負(fù)載均衡到我們的到SQL引擎層,而SQL引擎層會直接訪問到我們底層的db底層DB,db上也DB上會部署agentAgent,像。圖中左側(cè)列這些我們叫做dbDB管理節(jié)點。像右側(cè)列如冷備中心、消息隊列、多源同步等,我們一般劃分為數(shù)據(jù)節(jié)點。而日志分析平臺其實就是一個其他的模塊,可劃分為其他的節(jié)點。
像這些節(jié)點之間的也是依賴關(guān)系比較復(fù)雜,像我們的管理節(jié)點之前有講到,像這些。比如管理節(jié)點,其實主要做的工作就是負(fù)責(zé)元原數(shù)據(jù)管理,像元原數(shù)據(jù)包括很多,比如以監(jiān)控采集模塊為核心的監(jiān)控數(shù)據(jù),還有、以任務(wù)分發(fā)系統(tǒng)為核心的任務(wù)節(jié)點的數(shù)據(jù)。第二個是我們的DB模塊,DB會和管理節(jié)點有一些交付交互,首先——所有的角色不僅是除了DB節(jié)點,還有其他的節(jié)點都會向管理節(jié)點發(fā)送他的監(jiān)控信息,因為都會把監(jiān)控信息發(fā)送上去。而管理節(jié)點也會下發(fā)一些任務(wù),比如說客戶在前臺進(jìn)行一些的變更,比如說垂直擴(kuò)容、水平擴(kuò)容、主備切換,像這些的等變更動作也是會到實際的DB上進(jìn)行的交付,也會到實際的DB進(jìn)行交互。數(shù)據(jù)節(jié)點首先會像向管理節(jié)點發(fā)送數(shù)據(jù),會和DB節(jié)點做一些交付互,比如我們最常用的就是數(shù)據(jù)庫數(shù)據(jù)的備份和回檔,這個就是DB的節(jié)點和數(shù)據(jù)節(jié)點進(jìn)行交付。日志分析平臺也會和DB節(jié)點去交付,他分析DB節(jié)點產(chǎn)生的日志,具體會做一些用戶的日志分析、SQL分析,甚至?xí)o用戶帶來一些SQL審計的功能,也會向管理節(jié)點上報他的監(jiān)控信息……
所以大家再簡單看一下,其實各個組件之間的依賴關(guān)系,可以看得出來他們還是比較復(fù)雜的。其實就是因為像我們這樣比較復(fù)雜的依賴關(guān)系。他,這對于我們的交付是帶來一定的難處。在TDSQL早期我們是通過自身TDSQL產(chǎn)品團(tuán)隊給客戶做交付。其實按照這樣的要求,這會對交付的人力帶來很大的要求,既即使是我們?nèi)サ脑?,部署一個交付的環(huán)境也要兩天以上。

1.2 多場景交付


    第二個挑戰(zhàn)來自于TDSQL多個場景。

直播回顧 |TDSQL的交付

TDSQL多個場景主要來源于使用TDSQL的對象是不同的,這個對象可以劃分未使用TDSQL的人群是不同的,有個人使用,也有企業(yè)使用,也有第三方平臺使用,包括個人、企業(yè)、第三方平臺。其實這些不同的對象使用TDSQL的過程中,他們的需求和場景也是不同的。以個人使用為例,個人使用TDSQL的話,他更多強(qiáng)調(diào)的是我想了解你的產(chǎn)品,學(xué)習(xí)你的產(chǎn)品,體驗?zāi)愕漠a(chǎn)品,個人使用可能更想我能盡量的低門檻快速上手你的產(chǎn)品,盡量的簡單。企業(yè)使用最主要的兩個場景,一個是POC測試,另一個就是我們的和生產(chǎn)場景。POC測試是,關(guān)注我們的的是整個產(chǎn)品的性能和功能,包括高可用性、容災(zāi)能力、國產(chǎn)化適配等。從性能和功能的出發(fā),也會帶來不同的場景需求。生產(chǎn)其實我們更多關(guān)注的是整個交付、整個產(chǎn)品、整個集群,是否有高可用性,是否有容災(zāi)能力,是否有一次性的保證。我們的平臺接入會帶來更多的挑戰(zhàn),我們的平臺可能會涉及到一些國產(chǎn)化交付的項目,國產(chǎn)化其實會對我們帶來一些兼容性的問題,還會對我們的標(biāo)準(zhǔn)對接、接入帶來一些需求。
所以由于不同的對象使用我們TDSQL的產(chǎn)品,就會帶來不同場景的需求如何高效滿足?
我 們當(dāng)時想的是我們TDSQL在交付的場景下,我們是要做多個分支去適配不同的場景,還是用一個分支去適配不同 的場景? 當(dāng)然我們是用一個分支去適配不同的場景。

1.2 TDSQlL交付質(zhì)量保障:安全、合規(guī)、多層級實時掃描

直播回顧 |TDSQL的交付

第三個挑戰(zhàn)也是,由于時間的推移,我們負(fù)責(zé)TDSQL去交付的人產(chǎn)生了變化。早期我們TDSQL交付是由我們TDSQL產(chǎn)品研發(fā)團(tuán)隊,我們、DBA同學(xué)去現(xiàn)場給客戶做交付。其實在我們的產(chǎn)品研發(fā)團(tuán)隊和DBA團(tuán)隊,大家都是一個團(tuán)隊,團(tuán)隊內(nèi)由于長期的的合作協(xié)同是有是形成了標(biāo)準(zhǔn)和質(zhì)量可靠,他的交付質(zhì)量也是有保證的。而隨著我們TDSQL產(chǎn)品化,做大做強(qiáng),對外推廣用戶規(guī)模不斷擴(kuò)大以后,其實會產(chǎn)生交付人員的不同交付人員會發(fā)生變化,當(dāng)然也有一部分是我們產(chǎn)品研發(fā)團(tuán)隊直接交付。還有一部分是由我們騰訊專門的交付團(tuán)隊去交付,還有是由我們騰訊內(nèi)部的第三方平臺以及騰訊外部客戶自己的第三方平臺接入了TDSQL產(chǎn)品,他們第三方平臺負(fù)責(zé)交付。還有也是客戶自己本身去做交付。不同的交付實施方,他們的操作和使用的過程中就會帶來一些隱患,這些隱患主要體現(xiàn)在以下方面如果不夠標(biāo)準(zhǔn)化,則容易帶來隱患,體現(xiàn)在幾個方面:
第一個是安全的方面。比如說我們環(huán)境的安全,我們知道數(shù)據(jù)庫場景是一個對內(nèi)存、CPU、硬盤、LOIO的等能力,都是要求比較高的場景。之前遇到的一個case,一個客戶在數(shù)據(jù)庫的場景下,他(9:22)沒有關(guān),在壓力比較高的情況下,由于性能問題,最終在一定的場景下帶來的一些風(fēng)險的問題,其實這些就是對環(huán)境的優(yōu)化。其實不僅僅是這種環(huán)境優(yōu)化,包括數(shù)據(jù)庫進(jìn)程會讀大量的文獻(xiàn),他最大的文獻(xiàn)數(shù)繼承的是系統(tǒng)用戶的最大文件數(shù)。像這些的設(shè)置,包括數(shù)據(jù)庫場景對TCP的一些內(nèi)核參數(shù)的優(yōu)化等這些工作都是作為潛在風(fēng)險來統(tǒng)一考慮的。像這些優(yōu)化其實是作為式一個潛在的風(fēng)險去考慮的。
第二個是監(jiān)控方面。對整個集群、進(jìn)程、機(jī)器的監(jiān)控,提到監(jiān)控還有一個以及自動的拉起,有很多即機(jī)械機(jī)器級別等的故障,故障之后一個,進(jìn)程快速恢復(fù)的能力,其實要考慮到完善的自動拉起的體系這些都要作為完善的體系來考慮。其他還有比如一些定時任務(wù),比如說包括定時去清理一些日志文獻(xiàn),清理一些歷史上的數(shù)據(jù),否則磁盤就會撐滿的情況,這在生產(chǎn)的環(huán)境上也是風(fēng)險很大的。還有我們最后是如何保障整個集群的高可用性、容災(zāi)性、(10:56)能力。剛才說到的是不同的實施人可能會帶來不同的風(fēng)險,其實除了實施人以外,還有發(fā)布的版本也需要控制。有的時候我們是作為第一方去交付這個產(chǎn)品,有的時候我們有外部的客戶,他們的平臺會交付,不管誰去交付,這個版本是否是一個歷史版本,這個版本是否會有一些歷史的問題和隱患;如何杜絕這些潛在的舊版本帶來的隱患,檢測到這些版本的漏洞等等方面,也是我們交付質(zhì)量的一個挑戰(zhàn)都是交付質(zhì)量體系中需要解決的問題。
其實我們TDSQL交付質(zhì)量服務(wù)和保障就是圍繞著上述的一些各方面問題方面,實現(xiàn)由在不同的實施人、實施方去交付我們TDSQL的產(chǎn)品下,都能保證我們TDSQL的投產(chǎn)的質(zhì)量。這是我們在做的一個事情。

1


TDSQL自動交付方案:全球靈活部署、實時巡檢,最快9分鐘



剛才也說到TDSQL的交付過程中遇到的一些挑戰(zhàn),我們針對這些上述的挑戰(zhàn),TDSQL沉淀出了一套TDSQL自動化交付方案。

直播回顧 |TDSQL的交付

2.1 自動化交付方案規(guī)劃

這是TDSQL自動化交付方案的架構(gòu)圖:

直播回顧 |TDSQL的交付

剛才說我們TDSQL是基于一個分支去做的來實現(xiàn)多場景、復(fù)雜關(guān)系下的自動化交付的,其實也可以說是基于三個分支去做的。我們TDSQL內(nèi)核包,當(dāng)前有三個分支,是:基于CPU的多分支進(jìn)行發(fā)布,當(dāng)前支持X86、arm、power。其實在我們TDSQL對客戶的發(fā)布包中,一個包自動的集成了不同CPU版本的TDSQLpocketpacket,是——以ansible組件為基礎(chǔ),加上了條件檢測、操作系統(tǒng)調(diào)優(yōu)、環(huán)境依賴的解決、安全規(guī)范、兼容性問題,我們對外做的是TDSQL私有云標(biāo)準(zhǔn)的發(fā)布包。像這個包我們是,可針對于客戶不同的場景,剛才說到的不同場景和不同的環(huán)境做的適配。


直播回顧 |TDSQL的交付

TDSQL的組件我們剛才分為四個角色,如果想要快速的交付TDSQL集群,大家只要搞清楚一件事情,打個比方說就是把不同的雞蛋放到不同的籃子里。雞蛋其實就是我們說的是指這些組件,分為這四個;籃子就是我們準(zhǔn)備的機(jī)器,可以是虛擬機(jī),也可以是物理機(jī)。
首先首先說一下我們的個人體驗的環(huán)境,個人體驗的環(huán)境剛才也說了,在這樣的環(huán)境下可能:個人體驗環(huán)境更注重的是較低門檻比較低,其實在這里我們在這里我們只需要一臺虛擬機(jī)的配制配置就可以達(dá)到這個目的。我們會然后可以把管理節(jié)點、DB節(jié)點、數(shù)據(jù)節(jié)點和其他的節(jié)點都部署在這臺機(jī)器上。當(dāng)然在體驗的環(huán)境下,數(shù)據(jù)節(jié)點和其他的節(jié)點,這兩個功能根據(jù)機(jī)器的配制來看,我們可以不進(jìn)行部署。
在測試環(huán)境:該環(huán)境換機(jī)下注重的是性能、功能。
首先從管理節(jié)點來看,其實管理節(jié)點提供的是元原數(shù)據(jù)的管理和任務(wù)的分發(fā)功能,他對于性能要求不是很強(qiáng),他其實要求的是一個穩(wěn)定性和容災(zāi)的能力。在測試環(huán)境可以稍微弱化這個要求,我們,比如可以準(zhǔn)備一臺或者三臺的虛擬機(jī),配置4C/8G普通磁盤就可以了,配制4C/8G;在測試環(huán)境下,我們要去要做DB節(jié)點的話,其實在DB節(jié)點我們要考慮到TDSQL的性能問題,這里我們就會推薦一個使用物理機(jī);我們TDSQL做進(jìn)行性能測試的時候要求一定是SSD盤,否則我們的性能數(shù)據(jù)是沒有任何參考性的?!@也是由數(shù)據(jù)庫的場景決定的,因為SSD和普通的磁盤,一個是隨機(jī),他們方面主要表現(xiàn)在隨機(jī)讀寫的能力上,的差距會比較大一點;數(shù)據(jù)節(jié)點和其他的節(jié)點方面,如果有一些客戶可能對測試他的功能要求不是那么強(qiáng)沒有那么強(qiáng),他就可以不部署這些節(jié)點的功能,而如果我想體驗一個完整的TDSQL的功能,則我需要準(zhǔn)備這些機(jī)器,以體驗完整的TDSQL的功能;如果我們要部署數(shù)據(jù)節(jié)點的話,我們可以選擇一臺機(jī)器或者三臺機(jī)器,虛擬機(jī),以及準(zhǔn)備大一較大容量點的磁盤做一個數(shù)據(jù)節(jié)點;其他的節(jié)點,這里我們提的是比如負(fù)載均衡和日志分析平臺,日志分析平臺的作用剛才也說了,是做一些SQL審計,DB日志分析等等。其實我們TDSQL的負(fù)載均衡會比較靈活,他是在我們的位于SQL引擎層上的上一層,這里推薦的有開源自身的LVS,當(dāng)然也有很多客戶會使用的F5。最后,像這些以上環(huán)境我們的推薦是部署兩節(jié)點來實現(xiàn),做一個容災(zāi)能力。這個其實就是總體而言,為了保證測試的性能,測試環(huán)境的要求,要求最多的就是DB這個節(jié)點模塊,保證測試的性能。
最終是大家最關(guān)心的生產(chǎn)環(huán)境的要求,我們這里要求的是:生產(chǎn)環(huán)境中要求管理節(jié)點,可以部署在三臺或者五臺是虛擬機(jī),但三臺或者五臺,最好是跨三個機(jī)房,比如說“1+1+1”的模式或者“2+2+1”的模式,因為我們的原元數(shù)據(jù)集群是一個基于多數(shù)選舉的機(jī)制來保障高可用,如果是只有兩個機(jī)房的話,則會失去了他本身容災(zāi)的意義,因此我們建議生產(chǎn)環(huán)境這里是中部署三個機(jī)房。DB節(jié)點生產(chǎn)環(huán)境更推薦的是NVME接口的SSD,因為傳統(tǒng)的SSD和NVME的SSD可能體現(xiàn)他的在接口性能上,會有比較大的性能差距。這里而數(shù)量上我們推薦的數(shù)量是3*N臺,其實——事實上這個是我們要去評估的生產(chǎn)環(huán)境TDSQL集群的數(shù)據(jù)量。因為我們,TDSQL是一個分布式的數(shù)據(jù)庫,他的數(shù)據(jù)量級可以根據(jù)用戶是根據(jù)你的機(jī)器數(shù)量實現(xiàn)做一個水平拓展擴(kuò)容。
舉個例子,比如說我們假設(shè)客戶有3T的數(shù)據(jù),如果(19:39)單臺物理機(jī)是1T的話,一個(?)set內(nèi)做的是一主兩備三個節(jié)點,我們此時就需要三個(?)set,三個(?)set可以承擔(dān)3T的數(shù)據(jù)量,同時會有兩個副本復(fù)本的冗余,我們DB節(jié)點的這些數(shù)數(shù)就需要9臺這樣的機(jī)器,這三個set會組成group shard。數(shù)據(jù)節(jié)點也是的機(jī)器也是推薦物理機(jī),這里數(shù)據(jù)節(jié)點在同時在生產(chǎn)環(huán)境也需要考慮容災(zāi)能力,我們因此推薦是三臺機(jī)器臺機(jī)器以上,這就不推薦1臺機(jī)器了,考慮數(shù)據(jù)節(jié)點的容災(zāi)能力。此外,需要的是一個高性能磁盤,來保證回檔和備份的效率;最后這邊也是推薦物理機(jī),訪問鏈路上接入層是非常重要的一層,我們強(qiáng)烈推薦推進(jìn)物理機(jī),來提高他的穩(wěn)定性。

2.2 TDSQlL自動化交付特性與要求

直播回顧 |TDSQL的交付

剛才其實也講到了我們前文講到了TDSQL不同的組件,他分成不同的層次,我們以及我們怎樣去管理這些層次等等其中的層次邏輯。在TDSQL真正交付過程中,為了保證交付質(zhì)量,結(jié)合金融級場景的安全合規(guī)、高可用容災(zāi)考慮,我們沉淀出一些基本要求和特性:
1.網(wǎng)絡(luò):離線部署無外網(wǎng)依賴,機(jī)器互通;
2.存儲:支持單磁盤、多磁盤和raid;
3.冷備中心:支持hdfs和掛載式分布式存儲(如ceph);
4.機(jī)器分布:支持跨機(jī)架和跨機(jī)房上架服務(wù)器,支持多種機(jī)器分布模式下的高可用容災(zāi);
5.CPU:在國產(chǎn)化趨勢下,目前機(jī)器CPU除了適配x86,還包括arm、power,而且首要推薦以上其中一款;
6.操作系統(tǒng):適配支持centos、ubuntu、以及包括國產(chǎn)化操作系統(tǒng)在內(nèi)的諸多主流操作系統(tǒng) 。

其實我們在真正去交付TDSQL的時候,用我們交付方案去交付TDSQL的時候,有一些注意點大家也要注意一下。 第一個是我們TDSQL的網(wǎng)絡(luò)是沒有外網(wǎng)依賴,因為很多客戶,像一些金融和證券的客戶是不能連通外網(wǎng),我們在TDSQL的發(fā)布包里已經(jīng)解決了這個依賴。 我們只需要一個網(wǎng)絡(luò)互通即可,也沒有網(wǎng)端的要求。 第二個是存儲,TDSQL既支持讀取物理機(jī)上的單磁盤,也支持讀取多磁盤,當(dāng)然也支持我們多磁盤的raid,然后讀取這個raid的路徑,這些都是可以的。 冷備中心這一塊我們TDSQL支持兩種,第一種是hdfs,第二種是遠(yuǎn)端掛載式的分布式存儲,比如說ceph的文件系統(tǒng),他是一種掛載式的文件存儲,比如說以前的NAS、NFS這些也算。
我們建議TDSQL要去跨機(jī)架和跨機(jī)房上架服務(wù)器,我們是有做TDSQL的IDC管理,如果按照我們規(guī)范的要求去做,你的實例滿出來的時候,實例內(nèi)的主備節(jié)點本身就是跨機(jī)房的關(guān)系。當(dāng)前我們TDSQL支持的CPU有三種,一種是X86系列,這個是之前的主流系列,第二個是arm,arm也是我們現(xiàn)在很多國產(chǎn)化的廠商去做的架構(gòu),第三個是power,power目前的主力還是在浪潮這邊。當(dāng)前客戶主要用的操作系統(tǒng)都做過適配,像centos、ubuntu、紅帽等一些國產(chǎn)化的操作系統(tǒng),這些我們都有做適配。
右邊這張圖上圖右側(cè)展示了我們簡單的簡要分布關(guān)系,其實我們就像這樣的規(guī)劃一樣,交付過程中我們只要理清楚我們?nèi)绾伟央u蛋放到對應(yīng)的籃子里就可以了,即可實現(xiàn)自動化交付:我們先選出籃子,一組物理機(jī)就是一個例子籃子,我們就隨之把一組的組件DB節(jié)點放到這個籃子里,其實這樣就完成了自動化的交付。

2.2.1 靈活交付

直播回顧 |TDSQL的交付

當(dāng)然這邊其中有很多的細(xì)節(jié),客戶最關(guān)心的問題是我該怎樣交付這個產(chǎn)品,大家要做的事情就是規(guī)劃,其實大家填寫的配置客戶要做的,是自由決定模塊的機(jī)械機(jī)器分布和集群規(guī)模。我們,TDSQL可以通過一個模塊之間填寫的數(shù)量不同的數(shù)量差異,會自適應(yīng)地做但點做出單點方案和多節(jié)點高可用容災(zāi)方案。這個過程是用戶在操作上是無感知的。
舉個例子,比如說剛才說的TDSQL是支持HDFS作為做他的冷備中心,如果我們HDFS選的是一個節(jié)點的話,他系統(tǒng)會做的一個HDFS的一個但點單點方案。我們知道HDFS的但點方案主要是由(25:38)組成。如果我們這邊填的是三節(jié)點的配置規(guī)劃,他它會自動感知到我要做的是一個高可用的容災(zāi)方案。當(dāng)時HDFS主流的用的高可用容災(zāi)方案,一個是QJM,一個是基于(?)做的方案。我們當(dāng)前是用是基于的QJM的方案,他其實包含了(26:07)高可用的方案方式。

2.2.2 簡單高效:整個部署過程最快僅需9分鐘


直播回顧 |TDSQL的交付

剛才說了TDSQL其實除了我們要做一個做完部署規(guī)劃,把怎樣的組件放到哪一組機(jī)器上,我們要做的,第二件事情是解決各個組件之間的一些關(guān)系,包括一些兼容性的等問題。我舉個例子,這次如果部署的TDSQL環(huán)境是基于ARM國產(chǎn)服務(wù)器的操作系統(tǒng)的國產(chǎn)化的環(huán)境,是急于arm平臺的操作系統(tǒng)。我怎樣我們?nèi)绾瓮ㄟ^一個交付的物料包去適配不同的環(huán)境?其實秘密就在這個配置文件里:
1.用戶無需關(guān)注TDSQL較為復(fù)雜的各模塊的互相依賴和配置管理問題,只需要根據(jù)實際,填寫變量文件配置即可;
2.用戶填寫一個機(jī)器規(guī)格配置文件、一個變量配置文件,填寫后可以適配操作系統(tǒng)和CPU實現(xiàn)一鍵自動化交付;
3.操作簡單用戶可獨立完成,自動化部署命令可重復(fù)執(zhí)行,在北京信通院機(jī)構(gòu)現(xiàn)場對TDSQL產(chǎn)品化的測試顯示,整個部署過程最快僅需9分鐘。

2.2.3適配與集成:國產(chǎn)化、全棧式


直播回顧 |TDSQL的交付

客戶就可以通過填寫我們的配置文件。其實已經(jīng)做了一些適配,包括對我們的內(nèi)核包,首先對我們的TDSQL的內(nèi)核包是出了不同CPU架構(gòu)的內(nèi)核包。還有對我們交付邏輯上做了對各個操作系統(tǒng)和CPU的兼容。其實客戶無須關(guān)心TDSQL比較復(fù)雜的模塊之間的依賴和配置關(guān)系,只要根據(jù)實際情況填寫變量的配置文件就可以了,填寫完了以后就可以執(zhí)行我們交付的發(fā)起命令,可以一鍵自動化交付。
整個交付過程是非常簡單的過程,之前我們有對整個TDSQL的自動化交付過程進(jìn)行測試,當(dāng)時是在北京的信通院的一個機(jī)構(gòu),對TDSQL產(chǎn)品化的交付進(jìn)行測試,整個過程在搭建TDSQL核心交付場景的情況下,只需要9分鐘就可以完成一個交付的場景。其實到這里我們核心的交付流程已經(jīng)給大家介紹完了,其實很簡單,我們根據(jù)自己的需求把不同的雞蛋放到不同的籃子里,將不同角色的組件放到我們準(zhǔn)備好的一組一組機(jī)器上,這是第一件事情,填寫規(guī)劃的配置文件。第二件事情是填寫依賴的變量文化,包括一些環(huán)境和操作系統(tǒng)CPU的變量文件,以幫助我們自適應(yīng)的調(diào)整當(dāng)前的環(huán)境是怎樣的,去調(diào)整一些交付的邏輯。第三個我們真正執(zhí)行交付命令,這個步驟都一鍵化的。

剛才有說到我們TDSQL在國產(chǎn)化方面也做了很多工作,當(dāng)前國產(chǎn)化已經(jīng)成為一個趨勢,TDSQL在國產(chǎn)化適也做了很多工作,從我們底層的服務(wù)器到存儲器、操作系統(tǒng)、CPU、行業(yè)軟件、數(shù)據(jù)庫軟件等,都是在相關(guān)部門指導(dǎo)下國家的領(lǐng)導(dǎo)下進(jìn)行了聯(lián)系與各個廠商合作實現(xiàn)從下層到上層全方位的做國產(chǎn)化適配。在國產(chǎn)化的浪潮下,我們TDSQL作為一個騰訊自研分布式數(shù)據(jù)庫,他作為一個優(yōu)秀的國產(chǎn)化數(shù)據(jù)庫,其實我們也是義不容辭的擔(dān)當(dāng)了我們國產(chǎn)化的責(zé)任。我們當(dāng)前其實是從CPU、操作系統(tǒng)都去做兼容,操作系統(tǒng)剛才有幾個沒有說到。centos、ubuntu、suse,像這幾個可能是大家常見的主流操作系統(tǒng),包括騰訊內(nèi)部的操作系統(tǒng)tlinux是騰訊內(nèi)部的一個操作系統(tǒng),以及中標(biāo)麒麟、銀河麒麟、UOS是等常見的主流國產(chǎn)化操作系統(tǒng),我們都有TDSQL都完成了適配。除了我們列出來的這些CPU的適配、操作系統(tǒng)的適配,適配全系國產(chǎn)操作系統(tǒng),TDSQL同時已相繼完成對全系國產(chǎn)芯片,全系列國產(chǎn)服務(wù)器等的兼容適配工作。而在完成適配工作的同時,騰訊也提供了對應(yīng)的技術(shù)服務(wù),幫助行業(yè)用戶更好地遷移到國產(chǎn)基礎(chǔ)技術(shù)生態(tài)當(dāng)中。剛才提到有很多服務(wù)器CPU的一些硬件廠商做國產(chǎn)化,我們和浪潮也做了一些測試和認(rèn)證,并且拿到了浪潮的認(rèn)證,除了浪潮的以外,我們還在很多其他的國產(chǎn)化的客戶項目中,可能更多偏向于政府和國企相關(guān),也同時并行做這些國產(chǎn)化的項目,并且已經(jīng)拿到了一定的成果。這個些是我們對國產(chǎn)化的方面的工作。
技術(shù)服務(wù)生態(tài)方面,TDSQL其實不僅可作為一個獨立發(fā)布的產(chǎn)品,在TDSQL發(fā)展的歷程中,也其實他已經(jīng)被很多其他的很多平臺廠商各種和合作伙伴接納,包括騰訊內(nèi)部主要是的TCE、Tstack、MDB架構(gòu)等。TCE是騰訊云基于金融級別的一個平臺,TDSQL也是和TCE進(jìn)行高度的集成,包括從我們的在部署方案、告警、用戶權(quán)限等等各種維度和TCE進(jìn)行了深度的集成,可為金融政務(wù)機(jī)構(gòu)提供全方位的PaaS基礎(chǔ)技術(shù)服務(wù),在完成高性能的分布式架構(gòu)轉(zhuǎn)型升級的同時保障金融級穩(wěn)定高可用。Tstack和MDB也是我們內(nèi)部的一些平臺,除了我們內(nèi)部的平臺,還有很多客戶自己的一些平臺。除了客戶自己的業(yè)務(wù)在使用TDSQL以外,有些TDSQL許多客戶合作伙伴是做一些的行業(yè)的解決方案,在他們的解決方案中也集成了TDSQL,把我們TDSQL的能力輸入到他們自己的平臺。

2.2.4 安全保障:秒級監(jiān)測


直播回顧 |TDSQL的交付

TDSQL在發(fā)展中對交付場景做了許多優(yōu)化:
1.條件檢測: 首先會自動對規(guī)劃的TDSQL集群下的所有機(jī)器做前置檢測,包括機(jī)器時間同步、時區(qū)一致、端口占用、系統(tǒng)默認(rèn)sh、機(jī)器規(guī)格等做檢;
2.環(huán)境優(yōu)化:針對關(guān)系型數(shù)據(jù)庫場景,對系統(tǒng)50處左右進(jìn)行針對性調(diào)優(yōu),并解決一些基礎(chǔ)的依賴;
3.機(jī)器秒級監(jiān)控:大部分的監(jiān)控平臺都是基于分鐘級的,對于金融級數(shù)據(jù)庫這種敏感場景,分鐘級的監(jiān)控是不夠的。
我們在交付的場景下也做了一些優(yōu)化,首先我們會對整個TDSQL規(guī)劃的集群下的所有機(jī)器做前置檢測,包括常見的機(jī)器的時間同步、機(jī)器的時區(qū)、端口占用、系統(tǒng)默認(rèn)sh、機(jī)器規(guī)格。我們會對環(huán)境進(jìn)行優(yōu)化,剛才有提到一些操作系統(tǒng)的內(nèi)核參數(shù),針對于關(guān)系型數(shù)據(jù)庫場景,比如說TCB的一些優(yōu)化,像一些內(nèi)存參數(shù)的優(yōu)化,其實我們做了一些調(diào)優(yōu),并解決了一些技術(shù)的依賴。還做了一個秒級的監(jiān)控。其實客戶自己的監(jiān)控平臺,包括我們本身給客戶提供的監(jiān)控中心,大部分的監(jiān)控體系是基于一個分鐘級的,但是數(shù)據(jù)庫這樣的場景比較特殊,其實很多的問題在分鐘級的監(jiān)控下,問題的現(xiàn)場就會丟掉,不能暴露問題的本身。所以我們針對這樣的場景做了提供了秒級的監(jiān)控,我們做了幾個維度,有包括針對機(jī)器的IO、CPU、網(wǎng)絡(luò)、內(nèi)存等等多個維度。

2.3 多集群下的自動化交付


前文剛才講的是我們在TDSQL在單集群下的交付場景和交付細(xì)節(jié),之前在架構(gòu)課上的時候我們也介紹了TDSQL多集群的交付方案。其實接下來介紹在多集群下的,我們來看一下交付具體是怎樣進(jìn)行的。

“同城兩地三中心”部署體系
直播回顧 |TDSQL的交付
直播回顧 |TDSQL的交付
“ 同城三中心”架構(gòu)顧名思義: 在一個城市有A、B、C三個機(jī)房,TDSQL仍采用“一主兩備”結(jié)構(gòu),很顯然我們需要將三個數(shù)據(jù)節(jié)點分別部署在三個機(jī)房,其中主節(jié)點在一個機(jī)房,兩個備節(jié)點分別部署在另外兩個機(jī)房。 同城雙中心的架構(gòu)下我們是有兩套集群,第一套集群是蛇口這個集群,我們是交付一套集群。 然后在觀瀾集群是交付另一個集群。 我們在兩個集群之間做了一個異步復(fù)制,這個是同城雙中心。 第二個是“同城三中心”,我們是架構(gòu)的部署下,是在一個大集群內(nèi),在這個數(shù)據(jù)庫實例下,我們數(shù)據(jù)庫實例使用使用的是同IDC異步、跨IDC強(qiáng)同步的方式,然后在這邊上海會有一個強(qiáng)同步的實例,實例之間會做一個DCN的復(fù)制實現(xiàn)金融級高可用容災(zāi)。 “兩地三中心”架構(gòu)顧名思義: 在一個城市有A、B兩個機(jī)房,另一個城市有C機(jī)房,在第一個城市中TDSQL數(shù)據(jù)庫實例采用同IDC異步、跨IDC強(qiáng)同步的方式,我們需要在第一個城市將四個數(shù)據(jù)節(jié)點部署在二個機(jī)房,其中主節(jié)點和一個備節(jié)點在一個機(jī)房,另外兩個備節(jié)點在另一個機(jī)房。 并且在第一個城市和第二個城市的數(shù)據(jù)庫實例間,采用的是異步復(fù)制,保障金融城市級高可用容災(zāi)。

“兩地四中心”部署體系

直播回顧 |TDSQL的交付
“最后一種就是兩地四中心”的架構(gòu),是一個自動化切換的強(qiáng)同步架構(gòu),我們也是兩個實例,第一個實例是深圳的實例,我們是分成三個IDC。 舉個例子,一個是福田,一個是蛇口,一個是觀瀾,一個實例跨三的IDC,我們做的一個強(qiáng)同步。 第二個實例是在上海,在這兩個實例上也是用的DCN做的實例之間的同步,對任何數(shù)據(jù)中心及故障都能30秒內(nèi)切換,并且數(shù)據(jù)零丟失,性能也穩(wěn)定可靠,對業(yè)務(wù)和用戶來說是實現(xiàn)更高的可用性和更低的成本。

1


TDSQL質(zhì)量保障服務(wù):全生產(chǎn)流程自動化巡檢


剛才有講到了我們TDSQL的一些交付的場景,交付的需求和一些做TDSQL國產(chǎn)化和兼容性一些特性的交付考慮。其實在最重要的地方就是最后,最重要的是我們?nèi)绾伪WCTDSQL的交付質(zhì)量,不僅是交付質(zhì)量和服務(wù)的質(zhì)量,這一塊我是單獨拿到最后一章給大家介紹。

首先我們TDSQL的交付質(zhì)量,我們是通過一個叫自動化巡檢的方案保證。TDSQL自動化巡檢的方案我們是通過三個維度控制我們的保障交付質(zhì)量。

直播回顧 |TDSQL的交付

1.監(jiān)控指標(biāo)分析

第一個維護(hù)維度基于是依賴TDSQL現(xiàn)有的監(jiān)控中心,從我們現(xiàn)有的監(jiān)控體系中去做一些進(jìn)行相關(guān)指標(biāo)性的分析,包括。當(dāng)前我們這個指標(biāo)性的分析也分為兩個維度,第一個維度是當(dāng)前時刻的指標(biāo)分析,第二個維度是和歷史時刻的指標(biāo)分析。什么意思?其實這里就會涉及到一個問題,我們當(dāng)我們要在驗證一個集群,一個TDSQL的集群是否有問題的時候,我們往往除了要分析此時此刻的集群是否存在有一些異常,是否有一些和告警,是、是否存在有一些資源負(fù)載過重等等情況。其實往往,還需要分析歷史性的問題,比如說在歷史我過去在歷史七天中各個指標(biāo)的曲線是如何的。為什么要分析過去歷史七天的指標(biāo)曲線?舉個簡單的場景案例,我這邊例如一個場景是在每天下午三點到五點的時候,是業(yè)務(wù)高峰期,在這個業(yè)務(wù)高峰期的期間,我可能有很多業(yè)務(wù)的慢查詢,甚至有一些慢查詢帶來的性能的問題。系統(tǒng)我如何監(jiān)控在歷史某個時刻出現(xiàn)的問題?比如說我那么我們發(fā)起自動化巡檢方案的時候,我是比如是上午8點鐘發(fā)起,其實上午8點鐘是我的,適逢業(yè)務(wù)低峰期,此時是發(fā)現(xiàn)不了問題的,所以我們需要對歷史上的指標(biāo)做進(jìn)行分析。
方案中具體看一下我們有分析的哪些指標(biāo),我們從哪些維度進(jìn)行分析。我們包括檢測前臺連通性如何,我們、確認(rèn)告警有沒有正確的發(fā)送到客戶手中,我們看一下實例的復(fù)制方式。我們的TDSQL有幾種實例的復(fù)制方式,有強(qiáng)同步,有異步,也有同IDC異步、跨IDC強(qiáng)同步的復(fù)制方式。其實我們在復(fù)制方式之間又很多的選項,比如說我們強(qiáng)同步有可推化的選項,其實當(dāng)強(qiáng)同步發(fā)生了可推化以后,他其實是一個潛在的風(fēng)險,我們要把這種潛在的風(fēng)險弄出來。還有實例免切節(jié)點,當(dāng)發(fā)生主備切換的時候,會產(chǎn)生一個免切節(jié)點,如果有這個免切節(jié)點的話,我們就知道之前歷史上發(fā)生過主備切換,會阻止接下來的自動主備切換方式等,影響我們整個集群的高可用性。
慢查詢是很多性能問題,甚至是一些線網(wǎng)問題比較常見的原因,備延遲,HDFS使用率,還有告警策略對比。其實監(jiān)控主要分為兩個方面:
第一個是監(jiān)控指標(biāo)的采集、上報、搜集,這是我們的監(jiān)控中心在管負(fù)責(zé)。除了我們拿到這個監(jiān)控的數(shù)據(jù),我們要對這個。
第二是對監(jiān)控數(shù)據(jù)進(jìn)行分析,我們對我們,并對認(rèn)為異常的分析進(jìn)行告警,其實在這些。分析和告警下,就會有一個過程中會遵循一定的策略的問題,我們認(rèn)為——怎樣的監(jiān)控數(shù)據(jù)才是異常的,才有必要告出來告警的?當(dāng)然我前們TDSQL維護(hù)了一套私有云的告警模板。我們,也給客戶提供了一些可配置的、定制化的選項,客戶可以根據(jù)自己的實際情況進(jìn)行告警策略的修改;同時提供基于實踐經(jīng)驗積累的告警策略對比,以防用戶做出不合理的修改,暴露告警策略的潛在風(fēng)險。
在這個維度,TDSQL多源同步等模塊可以對數(shù)據(jù)同步情況進(jìn)行監(jiān)控,他們當(dāng)前同步的穩(wěn)定性、同步的性能如何,等其他就是各個模塊的告警的監(jiān)控指標(biāo)。但是為了以防客戶誤操作或者不合理的修改,我們在這邊也會對告警策略進(jìn)行對比,將一些明顯不合理或者極為不合理的改動暴露出來,提示給客戶,告訴客戶這條告警策略什么時候被改過,我們建議這邊告警策略是有風(fēng)險的。

還有我們在TDSQL的同步方式上會有監(jiān)控,DCN的同步和多源同步的監(jiān)控,他們當(dāng)前的同步的穩(wěn)定性、同步的性能如何,其他就是各個模塊的告警的監(jiān)控指標(biāo)。第一個維度就是我們說的從監(jiān)控數(shù)據(jù)的角度來進(jìn)行分析,第二個維度相當(dāng)于是對第一個維度的補(bǔ)充,第二個維度就比較多,我們首先分析的是機(jī)器級的,我們不是采的監(jiān)控數(shù)據(jù),是直接真刀訪問服務(wù)器后臺,我們會對機(jī)器基的LO、CPU、內(nèi)存、磁盤、穩(wěn)定性這些進(jìn)行檢測。穩(wěn)定性就表現(xiàn)在有一些服務(wù)器可能是一些老服務(wù)器,比如說已經(jīng)運行五年了,我們要告知客戶運行五年的機(jī)器可能有風(fēng)險,還有一些機(jī)器可能會經(jīng)常重寫,我們告訴客戶從各種信息里面看這臺服務(wù)器本身的穩(wěn)定性是有問題的。我們從進(jìn)程級去考慮,我們關(guān)鍵要看的是進(jìn)程本身的情況,一般進(jìn)程是有守護(hù)進(jìn)程和工作工程組成的,工作進(jìn)程是否是正常的,守護(hù)進(jìn)程是否是正常的,當(dāng)前進(jìn)程開通的端口是否可以正常的訪問。除了進(jìn)程本身的問題,還要看一下關(guān)鍵進(jìn)程的配置文件的問題,其實很多的配置文件關(guān)系到我們整個TDSQL集群的可用性。

2. 集群環(huán)境

還有我們在TDSQL的同步方式上會有監(jiān)控,DCN的同步和多源同步的監(jiān)控,他們當(dāng)前的同步的穩(wěn)定性、同步的性能如何,其他就是各個模塊的告警的監(jiān)控指標(biāo)。第一個維度就是我們說的從監(jiān)控數(shù)據(jù)的角度來進(jìn)行分析,第二個維度相當(dāng)于是對第一個維度的補(bǔ)充。第二個維度就比較多,我們首先分析的是的分析是機(jī)器級的,我們不是通過采的監(jiān)控數(shù)據(jù),是直接真刀訪問服務(wù)器后臺,我們會對機(jī)器級基的LIO、CPU、內(nèi)存、磁盤、穩(wěn)定性這些等進(jìn)行檢測。穩(wěn)定性就表現(xiàn)在有一些服務(wù)器可能是一些老服務(wù)器,比如說已經(jīng)運行五年了,我們要告知客戶運行五年的機(jī)器可能有風(fēng)險,還有一些機(jī)器可能會經(jīng)常重寫,我們告訴客戶從各種信息里面看這臺服務(wù)器本身的穩(wěn)定性是有問題的。我們從進(jìn)程級去考慮,我們關(guān)鍵要看的是進(jìn)程本身的情況,一般進(jìn)程是有守護(hù)進(jìn)程和工作工程組成的,工作進(jìn)程是否是正常的,守護(hù)進(jìn)程是否是正常的,當(dāng)前進(jìn)程開通的端口是否可以正常的訪問。除了進(jìn)程本身的問題,還要看一下關(guān)鍵進(jìn)程的配置文件的問題,其實很多的配置文件關(guān)系到我們整個TDSQL集群的可用性。

我們會對一些關(guān)鍵的進(jìn)程進(jìn)行掃描,防止客戶手動的誤改或者人為的刪除修改一些關(guān)鍵配置錯改、誤改。除了機(jī)器級和進(jìn)程級,我們還會進(jìn)行實例級進(jìn)行一的些定制化的掃描,其實這個就體現(xiàn)在實例的體檢模塊。之前我們的課程也有分享過扁鵲的工具,實例的體檢就是TDSQL智能診斷分析平臺“扁鵲”工具的接口,可以為實例提供他會給我們從一個實例,從運營、開發(fā)、性能等各個指標(biāo)做一些的系統(tǒng)性的分析。第四個維度是
集群級層面,我們會關(guān)注從低到高,最高就是集群性的維度,在集群性的維度下我們要關(guān)注的問題,這個集群各個機(jī)器之間是否是同步的,時間是否是同步的,TDSQL是要求各個機(jī)器要時間同步。還有、實例下源元數(shù)據(jù)集群是否是有備份的,他、的備份是否是正常的,以及我們這邊會手工觸發(fā)此時此刻的源數(shù)據(jù)集群的備份。我們會在四個維度對第一個監(jiān)控項從四個方面做一個補(bǔ)充的掃描等。

3. 自動化演練

在我們以各個維度去掃描當(dāng)前集群沒有問題的情況下,我們還是要從結(jié)果出發(fā)TDSQL還會從結(jié)果出發(fā),我們會對整個集群做一次P0級別(最高級別)的自動化的演練,演練的場景就是我們正常運營和管理的場景。比如說,包括購買實例、創(chuàng)建用戶、用戶授權(quán)、創(chuàng)建庫表,在這個庫表上做一些表結(jié)構(gòu)的變更。在這個實例上我們會做一些、水平的擴(kuò)容,做一些、垂直的擴(kuò)容,把他擴(kuò)到不同的機(jī)器上,還會做一些、重做備機(jī),模擬一些重做備機(jī)的場景,還有、慢查詢?nèi)霂欤欠衤樵?,我們可以在制度的分析頁面上可以入庫,還有、備份和回檔,我們會模擬把當(dāng)年的實例做一次手動的備份,并且拿這個備份是否能回檔到之前我們備份的點以及保證整個回檔和備份的過程,他的數(shù)據(jù)是一致的等。最后我們系統(tǒng)會對購買的實例進(jìn)行刪除,他其實實現(xiàn)了閉環(huán),對P0級別的場景做了進(jìn)行閉環(huán)的自動化的演練。

總結(jié)來說,TDSQL自動化巡檢方案    我們從這三個方面,從我們的指標(biāo)級,從補(bǔ)充到整個集群環(huán)境的進(jìn)行掃描,以及我們的通過自動化演練,這三個維度確保我們整個交付的集群是安全、穩(wěn)定、可靠、高可用OK的,并且會生成一個我們的質(zhì)量報告到客戶以及我們TDSQL的產(chǎn)品研發(fā)團(tuán)隊去參考。

除了我們TDSQL的質(zhì)量保證除了技術(shù)上的保障方案,我們還會做一些產(chǎn)品化的TDSQL同時沉淀了大量產(chǎn)品化工作,幫助用戶快速、方便地使用分布式數(shù)據(jù)庫。

直播回顧 |TDSQL的交付

比如說當(dāng)我們的客戶從0到1,他是完全的交付。從交付以后從1到多的話,就是運營和使用的過程了。在這些交付和運營的過程中,我們又會帶來很多的問題,比如說怎么交付?剛才我們只是講了一些交付的特點,交付的概念,怎么去操作呢?其實我們也會做一些產(chǎn)品化的文檔的輸出。第一個文檔就是我們大部分的交付、運營在我們TDSQL的產(chǎn)品文檔上,他還包括我們的巡檢,剛才我們說的自動化巡檢的方案,還有故障處理。當(dāng)遇到一個告警和故障,我們怎么樣去處理,怎么樣解讀這個故障還有一些前臺的操作指導(dǎo),我們告警的異常解讀,我們的日常變更擴(kuò)容等等,他是在我們的產(chǎn)品文檔上。如果我們想做一些POC的測試,我們要對一些場景進(jìn)行適配的話,可能要考慮到業(yè)務(wù)側(cè)的開發(fā)問題,我們有輸出TDSQL最佳實踐的開發(fā)指南。還有對標(biāo)準(zhǔn)化測試這樣的情況下我們輸出我們POC的用例,提供了性能的用例、功能用例、高可用容災(zāi)用例。
我們也會對客戶的信息進(jìn)行定期的維護(hù),首先我們會對客戶定期發(fā)起一個集群的巡檢,通過這個巡檢我們可以保證客戶當(dāng)前以及歷史一段時間內(nèi),客戶的環(huán)境是沒有問題的。剛才也說了巡檢主要進(jìn)行功能性和容災(zāi)性的演練。通過自動的我們的定期的巡檢,會搜集到客戶的環(huán)境和版本信息,我們會把這些信息更新到我們的客戶管理系統(tǒng)中,更新的信息是用來之后做客戶私有云的版本推送。在我們的管理系統(tǒng)內(nèi)部會自動進(jìn)行掃描客戶當(dāng)前的版本,如果我們掃描到有建議客戶要升級的版本,我們則會自動推送到客戶代表,然后由客戶代表推送推動客戶升級。

直播回顧 |TDSQL的交付

最后是跟我們客戶最后,在客戶日常運營、日常變更相關(guān)的中,可能大部分運營面臨的大部分問題是怎么去擴(kuò)容、升級、處理告警?怎么擴(kuò)容?我們TDSQL會對各個節(jié)點的擴(kuò)容有一個提供了自動化的擴(kuò)容方案,可以一鍵的擴(kuò)容。同樣升級也是提供了前臺化一鍵操作的功,功能,既可以進(jìn)行點對點的升級,也可以進(jìn)行整個集群的批量升級,這個也是我們有一個前臺化的升級工具。TDSQL的高可用性一方面在于自身的彈性架構(gòu)和容災(zāi)能力,以及數(shù)據(jù)強(qiáng)一致性。

直播回顧 |TDSQL的交付

可用性方面TDSQL提供了自動化告警處理方案告警其實TDSQL的可用性一方面在于他自身的架構(gòu)和容災(zāi)能力,在于他的強(qiáng)濃度告一致的特性,還有我們的監(jiān)控系統(tǒng)。在我們的監(jiān)控系統(tǒng)中難免會產(chǎn)生告警的問題,告警問題處理及時與否,處理的方式其實是影響到我們TDSQL集群的可用性。其實在這個問題上,我們自身也是做了很多探索,我們既要平衡客戶實際的告警處理、告警解讀的工作量,也要幫助客戶保證整個集群的質(zhì)量。我們這邊提出了一個自動化告警分析,將一部分的告警可以自動化的處理,減少客戶自己線網(wǎng)運行的工作量,可實現(xiàn)自動化告警分析,并對部分告警自動處理,減少現(xiàn)網(wǎng)運營的工作量 。
剛才我們是以上我們以交付為核心介紹了我們TDSQL在歷史過程中遇到的幾個交付上的挑戰(zhàn),和針對這些交付挑戰(zhàn),我們提出的了我們自動化的交付方案,這些交付方案的特性是什么,我們?nèi)绾瓮瓿晌覀兊慕桓?,我們在這個交付上可以使用的特性,他的兼容性場景有哪些。以及最后我們對整個TDSQL標(biāo)準(zhǔn)化交付的質(zhì)量和客戶的服務(wù)進(jìn)行了提供了一系列的機(jī)制和能力的提升機(jī)制和能力方面的提升,關(guān)于更多我們TDSQL的細(xì)節(jié),可以關(guān)注我們TDSQL數(shù)據(jù)庫公眾號,我們在這個公眾號會有一些定期的推送文章跟大家分享。


PartⅤ  Q&A


Q:TDSQL支持?jǐn)?shù)據(jù)庫離線備份嗎?
A:我們TDSQL支持多種備份方式。我們,可以基于物理式的(56:22)的備份,也可以基于邏輯備份。但是我們備份的介質(zhì)是備份到HDFS或者掛載式的存儲上。整個備份過程其實是在備機(jī)上進(jìn)行備份,備份是,不會影響到我們正常的業(yè)務(wù)訪問,也不會對業(yè)務(wù)訪問的性能帶來影響。
Q: TDSQL的告警信息如何接入短信、語音、郵件告警平臺?
A:我們TDSQL的告警接入是比較靈活的,首先我們TDSQL的告警信息是一個文本的形式,他可以發(fā)送到任何的平臺,我們當(dāng)前已經(jīng)適配過的客戶已經(jīng)適配過的告警接入方式有很多,比如說客戶有HTTP接口的告警平臺,也有一些其他接口的。其實我們只要根據(jù)我們的指引手冊,把我們的告警信息以你根據(jù)客戶想要的接口,比如說HTP,我們就發(fā)一個HPT的TDSQL可以對應(yīng)地發(fā)一個包,包含了我們的告警信息,發(fā)到你的告警接收平臺就可以了。怎么樣告警的接受介質(zhì)?其實短信、語音、郵件,這個還是由每個客戶自身的告警平臺的能力有影響,比如說自身客戶已經(jīng)有了一個微信的告警接收的平臺,此時我們TDSQL是接入到客戶微信的告警接收平臺,對于不同的告警接收平臺,TDSQL我們自身針對不同的語音、短信和郵件分別做了不同的告警信息發(fā)送。

特惠體驗云數(shù)據(jù)庫 

直播回顧 |TDSQL的交付

↓↓更多驚喜優(yōu)惠請點這兒~  

https://cloud.tencent.com/act/pro/MySQLtry?fromSource=gwzcw.3180840.3180840.3180840&utm_medium=cpc&utm_id=gwzcw.3180840.3180840.3180840

分享題目:直播回顧|TDSQL的交付
鏈接地址:http://bm7419.com/article48/jddgep.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)網(wǎng)站制作面包屑導(dǎo)航、搜索引擎優(yōu)化、品牌網(wǎng)站建設(shè)、ChatGPT、電子商務(wù)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化