時間已經(jīng)來到ChatGPT引發(fā)中國AI熱潮的第十個月,「AI+X」無疑是今年技術(shù)型企業(yè)里的當(dāng)紅命題,所謂外行看熱鬧、內(nèi)行看門道,這陣風(fēng)是否會徹底改變原有產(chǎn)品的技術(shù)架構(gòu),如何利用新技術(shù)、新趨勢切入賽道甚至實現(xiàn)領(lǐng)跑才是泛科技領(lǐng)域的焦點。
作為中國智能銷售SaaS的開創(chuàng)者,探跡科技目前已構(gòu)建超1.8億主體的企業(yè)全量知識圖譜,為企業(yè)解決從線索挖掘、商機(jī)觸達(dá)、客戶管理到成單分析等一系列銷售難題。面對如此巨量的數(shù)據(jù),探跡的大數(shù)據(jù)架構(gòu)是如何演變的,SaaS企業(yè)里的技術(shù)團(tuán)隊正在做哪些新的開發(fā)與探索?
9月16日,「探跡技術(shù)大講堂」在探跡科技總部開講,探跡科技CTO陳開冉致開場辭,探跡科技高級大數(shù)據(jù)開發(fā)專家鄧楚健與云器科技CTO關(guān)濤分別帶來各自的技術(shù)觀點與案例經(jīng)驗,其中不乏探跡大數(shù)據(jù)架構(gòu)核心技術(shù)解讀,以及未來的數(shù)據(jù)算法引擎思考。
關(guān)濤:暢想「One Size Fits All」的數(shù)據(jù)架構(gòu)
關(guān)濤毫無疑問是大數(shù)據(jù)領(lǐng)域?qū)<抑械膶<摇?/p>
早在2006年,關(guān)濤就加入微軟亞洲研究院,參與構(gòu)建微軟第一代分布式KV系統(tǒng)SearchRepository和Bing搜索的分布式存儲后臺Kirin Store。之后,關(guān)濤加入了微軟美國云計算和企業(yè)事業(yè)部,主持和參與開發(fā)了Azure Datalake、Cosmos/Scope等多套超大規(guī)模分布式存儲和計算平臺,直至2016年回國加入阿里,負(fù)責(zé)阿里巴巴主線大數(shù)據(jù)平臺飛天MaxCompute與Dataworks,之后又擔(dān)任阿里和螞蟻集團(tuán)技術(shù)委員會計算平臺領(lǐng)域組長、阿里云架構(gòu)組大數(shù)據(jù)組組長,直到2021年創(chuàng)立云器科技,擔(dān)任首席技術(shù)官。
云器科技CTO關(guān)濤
關(guān)濤表示,哪怕經(jīng)過多年的發(fā)展,國內(nèi)「原創(chuàng)」數(shù)據(jù)平臺技術(shù)依然偏少,但數(shù)據(jù)領(lǐng)域繼續(xù)保持高速增長,2023年國內(nèi)數(shù)據(jù)平臺技術(shù)依舊大多是組裝式數(shù)據(jù)架構(gòu),引擎數(shù)據(jù)語義均不統(tǒng)一,異構(gòu)存儲及多套元數(shù)據(jù)帶來了極高的開發(fā)成本、維護(hù)成本和大量的計算與存儲冗余。
最關(guān)鍵的是,這類的組裝式數(shù)據(jù)架構(gòu)缺乏滿足業(yè)務(wù)的靈活性。
關(guān)濤認(rèn)為,應(yīng)該有一個一體化數(shù)據(jù)分析引擎,實現(xiàn)統(tǒng)一接口、統(tǒng)一處理邏輯,提供多種優(yōu)化指標(biāo)的高覆蓋度和靈活調(diào)整能力。此外,AI擴(kuò)展了能夠處理的數(shù)據(jù)類型,給結(jié)構(gòu)化數(shù)據(jù)提供了新的處理能力,接下來將有全新的大數(shù)據(jù)架構(gòu),支持AI新計算范式。
那什么才是合理的解?
探跡同學(xué)向關(guān)濤請教
關(guān)濤的答案是,開放式湖倉一體架構(gòu)是面向Data+AI融合場景的最優(yōu)選擇,而具備多元獨立、分析引擎一體化、BA+AI的數(shù)據(jù)平臺才能最大程度解放數(shù)據(jù)生產(chǎn)力。
當(dāng)然,關(guān)濤認(rèn)為「增量計算」也許是one size fits all實現(xiàn)的關(guān)鍵,這也是目前云器科技Lakehouse下一代架構(gòu)的目標(biāo)。
鄧楚?。簺]有最好的架構(gòu),只有最適合的架構(gòu)
湖倉一體也是探跡科技的大數(shù)據(jù)架構(gòu)團(tuán)隊在應(yīng)用的技術(shù)之一。探跡高級大數(shù)據(jù)開發(fā)專家鄧楚健帶來了他的分享。
鄧楚健作為探跡大數(shù)據(jù)平臺架構(gòu)的高級技術(shù)專家,一直專注于探跡的 PB 級大規(guī)模數(shù)據(jù)實時計算架構(gòu)研發(fā),在企業(yè)大數(shù)據(jù)及知識圖譜技術(shù)方面有豐富的技術(shù)實踐和成果積累。
探跡高級大數(shù)據(jù)開發(fā)專家鄧楚健
鄧楚健介紹,探跡的數(shù)據(jù)來源和特點是大數(shù)據(jù)領(lǐng)域中別樹一幟的,具有數(shù)據(jù)量大,多源多構(gòu)半結(jié)構(gòu)化數(shù)據(jù),原始關(guān)聯(lián)性弱,大規(guī)模隨機(jī)更新等特點。如何從這種海量低價值密度數(shù)據(jù)中,提煉出有商業(yè)價值的部分,及時的呈現(xiàn)給客戶,實現(xiàn)為客戶建立商業(yè)鏈接的愿景,是探跡大數(shù)據(jù)架構(gòu)面臨的主要挑戰(zhàn)。
當(dāng)行業(yè)都在套標(biāo)準(zhǔn)化的數(shù)據(jù)包時,探跡選擇搭建自己的大數(shù)據(jù)架構(gòu)。探跡的目標(biāo)很清楚,要做「全量知識圖譜」,這是一條「開荒」的路子,也是目前中國 toB 銷售真正需要的東西——商機(jī)往往就在這些數(shù)據(jù)信息里,缺一不可,晚一步觸達(dá)都有可能錯失機(jī)會。
鄧楚健透露,探跡科技的大數(shù)據(jù)架構(gòu)目前已經(jīng)演進(jìn)到第三代TDR(Tungee Data Refresh),該架構(gòu)以存算分離、實時上新、數(shù)據(jù)治理為核心,極大滿足了各行業(yè)各版本的數(shù)據(jù)迭代上新要求,為客戶提供不可計量的商業(yè)價值。下一代,探跡大數(shù)據(jù)架構(gòu)將朝著獨家數(shù)據(jù)引擎的方向迭代,即Tungee Data Engine。
探跡同學(xué)向鄧楚健請教
此外,探跡大數(shù)據(jù)架構(gòu)體驗了傳統(tǒng)數(shù)據(jù)庫技術(shù)到大數(shù)據(jù)庫,再到數(shù)據(jù)湖,目前正在應(yīng)用湖倉一體、流批一體、智能調(diào)度、大語言模型引擎整合等技術(shù)。
探跡大數(shù)據(jù)的每代架構(gòu)都解決了當(dāng)時期的核心問題,都具有合理性。鄧楚健認(rèn)為,優(yōu)秀的架構(gòu)不是一蹴而就的,而是不斷演化而來。沒有最好的架構(gòu),只有最合適的架構(gòu),而架構(gòu)的發(fā)展過程,也是組織結(jié)構(gòu)的發(fā)展過程。技術(shù)架構(gòu)要貼合組織溝通結(jié)構(gòu),才能發(fā)揮出最佳效果,順應(yīng)時代,與時俱進(jìn),不斷地吸收新的技術(shù)和經(jīng)驗,不斷迭代演進(jìn)才是發(fā)展的根本。
本次探跡技術(shù)大講堂中,探跡科技的技術(shù)團(tuán)隊與云器科技就大數(shù)據(jù)架構(gòu)現(xiàn)狀與趨勢進(jìn)行了深入交流,期待多元的技術(shù)思考與觀點推動技術(shù)進(jìn)一步創(chuàng)新,在不久的將來助力行業(yè)技術(shù)繼續(xù)迭代升級、引領(lǐng)行業(yè)發(fā)展。
作為國內(nèi)智能銷售SaaS的開創(chuàng)者,探跡科技堅持創(chuàng)新為本、技術(shù)為先,立足各行業(yè)、企業(yè)真實銷售場景需求,致力于用大數(shù)據(jù)與AI技術(shù)為企業(yè)提供全流程智能銷售SaaS服務(wù),用科技助力企業(yè)降本增效、斬獲商機(jī)。在過去的七年里,探跡科技構(gòu)建了超過1.8億家主體的企業(yè)全量知識圖譜,開辟了智能銷售SaaS的新時代,先后榮獲“專精特新”“高科技高成長企業(yè)”“全球獨角獸”等榮譽(yù),服務(wù)客戶超過20000家,其中包括阿里巴巴、微軟、亞馬遜、戴爾等行業(yè)巨頭。