上證夜讀│孫元浩:核心技術(shù)“頂天立地”,大數(shù)據(jù)基礎(chǔ)軟件拼出一片天|環(huán)球觀熱點(diǎn)
2023-06-10 19:32:14    上海證券報(bào)

孫元浩,星環(huán)科技創(chuàng)始人、CEO。入選上海領(lǐng)軍人才培養(yǎng)計(jì)劃,獲得上海市科學(xué)技術(shù)獎(jiǎng)-青年科技杰出貢獻(xiàn)獎(jiǎng)、上海市十大杰出青商、上海市智慧城市建設(shè)領(lǐng)軍先鋒、上海市優(yōu)秀學(xué)術(shù)技術(shù)帶頭人等多個(gè)榮譽(yù)。帶領(lǐng)團(tuán)隊(duì)研發(fā)企業(yè)級(jí)大數(shù)據(jù)平臺(tái)等基礎(chǔ)軟件產(chǎn)品,在實(shí)時(shí)計(jì)算、分布式事務(wù)、分布式計(jì)算、分布式存儲(chǔ)等多方面做出重大革新。

在科幻作品中,“星環(huán)集團(tuán)”聚集了人類最優(yōu)秀的一批科學(xué)家,在太陽(yáng)系遭受“維度攻擊”時(shí),建造了太陽(yáng)系的第一艘超光速飛船——星環(huán)號(hào)。借助超光速引擎Transwarp,飛船超越光速在星際之間穿梭。


(相關(guān)資料圖)

10年前的2013年,大數(shù)據(jù)處理需求急速增長(zhǎng),大數(shù)據(jù)產(chǎn)業(yè)雛形開始形成,從國(guó)內(nèi)到國(guó)外都出現(xiàn)了大數(shù)據(jù)創(chuàng)業(yè)熱潮,國(guó)內(nèi)國(guó)外處于同一起跑線,中國(guó)完全可以出現(xiàn)像操作系統(tǒng)領(lǐng)域的微軟、數(shù)據(jù)庫(kù)方面的甲骨文這樣的基礎(chǔ)軟件公司,不但可以擁有巨大的產(chǎn)業(yè)機(jī)會(huì),而且可以從根本上改變關(guān)鍵技術(shù)被人卡脖子的境遇。

面對(duì)這一千載難逢的機(jī)遇,我集結(jié)身邊酷愛數(shù)據(jù)處理的十幾位同仁,確定了國(guó)家急需的大數(shù)據(jù)基礎(chǔ)軟件的創(chuàng)業(yè)方向,我們希望能聚集一批優(yōu)秀的工程師,打造世界上最快的大數(shù)據(jù)引擎。

“因?yàn)闊釔?,所以?jiān)持”。10年前,我們將公司的名字命名為星環(huán)科技,將經(jīng)過(guò)無(wú)數(shù)個(gè)日日夜夜研發(fā)的大數(shù)據(jù)引擎命名為Transwarp Data Hub,我們希望借助大數(shù)據(jù)的“超光速引擎”實(shí)現(xiàn)大數(shù)據(jù)技術(shù)服務(wù)國(guó)家發(fā)展、用大數(shù)據(jù)產(chǎn)業(yè)報(bào)國(guó)的夢(mèng)想。

1

填補(bǔ)中國(guó)空白

十多年前,我們生活、工作等所產(chǎn)生的數(shù)據(jù)量急速增加,數(shù)據(jù)處理的壓力增大,數(shù)據(jù)價(jià)值越來(lái)越受到重視。能充分挖掘數(shù)據(jù)價(jià)值的企業(yè),就會(huì)開拓一片藍(lán)海市場(chǎng),當(dāng)年這樣的例子比比皆是。

而成千上萬(wàn)的企業(yè),只有通過(guò)數(shù)字化轉(zhuǎn)型,融入數(shù)字經(jīng)濟(jì)發(fā)展軌道,讓數(shù)據(jù)與土地、勞動(dòng)力、資本、技術(shù)一樣成為一種生產(chǎn)要素,融入數(shù)據(jù)作為關(guān)鍵要素的數(shù)字經(jīng)濟(jì)新時(shí)代。

大數(shù)據(jù)是海量數(shù)據(jù)的集合,以容量大、類型多、速度快、價(jià)值高為主要特征,是推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展的新動(dòng)力。10年前在大數(shù)據(jù)處理基礎(chǔ)軟件領(lǐng)域,我們國(guó)家還是一片空白,市場(chǎng)則由國(guó)外公司主導(dǎo)的開源軟件和一些商用軟件所控制。為了實(shí)現(xiàn)不同業(yè)務(wù)需求,用戶通常需要部署多個(gè)不同的產(chǎn)品,通過(guò)組合的方式一起工作。

這種混合部署的方式,面臨眾多挑戰(zhàn),如不同的產(chǎn)品在接口標(biāo)準(zhǔn)上就不一致,用戶需要適配多個(gè)產(chǎn)品的不同接口,開發(fā)成本高。

同樣,這些產(chǎn)品也使用了各自獨(dú)立的計(jì)算引擎和存儲(chǔ),數(shù)據(jù)存儲(chǔ)在各自的生態(tài)中,像孤島一樣難以互通。

在技術(shù)上,一些大數(shù)據(jù)軟件是為十多年前的硬件設(shè)計(jì)的,顯然不適應(yīng)快速發(fā)展的新的硬件的處理需要,通過(guò)對(duì)框架進(jìn)行修修補(bǔ)補(bǔ)雖然可用,但在技術(shù)快速變化的今天依然會(huì)很被動(dòng)。

在應(yīng)用上,國(guó)外的大數(shù)據(jù)軟件企業(yè)在中國(guó)出現(xiàn)了“水土不服”的問題,常見問題是無(wú)法處理中國(guó)用戶這么大的數(shù)據(jù)量和復(fù)雜應(yīng)用場(chǎng)景,同時(shí)還存在安全問題,迫使客戶尋找新的技術(shù)路線、新的產(chǎn)品來(lái)解決遇到的問題。

幸運(yùn)的是我們團(tuán)隊(duì)發(fā)現(xiàn),在大數(shù)據(jù)時(shí)代,數(shù)據(jù)管理軟件正在逐步由集中式架構(gòu)向分布式架構(gòu)演進(jìn),為整個(gè)軟件系統(tǒng)特別是大數(shù)據(jù)基礎(chǔ)軟件帶來(lái)革命性的契機(jī)。沿用以前的技術(shù)路線,難以在短時(shí)間內(nèi)超越國(guó)外的廠商,但在新的技術(shù)架構(gòu)上國(guó)內(nèi)外同時(shí)起步,不僅有希望做到“超車”,而且有機(jī)會(huì)做到“領(lǐng)先一代”。

因此,我們選擇了分布式的技術(shù)路線,用一站式平臺(tái)軟件解決用戶面臨的各種挑戰(zhàn)。如果將以O(shè)racle等為代表的集中式技術(shù)路線比喻為是自行車,那么我們所采用的分布式技術(shù)路線就是小汽車,不僅能解決老問題,也能解決老的技術(shù)路線無(wú)法解決的新問題,用新技術(shù)解決新的場(chǎng)景。

另外,在企業(yè)級(jí)大數(shù)據(jù)軟件方面,中國(guó)還沒有出現(xiàn)特別大型的企業(yè)。因此我堅(jiān)信,中國(guó)大數(shù)據(jù)技術(shù)市場(chǎng)潛力巨大,完全有可能誕生一家中國(guó)人自己的大數(shù)據(jù)基礎(chǔ)軟件公司。

大數(shù)據(jù)管理軟件對(duì)客戶的價(jià)值大,對(duì)客戶的黏性強(qiáng),一旦采用了,可能5年、10年都不會(huì)換,會(huì)積累一批優(yōu)質(zhì)戰(zhàn)略客戶,通過(guò)一流客戶的積累和實(shí)踐,能夠打造出世界一流的大數(shù)據(jù)基礎(chǔ)軟件。

事實(shí)證明,我們心無(wú)旁騖、堅(jiān)持?jǐn)?shù)百個(gè)日子研發(fā)的分布式大數(shù)據(jù)平臺(tái)Transwarp Data Hub用一站式的軟件,解決用戶面臨的眾多數(shù)據(jù)處理需求,性能出眾,贏得了上千個(gè)用戶,填補(bǔ)了中國(guó)大數(shù)據(jù)基礎(chǔ)軟件的“空白”。

2

要啃自研這只“硬骨頭”

在選擇了大數(shù)據(jù)基礎(chǔ)軟件發(fā)展方向時(shí),我們隨即面臨一個(gè)發(fā)展道路的選擇問題:是選擇被大多數(shù)公司遵循的開源技術(shù)路線,還是選擇自主研發(fā)道路?

當(dāng)時(shí)很多企業(yè)選擇基于開源大數(shù)據(jù)技術(shù)推出自己的發(fā)行版,通過(guò)向客戶提供服務(wù)的商業(yè)模式收取費(fèi)用,以獲得發(fā)展。這種方式,產(chǎn)業(yè)研發(fā)投入少,因此短短的幾年時(shí)間之內(nèi),中國(guó)市場(chǎng)就出現(xiàn)了幾百家開源大數(shù)據(jù)產(chǎn)品發(fā)行版。有些公司僅僅改一下管理界面或者包裝就直接在市場(chǎng)上銷售,造成產(chǎn)品同質(zhì)化嚴(yán)重,缺乏競(jìng)爭(zhēng)力。

過(guò)去的從業(yè)經(jīng)歷讓我們創(chuàng)始團(tuán)隊(duì)深知掌握底層基礎(chǔ)軟件技術(shù)的重要性,我們選擇了去啃自主研發(fā)這個(gè)硬骨頭,依靠技術(shù)做出差異化的優(yōu)勢(shì),同時(shí)靠一流的產(chǎn)品贏得更多用戶的信任。

在技術(shù)壁壘高、研發(fā)周期長(zhǎng)、研發(fā)投入大等情況下,我們專注于大數(shù)據(jù)基礎(chǔ)平臺(tái)、數(shù)據(jù)云平臺(tái)、分布式關(guān)系型數(shù)據(jù)庫(kù)、數(shù)據(jù)開發(fā)與智能分析工具等基礎(chǔ)軟件領(lǐng)域,始終堅(jiān)持“自主原創(chuàng)、領(lǐng)先一代”戰(zhàn)略,為行業(yè)客戶的數(shù)字化轉(zhuǎn)型提供了一個(gè)安全可控的平臺(tái)選擇,也讓中國(guó)在大數(shù)據(jù)基礎(chǔ)軟件的自主創(chuàng)新邁上了一個(gè)全新的高度。

當(dāng)我們推出自己研發(fā)的大數(shù)據(jù)基礎(chǔ)平臺(tái)TDH后,在市場(chǎng)推廣上又面臨新的諸多困擾。如面對(duì)中國(guó)用戶在大數(shù)據(jù)應(yīng)用上會(huì)遇到許多疑難問題,就是以Cloudera、MongoDB、Elastic等為代表的開源大數(shù)據(jù)平臺(tái)廠商,以及如以O(shè)racle、IBM和Teradata等為代表的商業(yè)關(guān)系型數(shù)據(jù)庫(kù)廠商,都不能很好的解決。這時(shí),用戶會(huì)說(shuō),“美國(guó)大企業(yè)都沒走通的技術(shù)路線,我怎么能信任你們小創(chuàng)業(yè)公司?”

我們的舉措是堅(jiān)持技術(shù)引領(lǐng),一邊樹立標(biāo)桿用戶,一邊等待時(shí)間驗(yàn)證。通過(guò)采用自研的技術(shù)與產(chǎn)品,幫助用戶解決了問題,產(chǎn)品也得到不斷驗(yàn)證,積累了不少行業(yè)客戶,繼而產(chǎn)品又得到持續(xù)改進(jìn)。

2020年2月7日凌晨1時(shí)左右,星環(huán)科技接到研發(fā)上海市“隨申碼”任務(wù)。團(tuán)隊(duì)只有3天時(shí)間,要求是實(shí)時(shí)計(jì)算健康碼狀態(tài),支撐每秒至少“10萬(wàn)+”的并發(fā)查詢。近30名工程師、程序員組成臨時(shí)團(tuán)隊(duì),分成兩組,連班倒,利用星環(huán)科技自主研發(fā)的大數(shù)據(jù)引擎,撐起“隨申碼”的大數(shù)據(jù)存儲(chǔ)和計(jì)算能力的基礎(chǔ)平臺(tái)。僅用3天時(shí)間,“隨申碼”系統(tǒng)上線,一周后正式運(yùn)行,現(xiàn)在隨申碼一網(wǎng)通辦的功能已經(jīng)成為市民們的常用功能。

將大數(shù)據(jù)基礎(chǔ)軟件的核心技術(shù)掌握在自己的手里,不受制于人,一直是星環(huán)科技發(fā)展的“初心”。十年來(lái),我們一直專注于大數(shù)據(jù)基礎(chǔ)軟件領(lǐng)域,持續(xù)做一件事情,并把它做好、做精、做大。

我非常自豪的是,在大數(shù)據(jù)核心技術(shù)領(lǐng)域,我們能夠超越美國(guó)廠商,比他們做得更好,而且一直被模仿。

3

將大數(shù)據(jù)基礎(chǔ)軟件做強(qiáng)做大

因?yàn)闊釔?,所以?jiān)持;因?yàn)閳?jiān)持,所以成功?,F(xiàn)在,我對(duì)大數(shù)據(jù)產(chǎn)業(yè)的認(rèn)識(shí)更進(jìn)一步了。

在當(dāng)前時(shí)代背景和國(guó)際形勢(shì)下,涉及數(shù)據(jù)生成、采集、存儲(chǔ)、加工、分析、服務(wù)為主的大數(shù)據(jù)產(chǎn)業(yè),已經(jīng)成為了國(guó)家戰(zhàn)略新興產(chǎn)業(yè),是激活數(shù)據(jù)要素潛能的關(guān)鍵支撐,是加快經(jīng)濟(jì)社會(huì)發(fā)展質(zhì)量變革、效率變革、動(dòng)力變革的重要引擎。

現(xiàn)在,我們面臨的挑戰(zhàn)是在大數(shù)據(jù)產(chǎn)業(yè)發(fā)展中,如何做強(qiáng)做大大數(shù)據(jù)基礎(chǔ)軟件,進(jìn)而做大做強(qiáng)大數(shù)據(jù)產(chǎn)業(yè)?這是我經(jīng)常思考的問題,也有了很多自己的想法,與大家分享。

第一,要認(rèn)清基礎(chǔ)軟件發(fā)展的長(zhǎng)期性,潛心苦行,持續(xù)深耕,不能有絲毫松懈。自信息技術(shù)誕生以來(lái),基礎(chǔ)軟件就是都占據(jù)至關(guān)重要的地位,是IT產(chǎn)業(yè)發(fā)展的核心競(jìng)爭(zhēng)力,也是最容易被卡脖子的領(lǐng)域。大數(shù)據(jù)基礎(chǔ)軟件與操作系統(tǒng)、數(shù)據(jù)庫(kù)等基礎(chǔ)軟件一樣,是智力密集型行業(yè),具有研發(fā)周期長(zhǎng)、技術(shù)復(fù)雜、研發(fā)投入大等的特點(diǎn)。在國(guó)內(nèi),基礎(chǔ)軟件行業(yè)沉淀時(shí)間比較短,技術(shù)積累比較薄。因此,我們一定要認(rèn)清大數(shù)據(jù)基礎(chǔ)軟件發(fā)展的長(zhǎng)期性,認(rèn)準(zhǔn)發(fā)展方向,潛心苦行,持續(xù)發(fā)力,“不經(jīng)一番徹骨寒,哪來(lái)梅花撲鼻香”。

第二,在技術(shù)上要銳意創(chuàng)新,堅(jiān)持領(lǐng)先對(duì)手2~3年。隨著企業(yè)需要處理的數(shù)據(jù)規(guī)模急劇膨脹,數(shù)據(jù)類型更加豐富,數(shù)據(jù)應(yīng)用場(chǎng)景越來(lái)越廣泛,大數(shù)據(jù)基礎(chǔ)軟件也需要緊跟市場(chǎng)發(fā)展趨勢(shì),推陳出新,持續(xù)迭代,滿足用戶更廣泛的需求。

在發(fā)展大數(shù)據(jù)基礎(chǔ)軟件上,要堅(jiān)持發(fā)布一代、預(yù)研一代、持續(xù)迭代,在核心技術(shù)與產(chǎn)品上要領(lǐng)先國(guó)外競(jìng)爭(zhēng)對(duì)手2~3年。同時(shí),要以數(shù)據(jù)要素為核心,逐漸擴(kuò)大產(chǎn)品范圍,圍繞數(shù)據(jù)集成、存儲(chǔ)、治理、建模、分析、挖掘再到流通的數(shù)據(jù)全生命周期管理提供一體化工具與軟件。

當(dāng)今技術(shù)發(fā)展飛快,行業(yè)對(duì)新技術(shù)的接納和應(yīng)用速度遠(yuǎn)遠(yuǎn)超過(guò)當(dāng)年,比如近期通用大模型的火爆,讓很多行業(yè)開始積極摸索大模型落地,而我們也快速的在這一技術(shù)模式中確定了我們的產(chǎn)品方向:通用大模型并不是適用于具體的行業(yè)領(lǐng)域,也無(wú)法解決在特定領(lǐng)域中的問題,所以我們不跟風(fēng)不盲從,專注在自己的領(lǐng)域,在今年5月,我們推出了為用戶提供大模型應(yīng)用構(gòu)建的全棧軟件工具,目標(biāo)是讓每個(gè)企業(yè)都可以擁有自己專屬的行業(yè)大模型,推出星環(huán)無(wú)涯INFINITY金融量化大模型、大數(shù)據(jù)分析大模型SoLar“求索”兩大行業(yè)應(yīng)用大模型,SoLar“求索”可以讓企業(yè)的每個(gè)員工都可以擁有自己的專屬AI助理。

第三,聯(lián)合合作伙伴推出更多的行業(yè)解決方案,加快大數(shù)據(jù)基礎(chǔ)軟件的商業(yè)化落地。基礎(chǔ)軟件良好的商業(yè)化能力既能保障企業(yè)持續(xù)獲得客戶與收益,又能通過(guò)大型成熟的一流客戶,不斷優(yōu)化和迭代產(chǎn)品,獲得更好發(fā)展空間。

在打造商業(yè)化落地方面,我們一方面要持續(xù)擴(kuò)大行業(yè)的落地案例,尤其是行業(yè)標(biāo)桿案例,獲得大量應(yīng)用場(chǎng)景的驗(yàn)證和行業(yè)客戶的認(rèn)可。另一方面,不同行業(yè)所需處理的數(shù)據(jù)類型、分析場(chǎng)景、數(shù)據(jù)量等可能有差異,對(duì)大數(shù)據(jù)軟件的功能、性能、成本等會(huì)提出的不同要求,我們同樣要聯(lián)合合作伙伴提供針對(duì)性的行業(yè)解決方案,提升行業(yè)中的市場(chǎng)份額。

第四,做好大數(shù)據(jù)基礎(chǔ)軟件國(guó)產(chǎn)化替代,滿足用戶基礎(chǔ)軟件升級(jí)換代的需求。借助基礎(chǔ)軟件技術(shù)架構(gòu)升級(jí)的機(jī)會(huì),在很多關(guān)鍵領(lǐng)域和關(guān)鍵技術(shù)方面,通過(guò)自主研發(fā)逐步實(shí)現(xiàn)國(guó)產(chǎn)化替代,將是未來(lái)實(shí)現(xiàn)產(chǎn)業(yè)創(chuàng)新的出發(fā)點(diǎn)和落腳點(diǎn)。

過(guò)去40多年,包括數(shù)據(jù)庫(kù)在內(nèi)的大數(shù)據(jù)技術(shù)一直在迭代,賽道變得越來(lái)越寬廣,基礎(chǔ)軟件的國(guó)產(chǎn)化替代市場(chǎng)潛力巨大。一方面,既有應(yīng)用中的國(guó)外基礎(chǔ)軟件越來(lái)越不能適應(yīng)企業(yè)日益增加的創(chuàng)新場(chǎng)景需求,企業(yè)希望通過(guò)技術(shù)架構(gòu)升級(jí)換代,實(shí)現(xiàn)數(shù)據(jù)庫(kù)等基礎(chǔ)軟件國(guó)產(chǎn)化替代。另一方面,新的應(yīng)用要求數(shù)據(jù)庫(kù)等能處理更多的數(shù)據(jù)類型,滿足業(yè)務(wù)發(fā)展、安全合規(guī)等需求,由此形成了基礎(chǔ)軟件國(guó)產(chǎn)化替代的新興市場(chǎng)。

因此,大數(shù)據(jù)基礎(chǔ)軟件國(guó)產(chǎn)替代要兼顧兩個(gè)市場(chǎng),堅(jiān)持技術(shù)創(chuàng)新,以更高好的大數(shù)據(jù)基礎(chǔ)軟件產(chǎn)品滿足用戶升級(jí)換代的需求。

第五,發(fā)展大數(shù)據(jù)產(chǎn)業(yè)生態(tài),與生態(tài)伙伴共促大數(shù)據(jù)產(chǎn)業(yè)發(fā)展。在數(shù)字化生態(tài)階段,軟件產(chǎn)業(yè)的發(fā)展主要依靠平臺(tái)發(fā)展生態(tài),依靠生態(tài)發(fā)展壯大。

我認(rèn)為,大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的下一步就是打造以平臺(tái)為核心的大數(shù)據(jù)生態(tài)。我們將堅(jiān)持“平臺(tái)+生態(tài)”的發(fā)展理念,積極同軟件開發(fā)商、硬件開發(fā)商、系統(tǒng)集成商等眾多生態(tài)合作伙伴共同探索開發(fā)各個(gè)行業(yè)的大數(shù)據(jù)應(yīng)用,挖掘客戶需求,并深耕行業(yè)場(chǎng)景,打造聯(lián)合解決方案,解決客戶問題,滿足客戶需要,做大產(chǎn)業(yè),我們相信這也是國(guó)產(chǎn)基礎(chǔ)軟件做大做強(qiáng)的發(fā)展路徑。

(文章來(lái)源:上海證券報(bào))

關(guān)鍵詞: