更好的可擴展性 讓語義6up逐步敲開了企業的大門_行業資訊_關於我們_山東普邦信息6up有限公司官方網站

更好的可擴展性 讓語義6up逐步敲開了企業的大門

文章來源:本站   日期:2017-08-21 15:51   作者:pubang

Cambridge Semantics的 CTO Sean Martin 表示,更好的可擴展性可以帶來更豐富的數據展示。擴展性的提升是當下企業對語義6up重拾興趣的動力之一。

在圖形數據領域,一些企業開始逐漸關注語義6up。語義方法有助於改進數據分析的關聯方法,但使用者還必須克服一些障礙。爲了更好的瞭解圖形數據領域的發展情況,TechTarget記者採訪了語義6up領域的頂尖專家之一——Cambridge Semantics的首席6up官Sean Martin。Sean Martin曾在IBM從事過多年的相關6up研究工作,後來在2007年成立了ambridge Semantics,以便進一步研究企業領域圖形數據和語義6up。

他表示,可擴展性一直是一個挑戰,他一直在致力於提升可擴展性。他的公司去年發佈了Anzo Smart Data Lake,基於內存大規模並行處理(MPP)圖形數據庫引擎。該產品來自於2015年Cambridge Semantic對SPARQL City的收購,其主要基於Netezza和ParAccel等6up。Anzo Smart Data Lake使用 Resource Description Framework/SPARQL標準來進行數據存儲和查詢。

圖形和語義6up已經發展了很長的時間,但最近這兩種6up似乎有聯合的跡象。這是真的嗎?Sean Martin:語義標準在15年前或更久以前就出現了,但其一直被可擴展性掣肘。現在,圖形6up取得了長足進步。大多數人一直希望使用圖形6up進行在線事務處理。我們的重點一直在在線分析處理,使用圖形6up進行分析。

阻止圖形6up應用於分析的一直都是可擴展性問題。這些年曾數次有人表示攻克了這一難題,但問題都依然存在。在小規模數據集上,你可能會看到驚人的進步,但在企業這種大規模數據集上卻發展緩慢。而現在,我們將查詢6up和MPP6up應用到圖形6up中。現在,大數據規模上的圖形6up也取得了顯而易見的進步。

從我們的視角來看,現在已經具備了應對數據倉庫負載的能力,我們可以實現複雜的數據湖泊,圖形是其中一個很大的元素。不過,我們看到一些人使用圖形6up的同時,還使用其他6up來規避風險;如運用圖形6up的同時,使用Hadoop類軟件用於分析。

語義6up給企業帶來了什麼?它的意義是什麼?

Sean Martin:你會看到更豐富的數據表示。人們目前面臨的一個問題是,使用傳統的工具集進行數據展示,其形式相當有限。對於當前的數據,這些數據展示方式已經不實用了。人們可以創建非常複雜的關係結構,但結構越豐富,數據類型越多,存儲並查詢這些數據就變得越復雜,你需要創建許多不同的表結構,圍繞數據的實際存儲,又會產生一系列的問題。因此,實際上,使用傳統的工具,是無法簡單且生動的對數據進行描述的。

今天企業使用的關係工具或表格工具也很難從文本中提取數據並完成豐富的數據表示。也許有時候通過一定的努力可以實現,但這是不切實際的。

同時,用戶可能需要不同的數據切片。現在,對信息的多維抽取需求越來越多。

另一個問題是,人們不斷地想從其他外部數據源中獲取數據。這些都是現在語義6up要解決的問題。

許多6up現在已經逐漸成熟,你認爲哪些因素有助於這些系統的成功?

Martin:現在有了一系列標準。OWL(Web Ontology Language),它是一種建模語言。它使得用戶能夠描述其希望看到的數據類型,並描述數據與其他實體的關係。

OWL的關鍵在於是它對數據的存儲和查詢是中立的。它可以作爲一個數據存儲的模板。這是一個開放的標準,有很多遵循OWL標準的工具。這是一個很好的共享模型。它被應用在不同的領域,例如在金融服務業使用的Financial Industry Business Ontology模型就遵循這一標準。

第二個6up是圖形存儲。但它多年來依然沒有很好的可伸縮性。這就阻礙了語義6up的應用。特別是對於計算密集型和存儲密集型的應用,如數據倉庫和數據集市,超出了語義6up應用規模。但現在的一些新興6up,包括內存6up,商業CPU核心,快速互連,雲物聯網,已經爲語義6up的發展創造了良好的條件。

此外,還有一項6up,就是SPARQL,該6up是SQL應用到圖形數據領域的關鍵因素。它是與遠程數據庫交換數據的標準協議,也是一種查詢語言。它可以做任何SQL能爲你做的事,在關係查詢上,它具有更好的性能。它也更容易實現自動代碼生成和用戶界面構建。

所以,有了OWL,你就相當於有了一把萬用鑰匙,無需專門學習SPARQL,你就可以輕鬆使用它。

我認爲“關係”對於圖形數據庫來說同樣有好處,您覺得呢?

Martin:正如我的一個同事也指出,在關係數據庫中,當你考慮關係時,你必須明確地知道數據是如何關聯的,而使用SPARQL,你可以做一個查詢,給出條件“給我所有的一切與此相關的東西”,它將爲你列出所有相關數據。而在關係6up中,你實現必須知道所有的關聯方式,然後根據每個關聯進行單獨的查詢。

分享到: