ontology本體怎麼挖礦
❶ Gene Ontology
Ontology: 哲學中稱為本體論/存在論,這里本質是指一系列特定的文字可用來形容一些特定的模式、元件或角色,因此在國外的華人生物信息學家中試譯為語義(學)。
GO(gene ontology)對大家而言也許會是一個相對陌生的名詞,但是它已經成為生物信息領域中一個極為重要的方法和工具,並正在逐步改變著我們對 biological data的組織和理解方式,它的存在已經大大加快了我們對所擁有的生物數據的整合和利用,我們應該逐步學會理解和掌握這種思想和工具。
眾所周知,sequence based biology中的核心內容即是對序列的Annotation(注釋),其中主要包含structural annotation和functional annotation,前者涉及分析sequence在genome中的locus以及exon,intron,promoter等的location,而後者則是推斷序列編碼產物的功能,也正是我們在六月論題中所著重探討的。應該說,這二者是相互關聯的。
隨著多種生物genome的相繼解碼,同時大量ESTs以及gene expression profile date的積累,使得annotation的工作量和復雜度大大增加。然而另一方面,大多數基因在不同真核生物中擁有共同的主要生物功能,通過在某些物種中獲得的基因或者蛋白質(shared protein)的生物學信息,可以用以解釋其他物種中對應的基因或蛋白(especially in comparative genomics)。由於這些繁復的功能信息主要是包含在積累的文獻之中,如何有效的提取和綜合這些信息就是我們面臨的核心困難,這也是GO所要著力解決的問題。通過建立一套具有動態形式的控制字集(controlled vocabulary),來解釋真核基因及蛋白在細胞內所扮演的角色,並隨著生命科學研究的進步,不斷積累和更新。一個ontology會被一個控制字集來描述並給予一定的名稱,通過制定「本體」ontologies並運用統計學方法及自然語言處理技術,可以實現知識管理的專家系統控制。
到目前為止,Gene Ontology Consortium(GO的發起組織)的資料庫中有3大獨立的ontology被建立起來:biological process生物過程, molecular function分子功能及cellular component細胞組分。而這三個ontology下面又可以獨立出不同的亞層次,層層向下構成一個ontologies的樹型分支結構。可以說, GO是生物學的統一化工具。
❷ ontology在計算機科學中到底是什麼
種類」(kind)是指對那些具有共同性質的物體給出的一種范疇的劃分,或者說所有這個種類中的成員都具有(也只有這個種類中的成員才能具有)這一組性質。更確切地說,對每一個種類K,就會有一組性質N,其中每一條性質都是必需的,而所有這些性質組合起來,就成了可以成為K的成員的充分條件;即,「x是K的成員,當且僅當x具有N中的每一條性質」。IDEF5是用以獲取本體論的,要抓事物的本質,當然就要以種類的劃分及其基本性質作為研究的出發點。
事物的性質,首先可以區分為「本質的」(essential)和「附屬的」(accidental)兩種。然而,IDEF5要用來獲取企業本體論,問題會復雜得多,因此要把「種類」的定義作些靈活性的修正。把那一組用以確定種類K中成員的性質,稱之為「限定性的性質」(defining properties)。
「種類」(kind)和其他數據模型中提到的「類型」(type)和「類」(class),都是對個體集合的分類,都是可以有多個示例的。但是,種類(kind)和類型(type)的實例是可以隨時間改變的,但種類本身則不變。例如,「雇員」種類,並不因為一個企業雇員數目的增減、具體人員的變動而改變這個種類本身。而類(class)則有時依賴於一些可記錄的個體的集合,略有差別。
性質和屬性
本體論中要明確區分性質(property)和屬性(attribute)。屬性最好被看作一種函數,它一定要被賦予一個值。例如,屬性「…的顏色」(簡稱「顏色」),就把每一個對象映射到它的顏色;屬性「…的年齡」(簡稱「年齡」),就要把每個雇員映射到他/她的年齡。而性質則是直觀的,事物的特徵,所有個體所共同具有的一般抽象的特徵。
事物總要求顯示某種屬性值。事物的「顏色」(屬性)是紅的(屬性值),則其有性質「是紅色的」。雇員的「年齡」(屬性)是40(屬性值),他就有一條性質「年齡是40歲」。
在建立本體論的實踐中有時分不清性質和屬性,所以IDEF5中有時用一個中性名詞「特徵」(characteristic),包容了這兩個詞。
關系
除了各個個體的性質和屬性,本體論中當然要考慮個體之間的連接或關聯,稱之為「關系」(relation)。例如,「工作在…」關系,就是一個雇員與其所工作的部門之間的關系。 「關系」是可以多重示例的,並且是強制性的。在本體論中,一般說「關系」是存在於二者之間的,但並不排斥存在於三個以上個體之間的關系。
二階性質和關系
上面說到了「性質」和「個體」。顯然,這是不同邏輯類型的東西。性質是不同個體間共有的抽象的通用的特徵。同樣,關系也是不同的成對的(或三個以上)個體之間共有的通用的關聯。因此,性質和關系是從個體的特徵中抽象出來的,就被認為是一種更高的(更抽象的)邏輯類型。
如果把個體看作是「一階對象」(first-order objects),一階對象的性質和關系就叫做一階性質和關系(first-order properties and relations)。然而存在於個體之間的性質和關系,本身也是一種可識別的(雖然是抽象的)對象,因為它們比普通一階對象在抽象程度上高了一級,被看作是更高的邏輯類型,就稱之為「二階對象」(second-order objects)。而一階性質和關系作為一種對象,它們也有自己的性質(就不是用於個體的),例如,性質「具有至少一個實例」。這種性質因是用於二階對象的故稱為「二階性質」(second-order properties)。另外,二階對象相互之間存在著關系,例如,在兩個種類之間存在的「具有比…更多的實例」關系。又如,存在於一個給定種類和包含著它的一個更通用的種類之間的「子種類」(subkind)關系;人類是哺乳類的子種類,數控機床是機器的子種類。有些二階關系把個體作為其變元,如「是…的實例」關系,就存在於一個個體a與一個種類K之間(當a是K的一個實例時)。這種不同邏輯類型對象之間存在的混合類型關系,也稱為是二階的。因此,二階關系(second-order relation)就是至少包含一個一階性質或關系作為其變元的一種關系。
部分、整體和復雜種類
實際上IDEF5中有很多種類的個體,其本身就是由許多各種「種類」的其它對象所組成的復雜種類。一般來說,這些個體所以被看作是簡單的,只是因為在那個研究場合下,不必要考慮其合成特性。而同一個事物,在另一些場合下,某個對象種類的合成特性要突出地考慮時,這個對象種類,就要把其它種類的對象看作其「部分」(或零件)(parts)。所以在IDEF5中有一個基本的「是…的部分」關系,存在於一個個體與將此個體作為其一部分的那個更復雜的個體之間。譬如,火花塞與引擎,就存在這種關系,讀作「火花塞是引擎的一部分」。而這種具有其它「種類」作為其「部分」的種類,被稱為「復雜種類」(complex kind)。
IDEF5中的「是…的部分」關系,也完全具有兩個(高階的)性質:
·反身性(reflexivity)----每個對象都是其本身的「部分」;
·傳遞性(transitivity)----對象a的部分的部分,也是a的部分。
譬如火花塞是引擎的「部分」(零件),引擎是汽車的「部分」,故火花塞也是汽車的「部分」。
過程、狀態和過程種類
分析研究對象的種類,離不開實例所涉及的「過程」(processes)。過程涉及兩類變化: 「種類」的改變和「狀態」的改變。例如,一個燃燒過程,一定數量的木頭變換成了灰和煤氣,木頭本身被完全毀掉了,對象發生了「種類」的改變。另一種情況,如冰溶化為水,汽車噴上了另一種顏色的漆。對象本身性質沒有變,只是「狀態」(states)改變了。正象對象可以有「種類」,過程也有其通用的「種類」,不同的個別事件(events)就是其實例。然而,過程是指「發生的事物」,所以不僅要包含其它事物作為其「部分」(如前述「復雜種類」的實例),還要指出「發生」在一個時間段上,並表明事物在這個時間段內,至少某一部分時間內是「真」(true)的。由此特點,過程之間也是可以關聯的,也可以存在「子種類」關系
❸ 已經知道基因序列,怎麼知道它的Geneontology
Ontology:哲稱本體論/存論,本質指系列特定文字用形容些特定模式、元件或角色,外華物信息家試譯語義().
GO(gene ontology)家言許相陌名詞,已經物信息領域極重要工具,並逐步改變著我 biological data組織理解式,存已經加快我所擁物數據整合利用,我應該逐步理解掌握種思想工具.
眾所周知,sequence based biology核內容即序列Annotation(注釋),其主要包含structural annotationfunctional annotation,前者涉及析sequencegenomelocus及exon,intron,promoter等location,者則推斷序列編碼產物功能,我六月論題所著重探討.應該說,二者相互關聯.
隨著種物genome相繼解碼,同量ESTs及gene expression profile date積累,使annotation工作量復雜度增加.另面,數基同真核物擁共同主要物功能,通某些物種獲基或者蛋白質(shared protein)物信息,用解釋其物種應基或蛋白(especially in comparative genomics).由於些繁復功能信息主要包含積累文獻,何效提取綜合些信息我面臨核困難,GO所要著力解決問題.通建立套具態形式控制字集(controlled vocabulary),解釋真核基及蛋白細胞內所扮演角色,並隨著命科研究進步,斷積累更新.ontology控制字集描述並給予定名稱,通制定本體ontologies並運用統計及自語言處理技術,實現知識管理專家系統控制.
目前止,Gene Ontology Consortium(GO發起組織)資料庫3獨立ontology建立起:biological process物程,molecular function功能及cellular component細胞組.三ontology面獨立同亞層,層層向構ontologies樹型支結構.說,GO物統化工具.
❹ 如何通基因的ID獲得它們的gene ontology分析報告
Ontology:哲學中稱為本體論/存在論,這里本質是指一系列特定的文字可用來形容一些特定的模式、元件或角色,因此在國外的華人生物信息學家中試譯為語義(學).
GO(gene ontology)對大家而言也許會是一個相對陌生的名詞,但是它已經成為生物信息領域中一個極為重要的方法和工具,並正在逐步改變著我們對 biological data的組織和理解方式,它的存在已經大大加快了我們對所擁有的生物數據的整合和利用,我們應該逐步學會理解和掌握這種思想和工具.
眾所周知,sequence based biology中的核心內容即是對序列的Annotation(注釋),其中主要包含structural annotation和functional annotation,前者涉及分析sequence在genome中的locus以及exon,intron,promoter等的location,而後者則是推斷序列編碼產物的功能,也正是我們在六月論題中所著重探討的.應該說,這二者是相互關聯的.
隨著多種生物genome的相繼解碼,同時大量ESTs以及gene expression profile date的積累,使得annotation的工作量和復雜度大大增加.然而另一方面,大多數基因在不同真核生物中擁有共同的主要生物功能,通過在某些物種中獲得的基因或者蛋白質(shared protein)的生物學信息,可以用以解釋其他物種中對應的基因或蛋白(especially in comparative genomics).由於這些繁復的功能信息主要是包含在積累的文獻之中,如何有效的提取和綜合這些信息就是我們面臨的核心困難,這也是GO所要著力解決的問題.通過建立一套具有動態形式的控制字集(controlled vocabulary),來解釋真核基因及蛋白在細胞內所扮演的角色,並隨著生命科學研究的進步,不斷積累和更新.一個ontology會被一個控制字集來描述並給予一定的名稱,通過制定「本體」ontologies並運用統計學方法及自然語言處理技術,可以實現知識管理的專家系統控制.
到目前為止,Gene Ontology Consortium(GO的發起組織)的資料庫中有3大獨立的ontology被建立起來:biological process生物過程,molecular function分子功能及cellular component細胞組分.而這三個ontology下面又可以獨立出不同的亞層次,層層向下構成一個ontologies的樹型分支結構.可以說,GO是生物學的統一化工具.
❺ 什麼是Gene Ontology
gene
ontology
基因本體論
例句
on
ontologies
for
biologists:
the
gene
ontology--untangling
the
web.
論對生物學家來說的本體論:基因本體論--解開這個網。
如果您有什麼疑問和不解之處,歡迎追問我!
如果您認可我的答案,請採納。
您的採納,是我答題的動力,o(∩_∩)o謝謝
❻ 怎樣將gene ontology 本地化並進行基因注釋
Gene Ontology
基因本體論
拼音 雙語對照
Gene Ontology
網路
基因本體論; 基因本體; 基因功能注釋; 分析; 基因存在論
雙語例句
1
GOPubMed: research on information retrieval and analysis based on gene ontology and MeSH
GOPubMed:基於GO和MeSH的信息檢索與分析研究
❼ 求問什麼是本體(Ontology)轉載
Ontology也稱為本體,它最初是一個哲學范疇,後來隨著人工智慧的發展,被人工智慧界賦予了新的定義。而在Web飛速發展的今天,Ontology的發展已由哲學、人工智慧領域延伸到了圖書館學、情報學等其他各個領域,並受到專家和學者的關注。
Ontology在不同的領域有不同的定義,關注的焦點也不同:
人工智慧領域:認為本體是一種知識的人工引擎。但本體究竟是什麼仍是爭論中的一個話題。美國Stanford大學的知識系統實驗室(Knowledge System Laboratory)的學者Tom Gruber在1993年提出了第一個被廣泛接受的定義:本體是概念化的顯式的表示。之後Studer在Gruber的基礎上於1998年擴展了本體的概念,即本體是共享概念模型的明確形式化規范說明。顯然後一個定義更能夠說明什麼是本體。
這個定義的具體含義如下:
概念化:將客觀世界中的一些現象抽象出來得到的模型。它是客觀世界的抽象和簡化。
明確:即顯式地定義所使用的概念以及概念的約束。形式化:即精確的數學表述,能夠為計算機讀取。
共享:本體描述的概念應該是某個領域公認的概念集。
Ontology的種類
在介紹本體描述語言之前,我們先來看一下本體的種類。
Guarino提出了從詳細程度與領域依賴度兩個方面對Ontology進行劃分。詳細程度是一個相對的、比較模糊的概念,指描述或刻畫建模對象的程度。詳細程度高的稱作參考(reference)Ontologies,詳細程度低的稱為共享(share)Ontologies。依照領域依賴程度,可以細分為頂層Ontology、領域Ontology、任務Ontology和應用Ontology四類。
頂層Ontologies描述的是最普遍的概念及概念之間的關系,如空間、時間、事件、行為等等,與具體的應用無關,其他種類的Ontologies都是該類Ontologies的特例;
領域Ontologies描述的是某個特定領域(如醫葯、地理等)中的概念及概念之間的關系;任務Ontologies描述的是特定任務或行為中的概念及概念之間的關系;
應用Ontologies描述的是依賴於特定領域和任務的概念及概念之間的關系
Ontology的用途
Ontology是共享概念的顯示表述。它關注概念之間的內在的語義聯系,一般具有交流、互用性、軟體工程等三類用途。
交流是指人與人、組織與組織、以及人與組織之間的溝通。Ontology可以提供一組共同的詞彙和概念,從而實現交流。在交流活動中,Ontology是一個標准化模型,任何大規模集成軟體系統內,各種各樣、背景不同的人必須對系統及其目標有一種共同的認識,因此必須建立起標准化模型,否則無法進行溝通;Ontology對軟體系統中所用的術語所提供的明確定義,對於同一個事物在系統中有完全一致的認識,而且這種認識也是確定的;通過Ontology可以集成不同用戶的不同觀點,以形成更加全面完整的看法。
互用性是指系統間協同工作的能力。Ontology可以在完全不同的建模方法、範例、語言及軟體工具之間進行翻譯和轉換,從而實現不同系統之間的相互操作和集成。
Ontology在軟體工程方面的作用是從軟體系統的設計和開發方面進行考慮的。Ontology可以在可重用性、可靠性、規格說明等方面在軟體工程中發揮作用。
從Ontology的這些用途來看,Ontology可用於許多領域,如人工智慧、知識工程、知識管理、語義檢索、信息檢索和提取、企業集成、自然語言翻譯等各種信息系統。目前在上述領域中,對Ontology的應用探索開展得如火如荼。
❽ 求舉一些領域本體(Domain Ontology)的例子,簡單易懂的領域。
比如信息,信息的本體
❾ 關於ontology (本體)的應用
http://bbs.w3china.org/list.asp?boardid=2
這是一個很不錯的網站,我也是剛開始關注本體,希望這里能有你需要的東西,祝你好運.
❿ 基於Ontology驅動的廣東省地質數據中心設計
李丹秋
(廣東省國土資源檔案館)
摘要 本文結合廣東省地質資料管理和應用的實際情況,在已有地質資料空間資料庫和非空間資料庫的基礎上,引入Ontology技術以解決空間資料庫語義沖突問題,擴展和深化已有地質資料查詢的結果,在原有「一張圖」數據中心架構的基礎上重新設計了廣東省地質數據中心。
關鍵詞 Ontology 地質數據中心 構建 模式 廣東省
地質資料是地質工作形成的重要基礎信息資源,具有可被重復開發利用、能夠長期提供服務的重要功能(趙銘,2012)。自2010年國土資源部制定《推進地質資料信息服務集群化產業化工作方案》(國土資發〔2010〕113號)以來,廣東省認真落實地質資料信息服務集群化產業化工作,由廣東省國土資源檔案館承擔建設,目前已初步構建省級地質資料數據集群與管理服務平台和網路服務體系,對廣東省地質資料信息服務集群化產業化工作起到了很好的推動作用。然而現有數據中心的基本架構體系中採用基於數據驅動的數據交互方式,此種交互方式會產生諸如語義沖突、數據挖掘程度低等問題。為解決這些問題,我們通過依託Ontology在語義集成中的優勢,提出了基於Ontology驅動的廣東省地質數據中心設計。
1 Ontology技術概述
1.1 基本概念
Ontology最初是一個哲學概念,是客觀存在的一個系統的解釋或說明,關心的是客觀現實的抽象本質,即「本體」(鄧鴻志,2002)。本體(Ontology)通過建立概念體系,定義概念的屬性、相互約束和關系的方式,實現領域知識的概念化共享(Guarino,1997b)。本體概念應包括四方面:保持獨立性、定義的明確性、計算機可讀性和具有共享性。經過近20年的發展,本體已經為知識轉換、共享和數據集成等領域提供方法,被廣泛用於解決數據互操作能力問題。
地質本體的構建與引入為多源地質數據集成、地質知識的轉化,以及地質數據的互操作性等提供了技術基礎,並在語義層上解決地質異構信息的集成和互操作,從而促進並實現地質相關知識共享、交互和推理(Ma et al.,2012)。特別是本體能夠為數字基礎設施提供語義匹配支持、解決分布式服務組配等問題(Gurnis et al.,2011),形成了地球科學中若乾的本體應用。
1.2 在地質信息領域中本體相關應用
目前,地質本體主要用於地質圖、知識集成及共享。例如,GEON(是2002年由美國自然科學基金委員會信息技術研究項目(NSF Information Technology Research(ITR)program)資助的一個科研項目)工程中的地質本體主要用於地質圖中異構概念模式的協調和異構地質圖的組配(Lin et al.,2008);基於SKOS建立的GTS多語言詞典,可以解決在線地質圖之間的多語言障礙(Ma et al.,2012);通過建立基於詞表的地質圖檢索服務,AuScope克服了在地球科學術語中的語義和語法上的不同(Woodcock et al.,2010);Silva等人提出了應用本體實現地質影像的知識標記和解析,如地層形態和沉積結構、岩石視覺特徵等(Silva et al.,2004)。此外,地質本體被用於解決地質建模中地質語義異構、解析及構建地質知識模型等問題(侯衛生等,2009)。
總體來說,本體大致有兩個不同層次的應用:底層應用與頂層應用。底層應用主要包括數據集成與互操作、數據交換兩個方面,即從語義上實現異構數據源重用、集成及互操作,並對輸入和輸出的異構數據源進行校準;頂層應用主要包括服務和知識的集成、共享及互操作等方面。頂層應用則以語義的方式集成各類服務,以獲得有效工作流,實現知識的形式化、形式化知識推理及跨領域知識共享方式。
2 廣東省地質數據現狀分析
廣東省國土資源檔案館已完成館藏及廳礦政管理各類地質資料成果等數據資源的數據格式、數據完備程度等情況的分析整理,並根據地質資料數據集群與管理服務平台建設的要求,制定了地質資料數據集群與管理服務平台的資料庫規范,做到統一數學基礎、統一數據格式、統一數據分類的要求,提取各類數據的核心圖層,建立各類空間資料庫。初步建立起廣東省國土資源「地質資料數據集群與管理服務平台」的基礎核心數據體系。
目前,廣東省國土資源檔案館所管理的資料庫包括測繪、地質、礦產等多種空間和非空間資料庫,具體見表1。
表1 廣東省國土資源檔案集群服務平台資料庫列表
由此可見,目前省級檔案館在各類地質資料庫中已積累、管理了大量地質數據,種類繁多、類型和結構也存在多樣化,並且在相關業務的處理過程中,又會產生新的衍生數據。如何更好地挖掘地質知識以便更好地為地質服務已成為當務之急。
3 廣東省地質數據中心設計
3.1 架構設計
現有國土「一張圖」的基本架構體系中GIS空間數據引擎與基礎資料庫之間的數據交互是數據驅動的,由於不同資料庫的多源異構的特徵,這種基於數據驅動的數據交互方式會產生諸如語義沖突、數據挖掘程度低等問題。故此,我們通過依託Ontology在語義集成中的優勢,構建了基於Ontology驅動的廣東省地質數據中心設計模式(圖1)。
圖1 廣東省地質數據中心設計
該數據中心包括以下幾個部分:基礎數據層、空間數據交互層、地質大數據處理分析層、數據管理基礎平台、數字基礎設施支撐體系和標准規范及匯交更新機制。數字基礎設施支撐體系是整個數據中心的硬體基礎,包括網路設施、伺服器、存儲設施等。基礎數據層是指廣東省國土資源檔案館所管理的各類數據。空間數據交互層主要為空間數據的交互查詢、更新提供功能,它包括基於數據驅動的交互、GIS空間數據引擎、基於Ontology驅動的數據交互。地質大數據處理分析層是基於Ontology技術的一個地質知識挖掘和服務的中間層,是從結構化的地質資料庫中直接提取各類地質概念,建立相應的概念間邏輯關系與語義關系,為多源地質數據語義提取和數據挖掘提供服務。數據管理基礎平台為外在的數據錄入、管理、分析等交互界面和處理功能,是整個數據中心的外在表現。
標准規范及匯交更新機制是指各類地質數據匯交、更新過程中所必須依據的標准和規范,是整個數據中心運轉的制度保障。在各個平台的使用過程以及各部門的業務流轉過程中,既需要從檔案館地質資料集群平台提取地質數據,同時會產生新的地質數據需要匯交到地質資料集群平台,並更新地質資料集群平台。在這樣一個過程中,數據匯交、更新過程的標准和規范是必要的。
數據中心的底層是廣東省國土資源檔案館管理的基礎資料庫,在資料庫與空間數據引擎之間通過兩種途徑來實現數據交互:一是傳統的基於數據驅動的數據交互,這類交互通過SQL語句或GSQL語句實現對空間和屬性數據的獲取、更新管理;二是通過Ontology來實現數據的查詢,利用Ontology構建工具,基礎資料庫中的每一個資料庫建立一個相應的Ontology,理順資料庫中各實體及相互之間的語義關系、以及所涉及的概念體系,從而為深度數據查詢提供基礎。兩者通過GIS空間數據引擎共同構成了數據基礎管理平台與基礎資料庫之間的溝通橋梁。
該技術架構的設計注重地質數據語義集成與分析,並且可以在不改變業務應用的前提下實現。其中地質本體的構建原則採用侯衛生等人(2013)提出的基於地質空間資料庫的OWL本體自動構建方法,可實現一次構建,隨時更新,永久保存的特性。
3.2 架構優勢
基於Ontology驅動的數據交互和傳統的基於數據驅動的數據交互相比具有明顯的優勢。基於Ontology驅動的數據交互優勢主要包括兩點:
一是解決語義沖突產生的問題,使查詢結果更精確。基礎資料庫包括空間資料庫、非空間資料庫,它們來源廣泛、結構各異、尺度不同、精度不一,對同一地質現象在不同資料庫中的描述肯定不盡相同。如小比例尺空間資料庫中對某區域岩性統一描述為「砂岩」,而大比例尺空間資料庫中會細分為「含礫砂岩」、「含砂礫岩」、「泥質砂岩」、「砂質泥岩」、「含泥砂岩」等岩性描述。如果忽略了不同資料庫間語義上的聯系或沖突,單純使用基於資料庫的查詢方法可能得到不準確的查詢結果。而建立了Ontology之後,通過基於Ontology的查詢就可以很好地規避這個問題。
二是建立了資料庫之間的聯系,深化查詢結果。當前各個基礎資料庫之間是相互獨立的,不同資料庫之間的關聯不緊密或者沒有關聯,在進行數據挖掘時很難挖掘出足夠的信息。例如,對某區域的岩性「地質空間資料庫」描述為「砂岩」,而「水文地質資料庫」稱為「砂質岩」,那麼在基於資料庫查詢「砂岩」時,由於沒有查到「砂質岩」的結果,這次查詢就無法得到「水文地質資料庫」中的信息。而Ontology建立了「砂岩」和「砂質岩」兩個語義之間的聯系,那麼這兩個資料庫的數據都能被挖掘出來。
總之,依託結構化數據構建Ontolgy可以從中提取出各類概念及概念間的語義關系,可以更好地為地質知識挖掘服務。
4 小結
本文根據廣東省地質數據管理現狀,提出了基於Ontology驅動的廣東省地質資料集群化平台的數據中心設計模式。與傳統的基於數據驅動的模式相比,該數據中心設計模式可以解決空間數據查詢時的語義沖突以及數據挖掘程度不夠等問題,為今後拓展地質資料的集群化產業化應用領域,適應大數據的發展,以及更好地為地質數據知識挖掘和服務提供了良好的基礎和數據保障。
參考文獻
[1]Guarino,N..Understanding,building and using ontologies[J].International Journal of Human–Computer Studies,1997,46(2~3):293~310.
[2]Gurnis,M.,Flesch,L.,Okaya,D.,et al.EarthScope Cyber infrastructure Subcommittee(ECISC).Preliminary Strategic Plan for EarthScope Cyberinfrastructure[R].2011.
[3]Lin,K.,Bertram,L.GEON:Ontology-Enabled Map Integration.24th Annual ESRI International User Conference,[C].2008.
[4]Ma,X.,Carranza,E.J.M.,Wu,C.,et al.Ontology-aided annotation,visualization,and generalization of geological time-scale information from online geological map services[J].Computers & Geosciences,2012,40(3):107~119.
[5]Silva OP.da,Freitascmds.,Abel M.Interactive visualization of well data for supporting geological reservoir modeling.2004.
[6]Woodcock,R.,Simons,B.,Duclaux,G.,et al.AuScope』s use of standards to deliver earth resource data.Geophysical Research Abstracts 12,EGU2010-1556,EGU General Assembly,2010.
[7]鄧鴻志,等.Ontology研究綜述[J].北京大學學報(自然科學版),2009,38(5):730~738.
[8]侯衛生,劉修國,吳信才,等.面向三維地質建模的領域本體邏輯結構與構建方法[J].地理與地理信息科學,2009,25(1):27~31.
[9]趙銘.地質檔案信息開發利用新趨勢[J].檔案管理.2012(5):87.