漢語框架網絡學習策略研究

作者：時間：2009-08-20 來源：網絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

O 引言
本體學習能力對本體構建和語義Web的快速發展及自動問答技術的發展，具有非常重要的意義。現有本體可深層次理解領域知識，但是手工構建本體的方式遠遠不能滿足語義檢索應用的需求。因此，運用本體學習策略提高本體構建的速度成為本體應用的關鍵。以漢語框架網絡本體知識庫為基礎，采用不同的學習策略來處理不同特征的實例，抽取其中的語義信息，以便更好實現實例的定位和本體歸類。同時，通過實時監控，系統檢查用戶的檢索情況，采用適合用戶特征的輔策略來控制和修正主策略，提高檢索的性能。

本文引用地址：http://www.j9360.com/article/188730.htm

l 漢語框架網絡本體的構建
以FrameNet本體為依據，以法律領域為突破口，從語義角度描述法律概念與概念、詞語與詞語間的關系，形成語義知識網絡，構建法律詞匯及其所屬框架的計算機可讀信息。法律框架網絡本體中包含豐富的框架關系、配價模式等語義規則，機器可以此來自主地學習領域內外相關的概念及屬性，建立概念之間的關系。通過學習可以實現已有的框架與新框架的有效融合，不斷豐富法律框架本體，擴大其語義表述能力，提高本體知識庫的歸納、演繹、推理的能力。

2 本體學習策略
本體學習是一種可以由本體工程師使用，以便更容易地創建本體的方法，是一套用幾種資源以半自動化方式對現存本體進行挖掘、豐富或改造來構建新本體的方法和技術。目前，很多本體學習方法都以不同類型的無結構的，或半結構的，或充分結構化數據來進行訓練，運用聯想規則、概念聚類、本體修改、概念學習等方法，構建一個自動或半自動的、協同的本體。在漢語框架網絡中，我們采用了基于本體學習的半自動本體構建方法，采用多種學習策略，綜合構建一體化的本體學習環境，加快本體構建和本體語料加工的進程。此方法能更好的發現概念間的關系，更有效地獲得本體信息，是一種比較高效可行的本體構建方法。

本體學習的過程如圖l所示。首先，對各類語料進行處理，其中包括分詞、詞性標注、句法依存分析、語義信息的提取。其次，從語料庫中提取領域術語，使用自然語言處理、學習規則和統計的技術來過濾這些術語，然后使用通用本體中的概念對這些術語進行語義解釋，確定術語的語義類型，形成本體學習的結果。最后，由專家對學習結果評估，從而利用通用本體和核心本體來學會新領域本體。
2．1 語義信息的抽取
漢語框架網絡本體的語義信息由框架、語義元素及語義關系構成，而語義關系包括繼承關系、總分關系、使用關系和參照關系等。語義關系是對框架網絡本體間共同特性的描述，也是兩者的共同關注焦點，故可借助語義關系從一個已知框架來學習另一個未知框架的語義信息。
構建漢語框架網絡本體時，我們采用一個5元組O：={C，R，HC，rel，AO}來表示框架的語義信息。其中：C表示與該框架發生關系的框架集合；R為框架間的關系的集合；XXXXXXX是一種有向關系，HC(Cl，C2)表示框架Cl是框架C2的上位框架，其中框架關系包括繼承關系和使用關系；rel：R→C×C是一個函數，亦可表示為R(C1，C2)，表示除了繼承關系和使用關系外的框架間關系；AO為框架進行本體學習和推理的邏輯化、形式化公理，用以約束本體中的語義信息，校驗它的正確性或推導出新的信息。這樣，在上述5元組的基礎上，將學習任務的初始描述、中間狀態、學習到的規則等都借助例句庫保存起來，從而形成一組基本事實和判定公理。在公理中，我們利用了句法一語義相對應的學習經驗生成一系列規則，把每一個語法成分同它的框架元素聯系起來，然后從詞元和框架中找出合適的基本聯系，此方法對于不可繼承的框架元素的確定具有重要意義。然后，把基本學習器組成元學習器，元學習器分配給每個基本學習器一個權重，來顯示它所信任基本學習器在元學習器中學習能力。然后，由人工對此進行確認和修正，最終形成完整的框架網絡本體語義信息。
語義信息抽取時，學習器通過給定的學習策略不斷地在一組候選框架及例句中挑選最適合的選項加入學習器中，這些候選框架及例句被公理和規則不斷地特殊化(借助大量的反例來篩選候選框架及例句)，直到它們符合第一類基本學習器的基本條件，然后由第二類學習器進行語義關系的學習。其中，第一類基本學習器利用了每個框架特定的語義信息，來處理框架間的繼承關系，從上位框架中繼承所有的框架元素。例如，框架“文本”與框架“人造物品”屬于繼承關系，“人造物品”包含框架元素：創建者、類型、材料、人造物品、創造時間、名稱、使用價值等，以其語義信息作為學習的基礎，可歸納出“文本”框架應包括的框架元素及其它的語義信息。第二類基本學習器利用框架間的其它語義關系，如總分關系、先與關系、使用關系等。比如，框架“犯罪場景”與框架“犯罪”屬于總分關系。“犯罪”部分繼承“犯罪場景”的犯罪行為、犯罪人元素，同時增加了時間、地點、動機等其它元素。這需要學習器根據分框架中主體擔任的角色不同及情景的差異進行總結而獲得。這樣，通過學習器的學習，就獲得了未知框架網絡本體遺失的語義特性，再根據相應的判斷公理來學會了未知框架所代表的語義信息。
2．2 配價模式的學習
通過對語義信息的學習，我們把句子解析成了若干語法要素和語義元素。配價模式學習過程中，參照已有的本體及其語義模式(配價模式)等信息，根據詞性分析、語法分析和句法分析的結果及所總結的規則和統計信息，生成框架的配價模式。
框架配價模式學習過程：1)對例句做句法依存分析。2)以句法依存樹中的結點為目標詞，將目標詞所有的子樹看作一語義元素，每個子樹包含的所有詞語默認為最大短語。3)根據子樹的根結點與目標的句法依存關系類型，與已有配價模式匹配，確定子樹在配價模式中充當的框架元素，比如，它們之間為動賓關系，那么子樹就作為“受事”框架元素。若存在使義動詞則子樹所做框架元素為“施事”。最后，如果子樹中存在像并列關系之類的依存關系則應當考慮將其進一步細分為若干框架元素，算法如圖2所示。

a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

漢語框架網絡學習策略研究

評論

相關推薦

技術專區