Repository files navigation
命名實體辨別(Name Entity Recognition)
任務目標:識別出句子中的專有名稱。
總共22種類別。
使用 LSTM 和 GloVe 的 word embedding 進行訓練。
問答系統 (Question Answering)
任務目標:給定一篇文章和問題,找出文章中的正確答案。
屬於 ODQA(Open Domain Question Answering)。
必須使用TF-IDF 和 BM25 進行文章提取。
自然語言理解的解釋性資訊標記競賽
機器學習模型的可解釋性(explainability)是人工智慧技術在落實與應用時,備受期待的項目。如果模型能夠在精準預測之餘,同時提供佐證其預測行為之依據,人類將有機會事先發現模型判斷的錯誤,大幅提高人類對模型之信賴,使得人工智慧技術更能落實到關鍵性的決策場域。
議論探勘(argument mining)是近期廣受矚目的自然語言處理任務。該任務試圖從文句中找出人們的主張(claim),以及支持或反對這些主張的原因。這可視為輿論探勘(opinion mining)或情緒分析(sentiment analysis)的進階任務。基礎的議論探勘任務,是給定一個主張(claim)與一個前提(premise),由模型判斷兩者之間的議論關係,例如該項前提為支持或反駁該主張。換言之,這是一個典型的分類任務,判斷一組主張與前提的關係。對於這類的任務,目前的自然語言處理模型已能達到一定的效能,近期的深度學習技術也顯示模型已能掌握部份議論推理能力。然而,模型在提供分類預測之餘,究竟是如何得到該預測之結果,其中的解釋性要素則仍然未有充份的研究。
有鑑於此,本計畫以議論探勘為目標,希望能讓模型在預測文句之間支持或反駁的關係之外,找出文句之中關鍵性的片段,作為預測的佐證資訊。這類資訊可以讓研究人員更了解模型內部的行為、促進自然語言處理的研究,同時也可望將來在終端應用時,提供出模型的判斷依據,讓人類評估模型該次判斷的可靠程度。
比較ODQA的 generative 和 extractive 的結果表現。
參考論文:A Copy-Augmented Generative Model for Open-Domain Question Answering
Author: Shuang Liu, Dong Wang, Xiaoguang Li, Minghui Huang, Meizhen Ding
Publish: ACL 2022
add pointer network to fuss-in-decoder model
generative model:FiD-PGN, bert2BERT
extractive model: bert-base-uncased, 使用 TF-IDF 和 BM25 進行文章提取。
score TF-IDF bert2BERT FiD-PGN
Top k 1 2 3 4 5 5 25
LCS 0.633 0.654 0.650 0.671 0.724 0.372 None
F1 0.591 0.612 0.606 0.635 0.663 0.348 None
EM 0.524 0.538 0.536 0.547 0.578 0.312 0.684
score BM25 bert2BERT FiD-PGN
Top k 1 2 3 4 5 5 25
LCS 0.631 0.776 0.764 0.782 0.804 0.372 None
F1 0.588 0.751 0.748 0.758 0.779 0.348 None
EM 0.514 0.676 0.632 0.681 0.697 0.312 0.684
About
蔡老師的課程作業
Topics
Resources
Stars
Watchers
Forks
You can’t perform that action at this time.