Title page for 85325016


[Back to Results | New Search]

Student Number 85325016
Author Jing-Xin She(施建新)
Author's Email Address No Public.
Statistics This thesis had been viewed 1683 times. Download 1110 times.
Department Computer Science and Information Engineering
Year 1999
Semester 2
Degree Master
Type of Document Master's Thesis
Language zh-TW.Big5 Chinese
Title 網路資訊與學習系統之中文全文探勘工具
Date of Defense 2000-07-04
Page Count 75
Keyword
  • IR
  • 中文
  • 全文
  • 品質
  • 學習網站
  • 摘要
  • 資訊探勘
  • Abstract 在學習系統中存在著大量的Web-Log以及文字資訊,目前大部份學習網站都偏重於Web-Log的分析,間接得知學生的學習狀況,但我們發現光是Web-Log分析,卻把學生在學習網站所留下的文字資訊忽略是一件很可惜的事,因為文字裡含有更豐富的資訊礦產等著我們去開採。
    因此,針對學習網站的需要,我們設計了一套中文全文探勘系統,裡面包含了「文件意向分析工具」用來分析文章問句類型與焦點;「文件特性萃取工具」用來進行中文文章斷詞及屬性分析;「文件主題類別化工具」可以找出文章的主題;「文件摘要萃取工具」萃取文章的摘要;「文件分類工具」判斷文章屬於那個預設類別;「任務指派工具」分配討論區文章給適當助教;「品質分析工具」經過訓練,可以判斷中文文章品質等,協助文件資訊的探勘、網站資訊管理、支援學習者的學習以及教師的教學。
    經實驗證明,除了「文件意向工具」外,其它工具所達到的準確率都超過七成以上,說明了我們工具實際運作的可靠性,同時透過系統設計的模組化,增加了彈性及未來功能的擴充性,中文全文探勘工具能協助學習系統,使得學習系統更聰明。
    Table of Content 目錄
    目錄I
    圖片目錄IV
    表格目錄VI
    第一章 緒論1
    1.1研究背景1
    1.2 研究動機5
    1.3 研究目標7
    1.4 問題分析10
    1.5論文架構13
    第二章 相關研究與技術14
    2.1 中文斷詞14
    2.2 分類15
    2.3 資訊萃取(INFORMATION EXTRACTION)16
    2.4 決策樹(DECISION TREE)16
    2.5 文字分析工具17
    2.6 本章總結18
    第三章 系統架構19
    3.1 中文全文探勘系統-OVERVIEW19
    3.2 詞庫、斷詞與偵測程序(DETECT DAEMON)21
    3.3 文件意向分析工具(DOCUMENT PURPOSE ANALYZER)22
    3.4 文件特性萃取工具(DOCUMENT CHARACTERISTIC ANALYZER)24
    3.5 文件主題類別化工具(TOPIC CATALOGER)26
    3.6 文件摘要萃取工具(INFORMATION SUMMARIZER)27
    3.7 文件分類工具(DOCUMENT CLASSIFIED TOOLS)29
    3.8 文件品質分析工具(QUALITY ESTIMATED TOOL)30
    3.9 任務指派工具(WORK DISPATCHER)33
    3.10總結摘要35
    第四章 我們的方法36
    4.1 中文斷詞36
    4.2 文意分析39
    4.3 特性萃取40
    4.4 主題類別化43
    4.5 摘要萃取44
    4.6 文件品質分析45
    4.7 總結摘要46
    第五章 實驗結果與討論47
    5.1 測試環境介紹47
    5.2 文件意向分析工具測試48
    5.3文件摘要萃取工具測試49
    5.4 中文文件分類工具測試50
    5.5 文件品質分析工具測試52
    5.6 任務分配工具測試55
    5.7 本章總結57
    第六章 結論58
    參考文獻61
    附錄 A 討論區文章屬性分析隨機列表64
    附錄 B 文件意向分析工具部份輸出列表65
    附錄 C 文件摘要萃取工具部份輸出列表66
    附錄 D 文件品質評估工具部份輸出結果68
    附錄 E 任務指派工具部份輸出結果70
    附錄 F 中文文件探勘工具探勘資訊總結72
    附錄 G 利用文件自動群簇工具分析文件分類結果的交叉比對74
    Reference 參考文獻
    [1] 中央大學遠距教學系統. (http://vc2.csie.ncu.edu.tw/)
    [2] 區國良,”網路虛擬教室之討論與群體學習管理系統”, 國立中央大學資訊工程所碩士論文, 1996.
    [3] C5.0, Data Mining Tool, http://www.rulequest.com/see5-info.html
    [4] Chien L.-F., Huang T.-I.“PAT-Tree-Based Keyword Extraction for Chinese Information Retrival” In Proceedings of the 20th annual international ACM SIGIR’97. pp. 50─58.
    [5] Craven, M., DiPasquo, D., Freitag, D., McCallum, A., Mitchell, T., Nigam, K. and Slattery, S.. “Learning to Construct Knowledge Bases from the World Wide Web” appear in Artificial Intelligence‘99.
    [6] Goldberg, M.W., Salari, S., and Swobada, P., “World Wide Web Course Tools: An Environment for Building Web base Courses”, Computer Network and ISDN Systems, 28, 1996.
    [8] Goldberg, M.W., “Student Participation and Progress Tracking for Web-Based Courses Using WebCT”, Proceedings of the Second International N.A. WEB Conference, October 5-8, 1996, Fredericton, NB, Canada.
    [8] Henry Lieberman, “Autonomous Interface Agents”, ACM CHI’97.
    [9] Hiltz, S.R., “The Virtual Classroom:Learning Without Limits via Computer Networks”, Ablex Publishing Corporation, Norwood, New Jersey, 1994.
    [10] IBM Intelligent Miner for Text, http://www-4.ibm.com/software/data/iminer/fortext/
    [12] Jobn R. Levine, Tony Mason & Doug Brown, “Lex & Yacc”, O’Reilly 1999.
    [12] Kupiec, J., Pedersen. J. and Chen, F., “A Trainable Document Summarizer”, in Proceeding of the 18th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 1995, pages 68-74.
    [13] “Modern Information Retrieval”, ACM Press, 1999.
    [14] Ou, K. L., Chang, C. K., and Chen, G. D., “Web-Base Asynchronous Discussion System”, International Conference on Computers in Education, 1998.
    [16] Robert Armstrong, Dayne Freitag, Thorsten Joachims and Tom Mitchell, “Web Watcher: A learning Apprentice for the World Wide Web”, in AAAI Spring Symposium on Information Gathering, Stanford, CA, March 1995.
    [16] Robertson S. E. and K.sparck Jones. Relevance weighting of search terms. Journal of the American Society for Information Sciences, 27(3):129-146, 1976.
    [17] Rush, J.. Salvador, R., and A Zamora, “Automatic Abstracting and Indexing II, Production of Indicative Abstracts by Application of Contextual Inference and Syntactic Coherence Criteria”, Journal of the ASIS, Vol. 22, No. 4., 1971, pages 260-274.
    [18] Salton, G..E. and M. McGill, “Introduction to Modern Information Retrieval”, McGraw-Hill, 1983.
    [19] Salton,G..E. and Lesk, M.E. “Computer evaluation of indexing and text processing”, Journal of the ACM, 15(1):8-36, January 1968.
    [20] Team of Chinese Knowledge Information Processing(CKIP) at Academia Sinica, Taiwan. (http://godel.iis.sinica.edu.tw/CKIP)
    Advisor
  • Gwo-Dong Chen(陳國棟)
  • Files
  • 85325016.pdf
  • approve immediately
    Date of Submission 2000-07-04

    [Back to Results | New Search]


    Browse | Search All Available ETDs

    If you have dissertation-related questions, please contact with the NCU library extension service section.
    Our service phone is (03)422-7151 Ext. 57407,E-mail is also welcomed.