|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
標(biāo)題 |
基于搜索引擎的有害信息監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)(16 卷) |
英文標(biāo)題 |
Research and implementation of Bad Information Detection System based on search engine |
摘要 |
在對(duì)搜索引擎核心技術(shù)進(jìn)行研究的基礎(chǔ)上,設(shè)計(jì)并實(shí)現(xiàn)一種采用主動(dòng)掃描探測(cè)方法進(jìn)行有害信息監(jiān)控的系統(tǒng)。基于bot包設(shè)計(jì)網(wǎng)絡(luò)蜘蛛模塊,實(shí)現(xiàn)對(duì)html、asp、php和jsp等網(wǎng)頁(yè)的自動(dòng)抓??;采用反向最大匹配和二級(jí)哈希散列算法,實(shí)現(xiàn)中文分詞;開發(fā)信息索引模塊,實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)的批量和增 |
作者 |
新聞作者:張曉梅,蘇 斌,王竹林,楊 柳 |
關(guān)鍵字 |