

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近年來(lái)隨著垂直搜索引擎的出現(xiàn)和發(fā)展,一定程度上克服了傳統(tǒng)搜索引擎的弱點(diǎn)。然而現(xiàn)在的垂直搜索引擎基本上還是基于單一關(guān)鍵字查詢的方式,無(wú)法克 服關(guān)鍵字查詢方式帶來(lái)的準(zhǔn)確率和召回率低的問題。在農(nóng)業(yè)領(lǐng)域里,垂直搜索引擎也存在同樣的問題,在國(guó)家重大科技支撐項(xiàng)目子課題“基于本體的農(nóng)業(yè)搜索引擎”(2006BAD10A0502)的支持下,本文針對(duì)農(nóng)業(yè)搜索引擎構(gòu)建了用戶個(gè)性化平臺(tái)。首先研究了個(gè)性化平臺(tái)的重要基礎(chǔ)之一,農(nóng)業(yè)信息的的地理屬性的添加,這
2、是為實(shí)現(xiàn)個(gè)性化平臺(tái)在構(gòu)建索引文檔時(shí)做的基礎(chǔ)工作。文中的設(shè)計(jì)主要對(duì)農(nóng)產(chǎn)品市場(chǎng)名稱進(jìn)行地理定位,采用了基于地理信息庫(kù)索引的市場(chǎng)名地理定位、基于搜索引擎搜索結(jié)果項(xiàng)的市場(chǎng)名地理定位、基于搜索引擎搜索結(jié)果數(shù)量的市場(chǎng)名地理定位三種方法逐步提高對(duì)市場(chǎng)名稱的地理定位能力。然后本文研究了用戶搜索個(gè)性化平臺(tái)的構(gòu)建方法,從服務(wù)器日志中挖掘用戶興趣信息,并基于本體對(duì)用戶興趣詞匯進(jìn)行語(yǔ)義擴(kuò)展,形成用戶興趣模型,當(dāng)用戶檢索相關(guān)信息時(shí),應(yīng)用用戶興趣模型對(duì)用戶提交的關(guān)
3、鍵詞進(jìn)行擴(kuò)展,然后將擴(kuò)展后的關(guān)鍵詞提交給檢索系統(tǒng),按照相似度排序輸出結(jié)果,這是在信息檢索時(shí)所采取的步驟,從而實(shí)現(xiàn)個(gè)性化服務(wù)平臺(tái)。 本文首先介紹了關(guān)于搜索引擎和本體論方面的一些基本知識(shí),接著分析了網(wǎng)絡(luò)上抓取的農(nóng)產(chǎn)品市場(chǎng)名稱的一些特征,根據(jù)市場(chǎng)名稱特點(diǎn)構(gòu)建了帶有別名識(shí)別的多級(jí)地理信息庫(kù),然后基于構(gòu)建的地理信息庫(kù)索引對(duì)市場(chǎng)名進(jìn)行地理定位;下一步分析了在互聯(lián)網(wǎng)上市場(chǎng)名稱和它所在的地名一起出現(xiàn)在搜索結(jié)果的同一網(wǎng)頁(yè)中的可能性關(guān)系后,研究了一
4、種基于搜索引擎搜索結(jié)果的市場(chǎng)名地理定位的方法;在上述方法無(wú)法定位時(shí),基于皮爾遜卡方來(lái)評(píng)價(jià)市場(chǎng)名稱和地名同時(shí)出現(xiàn)在一個(gè)網(wǎng)頁(yè)上的關(guān)系,從而產(chǎn)生了基于搜索引擎搜索結(jié)果數(shù)量的市場(chǎng)名地理定位的方法。然后本文研究了用戶興趣庫(kù)的的構(gòu)建和更新方法,首先通過用戶注冊(cè)信息構(gòu)建初始興趣詞庫(kù),然后通過挖掘服務(wù)器日志和計(jì)算興趣詞的響應(yīng)系數(shù),來(lái)維護(hù)和更新用戶興趣庫(kù);接著研究了根據(jù)用戶訪問文檔的具體信息計(jì)算關(guān)鍵詞用戶興趣度的方法;進(jìn)一步系統(tǒng)通過將用戶興趣庫(kù)中的詞基于
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)性化網(wǎng)絡(luò)搜索的研究.pdf
- 個(gè)性化的網(wǎng)頁(yè)搜索研究.pdf
- 基于個(gè)性化搜索的系統(tǒng)研究與設(shè)計(jì).pdf
- 基于移動(dòng)平臺(tái)的個(gè)性化搜索系統(tǒng)研究.pdf
- 農(nóng)業(yè)專業(yè)搜索引擎?zhèn)€性化服務(wù)研究與實(shí)現(xiàn).pdf
- 個(gè)性化搜索引擎的研究與設(shè)計(jì).pdf
- 網(wǎng)絡(luò)搜索的個(gè)性化潛力研究.pdf
- 個(gè)性化教育平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 個(gè)性化新聞搜索引擎的研究與設(shè)計(jì).pdf
- 個(gè)性化元搜索引擎的研究與設(shè)計(jì).pdf
- 個(gè)性化智能元搜索引擎的研究與設(shè)計(jì)
- 基于用戶詞典的搜索個(gè)性化研究.pdf
- 個(gè)性化推薦搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 個(gè)性化旅游線路搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
- 個(gè)性化智能元搜索引擎的研究與設(shè)計(jì).pdf
- Deep Web入口識(shí)別和個(gè)性化搜索研究與設(shè)計(jì).pdf
- 基于Web的個(gè)性化搜索引擎的研究與設(shè)計(jì).pdf
- 個(gè)性化Web搜索系統(tǒng)研究.pdf
- 個(gè)性化旅游線路搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 個(gè)性化推薦開放平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論