網意搜索引擎。
在后世擁有國內唯一的互動性開放式目錄管理系統!
最關鍵的是,網意基本搜索的適合,查詢結果嚴謹細致,能幫助用戶找到最重要、最相關的內容。例如,當網易搜索對網頁進行分析時,它也會考慮與該網頁鏈接的其它網頁上的相關內容。網易搜索還會先列出那些搜索關鍵詞相距較近的網頁。
而在搜索多個詞語的時候,網意搜索只會返回那些符合用戶的全部查詢條件的網頁。不需要在關鍵詞之間加上“and”或“”。如果用戶想縮小搜索范圍,只需輸入更多的關鍵詞,只要在關鍵詞中間留空格就行了。
這完全就符合張偉現有需要的條件啊,網意搜索這個名字在后世雖然并不太出名,可是說到另外一個名字相信很多人就能耳熟能詳了——有道搜索!
其中有道搜索包括網頁搜素、購物搜索、海量詞典、視頻搜索、圖片搜索等一系列,里面的智能結果和精選搜索就是張偉現在想要的模式,他馬上回憶起搜索流程,結合自己的猜測。
按照當時搜索時的情況,張偉開始推測,很多部分應該和傳統搜索沒什么兩樣,那么新式搜索需要需要根據一定的網頁分析算法過濾與主題無關的鏈接,保留有用的鏈接并將其放入等待抓取的資源管理器隊列,然后,要根據一定的搜索策略從隊列中選擇下一步要抓取的網頁資源,并重復上述過程,直到達到系統的某一條件時停止,另外,所有被抓取的網頁西藥存貯,再進行一定的分析、過濾,并建立索引,以便之后的查詢和檢索!
也就是說,前提需要一個自動抓取萬維網信息的程序或者腳本。
這些話對于常人來說都是廢話,可是張偉知道,對于專業人士就不是廢話了!
克里斯等人不就是需要個流程嗎?
張偉迅速拿起筆和本子記錄了下來,這些根本不用動腦子,因為都是自己親身經歷過的事情,只需要按照步驟稍加添加自己的想法就可以。
瑤瑤玩了會,道:“張偉,你要不要玩電腦?”
“暫時用不上了。”張偉刷刷在本子上寫著。
瑤瑤調皮地對著柳傾城做了個鬼臉,“看,張偉不要用,我再玩一會。”
柳傾城哭笑不得道:“你呀你,那就再玩一小會,眼睛離電腦遠點。”
瑤瑤啪嗒啪嗒按照鼠標,叫道:“姐姐,你過來教我打字。”
張偉抬頭笑道:“原來你不會打字啊?”
一行!
兩行!
五行!
他很快就寫完了!
心情徹底興奮了起來,這些東西寫出來,估計能幫到克里斯他們的忙吧?張偉期待著!
很晚才睡覺。
可是張偉老早就起來了。
再次拉著鄭文跑了一圈網景。
剛一走進去,就看見辦公區的工作人員都在忙碌,一看見張偉和鄭文后,這些員工就問好起來。
“鄭總。”
“張先生。”
眾人都露出了笑容。
正巧,克里斯剛剛過來工作。
張偉微笑道:“你們先忙著,克里斯,你過來一下。”話剛說完,瞧見負責研發這款產品的技術人員都走了進來,他補充了一句,“你們都過來,我和你們說點事情。”
克里斯道:“什么事?我們還要忙著研發產品,昨晚稍微有點眉目。”
羅曼嘿道:“是啊,或許這是一個突破也說不準。”
泰勒打了個哈欠,道:“可把我累壞了,昨晚兩點多才睡,清早六點多就爬起來了。”
看得出來大家都非常疲勞。
張偉和鄭文對視了一眼,也沒有上樓,直接把眾人拉到一旁角落的辦公桌,又叫人拿來椅子。
眾人坐下。
“那我就說一下我猜測的流程,你們聽聽有什么啟發沒有。”張偉拿出小本子翻開。
聞言,克里斯一愕。
泰勒也愣了愣。
羅曼和其他人也有些呆。
你說什么?你猜測的流程?這他媽也能猜測啊還能對我們有啟發?昨天還說要找人問問,怎么現在又變成你自己猜測了?這么多精英技術人員攻克了許久的都只是稍有眉目而已,你一個連互聯網都不懂的人光靠猜測就行了?我去,你以為你是上帝啊?是造物主啊?怎么想都能變成現實?
眾人已經全部無語。
克里斯憋了半天,也沒好意思說別的,“那你說我們聽聽。”
張偉也知道他們不相信,道:“反正你們就聽聽看又沒什么損失對不對?”
泰勒難以置信道:“會對我們有啟發?”
“應該會有吧。”張偉瞟了眼本子上的文字,說道:“需要根據一定的網頁分析算法過濾與主題無關的鏈接,保留有用的鏈接并將其放入等待抓取的資源管理器隊列。”
鄭文不太懂,瞟了瞟眾人。
可是眼前這些人懂啊,他們乍一聽的感覺……簡直驚艷!按照張偉所說的里面包含了三個步驟,一,用戶提供種子url;二,種子url進入linkbase中新url隊列中;三,調度模塊選取url進入到抓取模塊的待抓取隊列中,大家都是專業人士,一聽就知道完全可行啊!張偉這個推測簡直太棒了!聽著這個推測,他們都面面相覷,怎么這么簡單的事情他們就沒想到呢?在場十幾個精英都沒想到的事情,居然讓一個不懂網絡的人想到了!
克里斯忍不住贊嘆道:“好創意!”
張偉笑瞇瞇道:“我繼續說下去,然后根據一定的搜索策略從隊列中選擇下一步要抓取的網頁資源,并重復上述過程,直到達到系統的某一條件時停止,另外,所有被抓取的網頁西藥存貯,再進行一定的分析、過濾,并建立索引,以便之后的查詢和檢索。”
克里斯興奮了起來,道:“那就是抓取模塊讀取站點的配置文件,可以按照執行的頻率進行抓取,等到抓取到結果就返回接口中,這就是完成了抽取!”
羅曼也道:“然后把新發現的連接在linkbase里面進行dedup,并push到linkbase的新url模塊里面,最后讓調度模塊選取url進入抓取模塊的待抓取隊列,之后就能反饋了啊!”
張偉和鄭文不懂這些,聽得雨里霧里,可是接下來這些專業人士說的話讓他們至少明白一點,這個推測可行!
泰勒結結巴巴道:“這……這就是抓取流程了?”
克里斯非常堅定道:“我覺得有百分之八十的成功率!可以試試看!”
聽到最專業的克里斯這么說,十幾個人都非常驚奇地看了一眼張偉,他們怎么也想不明白,一個網絡上的外行,卻能大致推算出流程?難道這就是天生的妖孽?怪不得人家十幾歲就能執掌龐大的資產!怪不得華金資本被經營的有模有樣!上天果然是有區別的,有些人一出生就他媽和別人不一樣啊!(