自從搬家到Pixnet之後,自然也想帶一些Pixnet的使用者去使用WARM系統,不過礙於Pixnet的朋友清單預設隱藏,因此要靠BFS(breadth first search)拓樸方式來尋找使用者會有相當的難度,每個次撈資料發現增加的使用者人數實在有限,不過現在找到有用的方法了~就是去專注兩個頁面:
http://www.pixnet.net/blg/
http://www.pixnet.net/alb/

只要有更新個人的相簿或者部落格,就會被Pixnet官網丟上首頁,放在最近更新裡面,只要定期瀏覽這些頁面,就可以找到不同的使用者帳號!
其實這種方式在各站都有,只不過之前專注在無名小站,在無名不需要這種手段就可以拓墣超過70%的使用者,因此從來沒想過需要透過這類方式來蒐集使用者帳號,不過若到了其他比較小型的部落格系統,這種方法則是必要的!



寫個小程式放個兩天左右,就撈了超過14000個新的帳號,這讓我非常驚訝,因為之前的資料人數也不過69721人,相較起來這方法實在太有效了,此外也說明了一點,大部分的使用者對於「將朋友列入清單」這種動作不是很有興趣;當然也可以把原因歸給Pixnet預設將朋友清單隱藏。

然而在實際手動去觀察這些新找到的使用者之後,發現大部分的使用者只單純的把Pixnet帳號當成放照片的相簿空間,甚至一個帳號只開通相簿功能,部落格功能連開都沒開~

到此刻為止,Pixnet的使用者已經收集到102124人了,距上次收集增加了32403人,不過實際上放到WARM服務上的人數只有57986人,主要原因是維護者太懶,沒去更新資料,如果有人還想繼續使用,請多鼓勵我們的團員NocoldRuntime
畢竟我個人是個比較專注在畢業的傢伙,因此以撈資料、研究為主,網頁服務請找上述那對超強的金門兄弟~

話說我們團隊成立至今已經超過1年,我們應該算是有說到做到,我們已經有投上一個國際研討會:AINA2008
所以...我們應該不會被說成是拿學術資源亂搞吧~XD
報告日期是3/25,等到報告完論文集拿回來,再將論文pdf放上來給大家下載吧~^^
至於Journal...投了一個~沒上~仍在努力中~XD
創作者介紹

Next Step...

kuster 發表在 痞客邦 留言(0) 人氣()