星期六, 四月 08, 2006

词汇的网络

突然想到一个很有意思的游戏:
你可以用一个词(W1)在google上搜索,于是得到一个搜索的结果数量(S1)。
用另一个词(W2),也可以得到一个结果的数量(S2)。
然后是搜索W1 W2,得到S12
搜索W2 W1,得到S21
那么S12/(S1*S2),和S21/(S1*S2)的意义可能是什么呢?
如果google足够大,是否反映了某种P(W1|W2)或者P(W2|W1)
于是,我们也许可以通过google或者其他什么搜索引擎建立一个词汇的贝叶斯网络,我不知道它有什么用,也许是语言的理解,或者是其他的什么含义。

没有评论: