《55种用Google找乐子的方法》:之三

Friday, March 30, 2007

《55种用Google找乐子的方法》:之三

Memecodes--《55种用Google找乐子的方法》之三

　　Memecodes是用一些随机生成的文字组成的网页，这类网页在生成一段时间后会自动销毁。然而这是如何实现的呢？是利用一套进化规则：某个页面在Google被搜索和被点击的次数越多，即它越流行，那么由它衍生出来的子网页也越多。

Memecodes来源于英国著名科学家理查德•道金斯（Richard Dawkins）的《自私的基因》一书中的“meme”一词（有人称为“拟子”）。他在书中写到：
在诸如语言，观念，信仰，行为方式等的传递过程中与基因在生物进化过程中所起到的作用相类似的那个东西。

我在2004年早些时候开始进行的这个试验以观察它的发展，并得到了一些有趣的结果。以下是Memecodes的运作细节描述：首先，在某个词库的基础上，页面随机挑选一些单词。为了使该网页堵起来更自然，类似“这”、“和”这样的词以及标点符号被添加上。下面是包含了Jabberwockyish2段落的自动生成的网页。

　　Cognac? Is sloth is waist is declare of bramble flood in of stoical. Footman… Hesitancy a for attention flabby wanton and calculate vtol cyclamate that paprika feign the aline fourth qualifications of in. Thatch, Saccharin hansom rationale in dine numbers.

　　这一页，抑或称之为一组“基因”，是构成整个如生态系统般复杂的网页集合中独一无二的一页。如此一来，这页中很有可能有某句或者某个短语是具有实用性的。比方说：人们是极有可能在Google中搜索含有“肥胖的鸽子”这个短语的某个句子。一旦此搜索行为发生而且搜索者点击了Memecodes的搜索结果，那么这个特殊的页面就会生成子页面――是配合搜索者的行为生成的。任何的子页面都是通过随机替换某些单词以产生些许的改变来产生的。比如说刚才提到的 “肥胖的鸽子”可能会变成“肥胖的粉鸽子”（当然这有可能会变成一个更成功的基因），或者变成“肥胖的塔鸽子”（由于几乎没有人会去搜索这样一个短语，所以其面临着过期作废的命运）。

那么这些网页又是如何销毁的呢？2000基本上是此类页面生成数量的上限。每当生成一页新的，最旧的那个就会被删除（在Memecodes试验主页上该页的链接被删除）。如果某页不能继续生成子网页，那么它的基因也就不能继续生存下去并会随之删除。

其他基因（随机单词）则会比较成功。而且某些成功的页面能逐渐变成更成功。他们找到了与之相适应的一个自然的搜索规则并引导越来越多的搜索者去使用它们，并不断生成更自然的语言。到了某一天，这些页面甚至可能自动生成莎士比亚著作，而不用“无限猴子定理”来实现。其实也不过是我的希望而已。不过这套进化试验的确花费了一些时间来得到结果，在此之后一年多我结束了此项试验。然而到那时为止，已经有很多人找到了这个网站并通过它生成了许多子网页。总而言之，生成了有10，022页之多（其中2，500页是实验开始阶段自动生成的），有的页面甚至到了第五代！

　　有些流行的句子确实相当的奇怪，比方说“感受令人垂涎欲滴的蘑菇用微波炉吃青蛙样外星人时的愤怒”或更实际点的“海鸥三明治”。其他一些句子则总是包括“种子”这个单词，因为“种子”已经成为互联网上流行的下载视频和其他文件的格式方法之一。然而唯一可以清晰明了的被识别为成功基因的都是些特殊单词或组合，我却无法在此展示给你们看，原因大家应该也能猜得到：它们都是些和成人话题相关的单词。大概这就是自然选择吧。

　附：
　1. Dawkins, R. (1976). The Selfish Gene. (www.55fun.com/3.1)
　2. Jabberwocky is the title of a nonsensical poem from Lewis Carroll’s Through the Looking-Glass and What Alice Found There (1872). It starts off with “Twas brillig, and the slithy toves/ Did gyre and gimble in the wabe.” (www.55fun.com/3.2)