我寫的像誰(I Write
Like)是一個免費開源的專案,通過分析使用者提供的文章來分析文章裡的人物和寫作風格,並與一些著名的作家寫的作品進行比較,分析文章與文章之間的相似度,這種演算法被成為”樸素貝葉斯分類器”。
名詞解釋:貝葉斯網路是一個帶有概率註釋的有向無環圖,圖中的每一個結點均表示一個隨機變數,圖中兩結點間若存在著一條弧,則表示這兩結點相對應的隨機變數是概率相依的,反之則說明這兩個隨機變數是條件獨立的。網路中任意一個結點X
均有一個相應的條件概率表(Conditional Probability Table,CPT),用以表示結點X 在其父結點取各可能值時的條件概率。若結點X
無父結點,則X 的CPT 為其先驗概率分佈。貝葉斯網路的結構及各結點的CPT 定義了網路中各變數的概率分佈。
I Write
Like創立於2010年7月9日,自創立之日起便深受人們的歡迎,在部落格、社交網站上廣泛傳播。該網站通過”樸素貝葉斯分類器”演算法來分析使用者的寫作樣本,尋找關鍵詞、慣用詞彙以及寫作風格,然後向用戶反饋與所提交樣本最為相似的通俗作家。