Go語言文字分類器 classifier程式 可用在社群群組內容關鍵字集分析

Skip to content





Code Issues <span class="colour" style="color: inherit;"\ data-tomark-pass >0</span> Pull requests <span class="colour" style="color: inherit;"\ data-tomark-pass >0</span> Projects <span class="colour" style="color: inherit;"\ data-tomark-pass >0</span> Security PulseDismiss

Join GitHub today

GitHub is home to over 36 million developers working together to host and review code, manage projects, and build software together.

Sign upBranch: master Find fileCopy path

clickbait-classifier/main.go

![@allisonmorgan](https://avatars3.githubusercontent.com/u/6633242?s=40&v=4) allisonmorgan Initial commit731554f on 30 Sep 2015
1 contributor
52 lines (43 sloc)  1.29 KB
RawBlameHistory

package main
import (
"encoding/csv"
"fmt"
"log"
"os"
"github.com/lytics/multibayes"
)
func main() {
// make a new classifier
classifier := multibayes.NewClassifier()
// read headlines from `buzzfeed_headlines.csv`
buzzFileerr := os.Open("./train/buzzfeed_headlines.csv")
if err != nil {
log.Fatal(err)
}
defer buzzFile.Close()
reader := csv.NewReader(buzzFile)
buzzDataerr := reader.ReadAll()
// read headlines from `reuters_headlines.csv`
reutersFileerr := os.Open("./train/reuters_headlines.csv")
if err != nil {
log.Fatal(err)
}
defer reutersFile.Close()
reader = csv.NewReader(reutersFile)
reutersDataerr := reader.ReadAll()
// train the classifier
for _doc := range buzzData {
classifier.Add(doc[0], []string{"clickbait"})
}
for _doc := range reutersData {
classifier.Add(doc[0], []string{"not_clickbait"})
}
// predict new classes
probs := classifier.Posterior("50 ways to win big")
fmt.Printf("Posterior Probabilities: %+v\n", probs)
// Posterior Probabilities: map[clickbait:0.9649489234536172 not_clickbait:0.03505107654638282]
// predict new classes
probs = classifier.Posterior("Pope lands in US")
fmt.Printf("Posterior Probabilities: %+v\n", probs)
// Posterior Probabilities: map[clickbait:0.19909505931578056 not_clickbait:0.8009049406842195]
}

共 1 个回复


ChungMingSu2

先建立分類器 分別讀取兩個檔案的資料填入分類器建立兩重類別 再讀取新資料運用分類器判斷分屬那一類別的機率是多少 用在社群群組內容的關鍵字相關性分析

# 0