0x90e's Blog

Chase Excellence,
Sucess will follow.


  • Home

  • Tags

  • Categories

  • Archives

NLP N-gram

Posted on 2017-07-03 | In Machine learning

N-gram Language Model

定義

為一種統計語言模型(Statistical Language Model),統計語言模型定義:

而N-gram又稱為N元模型,N-gram是指一段語句中包含N個Token,譬如abcde,則2-gram依次為:
ab, bc, cd, de

Read more »

RF Basic

Posted on 2017-06-28 | In Machine learning

Random Forsest

定義

RF為Bagging的擴展變形。RF以決策樹為基學習器,並在決策樹訓練時,引入隨機屬性選擇。

產生基學習器

建立每一顆決策樹皆包含行採樣、列採樣與完全分裂三個步驟:

  1. 行採樣: 目的是挑選進行訓練的數據。採用有放回的方式,及為採樣得到的樣本集中,可能會有重複的樣本。假設,輸入N個樣本,那麼採樣的樣本也為N個。在訓練時,每一顆樹輸入樣本都不是全部的樣本,使得相對不容易over-fitting。

  2. 列採樣: 目的是挑選進行訓練的特徵,從M個特徵中,挑m個(m << M)。

  3. 完全分裂: 使用完全分裂的方式對採樣後的數據建立決策樹,這樣決策樹的某一個葉子節點要麼是無法繼續分裂,不然就是裡面的樣本全屬一同一個分類。

與其他決策樹算法不同的是,這裡不進行剪枝,因為前兩個隨機採樣的過程保證了隨機性,就算不進行剪枝,也不會出現over-fitting

Read more »

SVM basic

Posted on 2017-06-26 | In Machine learning

SVM(Support Vector Machines)

運作原理

使用分隔超平面(separating hyperplane),將線性可分的數據分隔開來;在超平面同側的資料,屬於同一個類別。

如何挑選分隔超平面

找到離超平面最近的點,並且讓它們離分隔面越遠越好。支援向量(support vector)及為離超平面最近的那些點;而支援向量到超平面的距離稱為間隔(margin)。在挑選超平面時,追求一個擁有最大間隔的超平面,保證在處理未知資料時的分類或回歸效果最佳。

Read more »

Verify a signature with certificate

Posted on 2017-02-12 | In Security

所需檔案建立

建立CA基礎設施

  1. 建立CA基礎設施,步驟可參考openssl-certificate-authority
  2. 透過以上步驟可獲得Certificate與Private key
    • Certificate位置: /root/ca/intermediate/certs/www.example.com.cert.pem
    • Private key位置: /root/ca/intermediate/private/www.example.com.key.pem
Read more »
1…67
0x90e

0x90e

64 posts
8 categories
25 tags
E-Mail GitHub
© 2016 — 2020 0x90e
Powered by Hexo
|
Theme — NexT.Pisces v5.1.3
Unique Visitor Page View