自慰套教室~女子全员妊娠,精品无码国产自产拍在线观看蜜桃,亚洲国产精品成人精品无码区,久别的草原在线看视频免费
學員中心登錄
IT獵戶網
IT就業網
博睿云
IT易學網
營運協同系統
聯系我們
18922156670
English
集團站
切換校區
廣州
深圳
全部課程
網絡技術
華為
HCIA-Datacom
HCIP-Datacom
HCIE-Datacom
思科
CCNA-EI
CCNP-EI
CCIE-EI
系統運維
華為
HCIA-openEuler
HCIP-openEuler
HCIE-openEuler
紅帽
RHCSA
RHCE
RHCA
麒麟
KYCA
KYCP
Kubernetes
CKA
CKS
Datacom
/
Security
/
Storage
/
Big-Data
/
Cloud
/
DC
/
UC
/
R&S
/
WLAN
/
Transmission
/
AI
/
IOT
/
GaussDB
/
Kunpeng
HCIP
Datacom
/
R&S
/
Security
/
Storage
/
Big-Data
/
Cloud
/
DC
/
UC
/
WLAN
/
Transmission
/
IOT
AI
HCIE
Datacom
/
R&S
/
Security
/
Storage
/
Big-Data
/
Cloud
/
DC
/
UC
/
WlAN
/
Transmission
數據庫
華為
HCIA-openGauss
HCIP-openGauss
HCIE-openGauss
Oracle
OCP
OCM
MySQL
PostgreSQL
PGCA
PGCE
PGCM
TIDB
PCTA
PCTP
人大金倉
KCA
KCP
KCM
云計算
華為
HCIA
Cloud
/
Cloud Service
HCIP
Cloud
/
Cloud Service
HCIE
Cloud
/
Cloud Service
阿里云
ACA
ACP
ACE
騰訊云
TCCA
TCCP
TCCE
亞馬遜云
SAA
SAP
安全
華為
HCIA-Security
HCIP-Security
HCIE-Security
CISP
CISP
CISP-PTE
CISP-DSG
CISSP
大數據
華為
HCIA-BigData
HCIP-BigData
HCIE-BigData
人工智能
華為
HCIA-AI
HCIP-AI
項目管理
PMP
ITIL
ITSS
軟件開發
鴻蒙
鴻蒙OS移動應用開發
Java
Java高級軟件工程師
HTML5
HTML5高級前端工程師
其他
VMware
VCP
技能等級證書
首頁
優選課程
華為認證
紅帽認證
甲骨文認證
JAVA認證
UI認證
HTML5認證
python認證
思科認證
職業技能等級證書
紅帽培訓訂閱
高校合作
合作理念
合作院校
合作形式
案例分析
企業定制
服務理念
服務內容
服務特色
服務流程
案例匯集
合作名企
考試中心
熱門認證考試
預約考試
官方授權考試服務
考場環境
考試流程
考試資訊
學習資源
學習文章
學習視頻
關于我們
企業介紹
企業文化
企業環境
密碼登錄
驗證碼登錄
獲取驗證碼
驗證碼已發送,請查收短信
微信
電話
復制成功
微信號:
togogoi
添加微信好友, 詳細了解課程
已復制成功,如果自動跳轉微信失敗,請前往微信添加好友
打開微信
新聞資訊
騰科動態
騰科新聞
業界新聞
考試資訊
業界新聞
當前位置:
首頁
> >
業界新聞
> >
k-Means聚類
發布時間:
2022-05-17 14:50:44
k-Means聚類
1)k-Means聚類算法原理k-Means算法接受參數k,然后將事先輸入的n個數據對象劃分為k個聚類以便使所獲得的聚類滿足:同一聚類中的對象相似度較高;而不同聚類中的對象相似度較小。
聚類相似度是利用各聚類中對象的均值所獲得一個“中心對象”(引力中心)來進行計算的。
k-Means算法是最為經典的基于劃分的聚類方法,是十大經典數據挖掘算法之一。k-Means算法的基本思想是:以空間中k個點為中心進行聚類,對最靠近它們的對象歸類。通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結果。
假設要把樣本集分為c個類別,算法描述如下:
① 適當選擇c個類的初始中心;
② 在第k次迭代中,對任意一個樣本,求其到c個中心的距離,將該樣本歸到距離最短的中心所在的類;
③ 利用均值等方法更新該類的中心值;
④ 對于所有的c個聚類中心,如果利用②及③的迭代法更新后其值保持不變,則迭代結束,否則繼續迭代。
該算法的較大優勢在于簡潔和快速。算法的關鍵在于初始中心的選擇和距離公式。
2)k-Means聚類算法的實現
k-Means聚類算法的實現步驟如下。
(1)參數input指定待聚類的所有數據點,clusters指定初始聚類中心。如果指定參數k,由org.apache.mahout.clustering.kmeans.RandomSeedGenerator.buildRandom通過org.apache. hadoop.fs直接從input指定文件中隨機讀取k個點放入clusters中。
(2)根據原數據點和上一次迭代(或初始聚類)的聚類中心計算本次迭代的聚類中心,輸出到clusters-N目錄下。該過程由org.apache.mahout.clustering.kmeans下的KMeansMapper\KMeansCombiner\KMeansReducer\KMeansDriver實現。
① KMeansMapper:在configure中初始化mapper時讀入上一次迭代產生或初始聚類中心(每個mapper都讀入所有的聚類中心)。map方法對輸入的每個點都計算其最近的距離類,并加入輸出的key為該點所屬聚類ID,value為KMeansInfo實例,包含點的個數和各分量的累加和。
② KMeansCombiner:本地累加KMeansMapper輸出的同一聚類ID下的點個數和各分量的和。
③ KMeansReducer:累加同一聚類ID下的點個數和各分量的和,求本次迭代的聚類中心,并根據輸入Delta判斷該聚類是否已收斂。上一次迭代聚類中心與本次迭代聚類中心距離小于Delta。輸出各聚類中心和其是否收斂標記。
④ KMeansDriver:控制迭代過程直至超過較大迭代次數或所有聚類都已收斂每輪迭代后,KMeansDriver讀取其clusters-N目錄下的所有聚類。若所有聚類已收斂,則整個k-Means聚類過程收斂了。
3)k-Means聚類算法參數調整
manhout kmeans聚類有兩個重要參數,即收斂Delta和較大迭代次數。通常情況下,Delta值越小,表示收斂條件越高,因此最終收斂的聚類數可能會降低,而較大迭代次數可通過觀察每次迭代后收斂聚類數決定,當收斂聚類數幾乎不再變化或振蕩時可停止迭代。
您可能也喜歡:
廣州紅帽認證培訓暑假班/周末班_廣州騰科
HCIE云計算認證考試內容與備考攻略
華為HCIA-Cloud認證考試內容大綱有哪些?
紅帽考試中常見的問題有哪些?
廣州Oracle培訓機構_選擇合適的Oracle培訓機構
分享到:
QQ空間
新浪微博
騰訊微博
人人網
微信
更多
上一篇:
譜聚類算法
下一篇:
Canopy聚類
相關課程推薦
華為認證
紅帽認證
Oracle認證
思科認證
oracle認證ocp培訓課程
oracle考試培訓
紅帽linux培訓班
紅帽rhcsa認證
華為hcie題庫
十五年老品牌
微信咨詢:togogoi
咨詢電話:18922156670
咨詢網站客服:
在線客服
點擊QQ咨詢
聯系電話:18922156670
在線咨詢
在線咨詢
×
您好,請問有什么可以幫您?我們將竭誠提供最優質服務!
QQ咨詢
下次再說
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
|
<蜘蛛词>
| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>