💠

💠 2024-08-13 11:47:10


机器学习平台

将机器学习工程化组织的平台

商业平台

Azure

Azure 机器学习文档

无需代码经验的机器学习入门第一天 - 训练AutoML 分类模型

BML

BML 百度全功能AI开发平台


开源

Anaconda

Anaconda

Posit

posit

H2O

H2O-3开源 分布式内存机器学习平台 类似于 Jupyter Notebook 的数据开发平台

建模支持的算法

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
    Aggregator
    ANOVA for Generalized Linear Model
    Cox Proportional Hazards
    Deep Learning
    Distributed Random Forest
    Extended Isolation Forest
    Gradient Boosting Machine
    Generalized Linear Modeling
    Generalized Low Rank Modeling
    Information Diagram
    Isolation Forest
    K-means
    Model Selection
    Naive Bayes
    Principal Components Analysis
    RuleFit
    Stacked Ensemble
    TargetEncoder
    Uplift Distributed Random Forest
    Word2Vec
    XGBoost

部署

  • 下载压缩包解压运行h2o.jar之后,可打开一个默认无认证体系的 H2O Flow.
  • 加载数据库驱动 java -cp h2o.jar:mysql-connector-java-8.0.25.jar -Dsys.ai.h2o.sql.jdbc.driver.mysql=com.mysql.cj.jdbc.Driver water.H2OApp
  • 启动集群 -flatfile flatfile -name testEnv
    • 如果是同主机搭建需要不同的进程指定端口,例如 -port 54323 内部paxos端口则是参数值+1 54324
    1
    2
    3
    
    192.168.1.5:54321
    192.168.1.6:54321
    192.168.1.7:54321
    

H2O Flow

H2O Flow Tutorial mirrorH2O Flow GUI操作方式完成全流程

  • MOJO模型的抽象表示 导出为GenModel即jar包可部署到应用中。

跑GLM的流程

H2o使用分布式随机森林建模分类


  1. 数据处理
  2. 模型评分
  3. 模型部署

H2O-Python


同组织项目

  • H2O Wave 开源 基于动态数据实时渲染仪表板WEBAPI服务 Python实现
  • H2O Driverless AI 商业化 将ML工程简化,在交互上构建清晰的工作流程