资料介绍
软件简介
OpenMLDB是一个面向机器学习应用提供正确、高效数据供给的开源数据库。除了超过10倍的机器学习数据开发效率的提升,OpenMLDB也提供了统一的计算与存储引擎减少开发运维的复杂性与总体成本。
系统特性
-
一致性
OpenMLDB首先保证在线和离线特征计算一致性,科学家使用OpenMLDB建模生成的特征,可规避特征穿越等问题,上线后使用相同LLVM IR进行编译优化,保证与在线特征计算逻辑一致。其次保证数据存储一致性,数据从离线到在线进行实时同步,用户不需要为离线和在线管理不同数据源,也避免数据不一致对特征和模型带来的影响。
-
高性能
OpenMLDB基于C++和LLVM实现了原生SQL编译器,内置了数十种物理计划和表达式优化过程,可针对不同硬件环境动态生成二进制码,内存结构针对特征存储优化。最终特征存储空间和成本比同类产品可降低9倍,在线实时特征计算性能提升9倍,离线批处理计算性能比同类产品也提升6倍以上。
-
高可用
OpenMLDB的大规模并行计算服务和数据库存储服务,都支持多节点分布式高可用特性,可以自动Failover避免单点故障。
-
SQL支持
OpenMLDB支持用户友好的SQL接口,兼容大部分ANSI SQL语法以及针对AI场景拓展了新的SQL特性。以时序特征抽取为例,支持标准SQL的Over Window语法,还针对AI场景需求进行拓展,支持基于样本表滑窗的Window Union语法,实时计算引擎支持基于当前行的Request Mode窗口聚合计算。
-
AI优化
OpenMLDB以面向ML应用开发优化为目标,架构设计以及实现上都针对AI进行大量优化。在存储方面以高效的数据结构存储特征数据,无论是内存利用率还是实时查询效率都比同类型产品高数倍,而计算方面提供了机器学习场景常用的特殊拼表操作以及特征抽取相关UDF/UDAF支持,基本满足生产环境下机器学习特征抽取和上线的应用需求。
-
低门槛
OpenMLDB使用门槛与普通数据库接近,无论是建模科学家还是应用开发者都可以使用熟悉的SQL进行开发,并且同时支持ML应用落地所必须的离线大数据批处理服务以及在线特征计算服务,使用一个数据库产品就可以低成本实现AI落地闭环。
快速开始
使用OpenMLDB快速开发和上线ML应用,以Kaggle比赛Predict Taxi Tour Duration项目为例。
# 启动docker镜像 docker run -it 4pdosc/openmldb:0.1.0 bash # 初始化环境 sh init.sh # 导入行程历史数据到OpenMLDB python3 import.py # 使用行程数据进行模型训练 python3 train.py ./fe.sql /tmp/model.txt # 使用训练的模型搭建链接OpenMLDB的实时推理HTTP服务 sh start_predict_server.sh ./fe.sql 8887 /tmp/model.txt # 通过http请求发送一个推理请求 python3 predict.py
系统架构
- 面向机器学习的高可用、高并发数据库:OpenMLDB 0次下载
- 面向学分银行的区块链学习成果管控模型综述 5次下载
- 一种可分享数据和机器学习模型的区块链 15次下载
- 面向NoSQL数据库的JSON文档异常检测模型 20次下载
- 面向云数据库的属性基加密和查询转换中间件 5次下载
- 数据库学习教程之数据库的发展状况如何数据库有什么新发展 5次下载
- 数据库学习入门资料之如何进行数据库设计 14次下载
- 数据库教程之如何进行数据库设计 21次下载
- 如何进行数据库设计?数据库设计介绍和需求分析及结构设计资料概述 0次下载
- 数据库设计时有哪些常犯的一些错误?数据库设计的7个常见错误资料概述 3次下载
- 数据库学习入门之如何进行数据库设计详细分析概述资料免费下载 14次下载
- 基于面向对象数据库的CIM应用曹帅 0次下载
- 基于面向对象的过程实时数据库引擎设计 12次下载
- 面向对象数据库的关键技术和实现 18次下载
- 基于面向对象的GIS数据库的构建技术 20次下载
- 数据库优化那些事 269次阅读
- 数据库系列之特定实例错误有哪些 502次阅读
- 什么是数据库 859次阅读
- 云数据库和自建数据库的区别及应用 4140次阅读
- 机器学习应用及数据集 3657次阅读
- 面向人工智能的机器学习方法体系总结 3097次阅读
- 一文解读机器学习的作用及优势 1.2w次阅读
- 什么是机器学习?机器学习能解决什么问题?(案例分析) 1.5w次阅读
- 关于机器学习的前世今生和怎么用机器学习的方法去解决问题 1904次阅读
- 机器学习应用中的常见问题分类问题你了解多少 1.4w次阅读
- 一文看懂数据库原理与应用 11.5w次阅读
- 目前流行的数据库_构建数据库系统的流程 6892次阅读
- 机器学习与数据挖掘的关系 3883次阅读
- SQL Server数据库学习总结 4440次阅读
- 如何区分深度学习与机器学习 1720次阅读
下载排行
本周
- 1储能电源市场分析
- 7.99 MB | 7次下载 | 免费
- 2储能电源市场分析报告
- 2.61 MB | 6次下载 | 免费
- 3磁环电感定制时应该注意什么
- 0.32 MB | 2次下载 | 免费
- 4具有DCS-Control™ 功能的 3V 到 17V 0.5A 降压转换器TPS6217x-Q1数据表
- 3.17MB | 1次下载 | 免费
- 5labview文档教程资料(一)
- 24.29 MB | 1次下载 | 免费
- 6集成电流镜的 TPS61391 85VOUT 升压转换器数据表
- 1.54MB | 次下载 | 免费
- 7NCV7755 简单评估板数据手册
- 1.43 MB | 次下载 | 免费
- 8低纹波开关电容降压调节器LM2772数据表
- 2.08MB | 次下载 | 免费
本月
- 1ES9038PRO解码芯片的电路原理图介绍
- 0.25 MB | 35次下载 | 5 积分
- 2UHD智能显示SoC VS680产品简介
- 0.46 MB | 11次下载 | 免费
- 3STM32国内外发展现状
- 1.15 MB | 11次下载 | 免费
- 4ATmega8芯片中文手册
- 2.45 MB | 8次下载 | 1 积分
- 5TDK电容器产品指南
- 11.88 MB | 7次下载 | 1 积分
- 6储能电源市场分析
- 7.99 MB | 7次下载 | 免费
- 7传感芯片选型指南
- 3.60 MB | 6次下载 | 免费
- 8储能电源市场分析报告
- 2.61 MB | 6次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935086次下载 | 免费
- 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
- 1.48MB | 420050次下载 | 免费
- 3Altium DXP2002下载入口
- 未知 | 233068次下载 | 免费
- 4电路仿真软件multisim 10.0免费下载
- 340992 | 191316次下载 | 免费
- 5十天学会AVR单片机与C语言视频教程 下载
- 158M | 183316次下载 | 免费
- 6labview8.5下载
- 未知 | 81567次下载 | 免费
- 7Keil工具MDK-Arm免费下载
- 0.02 MB | 73786次下载 | 免费
- 8NI LabVIEW中实现3D视觉的工具和技术
- 未知 | 70088次下载 | 免费
评论
查看更多