您的当前位置:首页>关注 > 正文

甲骨文发布MySQL HeatWave ML

来源:中关村在线 时间:2022-04-07 17:43:07

甲骨文宣布,Oracle MySQL HeatWave现支持数据库内机器学习(ML),为之前的事务处理和分析功能锦上添花,这是唯一支持此功能的MySQL云数据库服务。MySQL HeatWave ML全面自动执行机器学习生命周期,并将所有经过训练的模型存储在MySQL数据库中,因此无需将数据或模型移动到机器学习工具或服务中。消除提取、转换和加载 (ETL) 流程可降低应用程序的复杂性与成本,并提高数据和模型的安全性。HeatWave ML功能现已包含在所有37个Oracle云基础设施(OCI)区域的MySQL HeatWave数据库云服务中。


HeatWave ML可以全面自动化模型训练、推断和解释

到目前为止,为MySQL应用程序添加机器学习功能对许多开发人员来说非常困难且耗时。首先,开发人员需要将数据从数据库提取到另一个系统,以创建和部署 机器学习模型。在将机器学习应用于应用程序数据方面,这种方法创建了多个孤岛,并延迟数据移动。这还导致数据库外的数据激增,使其更易受到安全威胁,并增加了开发人员在多个环境中进行编程的复杂性。其次,现有的服务期待开发人员成为指导机器学习模型训练过程的专家;否则,模型是次优的,并会降低预测的准确性。最后,大多数现有的 机器学习解决方案没有包括相应功能来解释开发人员构建的模型为何会提供某种特定预测。

MySQL HeatWave ML通过在MySQL数据库内原生集成机器学习功能来解决这些问题,而无需将数据ETL到其他服务。HeatWave ML完全自动化训练过程,并为给定数据集和指定任务创建具有最佳算法、最佳特征和最佳超参数的模型。HeatWave ML生成的所有模型都可以提供模型和预测解释。

没有其他云数据库供应商可以直接在数据库服务中提供此类高级的机器学习功能。甲骨文此次发布的机器学习基准测试可在大量公开可用的机器学习分类和回归数据集上执行,例如Numerai、Nomao和Bank Marketing等。针对在更大的HeatWave集群上进行培训时,会增加相对于Redshift ML的性能优势。使用MySQL HeatWave可以非常高效且快速地完成耗时的训练过程,因此客户现在可以更频繁地重新训练模型并跟上数据的变化。这样可以使模型保持最新并提高预测的准确性。

甲骨文首席企业架构师Edward Screven表示:“正如在单一数据库中集成运行分析和事务处理一样,我们现将机器学习引入MySQL HeatWave。MySQL HeatWave是甲骨文发展最迅速的云服务之一。越来越多客户从Amazon和其他云数据库服务迁移到MySQL HeatWave,并显著提高了性能和降低成本。如今,我们还发布一系列丰富了HeatWave功能的其他创新,以提高可用性并降低成本。我们全新且完全透明的基准测试结果再次表明,Snowflake、AWS、Microsoft和Google的速度比MSQL HeatWave更慢且成本更高。”

相较于其他云数据库服务,HeatWave ML提供了以下功能:

完全自动化的模型训练:使用HeatWave ML创建模型的所有不同阶段都是完全自动化的,无需开发人员干预。这样可以实现更准确、无需手动操作的模型优化,并且始终完成培训过程。Amazon Redshift等其他云数据库服务提供了集成外部服务的机器学习功能,意味着开发人员在ML培训过程中需要进行大量的手动输入。

模型和推断解释:模型的可解释性有助于开发人员了解机器学习模型的行为。例如,如果银行拒绝客户贷款,则它需要能够确定模型的哪些参数有被考虑在内,或者模型是否包含任何偏差。预测可解释性是一组技术,有助于回答机器学习模型为何做出如此特定预测的问题。如今,预测解释变得越来越重要,因为公司必须能够解释其机器学习模型作出的决策。HeatWave ML将模型解释和预测解释相结合,作为模型训练过程的一部分。因此,HeatWave ML创建的所有模型都可以提供模型和推断解释,而无需在推断解释时提供训练数据。甲骨文增强了现有的解释技术,以提高性能、可解释性和质量。其他云数据库服务并未针对其所有机器学习模型提供如此丰富的可解释性。

超参数优化:HeatWave ML为超参数优化实现了基于渐变搜索的全新缩减算法。这样可以并行执行超参数搜索,而不影响模型的准确性。超参数优化是机器学习模型训练最耗时的阶段,此独特功能可以为HeatWave ML提供优于其他云服务构建机器学习模型的性能优势。

算法选择:HeatWave ML使用代理模型的概念来确定最佳的ML算法,以进行训练。代理模型是一种展示完整复杂模型属性的简单模型。使用简单的代理模型可非常高效地完成算法选择,而不会牺牲准确性。其他用于构建机器学习模型的数据库服务皆未提供这种代理建模功能。

智能数据采样:在模型训练期间,HeatWave ML对一小部分数据进行抽样,以提高性能。这种抽样的方式是在样本数据集中捕获所有代表性的数据点。其他用于构建机器学习模型的云服务采用了效率较低的方法,即使用随机数据采样,在不考虑数据分布特征的情况下对一小部分数据进行采样。

特征选择:这个功能有助于确定训练数据的属性;这些属性会影响机器学习模型进行预测的行为。HeatWave ML中的特征选择技术针对多个域和应用程序的大量数据集进行了训练。根据这些收集到的统计信息和元数据信息,HeatWave ML能够有效地识别新数据集中的相关特征。 

除了机器学习功能,甲骨文还为MySQL HeatWave服务发布了更多创新。实时弹性功能让客户将HeatWave集群扩展和缩小到任意数量的节点,无需任何停机时间或只读时间,也无需手动重新平衡集群。其他功能还包括数据压缩,可让客户处理每个节点两倍的数据,并降低近50%的成本,同时保持相同的性价比。新增的暂停与恢复功能则可让客户暂停HeatWave,以节省成本。恢复后,MySQL Autopilot所需的数据和统计信息将自动重新加载到HeatWave中。

联想(Lenovo)SR588服务器主机2U机架式 桌面云数据库虚拟化 深度学习备份存储 定制 2颗银牌4210R 20核 2.2G丨双电 64GB丨480GB+3*4TB Raid5

[经销商]京东商城

[产品售价]28799元

进入购买

浪潮(INSPUR) NF5270M5机架式服务器(1颗3204 6核 1.9GHz/16G/2T*1 SATA/双千兆*1/单电550W/三年服务)

[经销商]京东商城

[产品售价]11700元

进入购买

戴尔(DELL)R740服务器主机/2*至强银牌4210R十核2.4GHz/16G*4/4TSAS*3/H730P-2G/750W双电/导轨/三年保修

[经销商]京东商城

[产品售价]27999元

进入购买

标签: MySQL

最新新闻:

新闻放送

关于我们 | 联系我们 | 投稿合作 | 法律声明 | 广告投放
 

版权所有©2017-2020   三秦科技网
 

浙ICP备2022016517号-20
 

所载文章、数据仅供参考,使用前务请仔细阅读网站声明。本站不作任何非法律允许范围内服务!
 

联系我们: 514 676 113 @qq.com
 

Top